Learning Audio-Visual Speech Representation by Masked Multimodal Cluster Prediction | OpenReview

Learning Audio-Visual Speech Representation by Masked Multimodal Cluster Prediction | OpenReview

Video recordings contain correlated audio and visual information, providing a strong signal for speech representation learning from the audio stream and the speaker’s lip movements. We introduce...

Date:

Related Entries

Polish NLP Meetup #12: Getting Started with Kaggle - YouTube
Read more Polish NLP Meetup #12: Getting Started with Kaggle - YouTube
0 users, 0 mentions 2021/12/01 16:37
画像処理勉強会 アンケート
Read more 画像処理勉強会 アンケート
0 users, 0 mentions 2021/12/07 00:08
BigQuery データをA5:SQL Mk-2 でCRUD クエリする方法
Read more BigQuery データをA5:SQL Mk-2 でCRUD クエリする方法
0 users, 0 mentions 2021/12/08 22:39
確率分布(probability distribution)①|問題演習で理解する統計学【1】 - あつまれ統計の森
Read more 確率分布(probability distribution)①|問題演習で理解する統計学【1】 - あつまれ統計の森
0 users, 0 mentions 2021/09/05 12:02
Accelerated Brain Aging in Amnestic Mild Cognitive Impairment:                     Relationships wit...
Read more Accelerated Brain Aging in Amnestic Mild Cognitive Impairment: Relationships wit...
0 users, 1 mentions 2022/01/06 06:09
GitHub - tomislavrekic/Unity-Number-Recognition: Number recognition done with a neural network. Made...
Read more GitHub - tomislavrekic/Unity-Number-Recognition: Number recognition done with a neural network. Made...
0 users, 1 mentions 2022/01/29 13:37

ML-Newsについて

機械学習の技術に関する情報は流速も早いし、分野も多様でキャッチアップが大変です。Twitterで機械学習用のリストを作っても、普段は機械学習以外の話題が多く流れており、効率的に情報収集するのは困難です。

ML-NewsはSNSを情報源とした機械学習に特化したニュースサイトです。機械学習に関する論文ブログライブラリコンペティション発表資料勉強会などの最新の情報を効率的に収集できます。

機械学習を応用した自然言語処理、画像認識、情報検索などの分野の情報や機械学習で必要になるデータ基盤やMLOpsの話題もカバーしています。
安定したサイト運営のためにGitHub sponsorを募集しています。

お知らせ

  • 2021/12/31: デザインを刷新しました
  • 2021/04/08: 日本語Kaggleのカテゴリを新設しました