wiki40b  |  TensorFlow Datasets

wiki40b  |  TensorFlow Datasets

Help protect the Great Barrier Reef with TensorFlow on Kaggle TensorFlow Resources Datasets Catalog Description: Clean-up text for 40+ Wikipedia languages editions of pages correspond to entities. The datasets have train/dev/test splits per language. The dataset is cleaned up by page filtering to remove disambiguation pages, redirect pages, deleted pages, and non-entity pages. Each example contains the wikidata id of the entity, and the full Wikipedia article after page processing that

2 mentions: @hpp_ricecake@hpp_ricecake
Date:

Referring Tweets

@hpp_ricecake
@hpp_ricecake ここらへん覚えておけば良いか Wikipedia(きれい): Wiki-40B t.co/GroqxgW0jy t.co/a4gAfi0PZ8 CommonCrawl(クソでかくてきたない): mC4 t.co/qfyDLD3B1n t.co/wUeDfEAMz3 CommonCrawl(でかくてきれい): CC-100 t.co/669stuKxkv
@hpp_ricecake
@hpp_ricecake 中身はこんな感じ(日本語) 各種ライブラリでの取り扱いもある tensorflow-datasets: t.co/tIxIxxuF4f hugginface/datasets: t.co/6veLkczRvP t.co/aT8xF2YV1j

Related Entries

FNet — transformers 4.12.5 documentation
Read more FNet — transformers 4.12.5 documentation
0 users, 1 mentions 2021/12/02 01:38
Add Perceiver IO by NielsRogge · Pull Request #14487 · huggingface/transformers · GitHub
Read more Add Perceiver IO by NielsRogge · Pull Request #14487 · huggingface/transformers · GitHub
0 users, 1 mentions 2021/12/02 04:38
Perceiver IO · Issue #12996 · huggingface/transformers · GitHub
Read more Perceiver IO · Issue #12996 · huggingface/transformers · GitHub
0 users, 1 mentions 2021/12/02 04:38
Active Learning for BERT: An Empirical Study - ACL Anthology
Read more Active Learning for BERT: An Empirical Study - ACL Anthology
0 users, 1 mentions 2021/12/03 03:08
roberta-large-mnli · Hugging Face
Read more roberta-large-mnli · Hugging Face
0 users, 1 mentions 2021/12/22 04:37

ML-Newsについて

機械学習の技術に関する情報は流速も早いし、分野も多様でキャッチアップが大変です。Twitterで機械学習用のリストを作っても、普段は機械学習以外の話題が多く流れており、効率的に情報収集するのは困難です。

ML-NewsはSNSを情報源とした機械学習に特化したニュースサイトです。機械学習に関する論文ブログライブラリコンペティション発表資料勉強会などの最新の情報を効率的に収集できます。

機械学習を応用した自然言語処理、画像認識、情報検索などの分野の情報や機械学習で必要になるデータ基盤やMLOpsの話題もカバーしています。
安定したサイト運営のためにGitHub sponsorを募集しています。

お知らせ

  • 2021/12/31: デザインを刷新しました
  • 2021/04/08: 日本語Kaggleのカテゴリを新設しました