論文紹介: SentencePieceの原著論文+α - radiology-nlp’s blog

論文紹介: SentencePieceの原著論文+α - radiology-nlp’s blog

はじめに 2018年に登場したニューラル言語処理のための教師なしサブワード分割モジュール,SentencePiece。 開発意図や仕様を確認するために原著論文を読みました。 github.com 論文は2018年8月にarXivに投稿されています。 arxiv.org 著者・開発者はMeCab開発者でもある工藤拓さん。自然言語処理に関心のある方で知らない人はいないでしょう。 github.com 1冊まるごと形態素解析という驚異的な本も執筆されています。 形態素解析の理論と実装 (実践・自然言語処理シリーズ)作者: 工藤拓,言語処理学会出版社/メーカー: 近代科学社発売日: 2018/10/0…

2 mentions: @iBotamon@roy29fuku
Keywords: sentencepiece
Date: 2019/08/07 12:58

Referring Tweets

@iBotamon ブログを更新しました。やはりSentencePieceは単なる前処理マシンではなく,epoch毎に実行しなおすのが正しい使い方のように思えます。 t.co/Je5DukVNYY
@roy29fuku > ニューラルネットワークの訓練のEpochごとに毎回実行しなおす なるほど。まさに単なる前処理と捉えてた🙅‍♂️ 端的でわかりやすかった。 論文紹介: SentencePieceの原著論文+α - radiology-nlp’s blog t.co/Acgmwy3ZQg

Related Entries

Read more [1808.06226] SentencePiece: A simple and language independent subword tokenizer and detokenizer for ...
0 users, 1 mentions 2019/01/16 15:46
Read more GitHub - google/sentencepiece: Unsupervised text tokenizer for Neural Network-based text generation.
99 users, 1 mentions 2019/01/27 02:16
Read more BERT with SentencePiece で日本語専用の pre-trained モデルを学習し、それを基にタスクを解く - クックパッド開発者ブログ
99 users, 61 mentions 2018/12/04 03:00
Read more GitHub - yoheikikuta/bert-japanese: BERT with SentencePiece for Japanese text.
14 users, 8 mentions 2019/01/15 00:46
Read more Sentencepieceの水増しをBERTで試してみる - 言語と知能
5 users, 1 mentions 2019/04/13 05:55