論文紹介: SentencePieceの原著論文+α - radiology-nlp’s blog

はじめに 2018年に登場したニューラル言語処理のための教師なしサブワード分割モジュール,SentencePiece。 開発意図や仕様を確認するために原著論文を読みました。 github.com 論文は2018年8月にarXivに投稿されています。 arxiv.org 著者・開発者はMeCab開発者でもある工藤拓さん。自然言語処理に関心のある方で知らない人はいないでしょう。 github.com 1冊まるごと形態素解析という驚異的な本も執筆されています。 形態素解析の理論と実装 (実践・自然言語処理シリーズ)作者: 工藤拓,言語処理学会出版社/メーカー: 近代科学社発売日: 2018/10/0…

2 mentions: @iBotamon@roy29fuku
Date: 2019/08/07 12:58

Referring Tweets

@iBotamon ブログを更新しました。やはりSentencePieceは単なる前処理マシンではなく,epoch毎に実行しなおすのが正しい使い方のように思えます。 https://t.co/Je5DukVNYY
@roy29fuku > ニューラルネットワークの訓練のEpochごとに毎回実行しなおす なるほど。まさに単なる前処理と捉えてた🙅‍♂️ 端的でわかりやすかった。 論文紹介: SentencePieceの原著論文+α - radiology-nlp’s blog https://t.co/Acgmwy3ZQg

Related Entries

Read more Deep Learning for NLP Best Practices
Read more Goodfellow先生おすすめのGAN論文6つを紹介
Read more Deep Learningを用いた教師なし画像検査の論文調査 GAN/SVM/Autoencoderとか .pdf
Read more 100 Must-Read NLP Papers | This is a list of 100 important natural language processing (NLP) papers ...
Read more COTA: Improving Uber Customer Care with NLP & Machine Learning