超巨大高性能モデルGPT-3の到達点とその限界. この記事では、超巨大言語モデルGPT-3の技術的な解説、GPT-3達成したことと… | by akira | Jul, 2020 | Medium

超巨大高性能モデルGPT-3の到達点とその限界. この記事では、超巨大言語モデルGPT-3の技術的な解説、GPT-3達成したことと… | by akira | Jul, 2020 | Medium

この記事では、超巨大言語モデルGPT-3の技術的な解説、GPT-3達成したことと、GPT-3でもできなかったこと、の3つに関して解説します。

45 mentions: @AkiraTOSEI@icoxfog417@y8o@todesking@koshian@kosukearima@yobata_tw@burabura_117
Date: 2020/07/24 03:28

Referring Tweets

@AkiraTOSEI ブログ更新しました。最近話題のGPT-3の解説です。GPT-3がすごいことは周知の通りですが、それでも出来ないことがチラホラあり、著者たちが述べている巨大化した言語モデルの限界点に関しても記載しています。 t.co/mkuSzMXo0B
@icoxfog417 OpenAIでβ版のAPIが限定公開され界隈をにぎわせているGPT-3について元論文を丁寧になぞり解説した記事。翻訳Few-shotでたまに教師ありを超える、文書生成で人間がほぼ判別できないなど強力な生成能力を持つ反面、QA/文間関係推論などを苦手としている。 t.co/f5yuZ16pzT
@kosukearima GPT-3の分かりやすい技術解説。ビジネス寄りの人は「GPT-3で上手くいかないタスク」以降を読むと収穫高大きいかもしれません。 しかし、fine-tuningに"Traditional"という形容詞がもうついてるとは・・笑 t.co/nVVHVjnVu0
@burabura_117 ざっくりまとまっていてよかった。しかしもはやちょっとしたR&D部門程度ではおこぼれを使うぐらいしかできないな… / t.co/k0cOdFrVnF

Related Entries

Read more 機械学習モデルの判断根拠の説明(Ver.2)
0 users, 60 mentions 2020/01/29 15:51
Read more 低レベルAPIユーザーのためのTensorFlow2.0入門 - Qiita
0 users, 6 mentions 2020/02/28 23:21
Read more GitHub - akirakubo/bert-japanese-aozora: Japanese BERT trained on Aozora Bunko and Wikipedia, pre-to...
0 users, 0 mentions 2020/03/14 08:21
Read more GitHub - yusukeurakami/dreamer-pytorch: pytorch-implementation of Dreamer (Model-based Image RL Algo...
0 users, 0 mentions 2020/06/26 12:52