自然言語処理 ベクトル化の手法

自然言語処理 ベクトル化の手法

はじめに 文章を固定長ベクトルに変換する方法はないかなあと調べていたら、SentenseBertというものを見つけました.それ以外にもベクトル化にはいろいろな方法があるようで調べた内容を少しまとめてみようと思います. ベクトル化の用途 ベクトル化することによる応用の仕方はいろいろですが、文書ベクトルの応用としては以下のようなことが可能です. 類似文書の検索 文章間の類似度を測っておすすめの記事をレコメンド 画像検索エンジン(文章ベクトルと画像ベクトルの類似度を測る) さまざま手法 word2vecに始まり、自然言語の機械学習によるベクトル化のアルゴリズムは常に改良されてきました. いくつか有名なものをピックアップして紹介します. word2vec(2013) 米グーグの研究者、トマス、ミニコフらが開発しました。 周辺語から中心単語(CBOW), あるいは中心単語から周辺語(Skip-gram)を予測するニューラルネットワークを学習し、学習後の中間層の重みを単語ベクトルとして用いています。 (CBOWのイメージ) Distributed Representat

Date:

Bookmark Comments

id:misshiki

Related Entries

MLflowで機械学習パイプラインの管理(1)
Read more MLflowで機械学習パイプラインの管理(1)
0 users, 1 mentions 2022/10/30 09:08
並列処理を使った時系列モデル(Prophet)の作成 - Qiita
Read more 並列処理を使った時系列モデル(Prophet)の作成 - Qiita
1 users, 1 mentions 2022/11/06 03:09
データ分析:前処理編 - Qiita
Read more データ分析:前処理編 - Qiita
0 users, 2 mentions 2022/11/09 07:37
MLOps における機械学習モデルモニタリングについて - Qiita
Read more MLOps における機械学習モデルモニタリングについて - Qiita
1 users, 4 mentions 2022/12/15 12:09
世界最高精度の言語モデルLUKEをファインチューニングして公開してみた(Question-Answering, SQuAD) - Qiita
Read more 世界最高精度の言語モデルLUKEをファインチューニングして公開してみた(Question-Answering, SQuAD) - Qiita
1 users, 2 mentions 2023/01/07 10:37

ML-Newsについて

機械学習の技術に関する情報は流速も早いし、分野も多様でキャッチアップが大変です。Twitterで機械学習用のリストを作っても、普段は機械学習以外の話題が多く流れており、効率的に情報収集するのは困難です。

ML-NewsはSNSを情報源とした機械学習に特化したニュースサイトです。機械学習に関する論文ブログライブラリコンペティション発表資料勉強会などの最新の情報を効率的に収集できます。

機械学習を応用した自然言語処理、画像認識、情報検索などの分野の情報や機械学習で必要になるデータ基盤やMLOpsの話題もカバーしています。
安定したサイト運営のためにGitHub sponsorを募集しています。

お知らせ

  • 2021/12/31: デザインを刷新しました
  • 2021/04/08: 日本語Kaggleのカテゴリを新設しました