LDAを用いたカテゴリ変数からの特徴抽出 - sola

kaggleのTalkingData AdTracking Fraud Detection Challengeで1位になったチームの解法の1つである、トピックモデルを用いたカテゴリからの特徴抽出を試してみたので紹介します。 Pythonでの実装はこちらです。 github.com 概要 参考にしたのは、kaggleでの解説とリクルートコミュニケーションズさんのブログでの解説です。 やろうとしていることは、トピックモデルを考えて2つのカテゴリ変数の共起度から潜在トピックを推定し、それを新規の特徴量として用いるということです。 トピックを抽出する方法として、LDA (Latent Dirichle…

Keywords: lda
Date: 2019/05/23 11:00

Related Entries

Read more GitHub - nzw0301/numba-lda
Read more Yuta Kashino on Twitter: "[1804.08711] All-Optical Machine Learning Using Diffractive Deep Neural Ne...
Read more GitHub - Microsoft/LightLDA: Scalable, fast, and lightweight system for large-scale topic modeling
Read more 論文コーパスの次元圧縮とLDAによるトピックの関係の可視化 - xiangze's sparse blog
Read more GitHub - ldanai/tidymodel: Make it easy to build models and evaluate model quality