- @ThothChildren
- 2018.9.11
- PV 445
コンテンツベースフィルタリングとは
ー 概要 ー
コンテンツベースフィルタリング(内容ベースフィルタリング)は、対象の商品またはアイテムの特徴量と、ユーザプロファイル(嗜好の傾向)の特徴量を算出しおすすめ商品を求めるフィルタリング技術.アイテムにはあらかじめ特徴的なキーワードを割り当てておく.ユーザの行動やアイテムの閲覧履歴等を参考にユーザの嗜好の特徴量をアイテムに記されているキーワード等から構築していく.ユーザの事前の情報がなくともある程度推薦を出せる.ユーザの嗜好の変化に合わせることや同じようなものばかりにならないようにすることがポイント.
この章を学ぶ前に必要な知識
条件
- 商品・アイテムにテキストキーワードベースの情報が付与されている
効果
- ユーザの嗜好に基づいてコンテンツの推薦を行う
ポイント
- ユーザの情報が少なくともある程度商品を推薦できる
- ユーザの好みのモデルを用意したり、行動履歴などを利用してユーザのプロファイルを作成する
- ユーザの好みの特徴量とコンテンツの特徴量を用いる
- これまでの履歴に基づく好みに基づいて推薦するため、同じジャンルの中でしか推薦できない
解 説
コンテンツベースフィルタリング(内容ベースフィルタリング)は、対象の商品またはアイテムの特徴量と、ユーザプロファイル(嗜好の傾向)の特徴量を算出しおすすめ商品を求めるフィルタリング技術.特徴量はテキストベースで記述されることが多く、何らかのキーワードで特徴を書き出し、それらを特徴量ベクトルとする.
アイテムにはあらかじめ特徴的なキーワードを割り当てておく.ユーザの行動やアイテムの閲覧履歴等を参考にアイテムに記されているキーワード等からユーザの嗜好の特徴量を構築していく.ユーザの事前の情報がなくとも少しの調査を行うかキーワードをもらえれば、ある程度の精度の推薦を出すことはできる.
時間経過とともに気をつける点として、
・ユーザの嗜好の変化に合わせること
・同じようなものばかりにならないようにすること
があげられる.
特に後者の「同じようなものばかりを推薦する」というのは、このコンテンツベースフィルタリングでは起こりやすい.同様のジャンルからおすすめをあげるため、新しいものと出会う機会を失いやすい.その点「協調フィルタリング」を用いた場合はそのようなことになりにくい. | コンテンツベースフィルタリングとは |
コンテンツベースフィルタリングの概念図.
複数のコンテンツが「スポーツ」や「技術」、「エンタメ」で特徴付けられており、ユーザの特徴量に応じてもっとも類似度の高いコンテンツBを推薦する.
類似度の計算は様々な方法があるが、コサイン類似度などが用いられる. | |
コサイン類似度に関しては右のリンクを参照ください. | コサイン類似度でベクトル間距離を求める |
協調フィルタリングでは、右のアイテム間協調フィルタリングが有名. | アイテム間協調フィルタリング |
この章を学んで新たに学べる
Comments
Reasons
知識: アイテム間協調フィルタリング
アイテム間協調フィルタリング(Item-Item Collaborative Filtering)は、ユーザの購買履歴や評価の履歴を元に類似した評価を持つ商品を見つけ出し、ユーザにおすすめするフィルタリング技術.Amazonによって発表された手法で、ユーザベース協調フィルタリングより、「ユーザ数がアイテム数より多い時にもよい」「アイテムの類似度は変わりにくいため更新頻度が少ない」といった点が有利.