2022-06-15
検索において提案されている様々なクリックモデルはユーザーの関連性判断や行動パターンが同質的であるという仮定を置いている。今回、Click Model Personalization framework (CMP)を提案し、特定のユーザーやクエリにおいてパーソナライズすることで性能向上を達成した。
  • #Infomation Retrieval
2022-04-01
ロジスティック回帰における交差エントロピー誤差が凸関数であることの証明
  • #統計数理
2022-03-10
サービス開発作業をする上で毎回repositoryを設計する作業にだいぶ工数が取られると思い、今流行ってる技術を利用したモノレポを改めて整備しました。
  • #Web開発
2022-02-13
Notionで管理されているドキュメントをBlogとして公開するようにしました。フレームワークはNextJSを利用しています。
  • #Web開発
2022-02-04
implicit feedbackで利用される内積モデルにおける学習アルゴリズムやサンプリングアルゴリズムについてのサマリー
  • #論文読み
  • #Recommendation
2022-02-03
coordinate descent(座標降下法)は限られた単純なモデルにしか実用的ではない。効率的にimplicit feedback学習するための必要十分条件としてk-separableを紹介し、k-separable modelsのための汎用的なiCDを紹介する。iCDはMF,FM,tensor factorizationにも適用可能であることを示す。
  • #論文読み
  • #Recommendation
2022-01-28
近年、iALSを利用したMFは最新のモデルに対して競争力がなくなってきたという指摘がされている。この論文では、iALSにおける有用なTipsを紹介していく。過去に紹介された4つのベンチマーク論文についても、適切なチューニングを行えば高い性能を示すことができることを紹介する。
  • #論文読み
  • #Recommendation
2022-01-24
レコメンドにおけるニューラルネットモデル(ANN)が近年疑問視されているが、様々な比較において精度ばかりが注目されており、novelty, diversity, biasなどの重要な指標に関しての考察が十分になされていない。この論文ではNCF(NeuMF)とMFを比較する。MFはlong-tailに対してよりよい精度を示す一方で、NCFはitem-coverageや多様性において優れた点が確認された。また、テスト手法によるバイアス効果は存在するが、baselineの精度に影響を与えるほどのものではなかったことを確認した。
  • #論文読み
  • #Recommendation
2022-01-21
多くのレコメンドシステムにおいて暗黙のフィードバックを利用している。しかし、多くのノイズが含まれており、例えば、ECではクリックしたのに購入されない。購入後に悪いレビューが投稿されたり、返品されるという事象が見られる。 今回の研究では、新しい学習戦略であるAdaptive Denoising Training (ADT)を提案する。ADTは学習時のノイズとなるinteractionsを刈り取ることで、損失関数を最適化する。
  • #論文読み
  • #Recommendation
2022-01-14
協調フィルタリングにおいて、行列分解(e.g. MatrixFactorizaion)のようなEnbeddingに基づくレコメンドモデルは10年以上に渡って最先端を走ってきた。近年では、多層パーセプトロン(MLP)を用いた学習によって得られた類似度の活用が提案されている。このアプローチはNeural Collaborative Fitering(NCF)と呼ばれる。この研究ではNCFの論文実験を見直した。第一に、適切なハイパーパラメータを選択することで、単純な内積の学習がMLPを大幅に上回ることを示す。第二に、MLPは理論的にはいかなる関数にも近似できるが、MLPによる内積の学習は簡単ではないということを示す。最後に、production環境において内積モデルは効率的なアルゴリズムになりうるが、MLPベースの類似度は運用コストが高すぎると示す。内積モデルはよりよい選択になりうると結論付けた。
  • #論文読み
  • #Recommendation