辛辞苑
ホーム
タグ
カテゴリー
このページについて
ja
#キーワード抽出
TF-IDF - てぃーえふあいでぃーえふ
TF-IDFとは、テキスト中の単語を数値化してえこひいきする魔法の秤。文書コーパスの広大さと頻出語のうるささを天秤にかけ、たかが単語をまるで王侯貴族扱いする技。単語が文書に何回現れるかと、コーパス全体でどれだけ珍しいかを掛け合わせるだけで、神々しく重要度を決定する。だが本質的には、ユーザに「数式を信じろ」と迫るだけの詐欺師の一種である。あらゆる文脈を無視して「数値だけが真実」と言い張る、デジタル時代のカルト信仰。