辛辞苑
  • ホーム
  • タグ
  • カテゴリー
  • このページについて
  • ja

#キーワード抽出

TF-IDF - てぃーえふあいでぃーえふ

TF-IDFとは、テキスト中の単語を数値化してえこひいきする魔法の秤。文書コーパスの広大さと頻出語のうるささを天秤にかけ、たかが単語をまるで王侯貴族扱いする技。単語が文書に何回現れるかと、コーパス全体でどれだけ珍しいかを掛け合わせるだけで、神々しく重要度を決定する。だが本質的には、ユーザに「数式を信じろ」と迫るだけの詐欺師の一種である。あらゆる文脈を無視して「数値だけが真実」と言い張る、デジタル時代のカルト信仰。

    l0w0l.info  • © 2026  •  辛辞苑