固有表現抽出 - こゆうひょうげんちゅうしゅつ
固有表現抽出とは、大量のテキストという名のジャングルから人名や地名、組織名といった特権階級を収穫し、人間の言語が管理可能だと錯覚させるデジタルの狩猟術。多くの場合、抽出結果はブラックボックスと化し、誰もその精度を真に理解できない。実務では「もうちょっとチューニングでどうにかなる」という魔法の言葉と共に、ひたすらパラメータがいじり倒される。時には、見落とされていた珍妙な固有表現が漏れ出し、システムの信用を一瞬で破壊する爆弾となる。結局、データサイエンティストは朝までログと戦いながら「人の名前ごときにこんな苦労して…」と嘆く羽目になる。