研究シーズの内容
好みの小説を探そうとしても、現状のシステムで「仲間を増やして悪と戦う話が読みたい」といったプロットに基づく検索は難しい。そもそも仲間や悪とは何なのか、戦うというのは何を指しているのかといったことがコンピュータには理解できない。しかし【殴る】という動詞があることや「殴る」のように【攻撃を意図する単語】の集合といったことは用意できる。これらを用いることで、ある程度の「コンピュータなりに関係性を把握する」ことができる。前述した方法は単なる単語マッチングに近いが、これを更に一歩進めて「誰が誰に対して攻撃したのか」といった登場人物間の関係性推定に取り組んだのが本研究である。基本的には攻撃性のある単語一覧を用意し、その単語と登場人物との間に存在する係り受け関係を元に推定するモデルを構築する。精度はまだ低く、自然言語処理についてのタスクもあるが、敵対関係にある人物を一定程度推定できるようになった。本研究室ではこれらのタスクを前提とした応用タスクに取り組んでおり、補正や改善の可能性について模索している。
実用化イメージ
・プロット類似に基づく情報検索
・機械学習を用いたクラスタ抽出
・関連情報の抽出・推薦
関連する特許や論文等
神谷美希・當間愛晃:小説プロット推定のための敵対関係判定に関する基礎研究、IPSJ80(第80回情報処理学会全国大会)、2018