単語埋め込みと名詞句の共起グラフを用いた教師なしキーフレーズ抽出手法の提案
雑誌・プロシーディングス名: 情報処理学会研究報告
国名(英語): Online
言語: Japanese
Vol.: 2020-IFAT-140
No.: 2
出版年: 2020
出版月: 9
出版日: 2020-09-05
概要
近年,BERT をはじめとする事前学習済みの言語モデルの登場によって,大量の外部情報を容易に 扱うことができるようになった.この言語モデルを用いた手法は,自然言語処理の他タスクと比べて精度 が低いと言われているキーフレーズ抽出の分野でも有効であることが示されている.先行研究では,キー フレーズが入力テキストを要約する語句であることに着目し,入力テキスト全体の分散表現に類似する表 現を持つ名詞句をキーフレーズとする手法が提案されてきた.しかしこの手法では,キーフレーズ抽出に おいて重要な特徴として考えられてきた各名詞句間の共起を考慮することはできない.また,各名詞句を ノード,それらが共起する関係をエッジとしたグラフから,キーフレーズらしさの値を算出する研究では, 名詞句自体の意味は考慮されていない.そこで本研究では,単語埋め込みと共起グラフの両方を考慮した キーフレーズ抽出手法を提案する.具体的には,入力テキストに出現する名詞句間の共起と,各名詞句と 入力テキストとの意味的類似度を基にエッジの重みを算出した重み付けグラフを構築し,グラフ内の名詞 句に対し,TextRank を用いてキーフレーズらしさの値を算出する.
引用情報
木村 優介, 楠 和馬, 寺本 優香, 波多野 賢治, 単語埋め込みと名詞句の共起グラフを用いた教師なしキーフレーズ抽出手法の提案, 情報処理学会研究報告, Vol.2020-IFAT-140, No.2, 2020-09-05.