AIで記事要約をやってみた。3分ー5分かかっていた作業が瞬時に
信濃毎日新聞の配信サービス、富士通の独自技術でスピードアップ
私たちにとって非常に身近な存在である「新聞」。最近の新聞社は、伝統的な紙媒体に加え、WebニュースやSNSなど、様々な情報を配信している。記者の仕事は政治、経済、国際問題から教育、文化、スポーツの取材まで多岐にわたっている。情報の伝達にはスピードアップが求められる現代、記者は日々研鑽を積んで情報を配信している。
紙媒体以外のメディアにニュースを配信するプロセスには、主に「配信記事の選定」「メディア編集システムへの送信」「記事要約」「見出し作成」「校閲」の5つがある(注1)。
そのうち最も時間を要するのが「記事要約」。記事の重要部分を人間の目で判断しながら、メディアごとに異なる文字数で要約する必要があるため、作業には一定の時間と手間がかかってしまう。
従来の自動要約には、対象記事の冒頭から数文を抜粋していく「LEAD法」という手法がある。しかし、指定された文字列の範囲内で先頭から文を抽出してしまうため、重要な文章が中程や文末にある時は、抽出することができないケースがあった。重要部分を残しつつ、なおかつ短時間で自動要約したい―。このような作業は、実はAI(人工知能)の得意分野でもある。
(注1)信濃毎日新聞社様のCATV向けニュース配信サービスでのプロセスの例。
このほど、信濃毎日新聞社と富士通研究所は、信濃毎日新聞社が発信する記事をAIで自動要約する技術の実証実験を行った。記事配信サービスの中でも特にCATVに向けた「文字ニュース配信」の要約。
信濃毎日新聞の過去記事と、それらを配信サービス向けに人手で要約した約2,500セットの記事に、富士通研究所が開発した自然言語処理技術と機械学習を組み合わせてモデル化した。
「重要な単語を含む文」「文頭・文末に近い文」「多くの文と類似する文」を重要とみなし、「すなわち」「つまり」で始まる文には加点、「例えば」で始まる文は減点するなど、指標を決める。
これらを機械学習し、文単位で重要度を評価する「重要文抽出モデル」を構築する。これにより、記事の中程や文末からも重要な要素を抽出でき、人手と同じように精度の高い要約文を作成できる。
実証では、1件あたり3分~5分程度かかっていた記事要約作業を、瞬時に終えることができた。実際に導入できれば、従来の要約作業に比べて約5割の時間短縮が期待できる。
この自動要約システムを応用し、今後、CATV向け文字ニュースだけでなく、電光掲示板ニュースやSNSなど、様々なメディアで自動要約モデルを活用することも考えらる。
今後、富士通では、汎用性の高いAI機能をAPIとして提供するサービスを「FUJITSU Cloud Service K5 Zinraiプラットフォームサービス」の一部として提供し、自治体・製造・運輸・医療・メディアなど様々な分野で活用することを目指す。
-----------------------
この記事は、2018年3月28日にFUJITSU JOURNALに掲載されたものです。
記事要約をAIで瞬時に!ネット配信をスピードアップする技術
http://journal.jp.fujitsu.com/2018/03/28/01/
紙媒体以外のメディアにニュースを配信するプロセスには、主に「配信記事の選定」「メディア編集システムへの送信」「記事要約」「見出し作成」「校閲」の5つがある(注1)。
そのうち最も時間を要するのが「記事要約」。記事の重要部分を人間の目で判断しながら、メディアごとに異なる文字数で要約する必要があるため、作業には一定の時間と手間がかかってしまう。
従来の自動要約には、対象記事の冒頭から数文を抜粋していく「LEAD法」という手法がある。しかし、指定された文字列の範囲内で先頭から文を抽出してしまうため、重要な文章が中程や文末にある時は、抽出することができないケースがあった。重要部分を残しつつ、なおかつ短時間で自動要約したい―。このような作業は、実はAI(人工知能)の得意分野でもある。
(注1)信濃毎日新聞社様のCATV向けニュース配信サービスでのプロセスの例。
このほど、信濃毎日新聞社と富士通研究所は、信濃毎日新聞社が発信する記事をAIで自動要約する技術の実証実験を行った。記事配信サービスの中でも特にCATVに向けた「文字ニュース配信」の要約。
信濃毎日新聞の過去記事と、それらを配信サービス向けに人手で要約した約2,500セットの記事に、富士通研究所が開発した自然言語処理技術と機械学習を組み合わせてモデル化した。
「重要な単語を含む文」「文頭・文末に近い文」「多くの文と類似する文」を重要とみなし、「すなわち」「つまり」で始まる文には加点、「例えば」で始まる文は減点するなど、指標を決める。
これらを機械学習し、文単位で重要度を評価する「重要文抽出モデル」を構築する。これにより、記事の中程や文末からも重要な要素を抽出でき、人手と同じように精度の高い要約文を作成できる。
実証では、1件あたり3分~5分程度かかっていた記事要約作業を、瞬時に終えることができた。実際に導入できれば、従来の要約作業に比べて約5割の時間短縮が期待できる。
この自動要約システムを応用し、今後、CATV向け文字ニュースだけでなく、電光掲示板ニュースやSNSなど、様々なメディアで自動要約モデルを活用することも考えらる。
今後、富士通では、汎用性の高いAI機能をAPIとして提供するサービスを「FUJITSU Cloud Service K5 Zinraiプラットフォームサービス」の一部として提供し、自治体・製造・運輸・医療・メディアなど様々な分野で活用することを目指す。
-----------------------
この記事は、2018年3月28日にFUJITSU JOURNALに掲載されたものです。
記事要約をAIで瞬時に!ネット配信をスピードアップする技術
http://journal.jp.fujitsu.com/2018/03/28/01/