シュプリンガーネイチャー、初の機械生成書籍を出版

2019年4月、シュプリンガーネイチャーは化学分野において機械生成書籍、Lithium-Ion Batteriesを出版しました。これは、急成長を見せるリチウムイオン電池関連の多数の研究論文を横断的に集積した自動要約に基づいて、最新の研究概要を取りまとめたものです。シュプリンガーネイチャーとドイツのフランクフルトにあるゲーテ大学の研究者の協力のもと、1年半の歳月をかけてアルゴリズムが開発されました1) 

New Content Item (1)
プロジェクト責任者であるシュプリンガーネイチャーのDirector Product & Metadata Management、Henning Schoenenbergerに、機械生成書籍を制作した理由と、今後の学術出版のコンテンツ制作に与える影響について聞きました。

さらに、番外編としてこの機械生成書籍を日本でご紹介した際のお客様からのフィードバックもまとめました。合わせてご覧ください。

1. 機械生成書籍出版の経緯

機械生成書籍について、また、機械生成書籍出版の経緯について説明してください。

機械生成書籍とは、コンピューター処理によって自動的に生成された書籍です。既存のコンテンツやデータリソースに基づいて、アルゴリズムがコンテンツを再構築したり新たに生成したりします。アルゴリズムは書籍で扱う内容を決める一連のパラメーターに基づいて実行されます。
自然言語生成は急速に進化しており、人工知能関連技術によって、科学的コンテンツ自動生成という有望な可能性が生み出されています。私たちは現在の技術レベルを検証するため、1年半前にゲーテ大学のApplied Computational Linguistics labと共同研究を開始しました。今回、初の機械生成書籍を出版したことで、この分野における一つのマイルストーンに到達したと言えるでしょう。
このプロトタイプの出版を通じて、私たちは機械生成による研究コンテンツの可能性と限界を探ることを目指しています。技術が進歩する中、機械生成コンテンツが学術出版にもたらす可能性、意義、潜在的リスクについて、広く議論を喚起することが主な目的です。潜在的な意義を考慮しながら新たな出版のフレームワークを提供することは、世界的な出版社である私たちの責任だと考えています。こうした議論を行うには今が最適のタイミングでしょう。

2. 機械生成書籍と、人による書籍の違い

機械生成書籍と人間が執筆した書籍にはどのような違いがあるのでしょうか。

今回のプロトタイプは研究者、New Content Item専門家、学生に情報を伝える新たな方法を模索しています。最新のコンピュータアルゴリズムを用いて、SpringerLinkで閲覧できるシュプリンガーネイチャーの出版物から関連のあるものを選び、トピック順に並べ替えて、論文の簡潔な要約を作成しました。整合性のある章や節に対して類似性に基づくクラスター化処理を行い、最新論文の横断的な自動要約を作成したのです。
人間が執筆する書籍に比べ、機械生成書籍のテキスト作成プロセスははるかに速く、極めて短期間で概要、レビュー、新たな洞察を提供することができます。

3. 機械生成書籍がもたらすベネフィット

化学分野における最新研究の概要はグーグルなどの検索エンジンを利用して入手することもできますが、機械生成書籍は学生と研究者にどのようなメリットがあるのでしょうか。

機械生成書籍は膨大な数の論文から構造化された抄録で、この分野において氾濫している情報を効率的に管理するうえで研究者や学生に役立ててもらうことを目的に作成されています。検索エンジンを利用する際、ユーザーが直面し、解決しなければならない主な課題のひとつが情報の管理です。機械生成書籍であれば、大量の文献を読むことなく、信頼できる要約を得ることができます。また、読者は必要に応じてオリジナルソースのドキュメントを簡単に特定・確認し、必要なトピックをさらに詳しく調べることもできます。検索エンジンの結果は信頼性のある情報かどうかの判断が難しいですが、機械生成書籍を読めば、シュプリンガーネイチャーのコンテンツプラットフォームであるSpringerLinkに掲載されている情報を得ることができますし、これらはすべて科学的な精査に耐えうる信頼性のある情報に限られています。
この新しい技術をさらに応用するための取り組みも進めています。研究件数とデータ量が急速に増える中、研究者がより速く、より完全な形で関連する研究を抽出できるような仕組みを提供できる日も近いかもしれません。

4. 機械生成技術が学術出版プロセスにもたらす影響

機械生成コンテンツは、今後、学術出版のコンテンツ制作プロセスにどのような影響を与えるでしょうか。

将来的にはコンテンツ制作の選択肢が増えると考えています。最初からから最後まで人間の手で創り出されたコンテンツから、人間と機械の両方がさまざまに関与して作られた融合型のテキスト、さらには完全に機械によって生成されたテキストまで、さまざまなタイプが登場するでしょう。学術出版において、研究者は執筆者として今後も重要な役割を果たすと思いますが、多くのコンテンツがアルゴリズムによって生成されるようになれば、研究者の役割は大きく変わる可能性があります。ある意味、機械生成コンテンツの発展は、過去数百年にわたって進められてきた製造業のオートメーション化とさほど変わりはないでしょう。製造業の場合、オートメーション化によって工場労働者が減ると同時に、設計者が増える結果となってきました。現段階で今後の進展を予想するのは困難ですが、おそらく科学コンテンツ制作においても同様に、執筆者が減ってテキスト設計者が増えていくのではないでしょうか。
シュプリンガーネイチャーは化学分野での経験をもとに、今後、他の分野でもパイロットプロジェクトを立ち上げる計画です。当社初の機械生成書籍は機械生成コンテンツのさらなる発展の基盤となり、学術出版の未来を築くうえで役立つ貴重な知識やフィードバックをもたらしてくれると思います。


【番外編】今後、機械生成書籍が日本の研究にどのような影響を与えうるのか?

第21回図書館総合展 教育・学術情報オープンサミット2019のフォーラムでは、機械生成書籍が出版された経緯や今後の展開について詳しく紹介された後、研究に与える影響について活発な議論がなされ、主に以下の通りまとめられました。

New Content Item

  • 新たなテクノロジーを通して、人間ができる以上の情報量を扱うようになる。また、横断的に効率よく、整理された情報を把握することができるようになる
  • 基礎研究において、まだ解明すべき問題に活用できる可能性がある
  • 研究者の行動の変化が考えられる。効率的な情報収集を通じて、本をいち早い研究成果の発表の場として活用できる可能性がある
  • 図書館が研究者のニーズや動向をより早く把握し、提供すべき情報をより効率よく選択できるようになることで、ファカルティ・リエゾンとしての役割が強化される


参加者の皆様から頂いたご意見や感想を一部ご紹介します。

  • AIが得意とする分野を知り、活用することで効率化される分野は多くあると思った
  • AI等の最新技術が学術コミュニティに寄与できる可能性を具体的に挙げており、興味深かった
  • eBookの出版に対する技術的、意識的変化が今後の情報のあり方をどのように変えていくのかを想像することができ、とても興味深かった
  • 研究におけるBookの意義・可能性を明確に説明された
  • 情報過多の時代において人の力で情報収集が難しくなっていること、そのためにAIの力を借りるという点に興味を持った

また図書館が今後取り組むべきこととして以下のアイデアをお寄せいただきました。

  • 1. 研究者のニーズを把握する  2. 最新の技術情報を集め、できる所は取り入れる  3. 技術の活用によって効率化できるところを見極める
  • 研究データ管理(オープンサイエンス)、AIに与えるデータセット情報の評価、選書など
  • 研究のライフサイクルに必要な情報を網羅的に収集し整理する
  • 研究者のニーズを収集の上、整理しどう研究力強化につなげるかを主導的に検討推進すること 
  • 出された情報の整理、違う角度からの指標の提示など

フォーラムの詳しい内容はNatureダイジェストのイベントレポートおよび動画2)でご覧いただけます。


1) プレスリリース

2) 動画:第21回図書館総合展 教育・学術情報オープンサミット2019

「高等教育における電子書籍のこれまでと未来 -大学の研究力強化にどう貢献できるか、そして図書館が果たす役割とは」

小泉周氏のインタビューはこちら