TDMとは
TDM(テキストデータマイニング)は、検索、パターンの検出、関連性の発見、意味解析、研究などで必要となる価値ある情報を提供できるようにコンテンツがアイデアやニーズにどのように関連性があるのかを学ぶため、膨大なテキストやデータリソースを自動的に選択、分析するプロセスです。
シュプリンガー・ネイチャーは、新たな研究技法の重要性を認識し、イノベーションのサポートを目標としています。私たちは科学系出版物の増加とTDMソフトウェアツールの進歩に伴い、TDMを可能にするための、より形式化されたプロセスが必要となることを十分理解しており、研究者のため可能な限り単純化するよう日々努力を重ねています。 オープンアクセスで発表されるシュプリンガー・ネイチャーのジャーナル論文は増え続けています。シュプリンガー・ネイチャーのオープンアクセスコンテンツの多くはCC-byでライセンスされているため、通常こうした出版物には、制約なくTDMを実施することができます。 購読している学術機関の研究者向けTDMシュプリンガー・ネイチャーでは、購読されている雑誌や書籍には非商用研究目的であれば、学術機関経由で対象研究者にTDM権限を提供しています。 研究者は、購読中(およびオープンアクセス)のジャーナル論文および書籍をTDM目的でシュプリンガー・ネイチャーのコンテンツ・プラットフォームからダウンロードいただけます。必要な論文の選定には、PubMedやWeb of Scienceのほか、シュプリンガー・ネイチャーのMetadata APIなど、既存の検索方法やツールを用いて行うことができます。研究者がシュプリンガー・ネイチャーのTDM APIを使用したい場合に限り、APIキーが必要となります。 | 研究者は、TDMプロジェクトの期間中、適切な措置を講じることでダウンロードコンテンツのセキュリティを維持しながら、コンテンツを安全な内部サーバーに保存し、第三者がアクセスできない状態にする必要があります。 ダウンロードについて十分考慮し、ダウンロードを適切な回数に制限することで、シュプリンガー・ネイチャーのシステムおよびサーバーに過度の負荷をかけないようご注意ください。 学術機関および行政機関向けTDM購読中の学術機関および行政機関は、シュプリンガー・ネイチャーの標準TDM条項に従い、追加費用なしで、すべての新規および更新購読契約にTDM権限を含めることができます。既存の購読者も、契約更新時期以前に同じ条項に従い、TDM権限を追加することができます。 シュプリンガー・ネイチャーのTDM APIの使用には追加費用が発生します。 企業向けTDM(商用研究目的)シュプリンガー・ネイチャーでは、商用研究目的のTDMについて標準TDM条項のほか、TDM APIを有料で提供しています。この場合、非商用研究の制約は適用されません。 企業のお客様による有料のご利用についてはこちらまでメールにてお問合せ下さい。 なお、Copyright Clearance Centerではシュプリンガー・ネイチャーを含む25のSTM出版社発行の出版物を網羅したテキストマイニング・ソリューションを提供しています。 |
購読者向けTDMシュプリンガー・ネイチャーでは、メタデータAPIやフルテキストAPIなど、非常に多彩なTDMツールを購読者に用意しており、オープンアクセスリソースおよび購読中のリソースでご使用いただけます。 非購読者向けTDM非購読者には、オープンアクセス・フルテキストAPI (https://api.springernature.com)など、オープンアクセスリソースのための多彩なTDMツールを用意しています。ペイウォール・コンテンツへアクセスする際のTDM要件には適宜対応しています。
オープンアクセスコンテンツ用TDMオープンアクセスコンテンツには、強力なオープンアクセス・フルテキストAPI (https://api.springernature.com)を提供しています。オープンアクセスAPIを通じ、BioMed CentralやSpringerOpenジャーナルなど、シュプリンガー・ネイチャー オープンアクセスXMLの500,000件以上のオンライン文書のメタデータやフルテキスト・コンテンツを提供します。 | イメージマイニングについて現在、シュプリンガー・ネイチャーではイメージマイニング向けのAPIは提供しておりません。 論証マイニング(argumentation mining)について“論証マイニングでは、テキスト内の議論の自動的な検出、分類、構造化を目的としています。そのため論証マイニングは、一連の議論の内容、言語構造、前後の議論との関係、内在する概念的な信条の認識、さらに特定のトピックの包括的な一貫性の下での理解といった、完全な議論分析にとって重要な要素となります。” (Mochales, R. & Moens, MF. Artif Intell Law (2011) 19: 1. https://doi.org/10.1007/s10506-010-9104-x) 論証マイニングは、テキストマイニングのサブセットと考えることができます。論証マイニングプロジェクトで、非オープンアクセスコンテンツのローカルへの保存をご計画の場合は弊社までお問い合わせください。オプションについてご提示いたします。 |
APIシュプリンガー・ネイチャーでは、TDM活動を支援するための様々なAPIを用意しています。
弊社が提供するAPIの詳細、サンプル、APIキーサインアップの方法などについては、下記をご覧ください: | メタデータ・デリバリーシュプリンガー・ネイチャーでは、JATS、Dublin Core、ONIX、MARCレコードなど、様々な形式のダイレクトメタデータ・デリバリーオプションを提供しており、メタデータ・ハーベスティング(OAI-PMH)を含む、様々なプロトコル(ftp/ftps、sftp)が使用されています。 メタデータ・ダウンローダを介したダイレクトメタデータ・ダウンロード機能については下記をご参照ください: |
シュプリンガー・ネイチャーは、Crossref TDMワーキンググループに参加しており、全出版社のTDMを対象としたCrossrefサービスを推奨しています。
詳細については、 http://tdmsupport.crossref.org/ をご覧ください。
Springer Nature SciGraphは、シュプリンガー・ネイチャーおよび学術領域の主要パートナーが保有するデータソースを集約する、シュプリンガー・ネイチャーのリンクトオープンデータ機能です。リンクトオープンデータ・プラットフォームは、資金提供者、研究プロジェクト、会議、アフィリエーション、出版物など、研究分野を横断して情報を照合します。
あらゆるシュプリンガー・ネイチャー の論文、書籍、章、会議情報のデータを様々なフォーマット(JSONLD、NTriples、Turtle、RDF/XML)でリリースしました (参考 http://www.springernature.com/scigraph)。TDM目的でも再利用が可能です。
TDM(Text and Data Mining)は、検索、パターンの検出、関連性の発見、意味解析、研究などで必要となる価値ある情報を提供できるようにコンテンツがアイデアやニーズにどのように関連性があるのかを学ぶため、膨大なテキストやデータリソースを自動的に選択、分析するプロセスです。 “論証マイニングでは、テキスト内の議論の自動的な検出、分類、構造化を目的としています。そのため論証マイニングは、一連の議論の内容、言語構造、前後の議論との関係、内在する概念的な信条の認識、さらに特定のトピックの包括的な一貫性の下での理解といった、完全な議論分析にとって重要な要素となります。” (Mochales, R. & Moens, MF. Artif Intell Law (2011) 19: 1. https://doi.org/10.1007/s10506-010-9104-x) Springer Nature SciGraphは、シュプリンガー・ネイチャーおよび学術領域の主要パートナーが保有するデータソースを集約する、シュプリンガー・ネイチャーのリンクトオープンデータ機能です。 | “APIはアプリケーション・プログラミング・インターフェイスの略語です。APIは、ビジネスサービスや企業資産をアプリケーション開発者に公開し、利用できるようにします。アプリケーションは、スマートフォン、タブレット、キオスク、ゲーム機、コネクテッドカーなど、様々なデバイスにインストールしてアクセスすることができます。APIの例として、地図上で所定の場所を探すためのGoogle Maps API、ゲームやコンテンツ共有のためのFacebook API、製品情報を提供するAmazon APIなどがあります。開発者は、これらのAPIを用いることで、同じホテルに対するそれぞれの旅行会社の価格を比較し表示する、優れた革新的なアプリの構築が可能です。ユーザーは、十分な情報を得たうえで決定を下し、もっとも優れた提案をした会社を通じてホテルに予約を入れます。これによりユーザーは、自分で比較を行うことなく、全体的なエクスペリエンスを向上させることができます。このようにAPIは優れたユーザーエクスペリエンスの提供に貢献します。"(De B. (2017) API Management. Apress, Berkeley, CA. https://doi.org/10.1007/978-1-4842-1305-6) “APIキーは、APIを用いてアプリケーションを識別し、アプリを認証するシンプルなメカニズムを提供します。APIキーは、APIによりどのアプリケーションがAPIを使用しているかを判別します。APIキーは一般的に、長く連なったランダムな文字であり、通常HTTPクエリパラメータまたはヘッダーとして渡されるため、アプリケーション認証のAPI要求で簡単に使用することができます。APIキーは、アプリID、クライアントID、アプリ・キー、コンシューマ・キーなどの名称でも知られています。” (De B. (2017) API Management. Apress, Berkeley, CA. https://doi.org/10.1007/978-1-4842-1305-6) “XML (Extensible Markup Language) は、ツリー構造を用いてデータをモデリングする標準規格です。ドキュメント構造を定義する規則で構成されており、定義済みの構造と整合性のあるデータを保管できるようになっています。そのためXMLは、実際のドキュメントがどのように処理されるかについて記述する必要のない、データ構造の定義のためのフレームワークです。” (Lupp M. (2008) Extensible Markup Language. In: Encyclopedia of GIS. Springer, Boston, MA. https://doi.org/10.1007/978-0-387-35973-1) | “IE(Information extraction)は、文書や音声転写から事前に指定したファクトを抽出し、それらを構造化表現(データベースなど)に変換するタスクです。” (Ji H. (2009) Information Extraction. In: LIU L., ÖZSU M.T. (eds) Encyclopedia of Database Systems. Springer, Boston, MA. https://doi.org/10.1007/978-0-387-39940-9) “NLP(Natural Language Processing)は、人間の言語の理解と生成のための計算法およびアルゴリズムの開発を目的としています。” (Rus V. (2013) Natural Language Processing. In: Runehov A.L.C., Oviedo L. (eds) Encyclopedia of Sciences and Religions. Springer, Dordrecht. https://doi.org/10.1007/978-1-4020-8265-8) “XML解析は、XML文書を読み込み、その文書にアクセスするためのインターフェイスをユーザーのアプリケーションに提供するプロセスです。” (Li C. (2009) XML Parsing, SAX/DOM. In: LIU L., ÖZSU M.T. (eds) Encyclopedia of Database Systems. Springer, Boston, MA. https://doi.org/10.1007/978-0-387-39940-9) |
TDMに関するお問合せはこちら