ユーザー事例

DataSpider Servista  >  ユーザー事例  >  独立行政法人 科学技術振興機構

独立行政法人 科学技術振興機構

多様なデータソースを集約する情報提供サイトで効率的な処理を実現


知の創出から研究成果の社会還元まで、我が国の科学技術基本計画の中枢的な実施機関である独立行政法人科学技術振興機構(略称JST)。その事業の一環と して、各種機関に蓄積された膨大な科学技術情報の活用するためのサービスを展開しています。JSTが進めるこうした文献や特許などの情報を集約・連携する サービス「J-GLOBAL」の構築にDataSpiderが採用されています。

2010-02-10

各分野バラバラだった情報サービスのハブを作り上げる

jst_p2.gif 我が国の科学技術基本計画の中枢的な実施機関として「新技術の創出に資する研究」「新技術の企業化開発」「科学技術情報の流通促進」「研究開発に係る交 流・支援」「科学技術理解増進」と、科学技術に関連した幅広い事業を手掛ける独立行政法人科学技術振興機構(略称JST)。

 

JSTは、前身である日本科学技術情報センターの時代から、文献情報、研究者情報、特許情報など、さまざまな科学技術情報を提供しています。これらのデー タベースは科学技術や医学などの文献情報を提供する「JDreamII」、研究成果展開総合データベース「J-STORE」、研究開発支援総合ディレクト リ「ReaD」といった数々のサービスとして展開しています。

 

そして2006年、こうした多様なデータベースを連携させるべく、新たな開発がスタートし、2009年3月に科学技術総合リンクセンター「J- GLOBAL」としてサービスを開始しました。 「科学技術の幅が広がり、一つの分野だけで解決できない課題も増えてきました。JSTの目的の一つである 『イノベーションを創出する』ためには、JSTをはじめ国内外の機関で各分野バラバラに提供されている情報サービスを結び、情報ハブとなるサービスを作り 上げなければならないと考えたのです」と、イノベーション推進本部研究基盤情報部情報整備課係長の黒沢努氏はその意義を説明しています。

jst_p3.gif

異種かつ大容量のデータ処理を自分たちで行うためのツール

jst_p4.gif J-GLOBALのシステムを作り上げる上で課題となったのが、形式の異なるデータの統合です。既存の各データベースは、それぞれのサービスに最適化され ているため、DBMSやデータベーススキーマが多岐にわたり、提供されるデータもtxtやcsvやXML、また、独自の形式など、使用する上ではさまざま な問題がありました。研究者名も、特許情報と科学論文では表記が異なっており、名寄せの必要がありました。

 

また、J-GLOBALは扱うデータ量も膨大です。2009年の時点では、数の多いものだけでも、文献は約600万件、特許は約200万件、化学物質名称 データベースが約260万件となっています。より新鮮なデータを提供するためには、この大量のデータを迅速に処理する必要があります。

 

加えてもう一つ、JSTの事情がありました。独立行政法人として、外部委託を行う際には一般競争入札が義務づけられているのです。

 

「単純に外部に委託すれば、データ処理のノウハウが特定の委託先に集約してしまい、他に委託することが困難になってしまいます。それを避けるため、私たち の側で詳細な技術仕様を策定し、細部まで理解できるシステムが必須だったのです」(黒沢氏) 黒沢氏らは情報連携ツールの比較検討を重ねた末、 DataSpiderの採用を決定しました。

 

「最終的には2つの製品を比較し、それぞれの営業担当から説明を受けました。アプレッソは回答が素早く、説明も分かりやすく、私たちが欲している製品だと いうことが理解できました。DataSpiderはプログラムをスクラッチで開発する必要がなく、短期間でのデータ変換も可能でした。データ構造の確認や テストも迅速で、イメージ図もどことなくJ-GLOBALに似たところがあって親近感を覚えました」

 

試行錯誤を繰り返した後にエキスパートの支援で公開へ

jst_p6.gif こうして、J-GLOBALの開発がスタートしました。プロトタイプを作りながら、DataSpiderの活用法を探っていったそうです。

 

若干の苦労があったものの、黒沢氏らはプロトタイプで動作を確認しつつ、J-GLOBALの基本的な処理手順の開発を進めていきました。そして、基本的な 構成ができあがってきたところで、新たな段階に入ります。今後のスクリプト開発を容易にし、技術を継承するためにスクリプトの標準化や性能向上を進めるこ とにしたのです。

 

「将来に向けたマニュアル化に備えて、標準化の必要を感じていました。また、私たちが手探りで作ったスクリプトが本当に適切か不安もありました。そこで、 アプレッソに相談し、DataSpiderのエキスパートを紹介してもらい、支援を受けることにしました」(黒沢氏)

 

支援に加わったのは、アプレッソの開発パートナーである株式会社メディアフォースの事業推進室長、松本一生氏でした。 「まずは、ディレクトリ構造や命名 規則、処理順序などを標準化しました。それから、公開へ向けて処理性能を向上するためスクリプト改良に携わり、中には、2週間近くかかっていた処理を 3~4時間と飛躍的に短縮する改善も実現しました。さらに現在、運用支援も行っています。システムインテグレータとしてのエッセンスを提供した、というと ころですね」(松本氏)

今後さらに改良を加えより充実したサービスを目指す

 jst_p5.gifJ-GLOBALは2009年3月、2度の調査とプロトタイプ開発を経て、β版としてリリースされました。

 

J-GLOBALは各種データベースから更新された情報を受け取り、バッチ処理で反映、毎週月曜に更新しています。更新処理を担当するイノベーション推進 本部研究基盤情報部情報整備課の関本和美氏は次のように説明します。

 

「バッチ処理そのものは順調ですね。出勤してきて処理を開始したら他の作業をして、終わったところで確認するようにしています」(関本氏)

 

また、J-GLOBALで扱う情報の拡充も進められています。2009年10月からは、第二期として半年間の追加開発に取り組んでおり、同12月中旬に は、当初の公開時点よりデータ量が2倍ほどになる予定です。

そして、使い勝手の向上も課題の一つです。これはJ-GLOBALに限ったことではなく、例えばReaDでは本人が自発的に更新する仕組みになっているこ とから、登録・更新作業をより容易に行えるようにして、データの鮮度や精度を高めることが求められています。

 

「例えば業績の登録をする際、その研究者の情報を文献や特許の情報ソースから抽出し、候補として示すような仕組みを考えていますが、DataSpider を活用して進めていきたいですね」と、イノベーション推進本部研究基盤情報部情報整備課係長の関根基樹氏は言います。J-GLOBALは単なる情報集約サ イトでなく、逆にデータ提供元となっているデータベースへのフィードバックも考慮されているのです。

 

「情報を複合することで、新しいものが見えてきます。例えば、注目する技術や分野が今後伸びるかどうか、文献や特許をはじめとするさまざまなリソースを複 合した時系列推移から、類推することが可能だと思っています。今後もDataSpiderを活用して、統合された科学技術情報の発信に努めていきたいです ね」(黒沢氏)


 

※2009年10月の内容に基づいて作成しています。

PDF ダウンロード

お客様情報

独立行政法人 科学技術振興機構

DataSpider® 販売

株式会社日本システムディベロップメント

  • 本 社 東京都新宿区西新宿2-7-1 新宿第一生命ビル16F
  • お問合わせ TEL:03-3342-1200

DataSpider® サポート支援

株式会社メディアフォース

  • 本 社 東京都新宿区下落合2丁目3-18 SKビル5F
  • お問合わせ TEL:03-5988-2010

お問合わせ・資料請求

製品に関するお問合わせ、資料請求はアプレッソまたは販売代理店まで
お気軽にお問合わせください。

株式会社アプレッソ
営業統括部 TEL. 03-4321-1111(代表)

Webフォームからのお問合わせ お問合わせフォーム

DataSpider Servista 販売代理店 販売代理店一覧