最近,RDFを書き始めました。セマンティックWebプログラミングの本を読んだり,ググったりはしているのですが, 調べきれていないこともありそうに思い,また,時代は進歩しているに違いないという思いから,質問させて頂きました。 1.RDF化に便利なツールについて私は疾患や薬に関するデータをRDF化しているのですが,皆さんはどんなツールを使ってRDF化していますか? 今回はあまり,データ数が多くない表形式のデータなので,こちらを参考にして,Google Refineを使って今はRDF化しています。 データが多くなった時には,プログラムで生成させるのが妥当だとも思うのですが, 皆さんが使用している便利なRDF化ツールがありましたら,教えてください。 2. 疾患・創薬のRDFについて主にprefixとpredicateの検索に関してなのですが,皆さんはprefixやpredicateを主にどこから検索して使用していますか? 私はBio2RDFを調べたり,今回RDF化したいデータは薬に関するデータなので,drugbankの例を見たりしているのですが, 有用なサイトを御存知でしたら教えてください。 他にもこのサイトを参照にすると便利だよ,であるとか,あなた,これは必須よ!的なサイトがありましたら,教えてください。
This 質問 is marked "community wiki".
|
1.のRDF化ツールについて、私はこれまで変換用のプログラムを都度都度自分で書いていたので詳しく説明できませんが、RDF化ツールは幾つかあります。 特に生命科学分野ならば Health Care and Life Science (HCLS) Linked Data Guide を参考にすると良いと思います。 これと同じくSemantic Web for Health Care and Life Sciences Interest Group (HCLSIG) がまとめているツールリストもあります。 身近なところでは、TogoDB、BioInterchange、Link Dataがありますね。RDBに収められているデータをRDF形式やSPARQLクエリで取得するのには、D2R Serverが比較的広く使われている印象があります。 |
2の方についてです。 薬のデータのRDF化についてでしたら、Linked Open Drug Data (LODD)、 OpenPHACTS と ChEMBL-RDF が参考になると思います。 OpenPHACTは資料が豊富なので、それらを読むと良いと思います。 ChEMBL-RDFは http://chembl.blogspot.jp/search?q=ChEMBL-RDF あたりを読むとよいと思います。ChEMBL-RDFはちょっとバグがあってそのままだとトリプルストアにインポートできません。https://github.com/dbcls/bh13/wiki/Rdf-ontology-on-drug-discovery-data にリンクしてある https://gist.github.com/nakao/5966847 で修正できます。 ご回答ありがとうございます。こんなに色々と取り組んでいらっしゃる方がいるのですね! 参考にさせて頂きます!! 疾患名でしたら、uniprot が human diseases のデータhttp://www.uniprot.org/diseases/ を整備しています。uniprot-rdf 側に対応するIDがあるので、RDFとして利用可能です。 ありがとうございます。コメントが遅くなってしまってすみません。uniprotの疾患データもあるということを初めて知りました。手持ちの疾患のデータにどのIDを振るべきか,実際にふって頂くのが,別のラボの方になると思うので,どの方法が良いか,検討したいと思います。参考にさせていただきます :-) |