<?xml version="1.0" encoding="utf-8"?>
<rss xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title>Answers to: NCBIへのサービスのクエリの自動解釈の誤作動の問題</title><link>http://qa.lifesciencedb.jp/questions/495/ncbi%E3%81%B8%E3%81%AE%E3%82%B5%E3%83%BC%E3%83%93%E3%82%B9%E3%81%AE%E3%82%AF%E3%82%A8%E3%83%AA%E3%81%AE%E8%87%AA%E5%8B%95%E8%A7%A3%E9%87%88%E3%81%AE%E8%AA%A4%E4%BD%9C%E5%8B%95%E3%81%AE%E5%95%8F%E9%A1%8C</link><description>&lt;p&gt;バッチで、論文タイトルのリストからEntrez &lt;a href="http://www.ncbi.nlm.nih.gov/pubmed"&gt;PubMed&lt;/a&gt;のIDを取得するためにNCBIの&lt;a href="http://www.ncbi.nlm.nih.gov/corehtml/query/static/esearch_help.html"&gt;ESearch&lt;/a&gt;からxml情報を取得しようと
考えているのですが、以下のように、PubMedのWebサービスでは、ヒットするものが、ESearchでヒットしないものがあります。&lt;/p&gt;
&lt;p&gt;問題の起こった論文のタイトル
「The long march: a sample preparation technique that enhances contig length and coverage by high-throughput short-read sequencing.」&lt;/p&gt;
&lt;p&gt;Entrez PubMed&lt;/p&gt;
&lt;pre&gt;&lt;code&gt;http://www.ncbi.nlm.nih.gov/pubmed?term=The%20Long%20March%3A%20a%20Sample%20Preparation%20Technique%20that%20Enhances%20Contig%20Length%20and%20Coverage%20by%20High%2DThroughput%20Short%2DRead%20Sequencing
&lt;/code&gt;&lt;/pre&gt;
&lt;p&gt;ESearchでdb=pubmedで検索時&lt;/p&gt;
&lt;pre&gt;&lt;code&gt;http://eutils.ncbi.nlm.nih.gov/entrez/eutils/esearch.fcgi?db=pubmed&amp;amp;term=The%20Long%20March%3A%20a%20Sample%20Preparation%20Technique%20that%20Enhances%20Contig%20Length%20and%20Coverage%20by%20High%2DThroughput%20Short%2DRead%20Sequencing
&lt;/code&gt;&lt;/pre&gt;
&lt;p&gt;ESearchの結果のxmlを見ると、なぜが、タイトル中の"The Long"だけ"Author"フィールドとみなされているようです。
特にタグ付けを行っていないこと、かつ、ESearchのみで発生していることで、原因が想像つかないのですが、
どなたかこのような現象に遭遇された方、対策にお心当たりのあるかたがおられましたらご助言いただけないでしょうか？&lt;/p&gt;
&lt;p&gt;根本的な解決になるかは分かりませんが、&lt;a href="http://www.ncbi.nlm.nih.gov/books/NBK3827/table/pubmedhelp.T43/?report=objectonly"&gt;stopword&lt;/a&gt;を除去すれば、この件に関しては解決することが分かっておりますが、
類似の問題が発生しないとも限らないので、そのような場当たり的対応で良いのか分からず困っております。&lt;/p&gt;</description><atom:link href="http://qa.lifesciencedb.jp/questions/495/ncbi%E3%81%B8%E3%81%AE%E3%82%B5%E3%83%BC%E3%83%93%E3%82%B9%E3%81%AE%E3%82%AF%E3%82%A8%E3%83%AA%E3%81%AE%E8%87%AA%E5%8B%95%E8%A7%A3%E9%87%88%E3%81%AE%E8%AA%A4%E4%BD%9C%E5%8B%95%E3%81%AE%E5%95%8F%E9%A1%8C" rel="self"></atom:link><language>ja</language><lastBuildDate>Tue, 28 Jun 2011 19:01:44 +0900</lastBuildDate><item><title>Answer by yayamamo</title><link>http://qa.lifesciencedb.jp/questions/495/ncbi%E3%81%B8%E3%81%AE%E3%82%B5%E3%83%BC%E3%83%93%E3%82%B9%E3%81%AE%E3%82%AF%E3%82%A8%E3%83%AA%E3%81%AE%E8%87%AA%E5%8B%95%E8%A7%A3%E9%87%88%E3%81%AE%E8%AA%A4%E4%BD%9C%E5%8B%95%E3%81%AE%E5%95%8F%E9%A1%8C/505</link><description>&lt;p&gt;本件ですが、PubMed検索でもESearchと同様の検索が行われています。ただ、それで一件もヒットしなかった場合の振舞いが異なり、PubMedでは続けて内部的に完全マッチ検索を行った上で対応するPubMed IDを取得し、それを改めてクエリとして発行しているようです。&lt;/p&gt;
&lt;p&gt;事実、PubMedでは検索結果のページに以下のコメントが表示されています。&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;We found 1 article using an alternative search:&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;更に、Advanced searchタブをクリックして得られる検索履歴(Search History)に以下の表示があることからも確認出来ます。&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;#3    Search 18941527[uid]    05:32:47    1&lt;/p&gt;
&lt;p&gt;#2    Search The Long March: a Sample Preparation Technique that Enhances Contig Length and Coverage by High-Throughput Short-Read Sequencing     05:32:47    0&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;#3のクエリは利用者が発行したものではなく、PubMedが内部的に行ったものです。&lt;/p&gt;
&lt;p&gt;ただ、このPubMedと同じ動作をESearchでも行う方法については分かりません。&lt;/p&gt;</description><dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">yayamamo</dc:creator><pubDate>Tue, 28 Jun 2011 19:01:44 +0900</pubDate><guid>http://qa.lifesciencedb.jp/questions/495/ncbi%E3%81%B8%E3%81%AE%E3%82%B5%E3%83%BC%E3%83%93%E3%82%B9%E3%81%AE%E3%82%AF%E3%82%A8%E3%83%AA%E3%81%AE%E8%87%AA%E5%8B%95%E8%A7%A3%E9%87%88%E3%81%AE%E8%AA%A4%E4%BD%9C%E5%8B%95%E3%81%AE%E5%95%8F%E9%A1%8C/505</guid></item></channel></rss>