RからNCBIのeUtilsを使う
NCBIは大量のダウンロードを攻撃とみなしてブロックする機能がある。
そこで登場するのがeUtilsという機能。
perlなどで動くのだけど、Rからwebサービスを動かして使うこともできる。
- entrezパッケージ
一番初めに見つけたパッケージ。CRANに登録されておらず、たまたまgoogleでヒットしてきたのを拝借した。XMLパッケージと組み合わせていろいろお世話になった。
最近、使っていなかったら知らない間にサイトが引っ越していたようだ。
entrezSearch関数が結構シンプルで使いやすい。
Gregor Gorjanc (gg): R package "entrez"
entrezSearch(term,db=NULL,WebEnv=NULL,useHistory=FALSE,queryKey=NULL
,tool=NULL,email=NULL,field=NULL,relDate=NULL
,minDate=NULL, maxDate=NULL, dateType=NULL,retMax=100
,retStart=0,retType="uilist",xmlKeep=FALSE
,entrezURL="http://eutils.ncbi.nlm.nih.gov/entrez/eutils/esearch.fcgi?",warn=TRUE)