在一篇文章《pubmed停更?和你没半毛钱关系!你们是想放假想疯了吧?》我就解读了所谓的停更,根本不碍事,然后又分析了事情只是被自媒体拿来博眼球而已,真正受影响的NCBI数据库没人说,而PubMed停更的可能性不大。

Because of a lapse in government funding, the information on this website may not be up to date, transactions submitted via the website may not be processed, and the agency may not be able to respond to inquiries until appropriations are enacted.

这个消息,很多人上pubmed看到,就打鸡血了,哟哟哟,号外号外大新闻,真的有过过脑子吗?

transactions submitted via the website may not be processed

Pubmed这个数据库需要你去submit了?需要人工去process了?所以我在《pubmed停更?和你没半毛钱关系!你们是想放假想疯了吧?》一文中除了怒怼为了博眼球关注点不对之外,也分析了这一点,并下了断言,PubMed停更的可能性不大。

毕竟很多东西都是自动化的,而服务还在,又没关机,人不上班,难道要把自动化的流程也给关掉不成!显然不是,因为他们用了「may not be processed」,而PubMed这个数据库,不需要人工去处理,也不存在需要用户提交数据的操作,所以我敢断言,是不停更的。

然而所谓「谣言动动嘴,避谣跑断腿」一样,普及正确姿势,没什么人传播,而「哟哟哟,pubmed停更来一个」,呵呵哒,刷屏了!我的朋友圈就刷了,而我普及姿势后,我朋友圈几乎没看到人转发,虽说这「停更」的消息,也不算是造谣,但从各大公号写的,明显是片面性且有意导向,当然也可以看出,很多是无脑跟风吃瓜。(造谣也是有的,比如有少数说美国破产,pubmed关门什么的。)

我的文章《pubmed停更?和你没半毛钱关系!你们是想放假想疯了吧?》讲了三个内容:

  • pubmed停更关系不大
  • pubmed停更这事不太可能发生
  • 真正受灾的数据库没人关注

自媒体的传播无非靠博眼球,又无非靠无脑群众基数大。那篇写「美国破产」标题的,已经10万+,而有些公众号到处群里发红包求转发,都是博眼球噌热点而已。

分析终究只是分析,好比我们发paper,总得要实验来实锤一下,我的分析出来后,也是没人传,而大量的人还在传pubmed停更,我想有必要验证实锤一下。当然结果就是我实锤之后,各大公号又来一波,pubmed其实没停更的新闻,谁先跟进我这篇,谁的粉丝多,谁就赢了,而我这篇,就像之前的N多篇一样,安静地躺在历史记录里。

要想验证,只需要搜索最新的文章,日期从所谓的「停更」开始,「停更」消息没撤,而不断有新文章被收录,就粉碎了停更这一说法。

首先我们得知道怎么检索文献被收录进pubmed的日期,这个日期可以通过EDAT来设定:

https://www.nlm.nih.gov/bsd/mms/medlineelements.html#edat

Entrez Date (EDAT)

In most cases, Entrez Date is the date the citation was added to PubMed. However, prior to October 9, 2008, the Entrez Date was set equal to the Publication Date (DP) on records with publication dates before September 1997. Beginning on October 9, 2008, the Entrez Date is set equal to the Publication Date (DP) when the record enters PubMed more than twelve months after the date of publication.

简单点说,EDAT就是PubMed收录的时间记录,但如果这个时间超过了12个月,就会改成文章发表的时间。文章发表的时间比在线慢很多,而在线了,很快就会被PubMed收录。

比如我搜索了:("2018/01/22"[EDAT] : "2018/01/22"[EDAT])(检索时间为北京时间22号14:30,考虑到美帝有时差), 总共搜索到696篇新加入的文献,这就实锤了停更的谣言。

如果你还记得我写的《pubmed年度趋势,你的开题报告需要它!》这一篇文章的话,你应该能够通过yyplot来每天看一下pubmed文献更新了多少篇。之前有人问yyplot的pubmed年度趋势是否可以这样,是否可以那样,我只想说,你们不懂检索我也没办法,你用pubmed能检索的,用yyplot也可以,各显神通了。

date = 20:22
terms = paste0('"2018/01/', date, '"[EDAT]')
terms = paste0('(', terms, ':', terms, ')')
yyplot::pubmed_trend(terms, year=2018)

输出如下:

> pubmed_trend(terms, year=2018)
search term: ("2018/01/20"[EDAT] : "2018/01/20"[EDAT])
-> querying year 2018
search term: ("2018/01/21"[EDAT] : "2018/01/21"[EDAT])
-> querying year 2018
search term: ("2018/01/22"[EDAT] : "2018/01/22"[EDAT])
-> querying year 2018
                                       TERM year number
1 ("2018/01/20"[EDAT] : "2018/01/20"[EDAT]) 2018   4611
2 ("2018/01/21"[EDAT] : "2018/01/21"[EDAT]) 2018   1042
3 ("2018/01/22"[EDAT] : "2018/01/22"[EDAT]) 2018    696

22号的696和我们网页检索的数目一样,而「停更」的20号开始,一直是有更新的。