返回
顶部
阅读文献的技巧

也说阅读文献的战略


看过孙学军老师和余党会老师的文献“秘诀”,我也想说几句“秘笈”,把他们的建议反过来说,不是为了反驳,而是我们基于不同的背景,看法必然不同。如果让学工程的学生去追求大量读文献,有可能陷入越读越糊涂的境界,在我们这个文章平均引用率极低的工程领域,你就是读了1000篇又如何?不能解决读文献的目的性问题,往往导致阅读的战略有问题,结果是阅读的收获非常有限,这里我斗胆说说自己的看法。


第一、要解决阅读文献的内在动力问题,每一篇文章在手,我们要解决为什么要读的问题。


我们读文献,往往是为了解决问题,对于研一来说,有可能是课程的内容或作业让你感兴趣,趁你还有一点兴趣,赶快扫荡一遍,趁热打铁,要比每天的固定阅读习惯,效果好很多。


第二、从CNS入手,在我们看来是最蠢的,因为领域不同,从上面看到工程理论突破的可能性极低。


即使是本专业的杂志,其原创贡献也有限,而且是未经生产过程校验和历史沉淀的方法,如果贸然入手,很可能收获有限。也许对于功成名就的研究者,从CNS扫荡最新成果的机会最大,也许对于文笔艰涩的初学者,从CNS学到表达方式的可能性最好,但这不能解决阅读的内在动机问题,所以要谨慎从事。


第三、一般认为,从距离你目标最近的领域的原创性突破入手,是最省力的办法。


名校和普校的最大区别在于,名校豢养的名师做过更多的原创性研究,因此能力高,在课堂上推导原创性理论的可能性大,所以培养出来的学生眼界高,上手快。不过,无论他们怎么厉害,原创性的论文是早已定型的,往往是几十年前的突破,还值得深究。这和生化领域的工作相反,工程领域的文章,历久而弥新。而且,文献越老,你越不怀疑其价值,因为相关研究多,可以相互印证,阅读的内在动力也可以得到提升。所以,不能因为文章老或找不到就放弃,学术境界的差异,在于对原创工作的理解上的差异。越能够理解原创性工作的人,做出原创性贡献的可能性越大。


第四、为什么读文章要原创?


因为太阳底下无新事。那些原创性的东西,再次出现的概率大,有助于你理解后面的研究进展,所以是磨刀不误砍柴功。如果你找不到原创,要么是你研究课程的老师不负责任,要么是你的导师选题太离谱,还有一种可能是你想歪了,你需要反思自己是否合适做研究的基础性问题,这种反思未必是坏事。


第五、解决了阅读文献的入口问题,然后怎么办?


看一看所有引用它的工作,从中你可以发现后人的眼光和境界。高山仰止,为什么还有人能够越过高山去攀登,跨过深渊去贡献?多想几个为什么,让你拥有更多的内在动力去阅读。


第六、阅读的坐标是如何得到的?


通过每一篇文章的参考文献,你可以建立整个领域的知识体系,大师与工匠的差别在于心中的体系,如果能够把所有的方法都能够在体系中找到很好的位置,就是大师的境界。他们根本记不住理论的内容,但可以根据自己的体系推导出来,这是我见到的大师境界,如果你能够对原创内容深入掌握,也有这个潜力。


第七、我曾经用一篇文章证明传质不如传热(烛芯效应),用另一篇文章反过来证明传热不如传质(可燃性理论),应用领域不同,瓶颈自然不同,需要的剃刀也不同。


发现了瓶颈所在,就看你能否挑战传统观念,跳出前人制定的篱笆。突破观念,需要方法;改进观念,促进方法,这需要一种战略的眼光,只有通过广泛的阅读才能得到。好文章,可以是知识的发现,方法的改进和观念(哲学)的突破,阅读文献如果时时注意鉴别出作者提出的全新的知识、方法和观念,大概算是入门了。


第八、所有功成名就的大师,他的原创性贡献都是奥卡姆剃刀,可以最简单地表达,所以大家才公认他的大师地位。


可是理解起来化繁入简易,创造起来是化简为繁难,就需要你广闻博记,把基础方法运用好,才有突破的可能性。所谓的突破,往往是库恩所谓的范式突破,是用更基础的理论挑战现有认识框架的结果。随时注意挑战原有体系的知识、方法和观念,才是写文章的灵魂所在。


第九、最后一点,是否能够突破要看你的机会(课题),不一定依赖于文献。


文献是死的,人是活的,需要把自己的长处与社会的需要发生共振,才能发挥最大的效果。阅读文献,本来就是为了达到这种匹配的效果,看别人的东西,也是理解自身长处的过程。“学海无涯”,“文献无边”,如何在短时间内发挥最大的阅读效果,需要一定阅读的战略。互联网时代,知识的进阶门槛下降了,鉴别的能力要求提高了,如果不注意选择,还是不能发挥个人的能力,适应时代的需要。能读书的人多了,会读书的人海了,成功的人怎么还只有那么几个?可读的文章无限,可推的理论无穷,我们怎能不从头选择?


第十、读书是为了适应社会的需要,有时候社交也会给你带来更多的灵感。


名师一句话,胜读一年书,这不是巧合。柳暗花明的境界和顿悟的妙处,可以在枯燥文献的阅读过程中自发体会,也可以在轻松愉快的闲谈中妙手偶得。读书无方也无法,适合自己的方法是最好的方法,适应社会需要的方法是最好的方法。除此以外其他的方法都可以当做笑话,包括我这里的所谓方法和战略。


早在1904年,马克斯·韦伯提出,德国首发的,美国流行的清教徒伦理认为,每一个人都是不同的,都是出生以后完全预定好的,所以我们要把握好自己,认清自己的社会定位。对自己的能力的越早把握,成功的可能性越大。韦伯的这一观点,有人认为是李约瑟难题的答案之一,是中欧科技差异的宗教性因素。吾然之。



怎样提高文献检索的查全率


文献检索是科研的基本功,阅读文献是科研人员获取科研信息的重要途径。


评价文献检索质量的两个最重要的指标是查全率和查准率。


查全率指的是检出的相关文献量与系统文献库中相关文献总量的比率,它反映该系统文献库中实有的相关文献量在多大程度上被检索出来。


查全率 = 检出相关文献量 / 文献库内相关文献总量× 100% 。


查准率指的是是指检出的相关文献量与检出文献总量的比率,是衡量信息检索系统检出文献准确度的尺度。


查准率 = 检出的相关文献篇数/检出的全部文献篇数× 100%。


查全率与查准率在一定程度上是成反比关系的,为了提高查全率就要以牺牲部分查准率为代价,反之亦然。在不同的情况下,对二者的要求也不同,有时文献的全面更为重要,这时就要以提高查全率为重点,有时希望找到的文献准确率更高,就以提高查准率为重点。本文讨论的是怎样提高文献的查全率。

 

1. 检索词的转换。


常见的转换是同义词、近义词、相关词、单复数及缩写形式,如果是动词还有可能有不同的时态。每一个检索词都有可能有多种表达形式,如果是由英文翻译过来的还有可能有多种翻译方法,所以应该尽可能找全检索词的所有同义词、近义词。相关词指的是与检索词不是同一个意思但是有关联的词。如,META分析的同义词包括元分析、荟萃分析、meta-analysis,近义词包括系统综述,相关词为循证医学。前列腺癌的缩写可能是Pca等等。值得注意的是,在检索中文文献的时候,有必要把英文的全称和缩写也作为检索词,因为有些中文文章中是直接用英文词汇表示的。

 

2 .使用截词符。


虽然从理论上来说我们找到所有的同义词和近义词可以扩大检索结果,但是要想做到这一点是相当困难的。这时可以利用截词符来帮忙。一般用的截词符是“?”和“*”,在不同的数据库中表示的意思有所不同,常见的意思是“?”表示0-1个字符,而“*”表示多个字符。

 

3. 使用上位词,即指代范围更广的词。


有些检索系统有主题词途径,则可以选用上位主题词。例如水果是苹果的上位词,prostatic neoplasm的上位主题词是prostatic disease。

 

4 .改变布尔运算符。


即将连接两个或多个检索词的AND改为OR,即可提高检出数量。

 

5. 改变检索项。


如要求检索词位于标题中或为关键词或主题,检出记录数太少,则可改为要求位于摘要或全文中,检出记录数即可增加。

 

6 .减少限制条件,增加副主题词。


如果前面的检索中有限制条件,放宽或去掉限制条件;如果采用的是主题词和副主题词搭配的形式,看是否漏掉可能的副主题词。

 

以上说的是在同一个数据库中进行检索。但是,每一个数据库所收录的文献都是有限的,而不同的数据库可能存在一定的互补关系。所以为了提高查全率,应该多检索几个数据库,将结果综合起来。当然前提条件是要了解每一个数据库收录期刊的范围、起止年代等,因为不排除有些小的数据库完全是另外一个大数据库的子集的情况,这时当然完全没有必要再检索那个小的数据库了。

 

即使是将目前所有的数据库加起来,也不能囊括所有的文献。例如,有一些年代比较久远的,或者是期刊知名度不高的。所以,除了在数据库中进行检索,还要辅以手工检索。包括对一些重要的而数据库中没有收录的期刊进行手工检索,在已经查到的文献的“参考文献”中或有些数据库提供的“相关文献”中进行查找,看有无“漏网之鱼”,还有,可以请教相关 领域的专家,看看是否有重要的文献没有检索到。

 

一般我们检索文献不是英文的就是中文的,对于其它语种的则不做要求。如果是要求查全率很高,则可以检索一些不常用的语种的文献,如日文、法文、德文等等。当然如果自己不会那门语言,即使查到了,阅读也是一个问题。如果真是非常重要,不妨请人翻译过来。

 

PUBMED的查全率问题

 

PUBMED是最常用的医学网络数据库,它收录的期刊范围最广,更新速度快,有部分(大约5%)能够获得免费的全文,95%以上有英文摘要,而且可以知道查到的某一篇文献是收录在哪个全文数据库中,因而深受医学科研工作者欢迎。PUBMED有自动转换功能,在检索框输入一个检索词,它会自动将其转化为对应的主题词,同时进行主题词检索和自由词检索,并把二者的检索结果用“OR”连接起来。所以,在PUBMED中,要提高查准率首选主题词加副主题词的形式,而要提高查全率则首选默认的检索形式,即打开PUBMED主页后直接在检索框输入检索词。如果采用主题词加副主题词的形式,由于最新的部分文献还没有进行主题标引,因此不能检索到最新的文献。

 

PUBMED的查全率问题与上面所说的大同小异。值得注意的是,如果使用截词符,其自动转换功能即停止。可以采取的办法是第一次用默认检索,第二次用截词符,再把两次检索的结果合并起来。例如,检索词的所有同义词近义词缩写相关词等分别为A、B、C、D、E,则第一次以默认的检索方式检索,检索式为 A OR B OR C OR D OR E,第二次用截词符检索,如A? OR B* OR C? OR D OR E*, 再把两次检索的结果合并,检索式为#1 OR #2。

 

此外,PUBMED还可以提供related articles, 点击这里即可以看到与你检索到的文献相关的文献,也许这其中就有需要而自己没有查到的。

 

META分析的检索问题

 

META分析是对文献的查全率要求最高的一种研究。严格的说,要求获得“所有发表的和未发表的所有形式的信息”,也就是说,包括各国语言的期刊论文、会议论文、学位论文、书籍、Cochrone图书馆的文献及正在研究尚未发表的资料。其实目前发表的META分析能够达到这一要求的几乎没有,即使是发表在柳叶刀、BMJ这样顶级医学期刊上的META分析也不例外。


rcs