logo 您当前浏览器版本过低,为了不影响您的使用,建议您使用最新的谷歌浏览器、火狐浏览器、 360浏览器,更换浏览器后使用更流畅!(注意!双核浏览器请切换为极速模式)

哈佛论文采用百度数据被批!研究者如何把握数据严谨性

发布时间:2020-06-12

近日,一篇公布于哈佛大学学术社区平台“DASH”的论文在国内外引起热议,除了论文本身极其荒谬的研究结论之外,该论文的数据引用更是引起业内人士的一片质疑。据悉,该论文的图片证据之一是通过百度搜索引擎检索相关关键词数量的曲线图。

“用百度搜索充当论文数据,这是我万万没有想到的.....”,一网友对此发表评论。而刚刚百度也回应哈佛医学院论文引用“咳嗽”“腹泻”数据得出新冠病毒结论:牵强,不严谨!

对于学术论文来说,严谨性与科学性是第一要义,失去这2个标准就称不上一篇学术论文,而提供真实准确的论文数据就是在体现论文严谨性的一面。百度在回应中解释到该论文涉及到的武汉的“咳嗽”整体搜索量峰值跟每年的流感季是吻合的,该论文作者在未多方综合考虑情况下,片面得出研究结论,是丢弃科学精神,非常不负责任的一种表现。

数据不严谨,直接影响他人后续研究进程

所有的科研都是以过去的研究结果作为基石来构建,正如金字塔的结构一样,前人研究结果一旦出现差错,后人基于此的研究功亏一篑。最为典型的案例就是2018年,心肌再生领域的开创者哈佛终身教授Piero Anversa因实验数据造假被撤稿31篇,由于其论文大多发布在柳叶刀等顶刊上,引用数量巨大,无数倾注了极大心血的学者的研究就此付诸东流。

作为科研人员,应如何获得充分而又严谨的证据? 可以从以下几方面着手:

1、尽可能使用权威机构发布的数据

学术论文在使用数据时一定要是权威性的数据,也就是权威机构发布的数据。然而,由于当前数据发布的机构比较多,一些作者在选取数据时太随意,不去研究一下机构本身的权威性,结果所用的数据被学界所质疑。有的甚至因找不到数据的来源而随意改动数据,导致数据时去了真实性。

2、尽可能多的证据来论证同一个假说

单个证据无法提供充足的说服力,可多维度、立体化分析数据模块,采用足够多的数据样本提纯分析去验证假说。

3、尽可能找到直接的证据

一般来说,如果能够找到针对假说的直接证据,研究结果可信度将大大提高。例如2017年丹麦科技大学报道了在人类致病菌间传播的抗某种抗生素的抗性基因与该抗生素产地相同后,直接证明了困扰科学家们30多年的抗性基因可能来源于生产抗生素的微生物假说,为后续的研究提供了非常有利的实验数据。

4、尽可能将实验数据联起来获得一个相对完整和严谨的科学故事

5、尽可能提供不同的实验方法论证

不同的实验方法可能论证结果也不同,在现有的多种实验方法下,采用不同方法论证出来的结果更能接近真实数据。


尽管提供好的证据来支持假说最为重要的,也是最难的,但是在文章的讨论中如何合理的解释数据结果也至关重要。此次被批的哈佛论文明显是带着心中已有的研究结果,跳跃两三个步骤直接得出推论,自动代入数据牵强得出研究结果,自然无法说服他人。

论文之所以需要严谨,是因为它在为科学服务,如若轻视,随意造假,那么科学也将成为伪科学,无法推进人类迈向科学真理,从而阻止人类文明的进步。


公众号版尾——新.jpg