那些被忽略的小细节,却影响了生命科学实验的可重复性?

2023-08-22

在知乎上看到这么一句话:

原则上,能够发表的数据,都应该是可以重复的。重复不出来只有两种可能,要么数据是不成立的,要么操作有问题。

我对于这句话的正确性不予置评,但个人认为,只有真的做过相关实验的人才有资格用评论它。不过,这并不影响我们关注科学实验的可重复性这个话题,我恰巧看到Journal of Cell Science上一篇关于此话题的文献《A guide to accurate reporting in digital image processing – can anyone reproduce your quantitative analysis?》,就将其摘要和引言部分进行简单翻译并转发在这里。有意向了解全文的小伙伴们可以复制以下链接自行搜索查看。

https://journals.biologists.com/jcs/article-abstract/134/6/jcs254151/237886/A-guide-to-accurate-reporting-in-digital-image?redirectedFrom=fulltext


摘要:

近年来,人们对改善生命科学研究的可复制性和可再现性给予了极大的关注,这推动各方人士在各种试剂、assays、细胞系和其他资源的标准化方面做出了值得称赞的努力。但是,虽然显微镜是生物学家们的主要工具,关于显微镜相关细节应如何正确报道和记录的讨论却相对很少。图像处理是几乎所有显微镜实验的关键步骤,可目前普遍存在的情况却是,对图像处理方法的使用所进行的报道往往不恰当或不完整。对于图像处理工作流程的不同选择可以很大程度上决定后续分析的结果,甚至可以决定一项研究的总体结论。我们这篇综述文章将详细说明,对图像处理方法进行正确报道将如何提升科学研究的可重复性,以及它将如何强化从图片结果所得出的生物学结论。

 

引言:

l 图像文件所包含的信息可以让人们对种类广泛的生物结构和过程取得深入了解,不幸的是,任何图像本质上都不是研究对象的完美体现(Aaron et al., 2019; Sluder and Wolf, 2013)。生物标本的复杂性及其与光的相互作用通常会使图像数据发生扭曲,导致图像信号和分辨率变差,从而进一步降低采集到的图像对真实生物样本的保真度。

 

l 无数可用的图像处理和分析软件包使生物学家们能够轻松执行高度复杂的数字运算,然而,这是把“双刃剑”。虽然这些唾手可得的算法为研究人员提供了诸多强大功能,但它们的基础是复杂的数学概念,许多研究人员却可能并不熟悉这些概念。这些算法的不恰当应用也许会以难以预知和适得其反的方式极大的改变底层图像数据。然而,许多图像处理软件程序,尤其是商业解决方案,所提供的一种简单的“一键式”操作,会在不知不觉中改变图像,却很少考虑如此操作对数据所产生的影响,只要最终的结果能使图像处理的手段合乎情理——于是背景去除了,图像增强了,重点关注的对象被截取了出来。

图像处理在成像实验中的重要性及其对最终结果的影响

(A)图像处理在几乎任何显微镜实验中都是必要的,它会发生在图像采集阶段和任何后续分析步骤之间。 图像处理可能包括特征增强/特征检测和/或图像分割。 这些图像处理步骤中的任意一个都会改变最终结果并让人对数据的理解发生偏差。

(B)细菌菌落的荧光图像示例(取自免费的FIJI样品数据,请参阅https://imagej.net/Samples)。

(C)两名研究人员对图像B用不同方法进行了背景去除,高斯去噪和自动阈值操作,得出的细菌菌落大小估计值差异很大(误差柱状图代表的是s.e.m.)。

l 我们必须指出,对原始图像进行数字处理以进行后续分析在本质上并无不对,对图像处理技术的合理应用是取得实验目标必不可少的步骤(Miura and Sladoje, 2020; Miura and Tosi, 2017),这也是事实。最后,确实存在某些操作,例如对图像进行“剪切和粘贴”,使用有损压缩,对用户选择的图像子区域所进行的任何局部性更改等,无论其应用如何,几乎都是不合适的(Cromey, 2010)。无论如何,对于所有数值修改的恰当记录都将成为一种可追溯的手段,以帮助我们识别出不恰当的操作方式。

 

当然,影响科学研究可再现性的因素有很多,除了要对图像处理的过程和算法以正确的方式进行报道,还要对显微镜进行定期维护,确保显微镜的性能稳定。为此,我们的合作伙伴ARGOLIGHT推出了一款包含标准图样的荧光测试标准片和定量分析软件Daybook,可实现显微镜性能的快速、量化评估及分析,帮助用户获得精确可靠的数据结果。