倾注很长时间和心血完成了一篇研究并投稿,却因统计上的细微差错而被编辑快速拒稿,是否觉得有些遗憾与不公?
在学术出版领域,确保数据的准确性和可靠性是至关重要的。一个小小的统计错误都可能会影响到整个研究的可信度和有效性,因此编辑和审稿人通常会对此类错误持非常严格的态度。那怎样才能避免被严苛的编辑们“秒拒稿”呢?
近日,来自多个国家的主编们在BMJ出版集团旗下刊物《BMJ Paediatrics Open》发表了题为“Common errors in statistics and methods”的综述,汇总了学术文章投稿过程中的常见问题——通过对这些常见统计错误进行分类和讨论,旨在帮助投稿者提高稿件质量和严谨性。
正在或准备投稿的你,快来看看主编们的建议吧,避免投稿中常见的统计学大“坑”,让文章被接收得更顺利!
图片
一、综述背景
由BMJ子刊《BMJ Paediatrics Open》期刊的编辑和审稿人编撰,总结了在审核论文时的常见错误,共汇总了七大类(详情如下)并为每类错误附上了简要说明,旨在帮助作者避免这些常见错误,提升文章质量,撰写更高质量、更可靠的研究,助力文章顺利投稿。
① 图表选择;
② 统计显著性分析及相关问题;
③ 呈现方式(如词汇、文本和表格呈现等);
④ 因果关系;
模型构建、回归和方法选择;
⑥ 荟萃分析;
⑦ 其他常见问题。
二、常见问题
1. 图表选择
(1)数据可视化时尽量少用饼图。类别少时,用表格或仅用文本;类别多时,可用点图。

 

(2)配有误差条和平均值的条形图经常存在信息量少、平均值缺乏代表性、误差条干扰解读、未展示实际数据等问题,可以用条带图箱线图提琴图等替代。
(3)双轴图易混淆且易操纵,更改任一轴范围即改变图表外观,难以估计两系列间差异或比率。可以使用差值图、比率图或分成多个面板展示。
(4)直方图受起始值和箱宽影响大,且不便于多图比较。用密度图、Q-Q图或分布矩阵图等效果更佳,可用与正态分布对比。
(5)堆叠条形图虽旨在跨类别比较,但难以横向对比不同类别。用并排条形图、折线图等替代更佳。
(6)表格和图表用途不同,表格适合呈现特定值,图表适合展示整体趋势和关系。行数多(超八行)的表格建议放附录中
2.统计显著性分析及相关问题
(1)p值与效应量:文中经常使用p值,而忽略了效应量。过度依赖p值可能有误导性。因为p值往往观察到的是极端统计量的概率,从而将其简单分为“积极”和“消极”结果;效应量(如患者生存时间或疾病风险降低程度)更能反映研究结果的实际意义
(2)效应量与置信区间(CI):因为统计推断本身具有不确定性,所以通过CI来呈现效应大小可以提高结果的准确性。

 

(3)近似p值:建议报告确切的p值,避免使用近似值(如“p<0.05”这种形式),除非p值极小如“<0.001”。

 

(4)“不显著”一词使用:所有p值都有其意义,表示了统计显著性的可能性,不应仅根据p值是否大于0.05来判断结果是否“无关紧要”。即使p值不显著,依然应准确报告效应量,让读者理解结果的接近程度。

 

(5)在描述统计中报告p值:不同研究亚组的p值通常意义不大。随机试验中,p值用于验证随机分组是否有效;而观察性试验中,组间差异和专家意见更重要。

 

(6)文件抽屉问题:即作者只提交和发表有显著结果的研究,导致过度强调,影响整篇文献。

 

3.呈现方式(如词汇、文本和表格呈现等)

 

(1)术语表达:当处理多变量数据时,因变量有多个,称为“多元”回归;独立变量有多个,称为“多重”回归;分层建模/随机效应模型称为多级回归。

 

(2)“±”符号使用:需明确其代表的实际度量值,如标准误(SE)、标准差(SD)或置信区间(CI),单独使用无意义。

 

(3)统计方法:若使用新的或不常见的方法时,应详细描述,并引用相关文献。

 

(4)F统计量:在报告时需附带分子和分母的自由度(df),否则难以解释。

 

(5)统计软件:应具体说明版本和相关插件(如R V.4.2.1),并区分软件、编辑器和专门用于特定统计方法的附加软件包。

 

(6)统计功效分析:应提供足够详细的信息以便重复计算,包括假设的效应大小、统计检验、p值、所需功效和样本量。

 

4.因果关系

 

避免从观察性研究中得出笼统的结论。谨慎使用因果关系的表述,如“因果(cause)”、“效应(effect)”等,只有特定研究设计和研究方法才能证明因果关系。

 

5.模型构建、回归和方法选择

 

(1)敏感性分析:避免数据驱动的敏感性分析导致的有效数据的排除,增加统计假阳性错误的风险(如排除“异常值”或“逐一排除分析”)。

 

(2)变量选择:在回归模型中,应基于专业知识和自动化方法(如LASSO)谨慎选择变量,避免使用逐步回归(包括向前、向后、双变量筛选)等方法,导致参数估计偏离真实值。

 

(3)线性回归:应考虑其他更先进的统计方法,如自适应回归样条、多元回归树、分位数回归等,以适应不同数据类型和分析需求。

 

(4)应基于科学数据和专业知识选择合适的分析方法,不应该因为“每个人都这么做”而使用不适合的方法。

 

(5)连续变量:进行分类时会增加统计错误,并引入不切实际的观念,应避免这种做法。

 

6.荟萃分析

 

(1)PRISMA:在系统评价和荟萃分析中,PRISMA是报告指南而非分析指南,不应将其误解为分析依据。

 

(2)I²:是异质性的相对衡量标准。I²的值不应作为选择固定效应模型或随机效应模型的唯一依据,应基于临床异质性和预期推断来选择模型。

 

(3)质量评估:是荟萃分析中不可或缺的一环,应根据预定义的标准评估研究的质量,并避免使用自定义评分系统。同时,应评估荟萃分析结果的确定性,考虑研究中的偏倚、异质性等因素,以更好地指导临床实践。

 

(4)论文应包含足够详细的信息,以便其他研究人员能够重复研究。在撰写荟萃分析时,应严格遵循相关指南,确保研究的科学性和可重复性。

 

7.其它常见问题

 

(1)描述统计数据时,应避免使用不恰当的衡量标准或方法,如均值和中位数。应考虑数据特性和需求来选择最合适的集中趋势衡量标准

 

(2)准确区分几率与风险、OR与风险比,理解它们在不同情境下的适用性。在报告统计数据时,应确保读者理解这些区别,避免误解和误导。

 

(3)在大型临床研究(如随机临床试验)中,应公开研究方案,提高研究的透明度和可信度。

 

(4)当分析数据不同子集变量间关系时,应使用交互作用项分析,而不是简单比较p值,以确保结果的准确性和可靠性。
(5)统计数据应注意小数点的使用,避免过度精确。并以适当的文本形式呈现,以提高可读性。
最后,祝愿每个科研人都逢必过!

参考来源:

 

Flom P, Harron K, Ballesteros J, et al. BMJ Paediatr Open. 2024 Sep 15;8(1):e002755. doi: 10.1136/bmjpo-2024-002755. PMID: 39284617; PMCID: PMC11409338.

 

撰写:彤彤
编辑:小饼干