非肿瘤研究者的福音!南京医科大团队模板文章:NHANES+机器学习+回归分析
机器学习作为人工智能领域的核心技术之一,在医学科研领域也表现出了巨大的潜力和影响力,为广大临床研究者构建更高质量的临床模型,提供了更多可能性!
今天小途跟小伙伴们分享一篇0实验即可发Sci机器学习类文章。这篇文章首先搜集了10个周期的NHANES数据库,然后通过加权多元逻辑回归,限制性三次样条(RCS)回归,最小绝对收缩和选择算子(LASSO)回归等算法探讨了饮食炎症指数 (DII)与中风之间的联系。这篇文章为什么能0实验发表呢?小途带小伙伴们一起揭秘一下吧~
1. 在10个周期的NHANES横截面数据库里筛出了46469个中风患者,大样本更能说明问题;
2. 应用加权多元逻辑回归,RCS回归检验线性, LASSO回归等算法,得出 DII与美国普通人群中风相关性很强,作为未来研究的重要支柱;
3. 敏感性分析验证算法的可靠性,得出DII与中风的关联性结果。(ps:不会吧不会吧,还有人不会使用公共数据库?配合一套分析简直猛如虎,立马提升文章档次,感兴趣的小伙伴赶紧联系小途吧!)
l题目:美国人群中饮食炎症指数与中风之间的关系:来自NHANES 1999–2018的证据
l杂志:BMC Public Health
l影响因子:IF=4.5
l发表时间:2024年1月
研究背景
尽管中风诊断和治疗在过去取得了巨大进展,但其患病风险依然增加,并且逐渐趋于年轻化。研究发现,饮食可能是调节全身炎症的重要因素,不健康的饮食模式,会加剧慢性低度炎症。DII已在大量出版物中广泛应用,尽管已经有几项流行病学研究探讨了DII与中风之间的联系,但其中的炎症指标并没有得到显著的报道。该研究旨在破译饮食炎症指数 (DII) 与美国普通人群中风的相关性强度。
数据来源
NHANES是由国家卫生统计中心(NCHS)发起的一项全国性活动,主要关注美国平民的健康和营养状况,每两年进行一次,其目的是全面了解当代疾病概况,并为制定公共卫生政策提供参考。NHANES的所有数据对公众开放,并可通过以下途径免费下载: https://www.cdc.gov/nchs/nhanes/index.htm。该文章起初收集了1999-2018年国民健康与营养检查调查(NHANES)101,316名横断面数据,在排除年龄(<18或>80岁的参与者,n = 46469),怀孕(n=1516),没有饮食记录(n=5747)的病人后,总共取44019名参与者进行后续分析。
研究思路
首先,对所有数据进行饮食评估,纳入26种食物参数,根据主要的炎症生物标志物的影响指定特定的DII评分,将所有特定食物成分的DII评分相加,得出总体DII,正值代表促炎,负值代表抗炎,零分代表没有显著影响。随后使用加权多元逻辑回归估计Dll与卒中的相关性,通过RCS回归检验其非线性。然后利用LASSO回归确定与中风相关的关键饮食因素,建立风险预测诺模图模型图,最后通过ROC曲线以评估其对中风的区分能力。
主要结果
1)研究参与者的基线特征
44019名患者中,加权平均年龄是45.83岁,中风占3.38%,加权DII评分中位数为 1.39。与非中风患者相比,中风患者往往是老年人、女性、非西班牙裔黑人、受教育程度较低、吸烟者、不饮酒者和糖尿病患者,及一些生理指标不好的患者(均P<0.05)。(表1)此外,中风者的DII评分特别高(P<0.001),进一步研究发现,中风者除维生素E和咖啡因外,几乎所有饮食成分的摄入量都较低。(表2)
2)DII病与中风的关系
通过抽样加权多元逻辑回归分析,检测到了DII和中风之间有较高的关联。(表3)
RCS曲线显示DII与卒中呈非线性正相关(图2A)。文章进一步探索了性别差异的影响,在男性中,DII和中风之间的关系仍然是非线性的,当DII超过2时,中风的几率似乎增加得更快,而女性的中风与DII呈线性相关(图2B)。
通过分层分析,在森林图中显示DII和中风在不同的亚组中均保持稳定。(P>0.05)(图3)
3)确定与中风相关的关键饮食因素
实验纳入26种饮食成分和3个协变量(性别、年龄和种族/民族),通过LASSO分析得出了与中风关系最密切的食物参数(图4)。利用16个变量构建一个风险预测诺模图模型,最终8个变量对模型的预测能力有统计学意义:年龄、种族/民族、碳水化合物、膳食纤维、胆固醇、PUFA(22:6n-3)、铁和酒精,其对中风的相当大的预测性能通过ROC曲线得到验证(AUC=79.8%)(78.2–80.1%)(图5)。
4)灵敏度分析
与加权逻辑回归的结果一致,敏感性分析也确定了DII与中风的正相关,这在未调整和调整模型中均得到一致。也证明了抽样加权逻辑回归分析结果的稳定性和可靠性。
文章小结
这篇文章可谓是紧跟当前研究潮流,既利用了可公开获取的大样本量临床数据,同时又使用多种当红的回归分析算法。只用统计学手段就能完成一篇纯数据分析的Sci。看到别的团队蹭蹭蹭地发文,你是不是也迫不及待准备大展身手啦?把握住“机器学习”方向,做临床数据库分析,不要太适合临床研究人员哟!
Tag标签: 非肿瘤生信 非肿瘤 NHANES 机器学习 回归分析