点击蓝字 关注我吧!
拆解悟生信

核心亮点(一眼抓重点)
1.全球首个肺癌跨组学基因-吸烟互作研究,整合4大组学维度,格局拉满
2.超大队列样本:2.7万肺癌病例+44.9万对照,数据量级碾压普通小样本生信
3.挖掘出8个关键生物标志物,精准调控吸烟致肺癌风险
4.独创MMS分子修饰评分,实现吸烟者肺癌高危人群精准分层
5.搭建免费在线分析平台,数据全开放,后续研究可直接复用
6.不用昂贵多组学测序!靠公共QTL+GWAS数据就完成深度分析,性价比超高
引言
众所周知,吸烟是肺癌第一大元凶,但现实里有个很奇怪的现象:同样天天抽烟,有的人一辈子没事,有的人早早患上肺癌。
这就说明,遗传基因和吸烟环境存在互作关系,基因会悄悄改变吸烟致癌的强弱程度。
以往研究要么只做单个组学,要么样本量小,很难系统搞清楚基因+吸烟到底怎么影响肺癌风险。而且大规模多组学测序成本极高,很多课题组根本承担不起。
这篇高分研究就瞄准这个痛点,想用跨组学xWAS分析框架,不用实验测序,纯生信整合公共大数据,挖掘调控吸烟致癌的关键分子,还搭建评分模型做风险分层,给肺癌精准防控和生信选题提供了绝佳思路。
文献解读

期刊
American Journal of Respiratory and Critical Care Medicine
发表时间
2026年1月23日
影响因子
19.4
如果你也想用“同款思路”进行研究,需要生信分析,复现高分思路,那就快关注拆解悟生信吧,助力每一个科研梦想。

研究概述
该研究由南京医科大学牵头,联合多国科研团队,依托4大国际肺癌联盟队列(ILCCO-OncoArray、TRICL、PLCO、UKB),纳入近48万欧洲人群样本。
整合DNA甲基化、基因表达、蛋白质、代谢物四大组学xQTL公共数据,采用两阶段筛选+荟萃分析策略,系统筛选与吸烟存在互作的肺癌生物标志物。
同时构建MMS分子修饰评分,验证其对吸烟者肺癌风险的分层能力,还解析了多组学之间的调控通路,最后上线专属在线分析平台,供全球科研人员使用。
研究目的
该研究旨在从多组学层面,系统筛选基因-吸烟互作的肺癌易感生物标志物;探究生物标志物如何调控吸烟对肺癌的致癌效应;构建分子评分模型,实现吸烟者肺癌高危人群精准划分;解析多组学分子间的调控通路,揭示吸烟致癌的潜在分子机制;搭建在线平台,为后续肺癌G×E互作研究提供数据和工具支撑。
研究方法
1.数据来源
● 基因型数据:4大公共队列,27737例肺癌病例+449910例对照,严格筛选欧洲血统无亲缘个体
● 多组学QTL数据:囊括甲基化、表达、蛋白、代谢物4类,均来自国际权威公共数据库
2.分子性状预测
用LDpred2算法,结合xQTL数据和连锁不平衡矩阵,预测每个人的多组学分子特征,仅保留遗传力达标(h²≥0.01)的可靠标志物
3.两阶段分析策略
● 发现阶段:ILCCO-OncoArray队列,BH法校正FDR≤0.05初筛候选标志物
● 验证阶段:TRICL、PLCO、UKB队列,效应方向一致且P≤0.05完成复刻
4.统计分析
采用逻辑回归模型,校正年龄、性别、基因主成分等混杂因素;用固定效应荟萃分析合并所有数据集结果
5.模型构建与分层
筛选独立核心标志物,构建MMS分子修饰评分,按三分位将人群分为低、中、高风险组,评估不同吸烟量下的肺癌发病风险
6.多组学整合分析
遵循中心法则,构建「甲基化→基因表达→蛋白→代谢物」调控通路,挖掘关键枢纽基因
研究结果
01
研究参与者的人口学与临床特征
研究共纳入27737例新发肺癌病例和449910例欧洲血统对照,经质控确认所有个体无亲缘关系。表1呈现了4个数据集的人口学特征:与对照组相比,肺癌病例吸烟包年数更高、当前吸烟者占比更高、从不吸烟者占比更低,且各研究的肺癌组织学亚型分布相近。

表1为
02
预测分子特征的良好表现
基于联盟xQTL数据,用LDpred2预测四类分子标志物,图2展示其遗传力分布,经质控筛选后大部分标志物保留,模型稳健性良好,不同组学的预测SNP数量差异显著。

图2为
03
两阶段显著基因 - 吸烟交互作用分析
两阶段分析识别并验证了7个CpG位点和1个基因与吸烟-肺癌风险的交互作用(表2);荟萃分析进一步确认了这些信号并新增138个显著交互作用,最强信号仍位于15q25.1烟碱受体区域,结果稳健(图3)。

表2为

图3为
04
显著基因-吸烟交互作用的影响模式
8组基因-吸烟交互作用,整体吸烟包年数肺癌风险OR=1.032(95%CI:1.031–1.033)。部分标志物高表达会加剧吸烟致癌风险,其余则起到削弱作用。将标志物按水平分层后,吸烟致病效应存在亚组差异,组间异质性显著。
05
吸烟状态分层敏感性分析新增信号
以吸烟状态为暴露指标开展敏感性分析,8项交互作用整体趋势与主分析相符,3个标志物验证期未达显著,推测由变量分类造成信息损耗、检验效能下降所致。合并数据中全部标志物交互作用均显著。两阶段分析检出10个CpG位点存在显著交互,4个与既往结果重合,新增6个标志物。
06
人群特征分层亚组分析整体信号
多数标志物的基因-吸烟交互效应在性别、病理类型亚组中趋于一致,作用具备普适性。cg26989927、cg02662658及RP11-326C3.14仅在肺腺癌中显现调控效应,特异性突出。
07
MMS可识别吸烟肺癌高危人群
整合5个标志物构建MMS,量化遗传对吸烟致癌的影响,可有效划分人群风险等级(图4)。同等条件下女性患病风险偏高,但吸烟暴露更低致使整体发病率更低。MMS侧重体现个体易感差异,预测增益较小,分层区分效果有所提升。

图4为
08
跨组学整合分析
转录组整合分析探明介导基因-吸烟互作的肺癌易感通路(图5)。组学关联以顺式作用为主,仅NELFE存在跨区域反式关联,其下游分子形成多级调控网络,具备实际生物学意义。

图5为
研究结论
该研究鉴定出8个核心生物标志物,可显著调控吸烟与肺癌的关联,15q25.1、17q12为关键易感区域;标志物呈现双向调控特征,分别加剧或削弱吸烟致癌效应;构建的MMS评分可有效划分吸烟者肺癌风险,吸烟量越高组间风险差距越明显,同等条件下女性易感程度略高;多组学分析证实NELFE是致癌调控关键枢纽;同时验证xWAS分析框架依托公共数据即可高效挖掘基因-环境互作,具备高分研究应用价值。
生信科研启示(想发SCI必看)
1.采用两阶段验证+荟萃分析的经典研究设计,结果可信度高,契合高分期刊偏好
2.聚焦基因-环境交互热门方向,结合多组学数据挖掘核心分子标志物
3.构建风险评分模型实现人群分层,提升研究临床实用价值
4.整合组学通路解析调控机制,丰富论文深度与创新性
5.依托公共大数据开展xWAS分析,无需实体实验,低成本产出高质量成果
如果你也想用【同款思路】做生信,但不知道从哪一步开始,把你的数据和目标发给我,拆解悟生信给你一个可执行的分析路线。

拆解悟生信
从入门到发文
生信分析全搞定
高分思路复现
SCI发文助力

点赞
收藏
分享
往期推荐
IF=15.7!华中农大团队跨物种登顶NC!IFAM整合功能注释,人类/畜禽/作物基因组预测精度集体暴涨!