
🔬吸烟是肺癌的头号元凶,可为啥有人抽一辈子烟没事,有人却不幸中招?答案藏在基因与环境的 “暗战” 里!
南京医科大学牵头的⚡全球首个肺癌跨组学研究,揭开了关键谜底 —— 整合超 47 万人的基因与多组学数据,发现 8 个核心生物标志物,能精准 “调控” 吸烟对肺癌的致癌效应。
更厉害的是,研究推出全新分子修饰评分(MMS),能给吸烟者做风险分层,还上线了免费在线平台。精准防控肺癌,这场基因与吸烟的博弈,终于有了破解之道!
GWAS+转录组+多组学多维度结合发医学高分 SCI 通关有秘籍!找专业生信从选题到投稿少走 80% 弯路
↓↓关注专业生信后台咨询,发文不迷路↓↓


研究目的:
本研究开展首个肺癌跨组学基因 - 吸烟互作研究,整合多源组学数据挖掘关键生物标志物,构建分子修饰评分实现吸烟者肺癌风险分层,还搭建免费在线平台,为肺癌精准预防和靶向干预提供支撑。
研究设计:
数据整合:
纳入 4 大联盟肺癌 GWAS 基因型数据(27737 例 / 449910 对照)+ 4 类 xQTL 汇总数据(甲基化 / 表达 / 蛋白 / 代谢),均为欧洲血统样本。
分子标志物预测:
用 LDpred2 构建预测模型,仅保留遗传力 h²≥0.01 的可靠标志物。
两阶段交互验证:
ILCCO-OncoArray 为发现阶段(FDR≤0.05),其余 3 个数据集为验证阶段(效应一致 + P≤0.05),荟萃分析整合所有结果。
补充分析:
以吸烟状态为暴露做敏感性分析,按性别、肺癌组织学亚型做亚组分析。
MMS 构建与应用:
筛选独立显著标志物,结合荟萃分析系数构建 MMS,分层评估吸烟的肺癌风险效应。
跨组学与平台建设:
分析组学间标志物关联,挖掘分子机制; 搭建免费在线平台 LungCancer-xWAS-GxE 共享数据。

图 1 跨组学关联研究框架原理及研究整体设计流程图


01、研究对象的人口统计学与临床特征
✅本研究纳入 27737 例欧洲血统新发肺癌病例、449910 例非病例,均经质控且无亲缘关系。
✅核心特征:肺癌病例吸烟包年数、现吸烟者占比均显著高于非病例,从不吸烟者占比更低;四项研究的肺癌组织学亚型分布一致。

02、预测分子表型的有效性验证
✅本研究通过 LDpred2 法,为四大研究队列成功推算出 ⚡DNA 甲基化、基因、蛋白、代谢物四类分子生物标志物。
✅经遗传力双重筛选,四类标志物保留率均超 92%,模型验证一致性高,标志物稳健可靠。
✅四类标志物预测用 SNP 数量差异显著,蛋白 / 代谢物因纳入更多 QTL 位点遗传力更高,且遗传力与 SNP 数量呈弱显著正相关。

图 2 基于 LDpred2 方法估算的分子生物标志物遗传力分布
03、两阶段研究筛选出显著的基因 - 吸烟交互作用位点
✅研究经发现 + 验证两阶段分析,筛选出吸烟相关肺癌的基因交互位点:发现阶段找到⚡ 53 个 CpG 位点、14 个基因表达位点和 4 种蛋白显著关联,代谢物无阳性结果;验证阶段最终确认 7 个 CpG 位点、1 个基因表达位点,效应方向一致且具统计学意义。
✅这些阳性位点分布明确:4 个 CpG 位点在烟碱型乙酰胆碱受体基因簇区域,2 个在 RDM1 基因、1 个在 GTPBP1 基因,阳性基因表达位点为 RP11-326C3.14。
✅整合两阶段结果开展荟萃分析,所有阳性位点仍显著,还额外发现 138 个吸烟交互生物标志物,其中烟碱型乙酰胆碱受体区域的 cg13714459 位点关联信号最显著。

04、显著基因 - 吸烟交互作用的影响模式
✅研究发现 8 个阳性位点对吸烟的肺癌风险调控模式分两类:5 个标志物水平升高会增强吸烟致癌效应,3 个则能降低吸烟相关肺癌风险。
✅整体人群中,吸烟包年与肺癌风险的 OR 值为 1.032。将标志物按水平分低、中、高三组后发现,吸烟包年的致癌效应在不同亚人群中差异显著,如 cg13714459 甲基化水平越高,吸烟 10 包年的肺癌风险 OR 值越高,且三组间效应异质性显著。
05、吸烟状态敏感性分析发现额外关联信号
✅以吸烟状态替代吸烟包年做分析,发现阶段结果与主分析一致,仅 3 个标志物验证阶段未达显著,或因变量转换致信息丢失,且合并数据中所有标志物均与吸烟状态显著交互。
✅用两阶段策略分析标志物与吸烟状态的交互作用,⚡共找到 10 个显著 CpG 位点,含 4 个主分析阳性位点,还新发现 6 个标志物。
06、按人群特征分层的亚组分析
✅大多数基因‑吸烟交互作用在不同性别、不同肺癌类型中普遍存在。
✅其中 3 个位点仅在肺腺癌(LUAD)中表现出显著调控作用,具有肺腺癌特异性。
07、分子修饰评分(MMS)可提升肺癌吸烟高危人群的识别能力
✅本研究构建的分子修饰评分(MMS),能量化遗传对吸烟致癌的放大作用,实现人群风险分层。
✅高 MMS 组肺癌风险更高,且吸烟量越大,风险差异越明显。同等条件下,女性肺癌风险略高于男性,但因吸烟暴露更低,整体发病率仍低于男性。
✅MMS 不直接预测肺癌,而是反映遗传易感带来的额外吸烟风险,可提升传统危险因素的风险区分能力。

图 4 按年龄、吸烟包年及分子修饰评分(MMS)组分层的肺癌风险预测概率
08、跨组学整合分析
✅跨组学分析显示,基因‑吸烟交互相关的分子通路以顺式作用为主,位置相近的标志物关联最强。
✅研究共发现 55 个甲基化位点与 26 个基因表达相关,⚡均为顺式调控。仅 NELFE 基因存在反式作用,可调控 3 个蛋白,其中 ANAPC7 又与 19 种代谢物相关。
✅这类跨组学关联更可能是功能性生物学调控,而非单纯位置邻近导致。

图 5 四层组学层面的跨组学整合分析结果

本研究开展首个肺癌跨组学基因 - 吸烟互作研究,整合多队列基因数据与多维度分子 QTL 数据,鉴定出 8 个调控吸烟致肺癌风险的关键生物标志物,构建分子修饰评分 MMS 可有效分层吸烟者肺癌风险,还搭建了免费在线平台 LungCancer-xWAS-GxE,为肺癌精准防控提供新工具与思路。
GWAS+转录组+多组学发医学SCI发文不迷路,就找专业生信,无痛复刻高分发文思路!
今天的高分医学 干货就和大家分享到这啦,如果大家有想拆解的期刊方向、想解决的发刊难题,可以后台咨询!

