SCI

6 October 2024

Single-cell chromatin accessibility reveals malignant regulatory programs in primary human cancers

(Science; if=44.7)

  • Sundaram L, Kumar A, Zatzman M, Salcedo A, Ravindra N, Shams S, Louie BH, Bagdatli ST, Myers MA, Sarmashghi S, Choi HY, Choi WY, Yost KE, Zhao Y, Granja JM, Hinoue T, Hayes DN, Cherniack A, Felau I, Choudhry H, Zenklusen JC, Farh KK, McPherson A, Curtis C, Laird PW; Cancer Genome Atlas Analysis Network‡; Demchok JA, Yang L, Tarnuzzer R, Caesar-Johnson SJ, Wang Z, Doane AS, Khurana E, Castro MAA, Lazar AJ, Broom BM, Weinstein JN, Akbani R, Kumar SV, Raphael BJ, Wong CK, Stuart JM, Safavi R, Benz CC, Johnson BK, Kyi C, Shen H, Corces MR, Chang HY, Greenleaf WJ. 

  • Correspondence: lakss@stanford.edu

To identify cancer-associated gene regulatory changes, we generated single-cell chromatin accessibility landscapes across eight tumor types as part of The Cancer Genome Atlas. Tumor chromatin accessibility is strongly influenced by copy number alterations that can be used to identify subclones, yet underlying cis-regulatory landscapes retain cancer type-specific features. Using organ-matched healthy tissues, we identified the "nearest healthy" cell types in diverse cancers, demonstrating that the chromatin signature of basal-like-subtype breast cancer is most similar to secretory-type luminal epithelial cells. Neural network models trained to learn regulatory programs in cancer revealed enrichment of model-prioritized somatic noncoding mutations near cancer-associated genes, suggesting that dispersed, nonrecurrent, noncoding mutations in cancer are functional. Overall, these data and interpretable gene regulatory models for cancer and healthy tissue provide a framework for understanding cancer-specific gene regulation.

为了确定癌症相关基因调控变化,我们生成了八种肿瘤类型的单细胞染色质可及性景观,作为癌症基因组图谱的一部分。肿瘤染色质的可及性受到拷贝数改变的强烈影响,拷贝数改变可用于识别亚克隆,但潜在的顺式调节景观保留了癌症类型特异性特征。使用器官匹配的健康组织,我们确定了不同癌症中“最接近健康”的细胞类型,表明癌症基底细胞亚型的染色质特征与分泌型腔上皮细胞最相似。为学习癌症调节程序而训练的神经网络模型显示,在癌症相关基因附近,模型优先的体细胞非编码突变富集,这表明癌症中的分散、非反应、非编码突变是功能性的。总体而言,这些数据和癌症和健康组织的可解释基因调控模型为理解癌症特异性基因调控提供了框架。

 

AI全文解析
这篇文章旨在通过单细胞染色质可及性图谱揭示癌症中的恶性基因调控程序。研究团队分析了来自癌症基因组图谱(TCGA)中八种癌症类型(包括乳腺癌、结直肠癌、肺癌、肾癌、黑色素瘤、膀胱癌和脑胶质母细胞瘤)的74个样本,使用单细胞ATAC-seq(染色质可及性测序)技术生成了227,063个细胞的染色质可及性图谱。这一技术使得研究人员能够区分癌细胞与肿瘤微环境中的基质和免疫细胞,并揭示每种癌症特异的基因调控特征。

 

研究显示,不同的癌症亚型表现出特异的基因调控程序。例如,通过对乳腺癌亚型的分析,发现基底样亚型的染色质特征最接近分泌型上皮细胞,而不是常规认为的基底型正常细胞。该结果表明癌细胞的染色质调控程序在恶性转化过程中发生了显著变化。通过构建深度学习模型,研究团队能够识别与染色质可及性相关的癌症突变,进一步揭示了非编码突变在调控癌症基因表达中的重要作用。

 

此外,该研究揭示了不同癌症亚型内部的异质性。例如,通过染色质可及性数据,研究人员能够识别出不同的肿瘤亚克隆,并分析这些亚克隆的基因调控差异。研究还发现,染色质可及性与拷贝数变异(CNA)之间的关联可以用于识别具有不同基因调控特征的肿瘤亚克隆。

 

深度学习模型在该研究中发挥了重要作用,用于预测非编码突变对染色质可及性的影响。研究表明,一些癌症特异的非编码突变可能在调控癌症相关基因表达中发挥关键作用。这一研究为理解癌症特异的基因调控机制提供了一个全面的单细胞图谱,为癌症的分子病理学研究和潜在的免疫治疗策略开发提供了新的资源和视角