TCGA肝癌临床数据资源全面介绍---肝癌研究领域的全谱!

2021-10-25 06:40 来源:白山妇科医院

2006年,乳乳癌测序平面图说(The Cancer Genome Atlas, TCGA)原计划以多形连续性囊状母蛋白质糙(GBM)、肺粒状蛋白质乳癌(LUSC)和睾丸上皮细胞连续性囊腺乳癌(OV)开始两星期3年的试点建设项目,2009年~2015年年底展开。到建设项目截止,TCGA局域网人口统计分析从业者已刻划了33种乳乳癌类别10,000余实有患儿的分子内部结构特连续性,并度量了很多分子内部结构病毒性。TCGA相相关联的药理学这两项特连续性代此表泛化的的资讯抽取。为确保时是确常用这些具测序特连续性的高层次药理学的资讯,最近TCGA完毕一批重大成果,发此表在CellPress旗下的期刊。

本文对4同月5日发此表Cell上的一文完毕重写。篇文章阐述以OS(总适应环境期)、PFI(无令人满意以外距)、DFI(无患以外距)和DSS(疟疾无关能活)为四个主要药理学结果三站的TCGA泛乳乳癌药理学的资讯水资源(TCGA-CDR)标准化化在线,并证明了了每种乳乳癌类别的三站常用决定。TCGA药理学的资讯可从测序的资讯共享空以外(GDC)门户网站电子书,所有的分子内部结构的资讯在电子书。药理学的资讯和分子内部结构的资讯常用同样的名片内部结构,便于患儿的药理学的资讯和样品分子内部结构的资讯为基础。

TCGA泛乳癌在线配置文件特连续性

平面图1A为药理学的资讯为基础和人口统计分析步骤及4个主要药理学三站独有和指标的流程平面图,对33份初始登记和97份紧接著的资讯文件,共33种乳乳癌类别111,60实有乳乳癌患儿的的资讯完毕了处理。此表1为每个TCGA配置文件的基本特连续性。按原发样品根据分子内部结构特连续性选入每个配置文件,毛发黑色素糙(SKCM)的原发和重新分配圹两种类别都有,其它极少数的原发与重新分配类别也有人口统计分析。

平面图1. 药理学的资讯为基础和人口统计分析步骤及4个主要药理学三站独有和指标流程平面图

此表1. TCGA 泛乳癌配置文件特连续性

药理学结果三站OS、PFI、DFI和DSS

总适应环境期(OS)很最主要,优点是度量OS惨案时模糊连续性上限。但常用OS作三站或许削弱药理学人口统计分析,因为非乳癌验尸不一定能反映借助于生物学学、波及连续性或对以外科手术缓解。常用OS或须要变长的随访以外隔时以外;很多药理学试验之中,并不一定选用相较随访以外隔时以外较短的DFI或PFI。针对现有TCGA药理学的资讯,要坚信除此以外药理学随访以外距在波及连续性乳乳癌类别结果的最主要连续性,因为或许几年内就同样到到药理学惨案,在死亡前所已再一借助于现患痛住院或令人满意。对波及连续性过强的乳乳癌类别,患儿在数十乃至几十年后住院,随访期以外或许无法同样到足够惨案以反对可靠结果供断定。该人口统计分析的用意是核对TCGA泛乳癌药理学样品的相较优势和严重不足,范本今后的人口统计分析和消除随访以外距以外隔时以外严重不足等缺陷。

人口统计分析全部TCGA药理学的资讯后,论据如下:在的资讯可得到时,OS、PFI及DFI相较精确,但相当多意味著不用估算DSS。平面图1B为33种各不完全一致乳乳癌类别的OS K-M椭圆。尽管适应环境人口统计分析不是TCGA主要目标,相当多乳乳癌类别适应环境椭圆与过去指标完全一致适应环境三站的统一人口统计分析基本完全一致,GBM、OV(2008, 2011)和低级别囊状糙(LGG)(2015)的TCGA结果就是比较好实有证。PFI、DFI和DSS的K-M椭圆见平面图1C–1E。

平面图1 B-E药理学的资讯人口统计分析

基于每种乳乳癌类别4个三站的同样到以外隔时以外计算最低随访以外隔时以外及惨案或核对的之中位以外隔时以外(此表2)。所有的之中位随访以外隔时以外为22.1个同月,但各不完全一致类别乳乳癌该以外隔时以外各不完全一致相当大;GBM和急连续性髓系白血患(LAML)最短分之一12个同月,而肾嫌色蛋白质乳癌(KICH)最长分之一48个同月。

此表2 各个方面之中位随访以外隔时以外及4个三站的惨案与同样到之中位以外隔时以外

提拔常用的药理学结果三站

药理学结果三站选择远大于人口统计分析目标、惨案存量、配置文件大小和结果的资讯总质量。将这些步骤和开发的其它步骤作为对单个疟疾在线的检验和补足核对,证明了在每种疟疾类别之中常用每个结果三站的决定及理由(此表3)。每种乳乳癌类别的适应环境三站须要要至少通过一个主要检验和补足核对才被接受。33种乳癌之中的13种常用全部4个三站:膀胱尿路上皮乳癌(BLCA)、宫颈粒状蛋白质乳癌(CESC)、结肠乳癌(COAD)、食管乳癌(ESCA)、外周粒状蛋白质乳癌(HNSC)、肾状蛋白质乳癌(KIRP)、肺腺乳癌(LUAD)、LUSC、OV、胰腺乳癌(PAAD)、肉糙(SARC)、小肠腺乳癌(STAD)和子宫内膜乳癌(UCEC)。相反,没一个三站的有嗜铬蛋白质糙和副皮质糙(PCPG)。上皮细胞充斥大B蛋白质上皮细胞糙(DLBC)、LAML和胸腺糙(THYM)数一个三站;剩余乳乳癌类别2或3个三站,但其之中一些持严厉批评。最可靠的是PFI,可无保留地提拔给除LAML(无的资讯)、DLBC和KICH(小心谨慎常用)和PCPG(不提拔)以外的4种。

此表3 三站OS,PFI,DFI及DSS的指标与提拔常用

时是确性TCGA-CDR及案实有应可用

在乳腺乳癌人口统计分析之中,雄激素ER阴连续性患儿药理学适应环境期患因比ER+患儿差。分别用OS、PFI、DFI和DSS来得这两类患儿的适应环境期(平面图3A–3D;椭圆截止于10年随访以外隔时以外,但常用整个在线完毕人口统计分析)。单原因人口统计分析显示,常用PFI(p= 0.005)和DFI(p = 0.001)作为药理学三站,TCGA之中ER+乳腺乳癌患儿比ER-患儿有能够的适应环境期,但常用OS时两类患儿以外不依赖于各不完全一致(p = 0.097) 。此以外,两类患儿的DSS(p = 0.009)有显着各不完全一致,此说明DSS的潜在层面。以上断定属实了PFI和DFI是特定类别乳腺乳癌分子内部结构人口统计分析的有用三站。

平面图3 时是确性和应可用实实有

此以外还时是确性了波及连续性GBM适应环境结果三站。TCGA之中GBM之中位OS为12.6个同月,介于此前所报道的标准化以外科手术的12.1个同月和标准化以外科手术合组替莫唑胺的14.6个同月两者之以外。之中位PFI是6.1个同月,介于此前所报道的标准化以外科手术5个同月和标准化以外科手术合组替莫唑胺的6.9个同月两者之以外。看来,TCGA在线OS和PFI惨案以外隔时以外与文献保持一致。再一窥见OS和PFI作为GBM分子内部结构人口统计分析的药理学三站效度。

用Cox比实也许性回归数学模型未确定高期(III、IV期)相较低期(I、II期)乳乳癌患儿的或许性比(HR),时是确性4个三站的TCGA-CDR的资讯。由于DFI度量与其它结果的度量不保持一致,对提拔常用OS、PFI和DSS的14种类别乳乳癌来得logHR(此表3)。随后数对意味着Cox比实也许性论据的疟疾完毕人口统计(平面图3E–3G)。结果此说明,14种类别乳乳癌之中,除以外皮糙(MESO)、PAAD和葡萄膜黑色素糙(UVM)以外,高期对比低期HR在3个提拔三站OS、PFI及DSS上明显极低。选用分组样品的Wilcoxon秩和时是确性,当常用PFI与DSS(p = 0.0008)或PFI与OS(p = 0.039)校准时,logHR有显着各不完全一致,显示疟疾令人满意和适应环境三站在HR上依赖于系统对偏差;OS与DSS两者之以外没显着各不完全一致(p = 0.106)。对2个logHR取值的标准化误完毕逆计量未确定Pearson无关系数, 由logHR估算的3种结果有极显着时是无关:PFI和OS无关系数0.96(95%置信区以外[CI]:0.77–0.99),PFI和DSS为 0.95(95%置信区以外:0.76–0.99),OS和DSS为0.90(95%置信区以外:0.61–0.98)。这些无关连续性潜在反对药理学早期用PFI,初期用OS和DSS做三站。

除了为基础分子内部结构的资讯,还尝试人口统计分析首次以外科手术后无患患儿与非无患患儿确实再一借助于现各不完全一致的新惨案。TCGA-CDR之中29类乳乳癌个人信息可用补救该弊端,归入患儿从诊疗到完毕首治并达到无患静止状态至少能活3个同月。以LUSC为实有,有289实有无患患儿和41实有一直非无患患儿,NTE叛将分别为21.8%和68.2%。用Cox比实也许性回归数学模型,断定在非无患患儿之中NTE或许性显着高于无患患儿(HR = 6.68,95% CI = 4.25–10.51,FDR调整q取值<0.05)。在另以外21种乳乳癌类别之中也有相近结果(此表4)。都已7种之中没同样到到这些各不完全一致。我们也在指标确实每个数学模型都意味着比实也许性论据,其之中有两个不合乎,须要要人口统计分析以外隔时以外相反及相当多组数学模型来探寻理由。

此表4 非无患与无患患儿NTE发展对比

TCGA从亚洲地区数百个换乘站抽取患实有,为补救药理学的资讯各不完全一致换乘站以外的可比连续性,须要权衡的资讯完整连续性、和患儿特连续性等。对每种疟疾而言,我们对比了前所两名提供患实有数最多的其组织举例来说换乘站(TSS)与所有其它TSS的同种疟疾及4个结果三站(此表5)。

此表5 对来自前所两位TSS的每个乳乳癌类别人口统计分析结果完毕来得

对于GBM等极具波及连续性的,前所两位TSS(#1和#2)的发患老年人与其它TSS相比较相近的有OS、PFI和DSS,因惨案实在少难以人口统计分析不提拔DFI做三站。BRCA等极低波及连续性,强力提拔常用PFI和DFI,但决定小心谨慎用OS或DSS指标。TSS #1的药理学的资讯转化成不实在好的OS和DSS,但没同样到到PFI各不完全一致;另以外,此表面上TSS#1有能够的DFI结果,数再一借助于现3实有 DFI惨案。这种此表里不一的现象此说明该换乘站的结果的资讯须要更进一步指标。另一方面,TSS #2的4个三站结果与其它地方保持一致。

这个直观的结果来得此说明,当从特定结果人口统计分析结构上TCGA的药理学的资讯时,须要要权衡TSS的实际个人信息。由于年龄、分期/这两项及以外科手术等原因影响各不完全一致TSS患患老年人的三站结果,TSS可以作为这些和不完全药理学注释等其它未校准各不完全一致的替代。

潜在的普遍依赖于原因、竞争结果的

或许性及数学模型论据

对药理学适应环境三站人口统计分析来说,决定常用所处理的全部药理学的资讯。但相比较分子内部结构/测序的资讯的为基础人口统计分析,要同样两个方面。首先,提拔意见基于基线适应环境数学模型,以分子内部结构病毒性作得借助于论据因子分成样品集,也许毁损结果人口统计的显着连续性各不完全一致。因此,从互无相关联的TCGA分子内部结构的资讯或病毒性TCGA-CDR结果的资讯之中得借助于的论据须要在统一的在线之中更进一步属实。

第二,我们决定数常用原发的分子内部结构的资讯,因为患儿初诊时,最主要以外隔时以外个人信息等给定的药理学的资讯已抽取相较完整。毛发黑色素糙(SKCM)在TCGA类别之中非常特殊,470实有之中数103实有原发,其余296实有为原发大面积上皮细胞结重新分配,68实有远端重新分配。这与常常抽取到重新分配糙的其它TCGA乳乳癌类别形成鲜明对比。SKCM重新分配糙常常有着给定的原发,而其它TCGA乳乳癌类别尽管常常有重新分配糙,但都有着给定的原发样品。因此,对于SKCM结果的无关连续性,决定只常用有限存量的原发患实有,尽管SCKM上皮细胞结重新分配的III期患实有可作为统一组群完毕人口统计分析。

在常用新为基础的TCGA-CDR在线时,还须要要同样:潜在误用原因、竞争结果的或许性及数学模型论据。

普遍依赖于原因

普遍依赖于原因依赖于但被排除在数学模型之以外时,偏差或许高估或低估真正。如在乳腺乳癌的种族各不完全一致人口统计分析之中,白人与非裔患儿两者之以外依赖于最主要的基因此表达各不完全一致,然而根据分子内部结构病毒性完毕调整后,这种各不完全一致显着降低甚至绝迹。治果也是潜在的普遍依赖于原因,当个人信息可获取时应适当权衡调整。以外科手术未被发现时,年龄、诊治医院及诊疗备注等标准化以外科手术作为替代个人信息能降低部分校准误差。对这方面的决策数学模型,鼓励常用研究课题患因人口统计分析决定调查结果(REMARK)。

竞争结果的或许性

量度DSS、DFI和PFI三站时,要对没经历最主要惨案且无患的死亡患儿完毕审查。在这种意味著,如果论据患儿没其它验尸,那她/他最终仍或许死于乳乳癌指征。然而,在估算以外科手术等得借助于论据因子对继发连续性乳乳癌或心血管疟疾等非加权乳乳癌死亡或许性的得借助于论据并能时,该论据并不可取。

数学模型论据

应可用Cox比实也许性(PH)数学模型须要核对PH论据。除少数案实有以外,大相当多数学模型都意味着Cox PH论据,但须要更进一步探索这些个案以追踪违背论据的理由,从而对HR这两项更正确的估算。尽管已经为清理的资讯和补救弊端付借助于了巨大努力,但仍依赖于最主要的常用上限,回访TCGA药理学的资讯都须要认识这些上限。

首先,TCGA主要是为分子内部结构人口统计分析设计者,最初患实有选择来自多个行政部门有着有用油料其组织的未以外科手术原发患实有,因此这些患实有不组合成连续连续性。此以外,对于每种各不完全一致类别/人口统计分析,随访的资讯没统合抽取。同时,药理学的资讯抽取的一些规则在过去不得不随着以外隔时以外的推移而改变。TCGA - CDR不相相关联乳乳癌以外科手术史,并非所有患实有都被注释。因此,人口统计分析特定类别或病毒性的以外科手术背景胜过概况连续性泛乳癌人口统计分析。当患儿完毕实际以外科手术时,充分利用能用DFI和PFI三站有效人口统计分析。

其次,TCGA样品药理学随访根据当地养老院的以外隔时以外此表,或许为疟疾或特定口腔的住院和患人最主要全人类静止状态的记录,因此没TCGA登录的药理学随访原计划,数证明了建设项目主要忽视的分子内部结构特连续性。

最后,几乎所有TCGA得到的样品和测序及分子内部结构的资讯来自新诊患儿原发的单个切片,由此转化成的测序和分子内部结构的资讯必须在空以外或以外隔时以外任何方面实际捕获代此表另一患儿结果数组的异质连续性。该弊端不是TCGA类同的,任何静态原发连续性人口统计分析都依赖于。

展望

这项工作是毫无疑问第一次年底系统对地处理TCGA泛乳癌药理学的资讯。由此转化成的TCGA-CDR的结果三站与统一非TCGA人口统计分析结果保持一致,说明该水资源在空前所规模的药理学尺度上提供了生物学太阳黑子新视角。也要坚信TCGA-CDR的内在常用局限连续性及这两项连续性范本和提拔意见。已经非常明晰,人类疟疾未来大规模的分子内部结构人口统计分析须要系统对地抽取药理学患理、以外科手术和重设惨案的资讯,以坚持最高标准化的药理学人口统计分析。尽管有其局限连续性,TCGA-CDR提供了标准化化在线,以及清晰的4个药理学结果三站导借助于,并补救了总质量弊端,从而在泛乳癌和生殖水平上完毕转化人口统计分析。未来的资讯人口统计分析的融合将大幅提高结果两者之以外的可比连续性,能够地解释和反对重复。

参考

An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics

TAG:
延伸阅读
受孕提前是什么原因 受孕期间吃它们好
更年期不调是异普遍性恋比较罕见的情形之一,很多异普遍性恋也显现过更年期提前结束的情形,更年期提前结束是什么理由?我们在更年期前夕肉类一定...[详细]
2022-05-05
【科普】 性病是如何传播的,又有哪些征状呢?
爱滋病是如何传播的,又有哪些征状呢?本文话题性传播疟疾(STDs),是指主要通过性沾染传播的四组传染性疟疾,简称爱滋病。目前爱滋病已达20余种...[详细]
2022-05-04
盆腔炎这种常见妇科病怎么疗程彻底
女性的外阴是看作更为最主要的作用的,而且它是性器官官不可或缺的一种,外阴炎是妇科更为类似的疾病,马上反之亦然的不良影响着女性的性器官。...[详细]
2022-05-03
多发性卵巢囊肿 全面性了解其症状
恶性肿瘤生殖细胞囊肿要较早发掘出较早病人,其跟生殖细胞囊肿的侵害是一样的,在较20世纪不病人好的话,就很易频发恶变,从而掀起更大的侵害。...[详细]
2022-05-02
JNNP:儿童因血清AQP4 IgG阳性视神经脊髓炎谱系疾病致残的早期数据分析因子
脊髓脊髓炎谱系持续性(NMOSD)是一种中的枢神经元系统(CNS)的炎性脱髓鞘癌症,主要阻碍脊髓和脊髓。约60%–80%的患儿毒素中的含有癌症特异性水连...[详细]
2022-05-02
宫寒的原因 保暖缺乏还会导致这个问题
一般来说的陌生人在生活当中都时会巧遇宫寒的状况,一旦出现了宫寒对我们的双脚有极大的因素,这个时候我们不该怎么办呢?只能引发宫寒的主因有很...[详细]
2022-04-28
女性月经不调 八个作法帮你摆脱月经不调
每个月总才会那么几天,才会让妇女儿童深感十分的困扰,而这就是月经期了。月经期是妇女儿童排毒养颜,甚至是气功保健的关键时机,因此如果显现...[详细]
2022-04-27
卵巢囊肿恶性的患者有哪些
卵巢病变如果不需要立即病人的话,那么是很有不太可能时会引发更加严重的疾病,反之亦然的威胁到我们的健康的。所以我们对于卵巢病变的病征就必...[详细]
2022-04-26
艾叶能治疗妇科疾病吗?
现代妇女的妇科疾病越来越多,让患者非常困扰,那么如何治疗妇科疾病呢?专家说,艾蒿叶可以治疗妇科疾病。艾蒿叶苦、辛、温,进入脾、肝、肾经...[详细]
2022-04-25
  • 地区医院
  • 医院联盟