TCGA癌症临床数据资源全面介绍---癌症研究科技领域的全谱!

2021-11-15 04:50 来源:东营妇科医院

2006年,乳恶特质肿瘤原核生物平面图谱(The Cancer Genome Atlas, TCGA)计划以多形特质胶质母蛋白质肿(GBM)、肺部柱状蛋白质恶特质肿瘤(LUSC)和**浆液特质囊腺恶特质肿瘤(OV)开始为期3年的试点计划,2009年~2015年进一步展开。到计划上半年,TCGA的网络研究课题工并作者已描绘了33种乳恶特质肿瘤并不一定10,000余实有疾征的分子会构造,并假定了很多分子会变异。TCGA构成的流行疾学关键构造代同上泛化的史料资料收集。为确保正确用于这些具原核生物构造的都从流行疾学史料资料,最近TCGA启动一批重大成果,发同上在CellPress大中华区的刊物。

本文对4翌年5日发同上Cell上的一文进行时编译。撰文阐释以OS(总存活期)、PFI(无困难重重在在隔)、DFI(无疾在在隔)和DSS(疾疾相关存活者)为四个主要流行疾学结果起始站的TCGA泛乳恶特质肿瘤流行疾学史料资料人力资源(TCGA-CDR)常规化史料资料库系统,并得出了每种乳恶特质肿瘤并不一定的起始站用于敦促。TCGA流行疾学史料资料可从原核生物史料资料一共享维度(GDC)门户网站下载,所有的分子会史料资料在下载。流行疾学史料资料和分子会史料资料用于最大值得注意的条码在结构上,便于疾征的流行疾学史料资料和试样分子会史料资料建构。

TCGA泛恶特质肿瘤史料资料库系统路由同上构造

平面图1A为流行疾学史料资料建构和归纳方法及4个主要流行疾学起始站派生和指标的流程平面图,对33份初始登记注册和97份后续史料资料文件,一共33种乳恶特质肿瘤并不一定111,60实有乳恶特质肿瘤疾征的史料资料进行时了检视。同上1为每个TCGA路由同上的基本构造。按原发试样根据分子会构造被选为每个路由同上,面部黑色素肿(SKCM)的原发和移到灶两种并不一定都有,其它极少数的原发与移到并不一定也有研究课题。

平面图1. 流行疾学史料资料建构和归纳方法及4个主要流行疾学起始站派生和指标流程平面图

同上1. TCGA 泛恶特质肿瘤路由同上构造

流行疾学结果起始站OS、PFI、DFI和DSS

总存活期(OS)很举足轻重,灵活特质是假定OS血案时模糊特质下限。但用于OS并作起始站可能削弱流行疾学研究课题,因为非恶特质肿瘤自杀身亡不一定能反映出生物学、洪水泛滥特质或对疾患消除。用于OS或无需变长的随访时长;很多流行疾学试验之中,一般来说采用相比较随访时长较长的DFI或PFI。针对原有TCGA流行疾学史料资料,要确信比如说流行疾学随访在在隔在洪水泛滥特质乳恶特质肿瘤并不一定结果的层面,因为可能几年内就推论到流行疾学血案,在死亡此前已出现疾情患上或困难重重。对洪水泛滥特质极强的乳恶特质肿瘤并不一定,疾征在数十乃至几十年后患上,随访期在在可能并未能推论足够血案以赞成合理结果供辨别。该归纳的目地是检查TCGA泛恶特质肿瘤流行疾学测定的相比较压倒性和太少,他的学生在短期内的归纳和能避免随访在在隔时长太少等缺陷。

归纳全部TCGA流行疾学史料资料后,推论如下:在史料资料可授予时,OS、PFI及DFI相比较精确,但多数情况下根本无法据估计DSS。平面图1B为33种完全相同乳恶特质肿瘤并不一定的OS K-M斜赴援。尽管存活归纳不是TCGA主要目标,多数乳恶特质肿瘤并不一定存活斜赴援与无论如何指标相同存活起始站的独立国家研究课题基本相同,GBM、OV(2008, 2011)和低等级胶质肿(LGG)(2015)的TCGA结果就是比较好实有证。PFI、DFI和DSS的K-M斜赴援见平面图1C–1E。

平面图1 B-E流行疾学史料资料归纳

基于每种乳恶特质肿瘤并不一定4个起始站的推论时长计算平均随访时长及血案或检查的之中位时长(同上2)。所有的之中位随访时长为22.1个翌年,但完全相同并不一定乳恶特质肿瘤该时长顶多异特质大大;GBM和急特质髓系白血疾(LAML)最短约12个翌年,而肾嫌色蛋白质恶特质肿瘤(KICH)最久约48个翌年。

同上2 总体之中位随访时长及4个起始站的血案与推论之中位时长

举荐用于的流行疾学结果起始站

流行疾学结果起始站选择取决于研究课题目标、血案数量、路由同上形状和结果史料资料精确度。将这些方法和合作开发的其它方法并作为对单个疾疾史料资料库系统的飞行测试和补充检查,得出在每种疾疾并不一定之中用于每个结果起始站的敦促及理由(同上3)。每种乳恶特质肿瘤并不一定的存活起始站须要多于通过一个主要飞行测试和补充检查才被接受。33种恶特质肿瘤之中的13种用于全部4个起始站:胃尿路上皮恶特质肿瘤(BLCA)、宫颈柱状蛋白质恶特质肿瘤(CESC)、结肠恶特质肿瘤(COAD)、食管恶特质肿瘤(ESCA)、头颈部柱状蛋白质恶特质肿瘤(HNSC)、肾状蛋白质恶特质肿瘤(KIRP)、肺部腺恶特质肿瘤(LUAD)、LUSC、OV、胰腺恶特质肿瘤(PAAD)、肉肿(SARC)、胃腺恶特质肿瘤(STAD)和内膜内膜恶特质肿瘤(UCEC)。反之亦然,并未一个起始站的有嗜铬蛋白质肿和副轴突肿(PCPG)。淋巴弥漫大B蛋白质淋巴肿(DLBC)、LAML和肩腺肿(THYM)极少一个起始站;这样一来乳恶特质肿瘤并不一定2或3个起始站,但其之中一些持保留发表意见。最合理的是PFI,可无保留地举荐给除LAML(无史料资料)、DLBC和KICH(严肃用于)和PCPG(不举荐)另有的4种。

同上3 起始站OS,PFI,DFI及DSS的指标与举荐用于

实验者TCGA-CDR及案实有领域

在乳恶特质肿瘤研究课题之中,雌激素ER阴特质疾征流行疾学存活期生存率比ER+疾征顶多。分别用OS、PFI、DFI和DSS相比较这两类疾征的存活期(平面图3A–3D;斜赴援上半年于10年随访时长,但用于整个史料资料库系统进行时归纳)。单原因归纳推测,用于PFI(p= 0.005)和DFI(p = 0.001)并作为流行疾学起始站,TCGA之中ER+乳恶特质肿瘤疾征比ER-疾征有更高的存活期,但用于OS时两类疾征在在不实际上顶多异特质(p = 0.097) 。此另有,两类疾征的DSS(p = 0.009)有非常大顶多异特质,同上明DSS的潜在价最大值。以上找到证实了PFI和DFI是特定并不一定乳恶特质肿瘤分子会研究课题的合适起始站。

平面图3 实验者和领域实实有

此另有还实验者了洪水泛滥特质GBM存活结果起始站。TCGA之中GBM之中位OS为12.6个翌年,介于此此前报道的常规疾患的12.1个翌年和常规疾患联合替莫唑胺的14.6个翌年两者之在在。之中位PFI是6.1个翌年,介于此此前报道的常规疾患5个翌年和常规疾患联合替莫唑胺的6.9个翌年两者之在在。显然,TCGA史料资料库系统OS和PFI血案时长与史料反之亦然。再次说是OS和PFI并作为GBM分子会研究课题的流行疾学起始站效度。

用Cox比实有不明确特质紧接著建模明确高期(III、IV期)相比较低期(I、II期)乳恶特质肿瘤疾征的不明确特质比(HR),实验者4个起始站的TCGA-CDR史料资料。由于DFI假定与其它结果的假定不反之亦然,对举荐用于OS、PFI和DSS的14种并不一定乳恶特质肿瘤相比较logHR(同上3)。随后极少对意味着Cox比实有不明确特质推论的疾疾进行时统计(平面图3E–3G)。结果同上明,14种并不一定乳恶特质肿瘤之中,除在在皮肿(MESO)、PAAD和葡萄膜黑色素肿(UVM)另有,高期对比低期HR在3个举荐起始站OS、PFI及DSS上相对来说偏高。采用配对试样的Wilcoxon秩和检测,当用于PFI与DSS(p = 0.0008)或PFI与OS(p = 0.039)精确测量时,logHR有非常大顶多异特质,推测疾疾困难重重和存活起始站在HR上实际上系统偏顶多;OS与DSS两者之在在并未非常大顶多异特质(p = 0.106)。对2个logHR最大值的常规有误进行时当此粗略明确Pearson值, 由logHR据估计的3种结果有极非常大正相关:PFI和OS值0.96(95%置信区在在[CI]:0.77–0.99),PFI和DSS为 0.95(95%置信区在在:0.76–0.99),OS和DSS为0.90(95%置信区在在:0.61–0.98)。这些差异特质潜在赞成流行疾学初用PFI,初用OS和DSS花钱起始站。

除了建构分子会史料资料,还先前归纳首次疾患后无疾疾征与非无疾疾征是否出现完全相同的一新血案。TCGA-CDR之中29类乳恶特质肿瘤资讯用于应对该关键问题,划入疾征从诊断到启动首治并达到无疾状态多于存活者3个翌年。以LUSC为实有,有289实有无疾疾征和41实有长期非无疾疾征,NTE赴援分别为21.8%和68.2%。用Cox比实有不明确特质紧接著建模,找到在非无疾疾征之中NTE不明确特质非常大高于无疾疾征(HR = 6.68,95% CI = 4.25–10.51,FDR优化q最大值<0.05)。在另另有21种乳恶特质肿瘤并不一定之中也有相似结果(同上4)。这样一来7种之中并未推论到这些顶多异特质。我们也在指标是否每个建模都意味着比实有不明确特质推论,其之中有两个不具备,须要研究课题时长依赖及多参数建模来寻找理由。

同上4 非无疾与无疾疾征NTE发展对比

TCGA从亚洲地区数百个线路收集疾症,为应对流行疾学史料资料完全相同线路在在的直接联系,无需考虑到史料资料完整特质、和疾征构造等。对每种疾疾而言,我们对比了此前两名备有疾症数最多的组织起来来源线路(TSS)与所有其它TSS的同种疾疾及4个结果起始站(同上5)。

同上5 对来自此前两位TSS的每个乳恶特质肿瘤并不一定研究课题结果进行时相比较

对于GBM等富于洪水泛滥特质的,此前两位TSS(#1和#2)的发疾人群与其它TSS相比相似的有OS、PFI和DSS,因血案有点少难以归纳不举荐DFI花钱起始站。BRCA等低洪水泛滥特质,强力举荐用于PFI和DFI,但敦促严肃用OS或DSS指标。TSS #1的流行疾学史料资料产生不有点好的OS和DSS,但并未推论到PFI顶多异特质;另另有,同上面上TSS#1有更高的DFI结果,极少出现3实有 DFI血案。这种同上里不一的反常同上明该线路的结果史料资料无需促使指标。另一方面,TSS #2的4个起始站结果与其它地方反之亦然。

这个简单的结果相比较同上明,当从特定结果归纳整体TCGA的流行疾学史料资料时,须要考虑到TSS的具体内容资讯。由于成年、应于/基准及疾患等原因影响完全相同TSS患疾人群的起始站结果,TSS可以并作为这些和不完全流行疾学注释等其它并未精确测量顶多异特质的替代。

潜在的混原因、垄断结果的

不明确特质及建模推论

对流行疾学存活起始站归纳来说,敦促用于所检视的全部流行疾学史料资料。但相比分子会/原核生物史料资料的建构归纳,要注意两个方面。首先,举荐发表意见基于基线存活建模,以分子会变异并作预测位点界定试样集,有可能破坏结果统计的标准差顶多异特质。因此,从彼此之间关联的TCGA分子会史料资料或变异TCGA-CDR结果史料资料之中得出的推论无需在独立国家的史料资料库系统之中促使证实。

第二,我们敦促极少用于原发的分子会史料资料,因为疾征初诊时,举足轻重时长资讯等也就是说的流行疾学史料资料已收集相比较完整。面部黑色素肿(SKCM)在TCGA并不一定之中相当特殊,470实有之中极少103实有原发,其余296实有为原发均匀分布淋巴结移到,68实有远端移到。这与很少收集到移到肿的其它TCGA乳恶特质肿瘤并不一定呈现出截然不同。SKCM移到肿很少较强也就是说的原发,而其它TCGA乳恶特质肿瘤并不一定尽管很少有移到肿,但都较强也就是说的原发试样。因此,对于SKCM结果的差异特质,敦促只用于有限数量的原发疾症,尽管SCKM淋巴结移到的III期疾症可并作为独立国家组群进行时研究课题。

在用于一新建构的TCGA-CDR史料资料库系统时,还须要注意:潜在混淆原因、垄断结果的不明确特质及建模推论。

混原因

混原因实际上但被排除在建模之另有时,偏顶多可能高估或考虑到主观。如在乳恶特质肿瘤的种族主义顶多异特质研究课题之中,白人与种族主义歧视疾征两者之在在实际上举足轻重的基因同上达顶多异特质,然而根据分子会变异进行时优化后,这种顶多异特质非常大减低甚至消失。治果也是潜在的混原因,当资讯可借助时应适当考虑到优化。疾患确实时,成年、诊治医院及诊断先后顺序等常规疾患并作为替代资讯能减低以外有误顶多。对这方面的决断建模,激励用于标志物生存率研究课题敦促简报(REMARK)。

垄断结果的不明确特质

测定DSS、DFI和PFI起始站时,要对并未经历举足轻重血案且无疾的死亡疾征进行时审核。在这种情况下,如果推论疾征并未其它自杀身亡,那她/他就此仍可能死于乳恶特质肿瘤指征。然而,在据估计疾患等预测位点对继发特质乳恶特质肿瘤或心血管疾疾等非指标乳恶特质肿瘤死亡不明确特质的预测控制能力时,该推论并不可取。

建模推论

领域Cox比实有不明确特质(PH)建模必无需检查PH推论。除少数案实有另有,大多数建模都意味着Cox PH推论,但无需促使探索这些个案以找出违背推论的理由,从而对HR毫无疑问更准确的据估计。尽管已经为掩埋史料资料和应对关键问题付出了非常大期望,但仍实际上举足轻重的用于受限制,访问TCGA流行疾学史料资料都必无需明白这些受限制。

首先,TCGA主要是为分子会研究课题设计,最初疾症选择来自多个独立国家机构较强合适库存组织起来的并未疾患原发疾症,因此这些疾症不看成连续特质。此另有,对于每种完全相同并不一定/研究课题,随访史料资料并未分立收集。同时,流行疾学史料资料收集的一些规则在无论如何不得不随着时长的推移而改变。TCGA - CDR不构成乳恶特质肿瘤疾患史,并非所有疾症都被注释。因此,归纳特定并不一定或变异的疾患背景比起概况特质泛恶特质肿瘤归纳。当疾征进行时具体内容疾患时,充分利用无需用DFI和PFI起始站有效归纳。

其次,TCGA试样流行疾学随访根据当地诊所的时长同上,可能为疾疾或特定部位的患上和疾人举足轻重生命状态的记录,因此并未TCGA指定的流行疾学随访计划,极少得出计划主要强调的分子会构造。

最后,完全所有TCGA授予的试样和原核生物及分子会史料资料来自一新诊疾征原发的单个腌,由此产生的原核生物和分子会史料资料不必在维度或时长任何方面说明捕获代同上另一疾征结果参数的同上型。该关键问题不是TCGA独有的,任何模板功能障碍研究课题都实际上。

展望

这项工并作是有史以来第一次进一步一新方法检视TCGA泛恶特质肿瘤流行疾学史料资料。由此产生的TCGA-CDR的结果起始站与独立国家非TCGA研究课题结果反之亦然,说明该人力资源在空此前规模的流行疾学尺度上备有了生物观测一新视角。也要确信TCGA-CDR的内在用于局限特质及关键特质他的学生和举荐发表意见。已经相当模棱两可,生物疾疾下一代大规模的分子会研究课题必无需一新方法收集流行疾学疾理、疾患和转归血案史料资料,以坚持最高常规的流行疾学研究课题。尽管有其局限特质,TCGA-CDR备有了常规化史料资料库系统,以及模糊的4个流行疾学结果起始站等价,并应对了精确度关键问题,从而在泛恶特质肿瘤和群体水平上进行时转化研究课题。下一代史料资料研究课题的混合将提高结果两者之在在的直接联系,更高地断言和赞成重复使用。

请注意

An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics

TAG:
延伸阅读
时占祥:机器人在照护应用上的现状和发展前景
12月12日,在中会欧国际工商学院筹办的2015中会国健康产业不断创新和平台奇璞峰才会上,世界外科医生组织北京代表处负责人时占祥就《外星人在保健...[详细]
2022-05-05
慢性附件炎治疗工具有哪些
女性的子宫附件仅指的就是腺体和十二指肠,当腺体和十二指肠发生发炎的时候也就是我们所说的附件炎了。而附件炎是细分急性附件炎和慢性附件炎的...[详细]
2022-05-04
答疑┃医生话说我的妇科病是因为久坐?这是怎么回事?
“上得了居室,眼看了浴室,撰写得了编码,查得出异常,杀得了米奇,翻得了围墙,开得起好车,相比之下大悟”,这是举例来说在网上流传颇多的开...[详细]
2022-05-03
用法、禁忌全部都是解读
/ 药店头条信息化汇编芝麻丧服药大全:年轻人?禁忌?病因?生吃饭?熬吃饭?饭从前吃饭?晚饭吃饭?一文搞懂。芝麻是中的药里面的电影明星中的...[详细]
2022-05-02
BMJ:脊柱葫芦样变怎么回事?
男病态症状,35岁,因腰痛且更为轻微而就诊。睡梦中症状;也因脑损伤而疼醒。下由此可知是症状的X线片,病因是什么?病因:强直病态横膈膜炎棘间...[详细]
2022-05-02
痛经的情况 吃这些可缓解痛经
痛经是很多男人在生活中则会遇到的问题,有的男人痛经不堪重负的不良影响了生活。痛经都是由于什么原因呢?小编给大家讲讲痛经的原因是什么、痛经...[详细]
2022-04-28
黑眼圈的原因 这个问题被骗和化妆品残留有关
黑眼圈还有一个名字叫做熊猫眼,都是指眼周有一圈色素凝固,黑乎乎的。黑眼圈的原因是什么?有的人黑眼圈极度值得注意,而且长三时间都不变成,还...[详细]
2022-04-27
结核性胸膜炎的治疗原理
结核性腹腔炎为以痉挛、呼吸困难、胸痛、新陈代谢苦难、四肢疲惫不堪、食欲不振为临床病症的肺部结核炎症连累腹腔时造成了的腹腔炎,发病系统是...[详细]
2022-04-26
手机号码的尾数意味着好生活
手机号码的尾数是多少?人们能过上美好的生活吗?随着科学技术的发展,几乎每个人都有一部手机。从运气分析的角度来看,手机号码对人们的运气有...[详细]
2022-04-25
  • 地区医院
  • 医院联盟