身体中个体细胞的命运在很多方面都是相关的。研究人员希望研究发育过程并了解疾病如何发展。“实验产生大量数据,即大数据,”HelmholtzZentrumMünchen计算生物学研究所所长Fabian Theis教授和慕尼黑工业大学生物系统数学模型教授(TUM)解释说。 )。研究人员不仅收集有关细胞本身的信息,还收集有关细胞与其他细胞和其他组织类型的相互作用的信息。“然而,以前,无法以清晰易懂的方式在细胞水平上对复杂过程进行建模。”
PAGA解释大数据
到目前为止,研究人员采用了两种数据分析方法。他们要么搜索具有相似属性的细胞并将它们分组(聚类),要么他们描述细胞沿其发育途径的时间(轨迹推断)。“如果你通过这些非常不同的镜头观察数据,不可避免地会出现分歧和不明确的解释,”Alex Wolf补充说,他最近在ICB担任机器学习小组负责人。“PAGA通过单一方法和单一一致的建模方法,可以在一次分析中完成聚类和轨迹推理所能完成的所有工作。”根据所需的分辨率,该工具按类型(例如皮肤细胞)和生物状态(例如经历有丝分裂的细胞)对细胞进行分组,并揭示细胞类型和状态之间的转变。
用于研究
最近几个月,已经发表了几篇文章,展示了PAGA开辟的可能性。Helmholtz协会的MaxDelbroück分子医学中心的Mireya Plass与Wolf及其同事一起重建了成年动物的第一个细胞谱系树 - 这项成就被科学杂志誉为2018年最重要的科学突破之一。由剑桥大学的Blanca Pijuan-Sala领导的团队使用PAGA重建了小鼠胚胎的发育过程。其他论文表明,PAGA在临床环境中提供了重要的结果。利用PAGA确定肠道细胞谱系,麻省理工学院和哈佛大学布鲁塞尔研究所的研究人员对慢性炎症性肠病的不同细胞贡献有所了解。
* PAGA是基于分区的图形抽象(PAGA)的缩写,PAGA是一种协调各种方法的方法,例如按属性和开发随时间推移的单元格分组。
**这包括转录组(所有活性基因的总和),蛋白质组(形成的所有蛋白质的总和),形态学(细胞的外观)和表观基因组(DNA和组蛋白的所有变化的总和) ,细胞核中的特殊蛋白质)。