唐纳利中心的研究人员已经开发出一种深度学习算法,可以跟踪蛋白质,帮助揭示什么使细胞健康和疾病出了什么问题。
“通过观察细胞图像,我们可以学到很多东西:蛋白质在正常条件下看起来如何,在携带基因突变的细胞中或者当我们将细胞暴露于药物或其他化学试剂时,它们看起来有何不同?人们试图手动评估他们的数据发生了什么,但需要花费很多时间,“分子遗传学研究生,该研究的合着者本杰明格里斯说。
该算法被称为DeepLoc,可以比人眼或之前基于计算机视觉的方法更好,更快地识别蛋白质产生的细胞模式。在最新一期“分子系统生物学”的封面故事中,由Donnelly中心的教授Brenda Andrews和Charles Boone以及分子遗传学系领导的团队也描述了DeepLoc处理来自其他实验室的图像的能力,说明了其广泛使用的潜力。
从自动驾驶汽车到可以诊断癌症的计算机,人工智能(AI)正在以难以预测的方式塑造世界,但对于细胞生物学家来说,这种变化不可能很快到来。得益于全新的全自动显微镜,科学家们可以比分析数据更快地收集大量数据。
“现在,只需几天到几周的时间就可以获得细胞图像,需要几个月到几年才能分析它们。深度学习最终会使分析的时间尺度降低到与实验相同的时间尺度,”领导公司的Oren Kraus说道。 - 该论文的作者和研究生共同监督由唐纳利中心和电气和计算机工程系的安德鲁斯和Brendan Frey教授。Andrews,Boone和Frey也是加拿大高级研究院的高级研究员。
与其他类型的AI类似,其中计算机学会识别数据中的模式,DeepLoc经过培训,可识别由发光蛋白质制成的各种形状 - 标记为荧光标记,使其在细胞中可见。但与需要详细说明的计算机视觉不同,DeepLoc直接从图像像素数据中学习,使其更加准确和快速。
Grys和Kraus对团队之前发布的数据进行了深度研究,该数据显示细胞中有超过4,000种酵母蛋白占据了一个区域 - 酵母中所有蛋白质的四分之三。该数据集仍然是最完整的地图,显示了任何细胞中绝大多数蛋白质的确切位置。当它于2015年首次发布时,分析是通过复杂的计算机视觉和机器学习管道完成的,需要数月才能完成。DeepLoc在几个小时内处理了数据。
DeepLoc能够发现类似图像之间的细微差别。初步分析确定了15种不同类别的蛋白质,每种蛋白质代表细胞中不同的邻域;DeepLoc确定了22个课程。它还能够对由于激素治疗而形状发生变化的细胞进行分类,这是以前的管道无法完成的任务。
Grys和Kraus能够使用与原始训练集不同的图像快速重新训练DeepLoc,表明它可以用于处理来自其他实验室的数据。他们希望通过眼睛看图像仍然是常态的领域中的其他人将采用他们的方法。
“有一些编码经验的人可以实现我们的方法。他们所要做的只是提供我们提供的图像训练集,并用他们自己的数据补充。重新训练DeepLoc只需一个小时或更短时间然后开始你的分析,“格里斯说。
除了与研究社区共享DeepLoc之外,Kraus还与Jimmy Ba合作,通过一个新的初创公司Phenomic AI将该方法商业化。Ba是AI先驱Geoffrey Hinton的研究生,他是退休的U教授和新成立的Vector Institute的首席科学顾问。他们的目标是为制药公司分析基于细胞图像的数据。
“在基于图像的药物筛选中,您实际上可以根据它们的外观来确定药物如何影响不同的细胞而不是一些简化的参数,例如活/死或细胞大小。这样您就可以提取更多关于细胞的信息我们希望通过发现化学化合物的更微妙的影响,使早期的药物发现过程更加准确,“Kraus说。