科普
KEPU
生物基础模型越来越强
发布时间:2025-01-29
打印
{{ isAudioPlay ? '暂停播放' : '播放声音' }}
放大 缩小
基于大语言模型(LLM)的平台,如ChatGPT等为全球数亿用户提供了从获取信息到起草论文、软件代码等“一站式服务”。现在,科学家希望借助生物学基础模型获得类似的能力。
  这些生物学模型可以由基因组序列、基因表达等数据进行训练。模型可执行各种任务,从解释新获得的数据到设计定制的蛋白质或通路。
  2024年,多伦多大学计算生物学家推出了名为scGPT的基础模型。它由约3300万个人类细胞的单细胞转录组数据训练而成,可以准确地对不同组织中的细胞类型进行分类,识别协同驱动不同生物过程的基因网络,并可预测破坏性突变对基因表达模式的影响,从而助力新药研发。
  去年12月,瑞士洛桑联邦理工学院计算机科学家夏洛特·布恩等人提出了开发“虚拟细胞”的路线图。它本质上是一个基于RNA、DNA、蛋白质等多个基础模型构建的复杂模型,或可为人类疾病研究、合成生物学和其他学科的发展提供强劲动力。