全国人大代表,民建中央副主席,中国工程院院士,清华大学医学院教授,生物芯片北京国家工程研究中心主任 程京
2023年,ChatGPT的出现标志着人工智能行业进入到了以大模型为代表的快速发展阶段。2024年初SORA所产出的视频更是加速了AGI发展的步伐。未来基础大模型与行业大模型的结合将会成为AGI时代的操作系统,为各行业领域开启第四次产业革命。
大模型已经从ChatGPT文本信息对话、DALL.E文本生成图片走到了最近的SORA文本生成视频。而黄仁勋、张亚勤、周鸿祎等认为AI大模型的下一站是生命健康,解码生命语言编码,最大限度接近人类“永生”的梦想。
生命现象本质也是一种自然进化的精密语言编码,尤其是生命科学领域中微观世界的分子序列数据,这种语言编码与自然语言具有许多相似之处,例如,蛋白质可以通过一个代表着氨基酸的字符序列表示,这与自然语言具有语法限制类似。
近年来,AI已经具备了理解真实世界的能力,AI制药也将会迎来新的飞速发展。大模型的快速发展使其已经具备了理解模拟世界的能力,大模型与医药行业的结合有望革新药物研发范式,而数据是大模型变得“聪明”的关键,中医药几千年积累的知识宝库作为优质数据资源需要尽快占领,构建中医药多模态大模型,抢占中医药大模型高地迫在眉睫。
而目前国内提出的中医药大模型普遍以中医药传统经验知识图谱作为训练数据,缺乏与生命底层语言的作用联系和颠覆性创新。由于生命是核酸和蛋白质等物质组成的分子体系,它具有不断繁殖后代以及对外界产生反应的能力。当人患病服用中药后,药物成分就会与体内的分子物质,如核酸、蛋白质、糖等产生作用而发挥疗效,过程中涉及人体疾病生命语言靶标发现、中药对人体生命分子作用功能的大规模底层实验数据、中医药算力算法等复杂计算和实验、临床论证过程等。为了促进中药传承创新,建议如下:
在“十四五”计划科技研发专项中,尽快设立重大专项,支持大学和企业联合开展“用颠覆性技术构建中医药AI大模型”重大系统化工程,打造从底层中医药知识数据和实验数据、中药功能评价算法工具、中药新产品开发智能平台综合解决方案的大模型赋能产业生态。开发符合中国人生命语言特点的原创中国药,用创新中药守住中国人生命健康红线。
(清华新闻网3月8日电)
记者:段颖
编辑:李华山
审核:郭玲