电话:020-66888888
让大模特读生命之书
作者:365bet体育注册 发布时间:2025-10-27 09:12
“人类基因组计划”于2003年完成了测序,我们得到了“生命之书”,但我们仍然面临着解读的问题。 10月23日,在第20届国际基因组大会上,华大生命科学与江实验室联合发布了全球首个可使用百亿参数的通用核心基因组模型Genos,为破译“天书”提供了新钥匙。与国内外同类模型相比,Genos的优势体现在解释能力和执行能力的双重提升。解释能力的提升主要来自于训练数据的扩充。现有模型往往依赖一到两个参考点,无法反映人类遗传资源的多样性。 Genos整合了人类泛基因组参考联盟(HPRC)、人类基因组结构变异计划(HGSVC)等众多公共资源,首次使用636“端粒到Te”Lomere”全球范围内的高质量人类基因组作为训练数据。这些数据覆盖了全球不同人群,有助于更全面地了解人类遗传多样性,从源头提高人工智能解读的质量。执行能力的提升来自于算法架构的设计。Genos采用“混合专家”架构,精准调度相关“专家”算法进行协同处理,成功降低了计算成本和 聚合数十亿参数时的资源消耗,解决大型模型“好用难部署”的痛点。另外,Genos也是一个开源模型。它是完全开源的,并向 Huggingface 和 Moda 等平台开放。提供12亿和100亿参数两个版本,满足不同需求。 临床试验的结果也证实了杰诺斯的真正能力:杰诺斯有一个准确的在直接面向临床应用的致病性突变解释任务中,cy 为 92%;与基础科学模型相结合,准确率高达98.3%。多项综合测试结果表明genos优于现有最好的模型。人类基因组由大约 30 亿个碱基对组成(参见)。对这种大规模数据的解释和分析是大规模人工智能模型的专长。大规模人工智能模型可以重塑基因组研究和临床应用的节奏,促进科学研究、临床实践和产业的三重跨越,具有广阔的发展前景。在科学研究方面,人工智能将“大海捞针”变成了“精准导航”,可以大大缩短寻找致病位点的周期,引导对罕见疾病和复杂疾病机制的研究。在临床方面,人工智能已经将基因报告从“天书”转变为“天书”。”变成了“手册”。它可以自动生成患者可以理解的文本,帮助医生完成快速、合规的临床级解读。在产业方面,AI将“试错”研发转变为“基于设计”的创新,可以显着减少实验迭代次数,为新研究和药物开发节省成本。展望未来,大规模人类基因组AI模型的进一步发展仍面临三大挑战。 应不断扩大培训数据库,纳入更多疾病样本和遗传数据,提高解读复杂疾病的能力。其次,有必要建立更加完善的伦理和安全法规,明确模型解读结果的临床边界,避免过度解读和隐私泄露的风险。暴露风险。三是加强跨学科合作,促进学科深度融合。AI结合临床数据系统和生物实验平台,通过“AI预测+实验验证”的反馈迭代,不断优化模型性能。让AI模型读懂生命之书,将加速精准医疗的到来,为健康保障筑起坚实的防线。 Genos 的发布是一个初步的阶段。未来谁能率先完成人类基因组“读、想、写、用”四步闭环,谁就打开了生命经济的下一扇大门。需要大家的共同努力。只有学界、产业界、政策制定者和公众共同努力,才能共同书写一个更加包容、健康、文明的世界。
电话
020-66888888