10月23日,在第二十届国际基因组学大会(ICG-20)上,杭州华大生命科学研究院与之江实验室联合发布全球首个百亿参数人类基因组通用基础模型——Genos。该模型支持百万碱基对超长上下文分析,实现单碱基分辨率精准识别,标志着基因组研究从“读出”迈向“读懂”生命底层逻辑的关键转折。

Genos系统整合人类泛基因组参考联盟(HPRC)、人类基因组结构变异图谱计划(HGSVC)等权威资源,首次汇聚全球636个“端粒到端粒”高质量人类基因组,覆盖不同人群,减少数据偏见。模型采用混合专家(MoE)架构,实现“按需激活”,在百亿参数规模下保持低推理成本。评测显示,Genos在基因组元件识别、远程调控预测、突变致病性预测等任务中半数以上超现有模型,长序列任务表现尤为突出。临床应用中,其致病性突变解读准确率达92%,结合021科学基础模型后提升至98.3%。
Genos提供12亿与100亿参数双版本,已依据MIT协议在GitHub、Hugging Face、魔搭等平台全面开源,并集成至DCS Cloud云平台,用户可一键调用,享10万次免费推理服务。模型已应用于RNA表达谱预测、细胞表达量分析、遗传疾病诊断及个人基因组报告解读等场景。
Genos由华大与之江实验室“大模型种子班”跨界团队研发,体现“共有、共为、共享”理念。华大还发起“十万长读长大人群联盟”与“百亿细胞计划”,推动基因组与多组学融合大模型迭代。









