英矽智能上线大语言模型训练框架MMAI Science Gym,赋能通用模型实现垂类领域专精
• 英矽智能创新的"MMAI Science Gym"训练框架可显著提升大语言模型(LLM)在生物化学领域的专精能力
• 经过训练后,原本在专业任务领域失败率高达75%–95% 的 LLM,可在关键药物发现基准测试中实现最高 10 倍的性能提升
• 此次发布将进一步推进制药超级智能(PSI)愿景
由生成式人工智能驱动的生物医药科技公司英矽智能(03696.HK)今日发布大语言模型训练框架Science MMAI Gym,旨在将具有因果推理能力的LLM转化为具备在真实世界处理药物发现与开发任务能力的高性能引擎。

英矽智能深耕AI 领域十余年,已构建覆盖27 款以上临床前候选化合物的创新内部管线,其中10 余款分子获得临床试验批件,并已完成或正在推进多项I 期及II 期临床试验。以此为基础,公司于近期搭建并正式上线AI训练基础设施Science MMAI Gym,旨在助力包括GPT、Claude、Gemini、Grok、Llama、Mistral等在内的通用LLM进行调整优化,使其能够以现代制药研发所需的精度在药物化学、生物学和临床开发方面展开推理。
填补制药领域LLM产出空白
许多知名LLM在通用领域具有强大的推理能力,却在垂类领域,比如关键药物研发任务中表现差强人意甚至彻底折戟,例如对hERG、药物性肝损伤(DILI)风险等复杂药代动力学与毒理终点的预测。根据英矽智能汇总的基准评测结果显示,即使经过提示词优化,通用模型在专精领域输出的结果往往是模糊的,或提出不合生化领域逻辑的推理。
Science MMAI Gym 有望填补这一空白,通过向LLM 系统化传授垂直领域的科学推理能力,使其理解化学家、生物学家与临床医生在实践中使用的语言、表达格式与概念链条,而非仅将药物发现简化为一般的NLP(自然语言处理)基准测试。
Science MMAI Gym主要聚焦以下领域:
• 药物和有机化学:多步优化链、反应推理、逆合成模板、构效关系和三维结合相互作用。
• 生物学和靶点发现:基因表达、通路、疾病机制和多目标靶点评分的组学感知推理。
• 临床开发:试验设计、终点、反应生物标志物的解释,以及使用专有基准(如ClinBench)预测II期试验的成功或失败。
训练整体架构:化学超级智能和生物学超级智能
Science MMAI Gym 是英矽智能迈向"制药超级智能"(Pharmaceutical Superintelligence,PSI)长期路线图的核心组成,设置两条垂直训练方向:化学超级智能(Chemical Superintelligence,CSI)与生物学超级智能(Biology Superintelligence,BSI)。
在 Science MMAI Gym 中,AI 模型将经历持续数周至数月的迭代训练,主要基于:
• 高质量、领域特定的推理数据集: 依托数百万级内部数据点,包括 400 万+ 药物化学优化链、1 亿条有机合成描述,以及数十万条分子动力学轨迹。
• 多任务微调与强化学习:通过多任务监督微调(SFT)与强化微调(RFT),结合奖励模型打磨推理能力,并将模型预测与实验结果对齐。
• 稳健的基准评测:每个训练周期都会在公开及内部的分布外(OOD)基准上进行验证,包括 TDC、TargetBench 与 ClinBench,确保模型在真实应用场景中具备稳定、可靠的表现。
从通用到专精:早期案例研究和成果
内部基准测试显示,MMAI Science Gym 可显著提升模型在药物研发关键任务中的表现:
• 化学超级智能(CSI):一款此前在70%药化任务中失效的开源LLM,经Gym训练后升级为"单模型一站式"的化学引擎。在多项 ADMET 任务上达到业界领先或接近领先的水平,并在 MuMO-Instruct 基准的五项优化任务中取得业界领先的成功率,表现可匹配甚至超越强势的类别专用通用模型。
• 生物超级智能(BSI):经过Gym训练的模型在专有基准上进步显著。在 TargetBench 上,BSI调优模型在多种疾病的新靶点识别中获得最高综合排名,体现出更高的生物学合理性与转化潜力。
商业模式:用于科学研究的会员制"AI GYM"
Science MMAI Gym 以灵活的会员制项目形式提供,既可支持为期两周或一个月的密集冲刺,也可支持为期三个月及以上、面向PSI 的长期合作。合作伙伴提交其基础模型后,可获得经CSI/BSI/PSI 增强的版本,相较基准模型性能最高提升10 倍;同时将获得详尽的基准测试报告,并可选配通过英矽智能自动化检测平台开展湿实验验证。
关于英矽智能
英矽智能是一家全球先锋生物科技公司,致力于整合人工智能和自动化技术,加速药物发现并推动生命科学领域的创新,赋能人类更长久更健康的生活。2025年12月30日,公司于香港联交所主板挂牌上市,股票代码:03696.HK。
利用自主研发的Pharma.AI 平台和先进的自动化生物学实验室,英矽智能正在为纤维化、肿瘤学、免疫学、疼痛、肥胖和代谢紊乱等未满足的疾病领域提供创新药物解决方案。此外,英矽智能持续将Pharma.AI应用拓展到多元化领域,如先进材料、农业、营养产品及兽医药物。更多信息,请访问网站www.insilico.com
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
盘点2025|光纤光缆:周期性放缓之下,确定性开始凸显
在2025年,光纤光缆厂商们习惯于用“周期性”一词来描述当前的困难,相比于宽带普及、4G升级换代带来的流量需求猛增这一巨大业务增长。可如今在刷着短视频、看着带货的新日常生活常态下,尽..[详细]
盘点2025|人工智能:破局前行、以智启新,同赴人机共生新未来
2025年,人工智能行业迎来技术迭代与价值落地的双重关口。这一年里既延续着近年来的高速增长态势,也迎来从野蛮生长向规范提质的深刻转型。 [详细]
盘点2025|算力行业:量质齐升的进阶之路
在数字经济加速渗透全球经济社会各领域的今天,算力已成为继电力、水资源之后的关键生产要素,是支撑数字中国建设、推动高质量发展的核心基础设施。算力的规模与质量直接决定了数字经济的发..[详细]
盘点2025|芯片:AI依旧是挖潜点,应用进一步多样化
时至2025年年底,人们已经开始渐渐习惯,有事听听AI给出的参考意见。其背后的算力支撑也在逐步加强,像是更先进的制程,以及向更多端侧设备的拓展。另一方面,AI又一石激起千层浪,机遇与需..[详细]
盘点2025 | 从5G到6G:深耕与突破并行,开启智能连接新纪元
2025年,全球通信产业站在了一个关键的历史交汇点。这一年既是“十四五”规划的收官年,5G建设成果全面转化的验收年,也是“十五五”规划启幕,6G布局从技术探索迈向工程落地的奠基之年,更..[详细]
盘点2025|量子信息:三大领域技术持续演进,产业发展未来可期
以量子计算、量子通信和量子精密测量为代表的量子信息技术是挑战人类调控微观世界能力极限的世纪系统工程,是对传统技术体系产生冲击、进行重构的重大颠覆性创新,将引领新一轮科技革命和产..[详细]
盘点2025|2025年智能终端趋势洞察:AI重构体验,超级终端时代加速到来
2025年,全球智能终端行业站在了技术革新与生态重构的十字路口。AI技术的规模化渗透、折叠屏形态的成熟落地、跨设备协同的深度演进,正在重塑终端产品的价值逻辑与市场格局。[详细]
6G 技术演进关键一跃:从理论研究走向系统验证
2025年,5G演进技术5G-A在中国实现了规模商用,全球通信行业开始越来越多地把注意力聚焦在下一代移动通信技术6G上。作为最早实现5G和5G-A规模商用的电信运营商之一,中国移动不仅拥有全球规..[详细]
苹果用上谷歌AI,最大亮点绝非Gemini
近期,苹果与谷歌发布联合声明表示,将使用谷歌Gemini AI模式,来为在今年即将推出的更具个性化版的Siri提供支撑,双方表示,这些模型将帮助驱动未来的 Apple Intelligence 功能。而被外界容..[详细]
亨通光电中标CWDM项目,领跑5G-A前传,助推光模块产业链升级
近日,在中国移动2026-2027年基站前传设备集中采购项目中,亨通光电凭借18.85%的最高份额,强势领衔中标,在8家中标企业中拔得头筹。本次集采涵盖无源与半有源波分彩光两大类型,规模高达57...[详细]













