蚂蚁专用模型超越o3蚂蚁刷新医疗AI榜纪录
不卷参数的专业模型,会不会被通用大模型取代?
在医疗领域,这个疑问正在被打破。
蚂蚁集团联合研究团队发布的《MedResearcher-R1: Expert-Level Medical Deep Researcher》技术报告,证明了一条关键路径:专业开源模型只要做好领域化设计,有机会在垂直赛道上“以小博大”,反超通用大模型。
团队发布的医学AI智能体MedResearcher-R1,靠2100条(约2K规模)训练样本,在权威医疗基准测试MedBrowseComp上,将复杂医疗研究任务的准确回答数量提升至27.5。
刷新该榜单纪录的同时,超过o3、Gemini 2.5 Pro等领先通用大模型,突破了此前25.5的业界准确回答“卡点”。