蚂蚁健康与北京大学人民医院王俊院士团队历时6个多月,联合十余位胸外科医生共同打磨,发布了全球首个大模型专病循证能力的评测框架——GAPS(Grounding, Adequacy, Perturbation, Safety),及其配套评测集 GAPS-NSCLC-preview。旨在解决现有医疗AI评测局限于考试式问答、缺乏临床深度、完整性、鲁棒性与安全性综合评估的问题。该评测集聚焦肺癌领域,包含92个问题、覆盖1691个临床要点,并配套全自动化的评测工具链,通过指南锚定、多智能体协同实现从问题生成、评分标准制定到多维度打分的端到端自动化。蚂蚁集团推出ai健康应用阿福 AI医生终于有了硬标尺!蚂蚁发布全球首个专病循证评测框架GAPS
蚂蚁健康与北京大学人民医院王俊院士团队历时6个多月,联合十余位胸外科医生共同打磨
量子位看科技
2025-12-29 15:26:46
0
阅读:1