支持心力衰竭患者的对话助手:神经符号架构与ChatGPT的比较
Anuja Tayal, Devika Salunke, Barbara Di Eugenio, Paula Allen-Meares, Eulalia Puig Abril, Olga Garcia, Carolyn Dickens, Andrew Boyd
发布日期: 4/28/2025

摘要
随着大型语言模型的普及及其能力的提升,对话助手在医疗等领域的应用日益广泛。为了深入探究传统架构与基于生成式人工智能的对话系统各自的优劣,有必要开展针对真实用户的严格、深入的对比评估。本研究采用组内用户实验方法,比较了两款专为心力衰竭患者设计的食物含盐量查询对话助手。其中一款采用自主研发的神经符号架构,另一款则基于ChatGPT构建。评估结果显示,自主研发的系统在准确性、任务完成率及表达简洁性上均优于基于ChatGPT的系统;然而,后者在语音错误率及完成任务所需澄清次数方面表现更佳。值得注意的是,患者对两款系统并未表现出明显的偏好倾向。