(跳过导航)
狗万体育下载地址《美国医学会杂志》网络的家
的观点 222651年
最初的调查
4月28日,2023年

比较医生和人工智能聊天机器人回答病人的问题发布到一个公共社交媒体论坛

作者的从属关系
  • 1高通研究所,加州大学圣地亚哥分校拉霍亚
  • 2传染病和全球公共卫生部门,医学系,拉霍亚加州大学圣地亚哥
  • 3布尔茅尔学院计算机科学系,,布林莫尔,宾夕法尼亚州
  • 4计算机科学部门,马里兰州巴尔的摩市约翰霍普金斯大学
  • 5赫伯特·韦特海姆公共卫生学院的科学和人类长寿,拉霍亚加州大学圣地亚哥
  • 6人类的长寿,加州拉霍亚
  • 7海军卫生研究中心、海军、圣地亚哥,加利福尼亚
  • 8的血液和骨髓移植,医学系,拉霍亚加州大学圣地亚哥
  • 9穆尔斯癌症中心,加利福尼亚大学圣地亚哥拉霍亚
  • 10生物医学信息学、拉霍亚加州大学圣地亚哥
  • 11奥特曼临床转化研究学院,加州大学圣地亚哥分校拉霍亚
JAMA实习生地中海。 2023年4月28日在线发表。doi: 10.1001 / jamainternmed.2023.1838
要点

问题可以人工智能聊天机器人助理,提供应对病人的问题,质量可比,同情那些医生写的吗?

发现195年这个横断面研究随机患者社交媒体论坛提问,一个团队相比医师执照的卫生保健专业人员和聊天机器人的反应病人的问题在公共社交媒体论坛上公开。chatbot反应优于医生反应和评价更高质量和同理心。

意义这些结果表明,人工智能助手可以帮助起草应对病人的问题。

文摘

重要性虚拟医疗的迅速扩张导致病人信息激增伴随更多的工作和卫生保健专业人员的倦怠。人工智能(AI)助手可以帮助创建回答病人的问题,起草的反应,可能是由临床医生了。

客观的评估人工智能聊天机器人助理的能力(ChatGPT)发布的2022年11月,为病人提供质量和移情反应的问题。

设计,设定和参与者在这个横断面研究,公共和nonidentifiable数据库的问题从公共社交媒体论坛(Reddit的r / AskDocs)被用来随机吸引195交流从2022年10月,一个医生验证回应了一个公开的问题。Chatbot反应生成原始问题进入到一个新的会话(事先问题被要求在会话中)12月22日和23日,2022年。最初的问题以及匿名和随机命令医生和chatbot反应评估团队的一式三份授权卫生保健专业人员。评价者选择”反应是更好”,认为“提供的质量信息”(万博manbetx平台首页非常贫穷的,可怜的,可接受的,,或很好)和“提供的共鸣或床边的方式”(不善解人意,略善解人意,温和善解人意,善解人意,非常善解人意)。意味着结果被命令在1到5范围内聊天机器人和医生之间的比较。

结果的195个问题和响应,评价者首选chatbot反应医生反应78.6%(95%可信区间,75.0% -81.8%)585年的评估。意味着(差)医生反应明显短于chatbot反应(52[17 - 62]字vs 211(168 - 245)字;t= 25.4;P<措施)。聊天机器人的反应被评为质量显著高于医生反应(t= 13.3;P<措施)。回答评为的比例很好质量(≥4),例如,对于chatbot高于医生(CI chatbot: 78.5%, 95%, 72.3%, -84.1%;CI医生:22.1%,95%,-28.2%,16.4%)。这相当于患病率高出3.6倍很好聊天机器人质量反应。聊天机器人的反应也比医生更善解人意的反应级(t= 18.9;P<措施)。的比例反应评价善解人意非常善解人意(≥4)更高的chatbot比医生(医生:4.6%,95%,2.1%,-7.7%;CI chatbot: 45.1%, 95%, 38.5% - -51.8%;医生:4.6%,95% CI, 2.1% - -7.7%)。这相当于患病率高出9.8倍善解人意非常善解人意聊天机器人的反应。

结论在这个横断面研究,聊天机器人生成质量和病人移情反应问题在网上论坛。进一步探索在临床设置这一技术是值得的,比如使用chatbot起草反应,医生就可以编辑。随机试验可能会进一步评估如果使用人工智能助手可能改善反应,降低临床医生职业倦怠,改善病人的结果。

添加或更改的机构
5对本文的评论
全部展开
聊天机器人可以通过预定程序的模拟移情反应,他们不能真正理解的情绪。
Ediriweera Desapriya博士|儿科医学院,UBC-BC儿童医院
移情,是能够理解和分享他人的感情,是一个复杂的情感和认知过程,涉及的不仅仅是提供信息。万博manbetx平台首页它包括积极倾听、真正关心和理解的能力和应对病人的情感需求。聊天机器人可以通过预定程序的模拟移情反应时,他们不能真正了解人类的情感和需求用户以同样的方式,一个人类医疗保健专业。而聊天机器人可能无法完全复制移情的人为因素,他们仍然可以培训卫生保健专业人士和有用的工具 提高病人沟通和接触。

研究结果表明,再从医疗专业人士更受欢迎和响应,因此,可能会有一个关联的长度chatbot反应和它们的评级。虽然是真的,反应时间过长可能会提供更多的信息,并且被认为包含更多的信息,这未必是真的,反应时间过长总是更好或更善万博manbetx平台首页解人意。

此外,我有一个问题,一个问题是否长chatbot反应仅仅是由于机器有更多的时间来回应,而不是提供更善解人意或信息的反应和机器有足够的时间(比忙碌的医生),重要的是要确保聊天机器人提供的反应已不仅仅为了不再,而是为研究人员提供相关和有用的信息。万博manbetx平台首页
利益冲突: 没有报道
阅读更多
作者的利益冲突的披露
百花大教堂Mastroianni博士|

几级的人反应是作者与金融相关的利益冲突或人工智能聊天机器人技术。他们更有可能能够识别的各种反应产生的聊天机器人由于他们的工作领域。此外,他们可能想得到经济如果计算机反应被发现是更好的。
利益冲突: 没有报道
有趣的调查有很大的局限性
香港太阳,博士|主要数据科学家,clinalytix部门,迪达勒斯医疗保健
谢谢你报告这个有趣的对比!作为数据科学家使用医学人工智能和ChatGPT的超级粉丝,我不惊讶地看到其鼓励表现在这个报告。不过,我也发现这篇文章引用作为证据,聊天机器人是人类超越医生在一些社交媒体,因此,我想提出一些本研究的局限性:

首先,从问答论坛答案并不代表真正的临床实践。此外,答案的提供者在问答论坛也提供答案从他们的临床实践时间短,它们的性能
不应该被认为是医生的正常水平。

其次,从chatbot持续长和详细的答案。它给详细解释和指导而与人类的医生。敏感性测试,医生反应超过第75百分位(≥62字)仍然低得多比211(168 - 245)字从聊天机器人。鉴于词数量如此巨大的差距,移情的评价很有偏见。

chatbot显示其潜在提高医生和病人之间的交流,我想知道这将是一个有趣的实验问题和医生的反应作为输入和问chatbot生成一个回复病人。这将允许评估是否仍有附加值的医生在这个问答论坛设置。

利益冲突: 没有报道
阅读更多
ChatGPT训练集
凯瑟琳Mac精益,医学博士|特种外科医院,纽约,纽约
首先,荣誉为有趣,作者信息和及时的文章。

作者评论是否数据从Reddit的r / AksDocs可能已经包含在ChatGPT的训练集,如果这应该怎么通知的解释研究结果。我要求这个问题聊天GPT和有了回应:

“作为一个人工智能语言模型,我没有直接访问任何特定subreddit,包括r / AskDocs。然而,它是可能的,一些文本,subreddit是包含在各种各样的来源用于培养我,
与许多其他网站和文本来源。”

作者可能有更好的信息。万博manbetx平台首页
利益冲突: 没有报道
阅读更多
聊天机器人与医生的性能。
罗勒Fadipe,黑带大师|贾斯汀Fadipe中心。多米尼加。
从某种程度上说这项研究的初步结果是令人鼓舞的如果不是鼓舞人心。
然而在另一个层面,它可能是不明智的跳转到任何明确的结论为时过早。大部分的医生和患者之间的相互作用在现实生活中尽可能多的与医生把线索不仅从病人坐在房间里也是不言而喻的词可能不经常比口语携带更多的线索。有经验的临床医生部署所有的五种感官(甚至六分之一)我的临床难题。可以
聊天机器人达到表面下的类似效果?
利益冲突: 没有报道
阅读更多
×
Baidu
map