AI聊天机器人ChatGPT在儿科病例诊断中存在错误,研究发现

快速导读:最近在《JAMA儿科学》上发表的一项研究揭示,AI聊天机器人ChatGPT 3.5版本在超过80%的儿科病例中诊断错误。ChatGPT给出的诊断结果中,72%是错误的,11%过于笼统而无法被视为诊断。研究建议需要更有选择性的训练来提高聊天机器人的诊断准确性。

ChatGPT存在高比例的诊断错误

该研究将来自有声望的医学期刊的100个儿科病例挑战输入到ChatGPT 3.5版本中,并评估了其诊断结果。结果显示,聊天机器人给出的诊断中,83%是错误的或过于笼统的。研究人员指出,聊天机器人无法识别某些关联,比如自闭症和维生素缺乏之间的联系。

进一步分析医疗领域中的人工智能

尽管诊断错误率较高,研究人员建议进一步分析人工智能在医疗领域的应用。虽然这项研究突显了像ChatGPT这样的AI聊天机器人的局限性,但它也表明,通过更有选择性的训练,这些系统有可能提高其诊断准确性。研究结果强调了在医疗环境中谨慎实施人工智能的必要性。

结论

该研究揭示了AI聊天机器人ChatGPT在准确诊断儿科病例方面的局限性。在高比例的诊断错误下,研究人员强调了对这些生成型人工智能系统进行更有选择性的训练的重要性。然而,他们也建议进一步分析和探索人工智能在医疗领域的潜力,强调在医疗环境中对人工智能技术进行谨慎考虑和实施的必要性。