健康的数据集是有效AI计划的基石

星标“医工学人”,第一时间获取医工交叉领域新闻动态~

哈维·卡斯特罗博士(佩戴 Apple Vision Pro 头戴式设备)、Richard Cramer、Sunil Dadlani和Anna Schoenbaum在 HIMSS24

在本月早些时候的HIMSS24上,Informatica医疗保健和生命科学首席策略师理查德·克莱默(Richard Cramer)与Penn Medicine应用和数字健康副总裁Anna Schoenbaum以及Atlantic Health System首席信息和数字官Sunil Dadlani进行了交谈。


他们都承认:大多数卫生系统在组织和态度上都为人工智能做好了准备,但他们的数据并非如此。

人工智能在医疗保健领域的应用,以及供应商们对这样的变革趋势的推动如火如荼。但我们需要承认的是,这是一个艰难的过程。

他们探讨了医院和卫生系统如何处理以及评估人工智能和自动化技术为他们所用,以及如何启动新的人工智能计划并在整个企业中扩展自己的项目。

Cramer说,尽管生成式人工智能的新闻到处都是,大家也对此感到兴奋,但坚持基础知识是很重要的。“我认为围绕ChatGPT的热情让人们认为它本质上是新的东西,”他说。“但作为一个行业,我们做人工智能已经有很长一段时间了。从多年的经验中得出的一个核心教训是,任何人工智能或机器学习项目都需要一个基本的先决条件:“可访问、可信、适合目的的数据”。

Trustworthy 是什么意思?“这都是关于透明度的,对吧?我需要知道数据来自哪里,发生的一切都在从源头到被消费的路上,“Cramer解释道。

“我是一名终生的数据分析师,我想说的一件事是,如果你是透明的,我可以不同意你的结论,但仍然相信你,因为我知道你所有的假设和一切是什么。但如果你不透明,我可能永远不会相信你,即使我同意你的结论。

“我认为这确实适用于我们正在谈论的人工智能,”他补充道。“数据不需要完美才有用。但你永远不想使用不完美以及你对此一无所知的数据。”

Dadlani 梳理了在卫生系统中工作了几十年的传统 AI 与目前处于 Gartner 炒作周期顶端的新型生成式 AI 之间的一些关键区别。“传统的人工智能只是更具确定性,它是针对特定任务进行训练的,”他解释说。“它更多地与基于真实世界数据中的数据的预测分析有关。我想说的是,传统人工智能在某些用例中已经变得非常成熟,在这些用例中,输出更具可解释性,并且已经成熟并在临床和非临床领域采用。“而当你谈论生成式人工智能时,我们区分的方式是它更多的是概率性的,而不是确定性的。这是自我学习,自我完善。它更多的是关于通用解决方案,而不是特定的解决方案。它可以学习,可以自行扩展这“有其自身的风险,一种可解释性的风险,”Dadlani 说。“因为通常情况下,生成式人工智能是基于基于大型语言模型的非常先进的深度神经网络。因此,这些人工智能模型的可解释性和可解释性确实是不透明的。”

在宾夕法尼亚大学医学院,数据科学家长期以来一直在研究人工智能,但genAI正在“快速发展”,Schoenbaum说。“我们确实将流程(无论是 AI、预测模型还是生成式 AI)都融入到同一个工作流程中。但我们试图弄清楚的是该如何制定政策法规,并支持进行模型治理。

Schoenbaum说,治理良好的数据“绝对重要”,这需要强大的互操作性,以及与其他医疗机构的信息共享。“你不能只在自己的卫生系统内工作,你必须在区域范围内,在社区中工作。你必须确保数据可以以正确的定义共享,因为我认为这就是我们利用数据来为这些系统提供数据的方式。

但当涉及到数据治理时,“应该在你自己的组织内,”她说。“当你添加东西时,应该有人监控,以及谁可以访问这些数据,并确保数据受到保护。这完全是关于患者的,但需要在机构之间共享,以获得更好的益处。”

*本文仅分享医疗科技前沿进展,不代表平台利益。如涉及版权问题,请联系我们删除。

END

编译 | 罗虎

来源 | NHIMSS Media

审核 | 医工学人

关注“医工交叉前沿技术”,可进入医工学人交流群

医工学人小助手微信(申请时请备注个人信息)

推荐阅读

医工学人社群招募

医工学人公众号征稿须知

Nat. Electron. | 汗液中的生命信号:可穿戴汗液传感器重塑心衰管理

Nat. Biomed. Eng | 通过可穿戴设备对汗液进行分析或许可以用于治疗药物滥用障碍

点击关注医工学人

本篇文章来源于微信公众号: 医工学人

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注