从ChatGPT到ChatCAD:基于大型语言模型的医学图像交互式计算机辅助诊断

news/2024/4/27 17:24:24/文章来源:https://blog.csdn.net/ImageFlow/article/details/129151392

基本信息

1. 标题:ChatCAD: Interactive Computer-Aided Diagnosis on Medical Image using Large Language Models.

2. 期刊:arXiv

3. IF/JCR/分区:

4. DOI:arXiv:2302.07257

5. 作者:沈定刚教授团队


1. 导读

2023年年初最火热的话题之一就是OpenAI的ChatGPT1,给人类带来了巨大的冲击。1月底,美国《财富》杂志2/3月合刊的封面文章《全球爆红的ChatGPT是如何诞生的?》引爆了创投圈。在这巨大的浪潮冲击下,如何让其在医疗领域发挥其强大的作用呢?沈定刚教授团队给出了初步的答案。在本文中,作者提出了一种将大型语言模型(LLMs)集成到医学影像计算机辅助诊断网络中的初步方法。


2. 背景动机

2.1 计算机辅助诊断(CAD)

传统的计算机辅助诊断网络模型是基于各种计算机视觉的先进算法在大量数据上进行训练,使他们能够学习识别特定于医学领域的视觉信息中的复杂模式和关系,在医学领域的各个任务中已取得了显著性地效果。


2.2 大型语言模型(LLMs)

大型语言模型(如ChatGPT)是经过大量文本数据训练的高级人工智能系统,在自然语言处理方面取得了显著成果,并有可能彻底改变各个行业。ChatGPT已经成功通过了部分美国医疗执照考试,展示了其在增加医疗专业人员提供护理方面的潜力。然而LLMs目前难以从医学影像中解释和提取信息,从而限制了他们全面支持临床决策过程的能力。但医学影像在临床决策中发挥着巨大的作用,如何整合 LLM 以理解计算机视觉任务中的视觉信息是一个有趣的问题。


2.3 视觉语言模型

一种流行的将视觉信息转换为语言的方法是通过图像描述。通过训练大量的数据,基于深度学习的图像描述模型可以生成连贯的描述。

在医学图像分析中,研究人员使用异质图、知识图谱和自监督算法等方法对图像进行描述来生成影像报告。

近年来,随着模型规模的增大,该领域的进展已转向视觉语言预训练和利用预训练模型,如:CLIP2、Frozen3和Flamingo4等。


3. 研究目的

本文目标是将 LLM 的医学领域知识和逻辑推理的优势与现有医学图像 CAD 模型的视觉理解能力相结合,为患者创建一个比传统 CAD 系统更加用户友好和易于理解的系统。这样患者就可以更好地理解病情,减少患者的咨询开销,增强在线医疗服务的可行性。

图2:使用LLMS的交互式CAD。本例使用ChatGPT作为LLM。例如,基于图像和生成的报告,患者可以询问适当的治疗方案(第二个面板)或定义医学术语,如"空域整合" (第三个面板)。或者以患者的主诉(第四小组),LLMs可以解释为什么会出现这样的症状。


4. 模型构建

图1:模型策略总览。


4.1 图像和文本的连接

为了将医学影像转为文本内容输入到LLM中,作者采用了以下策略:

1. 将影像输入到训练好的CAD模型中产生输出。

2. 将该输出转为自然语言。

3. 使用语言模型总结结果并作出最总的总结。

4. 基于以上结果和语言模型(基于医学知识预训练),参与关于症状、诊断和治疗的谈话。

以图3为例:

图3:提示张量和文本之间的桥梁。我们展示了三种不同的提示设计。

1. CAD模型的分类输出为一个含有5个概率值的向量。(即判别为五种类别的可能性)。

2. 将上述结果转为一个用以用于LLM的提示性语句。一种自然的提示方式是显示所有五种病理及其相应的分数。

① 为了避免一些误解,规定“疾病得分越高,患病的可能性就越大”作为基本规则。② 将每种疾病的分数表示为“{疾病}分数:{分数}”(Prompt#1)。但这种表示不符合临床报告需求。③ 为了和临床报告形式一致,作者又将概率分数转为定性描述疾病的严重程度。“没有迹象”[0.0-0.2],“可能性很小”[0.2-0.5],“可能”[0.5-0.9],“肯定”[0.9 及以上)。(Prompt#2)④ 为了使报告更简洁,报告诊断分数高于 0.5 的疾病。(Prompt#3)如果没有预测在这五种类别中,则显示“未发现”。


4.2 数据集和实验设定

模型:

● CvT2DistilGPT25

● R2GenCMN6

● 本文提出的模型(基于GPT-3)

● 本文提出的模型(基于ChatGPT)

数据:

● 用于报告生成的数据:MIMIC-CXR7

● 用于疾病分类器训练的数据:CheXpert8


5. 实验结果

5.1 报告生成

5.1.1 改进后的报告的质量

表1:模型诊断正确率对比。

图5:四种模型在五次观测上的F1分数。

5.1.2 LLMs是如何影响报告质量

语言模型的诊断能力与其大小成正比,这突显了LLMS的逻辑推理能力的关键作用。

表2:比较不同大小的GPT-3模型的性能。参数大的模型更好些。

越有效的模型会产生更长的报告。

图6:不同模型生成报告的长度。


5.2 交互的、可理解的CAD

ChatCAD能够利用LLM广泛而可靠的医学知识来提供交互式的解释和建议。通过这种方法,患者可以更清楚地了解自己的症状、诊断和治疗方案,从而更高效、更具成本效益地咨询医疗专家。

随着语言模型的不断进步,随着对更可信的医疗培训数据的访问,ChatCAD变得更加准确,ChatCAD有潜力显著提高在线医疗服务的质量。

图7:两个ChatCAD案例。一个讨论胸腔积液,另一篇讨论水肿及其与肿胀的关系。

图8:基于ChatGPT的模型生成的报告。


6. 局限不足

目前这个方向是个比较新的领域,还是有很多工作需要去完善:

● LLM生成的报告在某种程度上不像人类。ChatCAD 提高了诊断准确性,但降低了 BLEU 分数9。

● ChatCAD只给出了三种prompts,还需要继续完善。

● ChatCAD中不包含患者的主诉信息,因为没有相应的数据库。需要更好的数据集和基准。

● 视觉分类器的作用尚未得到探索,需要进行额外的研究以确定具有更大参数的ViT或 SwinTransformer等模型是否可以提供改进的结果。

● LLMs也可以用来帮助视觉模型的训练,比如利用在LLMs中学到的相关医学知识来修正视觉模型的输出。

● 对prompt设计只是进行定性分析,应该进行更准确的定量评估。

● ChatCAD的内容没有和临床医生进行专业的讨论,需要进一步完善。


7. 一些想法

● 虽然本文不那么完善(毕竟只是preprint,说不定作者已经在改进的路上了),但作者团队相当于挖了一个坑给大家,大家快冲!。(大佬们的动作真的快啊!)

● 基于现有的通用人工智能ChatGPT,给其输入医学知识学习构建ChatMedicine是一个很有意思的研究。(毕竟人工智能和人最大的区别是:你给他知识他是真的学啊!)

▎脚注列表

[1] 关于ChatGPT的解读互联网很多,推荐两个:通向AGI之路:大型语言模型(LLM)技术精要 - 知乎;https://mp.weixin.qq.com/s/IF43iCk4v3qwIBjMdljtJA

[2] Alec Radford, Jong Wook Kim, Chris Hallacy, Aditya Ramesh, Gabriel Goh, Sandhini Agarwal, Girish Sastry, Amanda Askell, Pamela Mishkin, Jack Clark, et al. Learning transferable visual models from natural language supervision. In International Conference on Machine Learning, pages 8748–8763. PMLR, 2021.

[3] Maria Tsimpoukelli, Jacob L Menick, Serkan Cabi, SM Eslami, Oriol Vinyals, and Felix Hill. Multimodal few-shot learning with frozen language models. Advances in Neural Information Processing Systems, 34:200–212, 2021.

[4] Jean-Baptiste Alayrac, Jeff Donahue, Pauline Luc, Antoine Miech, Iain Barr, Yana Hasson, Karel Lenc, Arthur Mensch, Katie Millican, Malcolm Reynolds, et al. Flamingo: a visual language model for few-shot learning. arXiv preprint arXiv:2204.14198, 2022.

[5] Aaron Nicolson, Jason Dowling, and Bevan Koopman. Improving chest x-ray report generation by leveraging warmstarting. arXiv preprint arXiv:2201.09405, 2022.

[6] Zhihong Chen, Yaling Shen, Yan Song, and Xiang Wan. Generating radiology reports via memory-driven transformer. In Proceedings of the Joint Conference of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing, Aug. 2021.

[7] Alistair EW Johnson, Tom J Pollard, Seth J Berkowitz, Nathaniel R Greenbaum, Matthew P Lungren, Chih-ying Deng, Roger G Mark, and Steven Horng. Mimic-cxr, a deidentified publicly available database of chest radiographs with free-text reports. Scientific data, 6(1):317, 2019.

[8] Jeremy Irvin, Pranav Rajpurkar, Michael Ko, Yifan Yu, Silviana Ciurea-Ilcus, Chris Chute, Henrik Marklund, Behzad Haghgoo, Robyn Ball, Katie Shpanskaya, et al. Chexpert: A large chest radiograph dataset with uncertainty labels and expert comparison. In Proceedings of the AAAI conference on artificial intelligence, volume 33, pages 590–597, 2019.

[9] Kishore Papineni, Salim Roukos, Todd Ward, and Wei-Jing Zhu. Bleu: a method for automatic evaluation of machine translation. In Proceedings of the 40th annual meeting of the Association for Computational Linguistics, pages 311–318, 2002.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_142.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

国内首个ChatGPT镜像系统?辅助写代码真方便

hatGPT 美国OpenAI研发的聊天机器人程序,于2022年11月30日发布。ChatGPT是人工智能技术驱动的自然语言处理工具,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚…

ChatGPT专业应用:生成新闻稿

正文共 949 字,阅读大约需要 4 分钟 媒体工作者必备技巧,您将在4分钟后获得以下超能力: 生成新闻稿 Beezy评级 :A级 *经过寻找和一段时间的学习,一部分人能掌握。主要提升效率并增强自身技能。 推荐人 | Kim 编辑者…

一点就通——ChatGPT翻译润色的最新简明使用方案

prompt使用推荐 1.翻译prompt 翻译主要有两种,第一种是我们的老朋友厦门大学潘王雨昂(个人主页:pwya.github.io)所编写使用的prompt,第二种是我自己改造的。 1.我希望你能担任英语翻译、拼写校对和修辞改进的角色。…

全网最详细中英文ChatGPT-GPT-4示例文档-TL;DR文档快速总结应用从0到1快速入门——官网推荐的48种最佳应用场景(附python/node.js/curl命令源代码,小白也能学)

从0到1快速入门TL;DR文档快速总结应用场景Introduce 简介setting 设置Prompt 提示Sample response 回复样本API request 接口请求python接口请求示例node.js接口请求示例curl命令示例json格式示例其它资料下载ChatGPT是目前最先进的AI聊天机器人,它能够理解图片和文…

事关ChatGPT账号封禁的强烈忠告

文 / 韩彬(微信公众号:量子论) 这两天有不少朋友加我微信(hanbin266),咨询ChatGPT账户被封了,怎么办? 我在《真实发生了,滥用这种场景,ChatGPT账号被封禁》一…

ChatGPT对测试行业的影响(附GPT使用实战展示)

引言: 时代的巨轮缓缓碾过,顺应时代才能胜者为王 文末有ChatGPT应用实战成果展示 ChatGPT之我见 测试的影响 正如上篇文章的推文所述,AI的发展让我们所有人都始料未及,就好像雨后春笋一样,各种各样的AI技术顺势而…

大学生对chatGPT的认知和使用

新一代对话式人工智能chatGPT在全球范围狂揽1亿名用户,不止于科技界破圈,更成为街头巷尾的谈资。 chatGPT能干什么? https://openai.com/blog/chatgpt/ chatGPT官网 写解决方案编写代码 说笑话 个人体验: 实用性强,相…

基于小程序制作一个ChatGPT聊天机器人

在AI技术日新月异的浪潮中,将ChatGPT与实战开发相结合,制作一个随身携带的聊天机器人,紧贴前沿的同时稳固基础。 一、前言1.1、什么是ChatGPT1.2、什么是文本完成二、API2.1、ChatGPT官网申请API所需要的key2.2、搭建API2.3、创建控制器及动作方法三、小程序3.1、页面创建3.…

使用Laf云平台,两步将ChatGPT接入微信公众号

使用Laf云平台,两步将ChatGPT接入微信公众号 最近很火的ChatGPT可以说已经满大街可见了,到处都有各种各样的体验地址,有收费的也有免费的,总之是五花八门、花里胡哨。 所以呢,最近我就在研究怎么才能方便快捷的体验到…

妈妈生了我,ChatGPT淘汰了我爸爸

当我还在老妈肚子的时候,经常听见老爸老妈讨论我该叫什么名字,那时他们争吵的火力十足,我在里面可真是干着急,但是因为不知道我是男是女,所以讨论了半天,最终也是无疾而终。 等我出生以后,老爸那…

手把手教你怎么搭建自己的ChatGPT(含源码)

这篇文章教你怎么不懂技术也可以搭建自己的chatGPT,内容都是一个字一个字的手打的,可能要错别字,需要技术支持私信老王。 提供本文你可以学到: 1、如何挑选、购买自己的服务器 2、如何注册自己的域名 3、如何安装服务器的软件…

关于ChatGPT API,你需要知道的…(截止到230303)

1. ChatGPT 的 API 已经推出 从官网 https://platform.openai.com/docs/guides/chat 和 https://platform.openai.com/docs/models/gpt-3-5 可以看出:gpt-3.5-turbo 已经正式上线。 GPT-3 快速入门:前端调用 GPT-3 API、Python 调用 GPT-3 APIopenAI 模…

零基础解读ChatGPT:对人类未来工作是威胁还是帮助?

摘要:火到现在的ChatGPT到底是什么?它背后有哪些技术?对于我们的工作和生活会有啥影响?快来一起了解吧~本文分享自华为云社区《零基础解读ChatGPT:对人类未来工作是威胁还是帮助?》,作者&#x…

「部署全流程」 中科院学术专业版chatGPT来啦

前言 上周末的时候,一位开发者将名为「ChatGPT Academic」的项目开源至 GitHub。 仅用了短短一两天,该项目 Star 数便增长到了 21k,成为 GitHub 上又一个基于 ChatGPT 构建的热门开源项目。 这个项目就是《中科院学术专业版 ChatGPT》。 …

普通用户如何在电脑和手机上极速体验最强AI——Chatgpt?

事先说明~这是我个人使用成功的方法,一时兴起从吃瓜群众变成尝鲜小白,花半天研究了点教程,踩坑上岸过后整合成的,可能会有漏洞或者写得不对的地方,欢迎有大佬交流指正!总之希望能帮助到感兴趣的友友~ 注&am…

重磅!openAI开放chatGPT模型APIgpt-3.5-turbo,成本直降90%!

ChatGPT API,千呼万唤终于来了。 chatGPT不仅开放 成本还直降90%! 全新API基于“gpt-3.5-turbo”模型,其基础是支持ChatGPT的GPT 3.5模型,取代了此前的“text-davinci-003.”。这款名为“gpt-3.5-turbo”的模型,定价…

你的好帮手,优质chatgpt镜像网站

众所周知的原因,现在国内访问chatgpt和newbing两个工具都比较困难。但是作为我们生产力提升的优质软件,我个人认为这种大语言人工智能模型帮助我们的工作是未来的一个大趋势。在这里我准备了几个好用的chatgpt免费镜像网站供大家使用。ChatGPT Bot (xeas…

Android Studio 插件 ChatGPT

一、为什么要在AS里使用ChatGPT 在AS里使用ChatGPT可以辅助生成一些重复性、解析类的代码,还有一些功能性问题查找,具体需要个人探索。官网使用经常性出现断连,需要刷新浏览器,而且经常历史列表丢失(个人是这样的&…

ChatGPT专业应用:生成外贸询盘邮件

正文共 897 字,阅读大约需要 8 分钟外贸必备技巧,您将在8分钟后获得以下超能力:生成外贸询盘邮件Beezy评级 :A级*经过寻找和一段时间的学习,一部分人能掌握。主要提升效率并增强自身技能。推荐人 | Kim编辑者 | Yoland…

Java SpringBoot实现调用OpenAI ChatGPT的相关接口(详细教程)

大纲 说明 Java调用OpenAI接口,Java调用实现ChatGPT聊天,OpenAIAPI是一个自己封装的OpenAI GPT-3聊天API的Java工具类,可用于通过Java代码调用GPT-3模型进行自然语言交互,实现智能聊天等功能。 通过调用GPT-3模型,输…