当前位置:首页>滚动 > >正文

剑桥华人团队搞出多模态医学大模型!单个消费级显卡就能部署

  • 2023-04-16 02:12:19来源:量子位

衡宇 发自 凹非寺


(资料图片仅供参考)

量子位 | 公众号 QbitAI

ChatGPT、AutoGPT能干那么些事,好想知道大模型啥时候才能看病,救我本人狗命?

带视觉的多模态医学基础大模型,它来啦~

名为 Visual Med-Alpaca ,官宣即开源。

这个专为生物医学领域设计的基础模型,构建于LLaMa-7B之上,还在一定程度上借鉴了Visual-ChatGPT和Alpaca (羊驼) 。

因为参数量相对较小,所以使用 单个消费级GPU 就能轻松部署和运行。

给小羊驼披上白大褂的背后团队,主要成员来自 剑桥大学语言技术实验室 (CambridgeLTL,Language Technology Lab at the University of Cambridge) ,以及一位MIT背景的 中国小哥 。

披上白大褂的羊驼

披上白大褂的小羊驼,望闻问切的实际效果如何?

带着疑问,我们把同样的考题 (根据模态能力) 丢给了Visual Med-Alpaca、Glass AI (提供诊断和临床建议的生成式AI应用) 、VQA Medical Model (医学影像语言模型) 、MOSS以及GPT-4。

看X光片能力

既然是多模态LLM,测试时自然不能放过这部分。

丢给他一张胸部X光片,并且提问:X光片显示了这人有啥毛病?该咋办?

Visual Med-Alpaca给出的答案是这样的:

在胸部X光片中看到的双侧浸润和双侧胸腔积液,可能表明呼吸道感染或其他呼吸系统疾病,例如肺炎肺水肿或胸腔积液,重要的是咨询医疗专业人员以进行正确诊断和治疗计划。

而参赛选手中另一名能读图看病的 VQA Medical Model ,回答就两个字:

褥疮 (the decubitus) 。

提供用药建议

鉴于能够读图看病的LLM应用太少,后续测试都只采用纯文字模式。

第一个问题: 我头发掉到快秃了,有啥药可以救救孩子?

Visual Med-Alpaca 列出了5种药物,顺带解释了一下用法和对应病症。

1、米诺地尔:一种用于头皮以促进头发生长的药物。 2、非那雄胺:一种口服药物,可减缓二氢睾酮 (DHT) 的产生,DHT 是一种可导致脱发的激素。 3、皮质类固醇:可涂抹在头皮上以减轻炎症和促进毛发生长的外用药物。 4、蒽林:一种应用于头皮的药物,通过刺激滋养毛囊的血细胞的产生来促进头发生长。 5、酮康唑:一种应用于头皮的药物,用于治疗可导致脱发的真菌感染。在使用任何这些化学物质治疗脱发之前。 请务必咨询医疗保健专业人员,因为它们可能有潜在的副作用并且可能并不适合所有人。

(感觉有人跟我一样需要,所以特地翻译后列出,狗头.jpg)

Glass AI 对这个问题的回答,给出的诊疗方案是米诺地尔和非那雄胺。

深孚众望的 ChatGPT ,也给出了5种用药:

(由于一些不可描述的原因,对第3种表示婉拒了哈)

第二个问题 :如何检测2型糖尿病?

Visual Med-Alpaca 给出了5种测试办法,包括空腹血糖测试、口服葡萄糖耐量测试等。

Glass AI 给出的建议包含了此前的5种方案,然后额外有一种脂质谱。

ChatGPT 给出的测试办法少了一种,但也举例了多种方法。

体验结果来看,Visual Med-Alpaca在医学领域确实普遍表现更好,Glass AI也很有不错的表现,但吃亏在无法进行多模态的生成。

Visual Med-Alpaca

而从技术层面来看,Visual Med-Alpaca构建于Meta开源的LLaMa-7B之上,是比较轻量级的一个模型,易于本地化部署,并降低微调成本。

据团队成员解释,整个模型还参考了Visual-ChatGPT和Alpaca。也就是说, 整个模型及其架构层面没有太大创新 。

基于这个问题,团队成员对量子位的回答是:

毕竟全天下basically Transformer,哈哈哈哈哈哈。

Visual Med-Alpaca的整体工作原理,就是使用prompt管理器,将文本和视觉两种模态的信息合并到prompt中,从而生成具有生物医药专业知识的回答。

首先, 图像input被送入类型分类器,识别出把视觉信息转换为中间文本格式的适当模块,然后加入文本input,用于后续推理过程。

为了让医学图像更适合输入,这一步涉及了集成视觉基础模型DEPLOT和Med-GIT。

然后, prompt管理器从图像和文本input中提取到的文本信息,合并到Med-Alpaca的prompt中,最后生成具有生物医学领域专业知识的回答。

训练过程中,为了更好地让生物医学知识和视觉模态在LLaMA-7B中结合,团队使用了 两个不同的数据集 进行微调。

一个是54000个生物医学示例问答对组成的模型生成数据集,负责执行标准微调和低秩自适应 (LoRA) 微调;另一个是Radiology Objects in Context (ROCO) 数据集,在其上微调了Microsoft GIT模型,用来合并视觉模态。

这里还运用了 GPT-3.5-turbo的NLP能力 ,从各种医学数据集中收集、查询,最后综合生成更符合人类对话习惯的结构化答案。

在体验过程中不难发现,所有的回答最后,Visual Med-Alpaca都会附上一句叮嘱,大致内容是:

“鉴于风险因素的存在,可以结合你的个人健康史去看看医生哈~”

究其缘由,团队解释这是一个学术合作项目,而非商业化模型。

团队强调,为Visual Med-Alpaca评估划定能力边界非常重要。模型虽然通过insruct-tuning,对整体的专业性进行了增强,让模型在生物医疗领域更倾向于保守作答,但无法完全避免大模型的幻觉现象。

所以开源页中也加粗标出了“ Visual Med-Alpaca严格用于学术研究,在任何国家都没有合法批准将其用于医疗用途 ”。

2名剑桥老师+4名华人小哥

Visual Med-Alpaca项目背后,是两位剑桥老师和四名华人小哥。

带队老师是CambridgeLTL联合主任、剑桥NLP教授 Nigel Collier ,他在NLP和AI领域研究25年有余,现在也是艾伦图灵研究所研究员。

共同一作 Chang Shu ,CambridgeLTL博一在读,导师是Nigel Collier。此前,他在爱丁堡大学完成本硕学业。

目前的研究领域集中在LLM的安全性和可解释性方面。

共同一作 Baian Chen ,本科毕业于MIT计算机系,从事AI方向的研究。他的目前身份是Ruiping Health创始人。

Fangyu Liu ,CambridgeLTL博三在读,师从Nigel Collier。在进入剑桥大学攻读硕士学位之前,他在滑铁卢大学就读计算机科学本科。

Zihao Fu ,CambridgeLTL助理研究员、博士后,同样是Nigel Collier的学生。在此之前,他博士毕业于香港中文大学,师从Wai Lam教授;本硕阶段则就读于北京航空航天大学。

以及还有一位 Ehsan Shareghi ,他是剑桥大学的兼职讲师,同时是莫纳什大学数据科学与人工智能系的助理教授,之前有在伦敦大学电气与电子工程系的工作经历。

研究兴趣包括探究和增强预训练大模型。

GitHub:https://github.com/cambridgeltl/visual-med-alpaca/tree/main/code 参考链接:https://cambridgeltl.github.io/visual-med-alpaca/

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

标签:

延伸阅读

推荐阅读

剑桥华人团队搞出多模态医学大模型!单个消费级显卡就能部署

衡宇发自凹非寺量子位|公众号QbitAIChatGPT、AutoGPT能干那么些事,好想知道大模型啥时候才能看病,救我本人狗命?带视觉的多模态医学基础大模

BBA 学不会内卷怎么办?极氪 X 老师下场言传身教-百事通

尽管早在2月份极氪X就开启了预热,每隔一到两个礼拜,外观、颜色、配置、内饰等信息就会像挤牙膏一样被一点点的释放出来,但关于价格,极氪始

增收还添爱,闲置核酸亭“再就业”_天天速递

4月14日一早,在拱墅区天水街道延安新村社区小院,热闹非凡,吸引了一大波周边居民的光临。“哎呀,这里的菜真便宜。”“这些

小i机器人副总裁肖修鹏:AI技术企业未来可探索针对具体行业训练大模型

据上证报,小i机器人副总裁肖修鹏在4月15日举行的第六届上海人工智能大会(SHAI2023)上接受记者采访时表示,AI行

阿拉山口市气象台发布大风橙色预警【Ⅱ级/严重】

据国家突发事件预警信息发布网:阿拉山口市气象台2023年4月15日14时33分发布大风橙色预警信号:预计未来24小时内,阿拉山口市可能受11级以上大

【全球新要闻】美军泄密案嫌犯履历曝光 曾在美国军事基地工作

一批疑似美军密件近期流传于多家社交媒体,涉及美国监听韩国等盟国、介入俄乌冲突等内容,引发舆论哗然。

送给喜欢的女孩子什么花好

给喜欢的女孩送花,一般不会送玫瑰的,如果想要表现一下,不妨考虑一下,以下给你几点建议:。送玫瑰花,送卡通花束,真人公仔

英媒:美国一直密切监听联合国秘书长

美国“泄露密件”持续发酵,再爆新料——联合国秘书长古特雷斯也被美国监听了。

真中!《爱很美味》路演郑州站 今日热搜

陈正道主持首秀李纯王菊欢乐捧哏昨日(4月14日),电影《爱很美味》“姐妹聚会,快乐加倍!”主题全国路演打卡第九站河南郑州。陈正道导演...

当前简讯:姚明冲上热搜第一!3大细节证假球无疑,上海8强资格恐被取消

姚明冲上热搜第一!3大细节证假球无疑,上海8强资格恐被取消

今日精选:让更多宁夏好物“突围”“出圈”

让更多宁夏好物“突围”“出圈”

美媒:美国会警察在国会大厦外没收一支突击步枪

据美媒当地时间14日报道,美国国会警察当天在国会大厦外检查车辆时,在一辆卡车的后座上发现并没收了一支带有加长弹匣的突击步枪,枪支的一部

笼中女囚迅雷下载 ftp_笼中女囚迅雷下载

1、叫♔我♔百♔度♔云♔ife♔izh♔uli♔u99导演:赫苏斯·弗朗哥编剧:赫苏斯·弗朗哥主演:莲娜·萝薇

天天要闻:樊振东7局力克林钟勋!莎莎4-0横扫陈梦,国乒包揽男女单冠亚军

北京时间4月14日,“WTT新乡赛2023”在新乡市平原体育中心进入到了男女单打半决赛的争夺。樊振东苦战七局艰难击败本届比赛的大黑马林钟勋,...

食用酒精75度可以给蔬菜水果消毒吗?

75%酒精不能直接喷蔬菜上消毒。如果喷洒后建议用清水冲洗,将残留在蔬菜表面的酒精残余物、杂物冲洗掉。首先用酒精给蔬菜消毒比较不方便,无法

天天热消息:生态环境部:4月下半月空气质量以良至轻度污染为主

上证报中国证券网讯据生态环境部消息,2023年4月14日,中国环境监测总站联合中央气象台、国家大气污染防治攻关联合中心、东北、华南、西南、西

天天头条:“大模型”开卷,知乎入场面临第一问:AI能否撬动内容增量?

2023年ChatGPT问世并在全球爆火,人工智能议题再度引发热议,AI辅助加盟内容平台成为趋势。4月13日,知乎创始人、董事长兼CEO周源宣布,正式发

喝茶可以配柿饼吗?

喝茶可以配柿饼。柿饼甜味,有助于口腔清新,同时柿饼也富含多种营养成分,如维生素A、B、C等。搭配茶饮更是可以起到相辅相成、相得益彰的作用

钧达股份:一季度净利预增1425%-1656% 电池片出货量同比增长160.78%:世界短讯

公司预计一季度归母净利润3 3亿元-3 8亿元,同比增长1425%-1656%。

西单新一代卖出去了吗_西单新一代

1、102,109,47,105在“商场“下车,你在卖手机前下的话,街对面指着走200米左手边,有一个肯德基。2、如果你

快播:武陵酒走出湖南,衡水老板干以香型探路全国化丨糖酒会2023

春糖期间,以“一树三香美美与共”为主题的中国酒业品类发展大会在成都东大明宇豪雅饭店举办。据了解,近年来河北衡水老白干酒业股份有限公...

每日热门:鹏欣资源(600490)4月14日14点12分触及涨停板

4月14日盘中消息14点12分鹏欣资源600490触及涨停板目前价格411上涨989其所属行业工业金属目前上涨领涨股为鹏欣资源该股为有色·钴黄金有色·镍

先进芯片不等于先进算力,腾讯讲解云上训练大模型必要性

用上了先进芯片并不代表就拥有了先进算力,原因在于高性能计算存在“木桶效应”,一旦计算、存储、网络任一环节出现瓶颈,就会导

女子爬黄山发现多人在厕所过夜,黄山管委会:不可以:世界快资讯

女子爬黄山发现多人在厕所过夜,黄山管委会:不可以,黄山,黄山管委会,住宿,酒店,山顶

高中军训生活感悟 高中生活感悟

今天来聊聊关于高中军训生活感悟,高中生活感悟的文章,现在就为大家来简单介绍下高中军训生活感悟,高中生活感悟,希望对各位小

台南88枪击案8人遭起诉,检方曝犯案动机

去年11月10日凌晨发生的台南学甲88枪击案,台南地检署14日侦查终结,将王文宗、洪政军、孔祥志等8人,分别依违反枪砲弹药刀械管制条例及刑法恐

附议程丨北京市千人进千企专项行动能源科技产研对接会邀请函

北京市千人进千企专项行动能源科技主题产研对接会邀请函为深入贯彻党的二十大精神,推动北京市科协实施的“千人进千企”专项行动,团结、动...

u盘无法格式化体积太大-(u盘无法格式化体积太大怎么办)_即时

u盘无法格式化体积太大(u盘无法格式化体积太大怎么办)前一阵子用u盘做过个linux启动盘,之后发现在windows系统下读不出来。用傲梅分区助手把u

信息:无锡锡山:奏响文旅融合“春之曲”

无锡锡山:奏响文旅融合“春之曲”---春风送暖,万物生长。走进江苏省无锡市锡山区,在民谣音乐节跟着节拍纵情高歌,在古镇市集逛上几圈不...

猜您喜欢

Copyright ©  2015-2022 北冰洋服装网版权所有  备案号:沪ICP备2020036824号-3   联系邮箱:562 66 29@qq.com