北大等机构提出医疗专家模型训练方法，80亿参数模型性能跃升至GPT-4水平

1年前发布AI俱乐部

摘要：

人们对于大型语言模型的兴趣和使用日益增长，我们有机会一探究竟。近期，一款名为8B参数的医疗专用模型崭露头角，它 […]

北大等机构提出医疗专家模型训练方法，80亿参数模型性能跃升至GPT-4水平的封面图

人们对于大型语言模型的兴趣和使用日益增长，我们有机会一探究竟。近期，一款名为8B参数的医疗专用模型崭露头角，它由GPT-4驱动。这款模型并非泛泛而谈，它专注于医疗领域，例如“医疗问答”，旨在提供专业的医学知识。

进一步来说，它专注于医学领域的应用，涵盖了广泛的医学概念。尽管如此，它仍然具有一定的局限性，这在大型语言模型中是常见的现象。为了弥补这些不足，我们有必要进行更深入的探索。一方面，是了解常见医学术语背后的含义，另一方面，是探索医学知识领域更广泛的应用。

值得一提的是，我们发现Llama-3-Physician-8B模型已经在HuggingFace平台上发布。

然而，这款模型的潜力远不止于此。据我们所知，OpenLLaMa模型在包含50个医学主题和4个数据集的背景下，已经在相关任务中展现出了卓越的性能。尽管如此，它在处理高级推理方面仍有不足之处。

重要的是，Llama-3-Physician-8B-insturct模型在基准测试中，不仅优于现有的8B参数模型，甚至超越了GPT-3.5模型，直逼GPT-4的水平。这些数据都表明了这款模型的强大之处。

考虑到这些因素，我们决定深入研究这款模型的性能，以便评估其在医疗问答领域的潜在价值。通过医学领域的专业知识和推理，我们希望这款模型能够在临床环境中提供有效的帮助，并在一定程度上简化决策流程。这无疑是一个充满希望的开端。

总而言之，医学专用模型的开发并非一蹴而就，它需要不断地进行优化和改进。通过借鉴“医疗问答”的经验，我们希望能深入了解和优化这些模型的性能，从而使其在实际应用中更加出色。这既是挑战，也是机遇。

论文链接:https://arxiv.org/abs/2406.14833

模型链接:https://huggingface.co/YiDuo1999/Llama-3-Physician-8B-Instruct

快讯中提到的AI工具

GPT-4

OpenAI 发布的最新一代语言模型

© 版权声明：

文章版权归作者所有，未经允许请勿转载。

本文地址：https://aidh.net/kuaixun/jps45m12

暂无评论

none

暂无评论...

英伟达联手加州，计划培训十万居民，助力掌握人工智能关键技能

5浏览 0点赞 1年前

英伟达联手加州，计划培训十万居民，助力掌握人工智能关键技能

Google Gmail新增侧边栏Gemini：帮你智能撰写和回复邮件

7浏览 0点赞 1年前

Google Gmail新增侧边栏Gemini：帮你智能撰写和回复邮件

智源发布Emu3原生多模态世界模型：基于下一Token预测，融会贯通文本、图像与视频理解生成

7浏览 0点赞 1年前

智源发布Emu3原生多模态世界模型：基于下一Token预测，融会贯通文本、图像与视频理解生成

EXL携手微软，共谱生成式AI创新篇章

6浏览 0点赞 2年前

EXL携手微软，共谱生成式AI创新篇章

咨询巨头麦肯锡推出其内部生成式 AI 工具 Lilli

21浏览 0点赞 2年前

咨询巨头麦肯锡推出其内部生成式 AI 工具 Lilli

Zoom AI 助手AI Companion重磅升级：智能识别任务并自动完成

9浏览 0点赞 8个月前

Zoom AI 助手AI Companion重磅升级：智能识别任务并自动完成

欧盟委员会请求深入调查英伟达收购Run.ai的交易。

9浏览 0点赞 11个月前

欧盟委员会请求深入调查英伟达收购Run.ai的交易。

陶哲轩借助AI工具，成功完成数学猜想的形式化证明

5浏览 0点赞 2年前

陶哲轩借助AI工具，成功完成数学猜想的形式化证明