开源GPT-4 Vision竞品即将发布

1年前发布AI俱乐部
7 0 0
开源GPT-4 Vision竞品即将发布的封面图

百度推出了升级版的LLaVA 1.5,采用了最新的AI技术,提升了语言和视觉之间的理解能力。LLaVA 1.5结合了CLIP与LLaMA模型,以及MLP结构,构建了一个强大的视觉语言模型。该版本包含了超过60万张图片数据,训练集的规模是之前版本的1倍,进一步增强了其图像识别和生成能力。LLaVA 1.5的应用场景涵盖了从简单的视觉到复杂的AI推理任务。

© 版权声明:
本文地址:https://aidh.net/kuaixun/n7fd8r0o

暂无评论

none
暂无评论...