DeepSeek国产大模型爆火：揭示大模型专利申请激增的行业趋势

摘要：

近日，国内人工智能新锐DeepSeek发布了其自研的“高质量、大规模”中文语料库，旨在为行业提供高质量的预训练 […]

近日，国内人工智能新锐DeepSeek发布了其自研的“高质量、大规模”中文语料库，旨在为行业提供高质量的预训练数据。据了解，该数据集涵盖了高质量的文本数据以及代码数据，可用于训练各类中文语言模型。

在具体数据方面，截至2024年6月，DeepSeek已经开源了包含1.64万亿token的数据集。与以往开源的数据集不同，此次开源包含了代码数据，使得2023年开源的数据集总量达到3.895万亿token，并在一年内增长了近20%。展望2024年，其数据集规模将持续扩大，预计增长率将超过207.19%，达到1.2万亿token。

快讯中提到的AI工具

DeepSeek

深度求索：引领未来人工智能技术的探索与创新

文章版权归作者所有，未经允许请勿转载。

本文地址：https://aidh.net/kuaixun/jtcsks0m

暂无评论

暂无评论...

DeepSeek国产大模型爆火：揭示大模型专利申请激增的行业趋势

快讯中提到的AI工具

OpenAI第二大市场：印度崛起，Altman访印承诺深化合作。

Cognida.ai 获 1500 万美元投资，加速企业人工智能部署进程

暂无评论

网易有道发布AI家庭教师“小P老师”，并升级“子曰”大模型至2.0版本

软件工程师化身发烧友，购OGOpenAI域名并重定向至DeepSeek，引人瞩目！

柯林斯词典：2023年度词“人工智能”

LG Exaone AI：成本效率媲美DeepSeek的强大模型

百度强力赋能，大模型应用生态蓬勃发展

智源研究院携手腾讯，深化大模型与AI技术应用落地

零一万物开源 Yi-34B-Chat 微调版及量化版本

周鸿祎：AI无法取代人脑，警惕制造焦虑的人

热门AI工具

AI快讯

历史AI快讯回顾

DeepSeek国产大模型爆火：揭示大模型专利申请激增的行业趋势

快讯中提到的AI工具

OpenAI第二大市场：印度崛起，Altman访印承诺深化合作。

Cognida.ai 获 1500 万美元投资，加速企业人工智能部署进程

热门AI工具

AI快讯

标签云

历史AI快讯回顾