DeepSeek梁文峰或成亚洲科技新首富：公司估值剑指1500亿美元

摘要：

目前，DeepSeek 的开源大语言模型在性能上已经可以与商业领域内最优秀的大模型相媲美，甚至有可能成为某些特 […]

目前，DeepSeek 的开源大语言模型在性能上已经可以与商业领域内最优秀的大模型相媲美，甚至有可能成为某些特定任务中的首选。最近的基准测试表明，其性能已达到令人瞩目的水平。值得关注的是，DeepSeek 的参数范围从 10 亿到 1500 亿不等。据相关评估，该模型的表现超越了 84% 的同类开源模型，在众多任务中均展现出卓越性能。

相关阅读：探索通用AI的未来，挑战Midjourney

风险投资公司 Glasswing Ventures 的创始人表示，DeepSeek 在自然语言处理领域取得了显著进展，其推理能力已达到或超过了其他具有更大规模参数的模型。这意味着在保证性能的同时，所需的计算资源更少。事实上，DeepSeek 的小规模模型已经可以媲美 OpenAI 拥有的 300 亿参数模型。一项针对 1260 亿参数模型的测试显示，它甚至超越了 CEO 拥有的 1180 亿参数模型。

DeepSeek 的目标是构建新一代 AI 基础设施，旨在与 OpenAI 以及 Anthropic 等公司竞争。这些公司通常需要运行超过 600 亿参数的模型。与此同时，Meta 和 Mistral AI 等公司也在积极研发参数数量超过 60 亿的模型。为了应对这一挑战，中国 AI 领域正在积极发展，目标是构建参数规模达到 2000 亿的模型。

总而言之，大模型的未来发展充满了机遇与挑战。DeepSeek 致力于推动人工智能技术的发展，并通过开源的方式，为研究人员提供宝贵的资源和工具。此外，DeepSeek 还积极参与社区合作，共同推动技术的进步。初步结果显示，在使用不到 1% 的数据量情况下，DeepSeek 已经能够达到 84.3% 的准确率。