DeepSeek 强势登陆国家超算平台，三大运营商已全面接入！

摘要：

据最新消息，DeepSeek 的一项重要研发成果已经公布，他们成功训练出了新一代的大语言模型。这款名为 Dee […]

据最新消息，DeepSeek 的一项重要研发成果已经公布，他们成功训练出了新一代的大语言模型。这款名为 DeepSeek-R1 的模型，参数规模达到了惊人的 671B。值得一提的是，该模型也展现出了对新兴硬件平台的良好适配性，甚至能够在 RISC-V 架构的 CPU 和加速器上流畅运行。

从公司背景来看，DeepSeek 是一家专注于人工智能和自然语言处理技术的中国企业，致力于推动前沿科技的创新与发展。他们秉持着“追求极致，拓展认知”的理念，不断探索人工智能的边界。

DeepSeek 在模型训练方面一直秉持着开放的态度，他们不仅开源了部分模型权重，还积极与开发者社区互动。为了方便开发者使用 DeepSeek 的模型，他们提供了完善的 API 接口，并允许用户灵活调整参数，以满足不同的应用需求。同时，DeepSeek 还提供了免费的在线推理服务，用户可以免费体验 1000 个 tokens 的输入和 100 个 tokens 的输出，这对于初步体验模型的性能非常有帮助。

在硬件适配方面，DeepSeek-R1 已经可以在 AMD 的 MI300X 加速卡上运行，并且支持使用 Docker 镜像进行部署。此外，该模型还能够在 CUDA 环境下运行，并且兼容 AMD 的 ROCm 平台，为开发者提供了更多的选择。值得关注的是，DeepSeek-R1-Distill Llama-70B 模型已经能够在 Groq、Cerebras 和 Sambanova 等 AI 推理平台上运行，实现了 500 到 1500 tokens 的低延迟推理。

总而言之，ai.com 域名似乎预示着 DeepSeek 将会在人工智能领域有更大的动作，他们正在构建更全面的 AI 应用生态。与其他公司相比，DeepSeek 的独特之处在于其对技术研发的坚持和对开源生态的贡献。