DeepSeek R1

共 2 篇文章

依靠逻辑题,AI数学竞赛能力大幅提升!微软、九坤投资:7B小模型也能接近o3-mini

本文由微软亚洲研究院的谢天、洪毓谦、邱凯、武智融、罗翀,九坤投资的高梓添、Bryan Dai、Joey Zhou,以及独立研究员任庆楠、罗浩铭共同撰写。 通过单一逻辑益智题训练,AI数学竞赛的表现竟显著提升? 在中国的深度学习团队成功突破硅谷的技术封锁后,它们再度推出重磅研究,揭示了DeepSeek...
+3
智能之星4个月前

仅用200多行代码,超低成本实现复旦大学开源的DeepSeek R1「Aha Moment」!

本文介绍复旦大学知识工场实验室肖仰华教授、梁家卿青年副研究员团队的最新研究成果:一个简洁高效的R1-zero自发反思能力复现项目。 DeepSeek研究中反复提及的“Aha Moment”(顿悟时刻),指的是模型训练过程中突然展现出类似人类自我反思和策略调整能力的现象。 DeepSeek 论文中提到...
+4
智能之星5个月前