斯坦福与哈佛联合提出POPPER:基于统计原则与智能体的自动化假设验证框架,实现科学发现速度提升十倍
假设验证在科学发现、决策制定与信息获取中扮演着基础角色。无论是生物学、经济学还是政策制定,研究人员通常依赖检验假设来引导其结论。传统的假设验证过程包括设计实验、收集数据并分析结果,以确定假设的有效性。 然而,随着大型语言模型(LLMs)的出现,AI 生成的假设数量已显著增加。这些假设虽能提供新颖见解...
+4
深度学习揭示3亿年大脑进化的新视角
比利时的一项新研究发表在《Science》杂志上,研究团队探讨了基因开关如何通过控制基因活动来定义不同物种的脑细胞类型。 研究人员使用了人类、小鼠和鸡的大脑数据来训练深度学习模型,并发现,尽管某些细胞类型在经过数百万年的进化后在鸟类和哺乳动物之间得到了高度保守,但其它细胞类型的进化方式却存在显著差异...
超越DeepSeek-ProverV1.5的豆包首个开源形式化数学推理模型BFS-Prover正式发布!
自动形式化数学定理证明是人工智能在数学推理领域的重要应用之一。这类任务需要将数学命题和证明步骤转换为计算机可验证的代码,这不仅能够确保推理过程的绝对严谨性,还能构建可复用的数学知识库,为科学研究提供坚实的基础。 早在20世纪中叶,众多逻辑学家、数学家及人工智能开创者,如戴维斯与明斯基,便开始探索这一...
+3
DeepSeek开源DeepEP:MoE训练推理EP通信库,拥抱开源!
上周五,DeepSeek 发布了一则推文,宣称本周为开源周(OpenSourceWeek),期间将连续推出五个软件库。 昨日,他们首度开源了第一个代码库——FlashMLA。这是一款专为Hopper GPU 设计的高效MLA解码核心,发布后仅24小时内便获得了接近8000个星标(具体信息详见《刚刚,...
+4
依靠逻辑题,AI数学竞赛能力大幅提升!微软、九坤投资:7B小模型也能接近o3-mini
本文由微软亚洲研究院的谢天、洪毓谦、邱凯、武智融、罗翀,九坤投资的高梓添、Bryan Dai、Joey Zhou,以及独立研究员任庆楠、罗浩铭共同撰写。 通过单一逻辑益智题训练,AI数学竞赛的表现竟显著提升? 在中国的深度学习团队成功突破硅谷的技术封锁后,它们再度推出重磅研究,揭示了DeepSeek...
+3
全球首款混合推理模型:Claude 3.7 Sonnet震撼上市,真实编码实力超越所有竞争者
就在昨晚,Anthropic 新模型的发布消息在人工智能社区中广泛传播,令人期待的并不是 Claude 4.0,而是 Claude 3.7 Sonnet 版本。 图源:https://x.com/btibor91/status/1893970824484581825 今日凌晨,Anthropic 准...
+11
DeepSeek开源FlashMLA:Hopper GPU解码的全新标杆与测评揭秘!
DeepSeek于今日正式启动了为期五天的开源成果发布计划,首个亮相的项目为FlashMLA。该开源项目结合了先进的MLA算法和GPU优化技术,旨在为大规模模型推理提供一套高性能、低延迟的解码方案。 FlashMLA是一款特别为Hopper GPU(如H800 SXM5)优化的高效MLA解码内核,旨...
+1
华为诺亚推出高效选择注意力架构ESA,稀疏注意力迎来新成员
在 DeepSeek 的 NSA 与月之暗面的 MoBA 共同引领稀疏注意力技术热潮之际,行业对于“效率革命”的追求迎来了重大的突破——华为诺亚方舟实验室正式推出全新的 ESA 算法(Efficient Selective Attention)。论文地址:https://arxiv.org/pdf/...
+8
复旦新研究在模型安全领域实现SOTA扩散模型风险概念擦除,入选AAAI 2025
本论文的第一和第二作者分别是来自复旦大学视觉与学习实验室的硕士生韩枫和博士生陈凯,通讯作者为副教授陈静静。该研究团队专注于人工智能(AI)安全相关的研究,近年来在CVPR、ECCV、AAAI、ACM MM等顶级会议上发表了多篇关于AI安全的研究成果。 是否觉得文生图模型生成的图像内容显得过于露骨?不...
+8
商汤大装置DeepSeek企业版强势来袭,免费版容量同步扩容,双重升级赋能企业AI应用
今年2月,商汤大装置万象平台正式上线了DeepSeek-R1、DeepSeek-V3等模型,并为免费版提供3个月内千万Token额度,此举受到了客户的热烈响应。 为进一步提升用户服务质量,经过一系列优化,现正式推出企业版,同时完成了免费版的国产化适配与算力扩容,构建了专业强支撑与普惠广覆盖并行的双擎...
