智能之星

帅气的我简直无法用语言描述!

全球首发:QwQ-32B实现本地一键部署,3090单卡驱动,共享算力成为关键因素

个人设备迎来最强模型时代。 仅过一天,阿里所开源的新一代推理模型已可在个人设备上运行。 昨日深夜,阿里重磅发布了其参数量达到320亿的全新推理模型QwQ-32B,其性能已与6710亿参数的DeepSeek-R1满血版可媲美。 基准测试结果显示,QwQ-32B在数学推理、代码生成及通用任务处理能力方面...
智能之星2个月前

科学家首次利用AI以毫秒级分辨率实时观察原子移动,揭开纳米世界的奥秘,登上《Science》杂志

设想我们能够清晰地观察材料表面原子的运动,正如我们在夜空中凝视闪烁的星星那样,这将为理解材料的功能打开全新的视角。 然而,传统电子显微镜技术面临着根本性的挑战:要实现毫秒级时间分辨率的原子尺度成像,必须显著降低电子束的剂量,这一要求常常使得图像被噪声掩盖,导致关键细节的模糊。 为了解决这一技术瓶颈,...
+2
智能之星2个月前

DeepSeek的MLA实现,轻松迁移任意大模型!

复旦大学自然语言处理实验室的博士后研究员纪焘是本文的第一作者,他的研究领域包括大模型高效推理和多模态大模型。近期发表的代表作包括首个NoPE外推HeadScale、注意力分块外推LongHeads及多视觉专家大模型MouSi,他在ACL、ICLR、EMNLP等顶级会议和期刊上发表论文超过20篇。 作...
+5
智能之星2个月前

强化学习助力,对抗攻击大型语言模型的新方法出现

事物皆具多面性,正如水可载舟亦可覆舟,还可用于烹煮。强化学习亦是如此,它既能助力 AlphaGo 战胜顶尖围棋棋手,也能赋能 DeepSeek-R1 强大的推理能力。然而,它同样可能被恶意利用,成为攻击人工智能模型的利器。 近日,威斯康星大学麦迪逊分校的研究团队发现,通过强化学习可对模型实施有效的黑...
+5
智能之星2个月前

从自我进化视角剖析LLM推理能力的技术演进历程

论文标题:关于大型语言模型复杂推理的自我进化研究综述 论文链接:https://www.researchgate.net/publication/389209259_A_Survey_on_Complex_Reasoning_of_Large_Language_Models_through_the_...
+6
智能之星2个月前

开源创新与推理革命的交汇:SGLang是如何打造DeepSeek的顶尖开源推理引擎的?

随着2025年新年的到来,DeepSeek R1 与 V3 重磅发布,其卓越的语言建模与推理能力迅速引发全球 AI 社区的广泛关注。在这一热潮中,隐藏在超大规模模型背后的一个重要技术问题逐渐浮现:如何使千亿参数的超大规模 AI 模型真正实现商业级的推理速度?这一问题的答案,蕴藏于推理引擎 SGLan...
智能之星2个月前

腾讯混元上线图生视频模型,我们用七个Prompt进行了测试

基于实验的数据。 腾讯实施了一场迅猛的市场攻势。 3月3日,腾讯元宝在中国区苹果App Store中反超DeepSeek,荣登免费榜首。 对于腾讯元宝而言,春节前其排名尚在200名开外,面对大量大模型的竞争犹如一颗“小卡拉米”,但自从接入DeepSeek后,仅用了十天的时间便迅速跃升至榜单第二位。 ...
+8
智能之星2个月前

《科学子刊:结合人工智能与生物物理建模创新设计新型蛋白质》

机器学习 (ML) 目前正在变革蛋白质计算设计的领域,数据驱动的方法在实验成功率上已然超越传统的生物物理方法。然而,现有研究多以个案形式呈现,缺乏系统化和标准化,导致客观比较变得困难。 在近期的研究中,来自德国莱比锡大学的跨学科研究团队在 Rosetta 软件框架的支持下,开发了一个简洁且多样化的工...
+2
智能之星2个月前

智源开源多模态向量模型BGE-VL:实现多模态检索的全新突破

BGE系列模型自其发布以来便广受社区赞誉。近期,智源研究院与多所高校合作开发了多模态向量模型BGE-VL,进一步丰富了原有生态体系。BGE-VL在图文检索及组合图像检索等主要多模态检索任务中均取得了显著成果。该模型得益于大规模合成数据MegaPairs的训练,具备以下两大核心优势: 出色的可扩展性:...
+4
智能之星2个月前

ET-SEED:高效等变扩散策略提升机器人操作的泛化能力

本文将介绍人工智能领域顶级会议 ICLR 2025 接收的论文 "ET-SEED: Efficient Trajectory-Level SE (3) Equivariant Diffusion Policy"。该论文由北京大学前沿计算研究中心的董豪教授团队完成,三位共同第一作者分别是:铁宸睿(本科...
+4
智能之星2个月前