AI快讯
AI导航
AI工具库
AI应用集
AI快讯
AI热点
未登录
登录后即可体验更多功能
登录
注册
找回密码
AI导航
AI工具库
AI应用集
AI快讯
AI热点
基准测试
共 7 篇AI快讯
OpenAI发布AI Agent评测基准PaperBench
3浏览
0
点赞
4周前
OpenAI推出SWE-Lancer基准,衡量模型在真实自由软件工程任务中的表现
6浏览
0
点赞
2个月前
智源和腾讯联合发布长文本理解基准测试模型LongBench v2
6浏览
0
点赞
4个月前
微软推出Windows Agent Arena:实测AI助手在实际Windows系统中的表现
5浏览
0
点赞
8个月前
北大通研院发布LooGLE基准,长文本理解难度超高,大模型表现惨淡
4浏览
0
点赞
9个月前
谷歌发布人工智能系统Gemini,或将增强其在AI领域的影响力
9浏览
0
点赞
1年前
亚马逊AWS成立人类基准测试团队,旨在提升人工智能模型评估水平
4浏览
0
点赞
1年前
没有了
热门AI工具
有言
万知
腾讯元宝
造梦次元
场辞
YOO简历
简单设计
Fryderyk
文多多AiPPT
HitPaw
创自由
一起剪
归档
2025 年 4 月
2025 年 3 月
2025 年 2 月
2025 年 1 月
2024 年 12 月
2024 年 11 月
2024 年 10 月
2024 年 9 月
2024 年 8 月
2024 年 7 月
2024 年 6 月
2024 年 4 月
2024 年 3 月
2024 年 2 月
2024 年 1 月
2023 年 12 月
2023 年 11 月
2023 年 10 月
2023 年 9 月
2023 年 8 月