MLCommons发布大型音频数据集,包含超过百万小时的多语种录音资源 人工智能工程联盟 MLCommons 于当地时间 1 月 30 日宣布推出 Unsupervised People's Speech 数据集。该数据集包含超过 100 万小时的音频内容,**预示着人工智能在音频领域发展的新契机**。 Unsupervised People's Speech 数据集资... AI之家9个月前
复旦大学团队发布中文医疗健康个人助手,共享47万高质量数据集 随着远程医疗的普及,中文医疗健康个人助手的需求日益增长。复旦大学的数据智能与社会计算实验室(FudanDISC)推出的DISC-MedLLM,利用大语言模型(LLM)技术,旨在为患者提供更为便捷和高效的医疗咨询服务。该助手不仅在问答和对话能力上表现优异,还发布了一个包含47万条高质量数据的开源数据集... 开放I2年前
GPT-4 MATH准确率飙升至84.3%!港中文、清华等七所顶尖高校推出创新CSV方法 引言 大型语言模型(LLMs)在常识理解和代码生成方面取得了显著进展,但在数学推理任务上仍然存在不足。最新的GPT-4 Code Interpreter在困难的数学推理数据集上展现了较高的性能。为了进一步提升其性能,研究人员提出了一种新的代码自我验证方法(CSV)。 研究背景 数学推理的挑战 尽管L... 开放I2年前