

大型语言模型(LLM)的崛起,使得人工智能领域涌现出各种创新,其中一个关键的突破是“Transformer”架构的广泛应用。Transformer 模型自 2017 年问世以来,已经成为众多自然语言处理任务的基础,为构建更强大更高效的人工智能提供了可能。最近,Liquid AI 推出了一种名为 STAR (Synthesis of Tailored Architectures) 的新型架构搜索方法,进一步推动了人工智能的发展。
STAR 架构旨在自动设计和优化定制的人工智能模型,它可以同时搜索连接结构和计算模块,从而生成 “STAR 细胞”,这些细胞构成了高性能模型的基础。Liquid AI 的目标是通过 STAR 方法,无需人工干预即可自动发现适用于特定任务的最佳模型架构,从而实现 “STAR 元架构”,能够自适应地根据数据特性调整模型结构。
在性能方面,STAR 能够生成超越现有技术的模型。例如,它可以发现性能优于 Transformer++ 和其他手动设计的架构。在图像分类任务中,STAR 构建的模型将 Transformer 的参数效率提高了高达 37%,同时将性能提高了 90%。这些结果表明,通过自动架构搜索,可以显著提升模型的性能和效率,为人工智能开辟新的可能性。
具体来说,STAR 的模型能够以更少的资源实现更高的性能。在 1.25 到 10 倍参数范围内,STAR 构建的架构在多个自然语言处理任务上均优于 Transformer++ 和其他手动设计的模型,展示了其强大的泛化能力和效率。这意味着未来的模型可以在更小的计算资源下运行,从而降低部署成本并提高可访问性。
Liquid AI 指出,STAR 的设计能够促进更大范围的应用,包括自适应计算和跨模态学习,为各种人工智能应用场景带来新的解决方案。STAR 的一个主要优势在于其能够在不同任务和数据集上实现卓越的性能,为构建更加通用和强大的智能系统奠定基础。这预示着未来的模型将更加灵活,能够适应不断变化的数据环境,并为各行各业带来创新。
Liquid AI 认为 STAR 代表着人工智能模型设计领域的一大进步,因为它能够自动发现高性能模型架构,从而加速人工智能的创新。展望未来,Liquid AI 计划继续探索 STAR 的潜力,并将其应用于更广泛的人工智能应用中,以推动人工智能技术的发展,为社会带来更大的价值。随着 AI 技术的不断进步,STAR 有望成为推动人工智能进入新时代的强大引擎。
项目地址:https://www.liquid.ai/research/automated-architecture-synthesis-via-targeted-evolution
关键要点:
✨ Liquid AI 推出的 STAR 架构旨在自动设计优化定制化 AI 模型。
⭐ STAR 模型在图像分类任务中,参数效率提升了 90%,超越了传统 Transformer 模型。
🔍 STAR 的自适应架构设计有助于提升 AI 算法的效率和性能,推动人工智能领域的创新。