

2025年4月9日,StepFun与复旦大学联合开发的强大SVG生成模型OmniSVG正式亮相,标志着矢量图形生成技术迈入新阶段。OmniSVG被誉为目前最先进的SVG生成大模型,其多模态生成能力和高效表现引发广泛关注。
OmniSVG基于预训练的视觉-语言模型(VLM)Qwen-VL构建,并集成了SVG标记化器,创新性地将SVG命令和坐标参数化为离散令牌(tokens)。这使得OmniSVG成功解耦了矢量图形的结构逻辑与低级几何细节,从而提高了训练效率,保留了生成复杂SVG结构的表达能力。
与传统方法相比,OmniSVG克服了SVG生成技术的核心难题,通过端到端的多模态生成框架显著提升了生成质量和复杂性,能够生成色彩丰富、细节生动的矢量图形。
为推动SVG生成技术发展,OmniSVG团队发布了MMSVG-2M数据集,包含200万个丰富注释SVG资源。他们还提出了标准化评估协议MMSVG-Bench,用于测试条件SVG生成任务性能,为未来SVG研究提供宝贵资源。
实验结果显示,OmniSVG在生成质量和多样性上超越现有方法,生成的SVG视觉效果出色,具备可编辑性,无缝集成到专业设计工作流程中,在图形设计、网页开发等领域具有广泛应用前景。
自发布以来,OmniSVG受到研究人员和设计师的热烈关注,其生成的高质量SVG表示震撼,尤其在处理复杂图形时表现出色。评论指出,OmniSVG重新定义了SVG生成标准,从单一的图标生成扩展到多模态、复杂图形的全面支持。
OmniSVG的问世展示了人工智能在矢量图形领域的巨大潜力,为AIGC(AI-Generated Content)社区带来新的研究方向。未来,随着技术的进一步优化,OmniSVG有望成为专业设计师和开发者的得力工具,推动SVG在数字设计中广泛应用。
详细信息可访问OmniSVG项目网站:https://omnisvg.github.io。