英伟达发布NIM代理蓝图，助力开发者加速企业级AI应用构建

11个月前发布AI俱乐部

英伟达发布了 NIM 推理微服务，这是一个用于加速 AI 推理和简化部署的全新解决方案。它代表着在任何地点部署 AI 模型，实现高性能推理方面迈出了一大步，并简化了生成式 AI 应用的开发和扩展流程。

这些微服务针对一系列常见的 AI 工作负载进行了优化，例如语言模型、语音和图像处理等。它们旨在简化模型集成，提供即用型的参考管道，便于快速将其融入生产级的应用中，并支持从简单的 PDF 文档问答到复杂的图形渲染等各种任务。通过利用这些微服务，企业能够显著加速其部署 AI 推理的速度，从而更快地实现价值。

在当今快节奏的世界中，能够快速响应 AI 需求至关重要。这些英伟达提供的即时可用的构建模块可以帮助企业加速创新。例如，英伟达的 AI Enterprise 软件版本现在已经更新到5.0，相较于4.4版本在性能上有了提升，并且包含60多个推理微服务。

那么，NIM 推理微服务如何帮助你应对挑战？想象一下能够轻松地将强大的 AI 功能集成到现有工作流程中，或在几分钟内部署 AI 模型，而不是数周。借助这些即时可用的组件，就可以快速启动和运行 AI，从而节省大量的时间和资源。更重要的是，AI 推理不再受限于特定的硬件，它可以在不同的基础设施上运行，从而保证了灵活性和可扩展性。

总体而言，NIM 推理微服务旨在促进在各种规模的企业中采用 AI 技术，使他们能够访问加速的、优化的 AI 推理能力，从而简化 AI 工作负载的部署。这包括访问用于构建 NIM 和 NeMo 以及其他工具的参考管道，以便更快地进行自定义模型开发，以及为 Helm 图表提供支持。这些微服务可以显著简化 AI 应用程序的堆栈，无论是在本地部署还是在云端。

具体来说，英伟达正在构建一个全面的微服务集合，其中包括用于语音合成的数字人、加速光线追踪和图形渲染的工具以及用于生成 PDF 文件的工具。其中一部分已经可以通过英伟达的 ACE、Omniverse RTX、Audio2Face 和 Llama3.1 NIM API进行使用，它们都能够加速 3D 工作流程的构建。

总而言之，英伟达正致力于通过为开发者、数据科学家和企业提供便捷的 AI 解决方案，来推动 AI 的普及。通过提供模块化和可定制的构建块，他们正在赋能企业更快地进行创新，并降低部署 AI 的门槛。因此，请充分利用 NVIDIA 的参考设计，利用经过优化的推理、预训练模型，以及用于加速 AWS、谷歌云、微软 Azure 和 Oracle 云基础设施上的部署的工具。

参考链接：https://blogs.nvidia.com/blog/nim-agent-blueprints/