亚马逊斥资2.3亿美元注资生成式AI初创企业

摘要：

亚马逊云服务（AWS）最近宣布对其人工智能推理芯片Inferentia2.3的更新，旨在提高性能并降低成本。这 […]

亚马逊云服务（AWS）最近宣布对其人工智能推理芯片Inferentia2.3的更新，旨在提高性能并降低成本。这一举措表明，AWS持续致力于提供更高效的人工智能推理解决方案。据称，AWS已成功部署超过10,000个“Inferentia加速器”，其中大部分被用于支持生成式人工智能工作负载，这有助于降低相关成本并提升推理效率。

Inferentia推理芯片在处理生成式人工智能方面表现出色，例如应用于ChatGPT等大型语言模型。这些模型常用于文本生成、内容总结、代码编写以及复杂对话交互等任务。通过优化算法和硬件设计，Inferentia可以显著提升大型语言模型的运行速度，同时降低能耗，从而优化推理过程。

亚马逊云服务的2.3版本更新专注于进一步提升人工智能推理性能，旨在优化芯片架构和内存管理，从而改进这些工作负载的整体效率和响应速度。通过这一增强，AWS旨在帮助客户更有效地部署其大规模语言模型及相关应用，同时降低运营成本，并提供更强大的AI计算能力。

总而言之，亚马逊云服务正在积极扩展其人工智能推理能力，通过不断改进推理芯片和优化基础设施，为客户提供更具成本效益和高性能的人工智能解决方案，以应对日益增长的人工智能应用需求。