亚马逊希望用户能够更有效地评估人工智能模型,并鼓励更多人参与这一过程。AWS推出了Bedrock上的模型评估,以便对其存储库中的模型进行评估。模型评估包括自动评估和人工评估两个部分,可以根据不同的指标评估模型性能。AWS还提供人工评估团队与用户合作,检测到自动系统无法检测到的指标。重要的是,模型需要为客户工作,要知道哪个模型最适合他们,我们正在为他们提供一种更好的评估方法。