来源:AWS Machine Learning Blog 2026-03-12 21:20

借助针对 TTFT 和估计配额消耗的新 CloudWatch 指标,提高 Amazon Bedrock 上推理工作负载的运营可见性

Amazon 针对 CloudWatch 指标 Bedrock
今天,我们宣布针对 Amazon Bedrock 推出两个新的 Amazon CloudWatch 指标:TimeToFirstToken 和 EstimatedTPMQuotaUsage。在这篇文章中,我们将介绍它们的工作原理以及如何设置警报、建立基线以及使用它们主动管理容量。

相关文章推荐

返回首页