跳到主要内容

请求限制(Rate Limits)

速率限制如何运作?

默认情况下,所有套餐的 Agent 功能都会受到速率限制。我们采用两种限制类型:突发速率限制(burst rate limits)和本地速率限制(local rate limits)。突发速率限制可随时应对高并发会话,但恢复速度较慢;本地速率限制则会每隔数小时完全重置。

速率限制的计算基于会话期间使用的总计算资源。具体数值会根据以下因素动态调整:

  • 所选模型类型
  • 消息长度(包含附件文件大小)
  • 当前对话上下文长度

如何提供如此大规模的计算资源?

为推出专业版和 Ultra 版本,我们与模型供应商深度合作,提供了远超市场标准价格的计算资源支持。

达到限制后如何处理?

当用户同时耗尽本地和突发限制时,系统会明确通知用户并提供以下三种解决方案:

  1. 切换至更高速率限制的模型(例如 Sonnet 模型比 Opus 模型拥有更高限制)
  2. 升级至更高阶套餐
  3. 启用按用量计费模式 为超出速率限制的请求付费

如果我只需要固定数量的请求额度怎么办?

如果您希望继续使用旧版专业版套餐,仍然可以选择保留!您可以通过 控制面板 > 设置 > 高级 来管理此配置。对于大多数用户,新版专业版套餐会是更优的选择。