请求限制(Rate Limits)
速率限制如何运作?
默认情况下,所有套餐的 Agent 功能都会受到速率限制。我们采用两种限制类型:突发速率限制(burst rate limits)和本地速率限制(local rate limits)。突发速率限制可随时应对高并发会话,但恢复速度较慢;本地速率限制则会每隔数小时完全重置。
速率限制的计算基于会话期间使用的总计算资源。具体数值会根据以下因素动态调整:
- 所选模型类型
- 消息长度(包含附件文件大小)
- 当前对话上下文长度
我能将 Max Mode 作为我的速率限制的一部分使用吗?
是的,Max Mode 的使用包含在付费计划的速率限制中,在速率限制范围内使用时无需额外费用。