请求限制(Rate Limits)
速率限制如何运作?
默认情况下,所有套餐的 Agent 功能都会受到速率限制。我们采用两种限制类型:突发速率限制(burst rate limits)和本地速率限制(local rate limits)。突发速率限制可随时应对高并发会话,但恢复速度较慢;本地速率限制则会每隔数小时完全重置。
速率限制的计算基于会话期间使用的总计算资源。具体数值会根据以下因素动态调整:
- 所选模型类型
- 消息长度(包含附件文件大小)
- 当前对话上下文长度
如何提供如此大规模的计算资源?
为推出专业版和 Ultra 版本,我们与模型供应商深度合作,提供了远超市场标准价格的计算资源支持。
达到限制后如何处理?
当用户同时耗尽本地和突发限制时,系统会明确通知用户并提供以下三种解决方案: