解决413请求实体过大错误 | AI生成和翻译

Home 2025.09

错误含义

解决方案

方案 操作方式 效果
精简提示词 删除冗余文本,使用简洁指令,或压缩数据(如先总结大段内容再发送) 降低输入令牌数
减少max_tokens 请求更短的补全内容(如将max_tokens设为500而非2000) 减少预估输出令牌数
拆分请求 将大型文档分割为多个片段依次调用,最后合并处理结果 确保单次调用不超TPM限制
升级服务层 切换至更高容量层级(如开发层),享受更大或无限的TPM限额 避免因单请求负载过大报错
调用限流 请求间增加短暂延迟或实施速率限制,保持每分钟总令牌数≤8,000 防止累计TPM超额

请求发送前快速检查清单

  1. 统计令牌数——使用OpenAI令牌化工具(或tiktoken)估算总令牌数(提示词+最大令牌数)
  2. 确保≤8,000 TPM(按需服务层限额)
  3. 若接近限额,请考虑上述缓解方案

通过确保请求保持在每分钟8,000令牌的配额内,即可避免413“请求过大”错误。[1]

引用文献: [1] https://www.reddit.com/r/OpenAI/comments/1nbtl2p/wow_weve_been_burning_money_for_6_months/


Back

openai/gpt-oss-120b

Donate