跳到主要内容

/batches

涵盖 批处理、文件

特性支持备注
支持的提供商OpenAI, Azure, Vertex-
✨ 成本跟踪仅限 LiteLLM 企业版
日志记录适用于所有日志记录集成

快速入门

  • 创建用于批处理完成的文件

  • 创建批处理请求

  • 列出批处理

  • 检索特定的批处理和文件内容

$ export OPENAI_API_KEY="sk-..."

$ litellm

# RUNNING on http://0.0.0.0:4000

创建用于批处理完成的文件

curl http://localhost:4000/v1/files \
-H "Authorization: Bearer sk-1234" \
-F purpose="batch" \
-F file="@mydata.jsonl"

创建批处理请求

curl http://localhost:4000/v1/batches \
-H "Authorization: Bearer sk-1234" \
-H "Content-Type: application/json" \
-d '{
"input_file_id": "file-abc123",
"endpoint": "/v1/chat/completions",
"completion_window": "24h"
}'

检索特定的批处理

curl http://localhost:4000/v1/batches/batch_abc123 \
-H "Authorization: Bearer sk-1234" \
-H "Content-Type: application/json" \

列出批处理

curl http://localhost:4000/v1/batches \
-H "Authorization: Bearer sk-1234" \
-H "Content-Type: application/json" \

支持的提供商:

Azure OpenAI

OpenAI

Vertex AI

批处理 API 的成本跟踪工作原理

LiteLLM 通过记录两个关键事件来跟踪批处理成本

事件类型描述记录时间
acreate_batch初始批处理创建提交批处理请求时
batch_success最终使用量和成本批处理完成时

成本计算

  • LiteLLM 轮询批处理状态直到完成
  • 完成时,它会聚合输出文件中所有响应的使用量和成本
  • 总计 tokenresponse_cost 反映了跨所有批处理响应的组合指标

Swagger API 参考