主要亮点
- SCIM 集成:使身份提供商(Okta、Azure AD、OneLogin 等)能够自动执行用户和团队(组)的配置、更新和取消配置
- 基于团队和标签的使用跟踪:您现在可以在 1M+ 消费日志中按团队和标签查看使用情况和支出。
- 统一响应 API:支持通过 OpenAI 新的响应 API 调用 Anthropic、Gemini、Groq 等模型。
让我们深入了解。
SCIM 集成
此版本为 LiteLLM 添加了 SCIM 支持。这允许您的 SSO 提供商(Okta、Azure AD 等)自动在 LiteLLM 上创建/删除用户、团队和成员资格。这意味着当您在 SSO 提供商上删除一个团队时,您的 SSO 提供商将自动删除 LiteLLM 上对应的团队。
基于团队和标签的使用跟踪
此版本改进了在 100 万+ 消费日志中基于团队和标签的使用跟踪,从而轻松监控您在生产环境中的 LLM API 支出。这包括
- 按团队 + 标签查看每日支出
- 在团队内按密钥查看使用量/支出
- 按多个标签查看支出
- 允许内部用户查看他们所属团队的支出
统一响应 API
此版本允许您通过 LiteLLM 上的 POST /v1/responses 端点调用 Azure OpenAI、Anthropic、AWS Bedrock 和 Google Vertex AI 模型。这意味着您现在可以使用 OpenAI Codex 等流行工具与您自己的模型配合使用。
新模型 / 更新的模型
- OpenAI
- Azure AI
- Anthropic
- Cohere
- Azure
- VLLM
- Mistral
- AWS
- 新增映射的 Bedrock 区域 - PR
- VertexAI / Google AI Studio
- Fireworks AI
- 在
tool_calls
字段中返回工具调用响应(Fireworks 错误地将此返回为内容中的 json 字符串) PR
- 在
- Triton
- 其他
支出跟踪改进
- 成本控制 - 在提示中注入缓存控制点以降低成本 入门, PR
- 支出标签 - 请求头中的支出标签 - 即使未启用基于标签的路由也支持 x-litellm-tags 入门, PR
- Gemini-2.5-flash - 支持推理令牌的成本计算 PR
管理端点 / 用户界面
用户
- 在用户页面显示 created_at 和 updated_at - PR
虚拟密钥
使用情况标签页
模型
- 使列可调整大小/可隐藏 - PR
API 演练场
- 允许内部用户调用 API 演练场 - PR
SCIM
日志记录 / 护栏集成
- GCS
- AIM
- Azure Blob 存储