部署此版本
- Docker
- Pip
docker run litellm
docker run
-e STORE_MODEL_IN_DB=True
-p 4000:4000
ghcr.io/berriai/litellm:main-v1.69.0-stable
pip install litellm
pip install litellm==1.69.0.post1
主要亮点
LiteLLM v1.69.0-stable 带来了以下主要改进
- 负载均衡批量 API 模型:使用 LiteLLM 受管文件轻松地在多个 Azure 批量部署之间进行负载均衡
- 电子邮件邀请 2.0:向新加入 LiteLLM 的用户发送电子邮件邀请。
- Nscale:符合欧洲法规的 LLM API。
- Bedrock /v1/messages:使用 Bedrock Anthropic 模型以及 Anthropic 的 /v1/messages 格式。
批量 API 负载均衡
此版本为批量处理带来了 LiteLLM 受管文件支持。这对于以下用户非常有用:
- 代理管理员:您现在可以控制用户可以调用哪些批量模型。
- 开发者:创建批量 .jsonl 文件时不再需要知道 Azure 部署名称 - 只需指定您的 LiteLLM 密钥有权访问的模型即可。
随着时间推移,我们预计 LiteLLM 受管文件将成为大多数团队在使用 /chat/completions
、/batch
、/fine_tuning
端点时使用文件的方式。
电子邮件邀请
此版本为我们的电子邮件邀请集成带来了以下改进:
- 用于用户被邀请和密钥创建事件的新模板。
- 修复了使用 SMTP 电子邮件提供商的问题。
- 原生支持 Resend API。
- 代理管理员控制电子邮件事件的能力。
LiteLLM 云用户,如果您希望为您的实例启用此功能,请联系我们。
新模型 / 更新模型
- Gemini (VertexAI + Google AI Studio)
- Perplexity:
- Azure OpenAI:
- 修复了 azure_ad_token_provider 参数的透传问题 - PR
- OpenAI:
- 在 'file' 参数中添加了对 PDF URL 的支持 - PR
- Sagemaker:
- 修复了
sagemaker_chat
提供商的内容长度问题 - PR
- 修复了
- Azure AI Foundry:
- 添加了以下模型的成本追踪PR
- DeepSeek V3 0324
- Llama 4 Scout
- Llama 4 Maverick
- 添加了以下模型的成本追踪PR
- Bedrock:
- OpenAI:为
o3
模型添加了reasoning_effort
支持 - PR - Databricks:
- 修复了 Databricks 使用外部模型时 delta 可能为空的问题 - PR
- Cerebras:修复了 Llama-3.1-70b 模型的定价和上下文窗口问题 - PR
- Ollama:
- 🆕 Nscale
- 添加了对聊天和图像生成端点的支持 - PR
LLM API 端点
- Messages API:
- Moderations API:
- 修复了允许使用 LiteLLM UI 凭据访问 /moderations API 的错误 - PR
- Realtime API:
- 修复了 WebSocket 认证请求中作用域内设置 'headers' 以及无限循环问题 - PR
- Files API:
- Batches API:
消费追踪 / 预算改进
- 错误修复 - PostgreSQL 数据库消费追踪中的整数溢出错误 - PR
管理端点 / UI
- 模型
- 日志:
- 用户管理:
日志记录 / 护栏集成
- 自定义日志记录 API:v2 自定义回调 API(将 llm 日志发送到自定义 api)- PR, 开始使用
- OpenTelemetry:
- 修复了 OpenTelemetry 以遵循 genai 语义约定 + 支持 TTS 的 'instructions' 参数 - PR
- Bedrock PII:
- 文档:
- 添加了 StandardLoggingVectorStoreRequest 的文档 - PR
性能 / 可靠性改进
- Python 兼容性:
- 缓存:
通用代理改进
新贡献者
- @zoltan-ongithub 首次贡献于 PR #10568
- @mkavinkumar1 首次贡献于 PR #10548
- @thomelane 首次贡献于 PR #10549
- @frankzye 首次贡献于 PR #10540
- @aholmberg 首次贡献于 PR #10591
- @aravindkarnam 首次贡献于 PR #10611
- @xsg22 首次贡献于 PR #10648
- @casparhsws 首次贡献于 PR #10635
- @hypermoose 首次贡献于 PR #10370
- @tomukmatthews 首次贡献于 PR #10638
- @keyute 首次贡献于 PR #10652
- @GPTLocalhost 首次贡献于 PR #10687
- @husnain7766 首次贡献于 PR #10697
- @claralp 首次贡献于 PR #10694
- @mollux 首次贡献于 PR #10690