部署此版本
- Docker
- Pip
docker run litellm
docker run
-e STORE_MODEL_IN_DB=True
-p 4000:4000
ghcr.io/berriai/litellm:main-v1.67.4-stable
pip install litellm
pip install litellm==1.67.4.post1
主要亮点
- 改进的用户管理:此版本支持在用户、密钥、团队和模型之间进行搜索和过滤。
- 响应 API 负载均衡:将请求路由到不同提供商区域并确保会话连续性。
- UI 会话日志:将对 LiteLLM 的多个请求分组到一个会话中。
改进的用户管理
此版本让在 LiteLLM 上管理用户和密钥变得更容易。您现在可以在用户、密钥、团队和模型之间进行搜索和过滤,并更轻松地控制用户设置。
新功能包括
- 按电子邮件、ID、角色或团队搜索用户。
- 在一处查看用户的所有模型、团队和密钥。
- 直接在“用户”标签页中更改用户角色和模型访问权限。
这些更改帮助您减少在 LiteLLM 上设置和管理用户的时间。
响应 API 负载均衡
此版本为响应 API 引入了负载均衡,使您能够将请求路由到不同提供商区域并确保会话连续性。其工作原理如下:
- 如果提供了
previous_response_id
,LiteLLM 会将请求路由到生成先前响应的原始部署——从而确保会话连续性。 - 如果未提供
previous_response_id
,LiteLLM 会在您可用的部署之间进行请求负载均衡。
UI 会话日志
此版本允许您将对 LiteLLM 代理的请求分组到一个会话中。如果您在请求中指定了 litellm_session_id,LiteLLM 会自动将同一会话中的所有日志分组。这使您可以轻松跟踪每个会话的使用情况和请求内容。
新模型 / 更新模型
- OpenAI
- Azure
- Bedrock
- VertexAI / Google AI Studio
- Cohere
- SageMaker
- 响应 API
支出跟踪改进
管理端点 / UI
用户
过滤和搜索:
- 按 user_id、角色、团队、sso_id 过滤用户
- 按电子邮件搜索用户
用户信息面板:添加了新的用户信息面板 PR
- 查看与用户关联的团队、密钥、模型
- 编辑用户角色、模型权限
团队
密钥
UI 日志页面
- 会话日志:添加了 UI 会话日志 开始使用
UI 认证与安全
- 强制认证:所有仪表板页面现在都需要认证 PR
- SSO 修复:修复了 SSO 用户登录无效令牌错误 PR
- [BETA] 加密令牌:UI 改为使用加密令牌 PR
- 令牌过期:支持通过重定向到登录页面来刷新令牌(修复了过期令牌会导致显示空白页面的问题) PR
UI 常规修复
- 修复 UI 闪烁:解决了仪表板中的 UI 闪烁问题 PR
- 改进术语:密钥和工具页面上的加载中和无数据状态显示更友好 PR
- Azure 模型支持:修复了编辑 Azure 公共模型名称和创建后更改模型名称的问题 PR
- 团队模型选择器:修复了团队模型选择的 Bug PR
日志记录 / 护栏集成
- Datadog:
- Prometheus / Grafana:
- AgentOps:
- Arize:
通用代理改进
- 缓存:修复了在计算缓存键时考虑 `thinking` 或 `reasoning_effort` 的缓存问题 PR
- 模型组:修复了用户在 model_info 中设置 model_group 的情况 PR
- 直通端点:确保 `PassthroughStandardLoggingPayload` 记录方法、URL、请求/响应体 PR
- 修复 SQL 注入:修复了 spend_management_endpoints.py 中潜在的 SQL 注入漏洞 PR
Helm
- 修复了迁移作业上的 serviceAccountName 问题 PR
完整更新日志
完整的更改列表可在 GitHub 发布说明 中找到。