以下是自 v1.61.20-stable
以来的变更。
本次发布主要侧重于:
- LLM 翻译改进(更多
thinking
内容改进) - UI 改进(错误日志现在显示在 UI 上)
信息
此版本将于 2025年3月9日上线
演示实例
这里有一个演示实例用于测试变更
- 实例:https://demo.litellm.ai/
- 登录凭据
- 用户名:admin
- 密码:sk-1234
新增/更新模型
LLM 翻译
- 支持 Assistant 端的
/openai/
直通。 开始使用 - Bedrock Claude - 修复 invoke 路由上的工具调用转换。 开始使用
- Bedrock Claude - 在 invoke 路由上支持 claude 的 response_format。 开始使用
- Bedrock - 如果在 response_format 中设置了
description
则传递它。 开始使用 - Bedrock - 修复传递 response_format: {"type": "text"}。 PR
- OpenAI - 处理将 image_url 作为字符串发送给 openai。 开始使用
- Deepseek - 返回流式处理中缺失的 'reasoning_content'。 开始使用
- 缓存 - 支持对推理内容进行缓存。 开始使用
- Bedrock - 处理助手消息中的 thinking 块。 开始使用
- Anthropic - 在流式处理中返回
signature
。 开始使用
- 注意:我们还从
signature_delta
迁移到了signature
。 阅读更多
- 注意:这重构了[测试版]统一的
/v1/messages
端点,使其仅适用于 Anthropic API。
- Vertex AI - 调用 vertex ai 时处理响应 schema 中的 $id。 开始使用
支出跟踪改进
管理端点 / UI
- 虚拟密钥页面
- 允许在创建密钥页面搜索团队/组织筛选器
- 向 Keys 表添加 created_by 和 updated_by 字段
- 在 key 表上显示 'user_email'
- 每页显示 100 个密钥,使用全高,增加 key alias 的宽度
- 日志页面
- 在 LiteLLM UI 上显示错误日志
- 允许内部用户查看自己的日志
- 内部用户页面
- 允许管理员控制内部用户的默认模型访问权限
- 修复使用 cookie 的会话处理
日志 / Guardrail 集成
- 使用自定义指标修复 prometheus 指标,当包含 team_id 的密钥发出请求时。 PR
性能 / 负载均衡 / 可靠性改进
通用代理改进
- 当请求中传入未知模型时抛出 BadRequestError
- 在 Azure OpenAI 代理路由上强制执行模型访问限制
- 可靠性修复 - 处理文本中的表情符号 - 修复 orjson 错误
- 模型访问补丁 - 在运行 auth 检查时不覆盖 litellm.anthropic_models
- 在 docker 镜像中启用时区信息设置