这是自 v1.63.11-stable
以来的变化。
此版本带来
- LLM 翻译改进(MCP 支持和 Bedrock 应用配置文件)
- 基于使用量路由的性能改进
- 通过 websockets 支持流式传输安全护栏
- Azure OpenAI 客户端性能修复(来自上一个版本)
Docker 运行 LiteLLM Proxy
docker run
-e STORE_MODEL_IN_DB=True
-p 4000:4000
ghcr.io/berriai/litellm:main-v1.63.14-stable.patch1
演示实例
这是一个测试更改的演示实例
- 实例:https://demo.litellm.ai/
- 登录凭据
- 用户名:admin
- 密码:sk-1234
新模型 / 更新的模型
- Azure gpt-4o - 将定价固定为最新的全球定价 - PR
- O1-Pro - 添加定价 + 模型信息 - PR
- Azure AI - 添加 mistral 3.1 small 定价 - PR
- Azure - 添加 gpt-4.5-preview 定价 - PR
LLM 翻译
- 新 LLM 功能
- Bedrock:支持 bedrock 应用推理配置文件 文档
- 从 bedrock 应用配置文件 ID 推断 AWS 区域 - (
arn:aws:bedrock:us-east-1:...
)
- 从 bedrock 应用配置文件 ID 推断 AWS 区域 - (
- Ollama - 支持通过
/v1/completions
调用 入门 - Bedrock - 支持
us.deepseek.r1-v1:0
模型名称 文档 - OpenRouter - 支持
OPENROUTER_API_BASE
环境变量 文档 - Azure - 添加音频模型参数支持 - 文档
- OpenAI - 支持 PDF 文件 文档
- OpenAI - o1-pro 响应 API 流式传输支持 文档
- [测试版]MCP - 将 MCP 工具与 LiteLLM SDK 配合使用 文档
- 错误修复
- Voyage:修复嵌入跟踪上的 prompt token 问题 - PR
- Sagemaker - 修复“declared Content-Length 数据过少”错误 - PR
- OpenAI 兼容模型 - 修复调用设置了 custom_llm_provider 的 openai 兼容模型时的问题 - PR
- VertexAI - 支持嵌入 ‘outputDimensionality’ - PR
- Anthropic - 在流式/非流式传输中返回一致的 json 响应格式 - PR
支出跟踪改进
litellm_proxy/
- 使用客户端 SDK 时,支持从 proxy 读取 litellm 响应成本头- 重置预算任务 - 修复 key/team/user 上的预算重置错误 - PR
- 流式传输 - 防止带有使用量的最终块被忽略(影响 bedrock 流式传输 + 成本跟踪) - PR
用户界面
- 用户页面
- 功能:控制默认内部用户设置 - PR
- 图标
- 功能:将外部 "artificialanalysis.ai" 图标替换为本地 svg - PR
- 登录/登出
- 修复:当
default_user_id
用户不存在于数据库时,默认登录 - PR
- 修复:当
日志集成
- 支持流式响应的调用后安全护栏 入门
- Arize 入门
- StandardLoggingPayload - 在 payload 中记录 litellm_model_name。允许了解发送给 API 提供商的模型名称是什么 入门
- Prompt 管理 - 允许构建自定义 prompt 管理集成 入门
性能 / 可靠性改进
- Redis 缓存 - 添加 5 秒默认超时,防止挂起的 Redis 连接影响 LLM 调用 - PR
- 允许禁用所有支出更新 / 写入数据库 - 补丁,允许通过标志禁用所有支出更新写入数据库 - PR
- Azure OpenAI - 正确重用 azure openai 客户端,修复了上一个稳定版本中的性能问题 - PR
- Azure OpenAI - 在 Azure/OpenAI 客户端上使用 litellm.ssl_verify - PR
- 基于使用量路由 - 支持通配符模型 入门
- 基于使用量路由 - 支持向 Redis 批量写入增量 - 将延迟降低到与“简单随机”相同 - PR
- 路由器 - 在“无可用健康部署错误”上显示模型冷却原因 - PR
- 缓存 - 向内存缓存中的条目添加最大值限制 (1MB) - 防止通过 proxy 发送大型图片 URL 时出现 OOM 错误 - PR
一般改进
- Passthrough Endpoints - 支持在直通端点响应头中返回 api-base 文档
- SSL - 支持从环境变量读取 SSL 安全级别 - 允许用户指定较低的安全设置 入门
- 凭据 - 仅当
STORE_MODEL_IN_DB
为 True 时轮询 Credentials 表 - PR - 图片 URL 处理 - 关于图片 URL 处理的新架构文档 文档
- OpenAI - 更新 pip install "openai==1.68.2" - PR
- Gunicorn - 安全修复 - 更新 gunicorn==23.0.0 - PR