一个新的 LiteLLM 稳定版本刚刚发布。自 v1.52.2-stable 以来的 5 个更新如下:
langfuse
, fallbacks
, new models
, azure_storage
Langfuse 提示管理
这使得在 Langfuse 上运行实验或更改特定模型(如将 gpt-4o
改为 gpt-4o-mini
)变得容易,而无需修改您的应用程序。从这里开始
客户端控制回退提示
Claude 提示与 OpenAI 不同
在进行回退时,传入特定于模型的提示。从这里开始
新提供商 / 模型
- NVIDIA Triton
/infer
端点。从这里开始 - Infinity Rerank 模型从这里开始
✨ Azure Data Lake Storage 支持
将 LLM 使用情况(支出、tokens)数据发送到 Azure Data Lake。这使得在其他服务(例如 Databricks)上使用使用情况数据变得容易。从这里开始
Docker 运行 LiteLLM
docker run \
-e STORE_MODEL_IN_DB=True \
-p 4000:4000 \
ghcr.io/berriai/litellm:litellm_stable_release_branch-v1.55.8-stable
获取每日更新
LiteLLM 每天发布新版本。在 LinkedIn 上关注我们以获取每日更新。