所有设置

environment_variables: {}

model_list:
  - model_name: string
    litellm_params: {}
    model_info:
      id: string
      mode: embedding
      input_cost_per_token: 0
      output_cost_per_token: 0
      max_tokens: 2048
      base_model: gpt-4-1106-preview
      additionalProp1: {}

litellm_settings:
  # Logging/Callback settings
  success_callback: ["langfuse"]  # list of success callbacks
  failure_callback: ["sentry"]  # list of failure callbacks
  callbacks: ["otel"]  # list of callbacks - runs on success and failure
  service_callbacks: ["datadog", "prometheus"]  # logs redis, postgres failures on datadog, prometheus
  turn_off_message_logging: boolean  # prevent the messages and responses from being logged to on your callbacks, but request metadata will still be logged.
  redact_user_api_key_info: boolean  # Redact information about the user api key (hashed token, user_id, team id, etc.), from logs. Currently supported for Langfuse, OpenTelemetry, Logfire, ArizeAI logging.
  langfuse_default_tags: ["cache_hit", "cache_key", "proxy_base_url", "user_api_key_alias", "user_api_key_user_id", "user_api_key_user_email", "user_api_key_team_alias", "semantic-similarity", "proxy_base_url"] # default tags for Langfuse Logging
  
  # Networking settings
  request_timeout: 10 # (int) llm requesttimeout in seconds. Raise Timeout error if call takes longer than 10s. Sets litellm.request_timeout 
  force_ipv4: boolean # If true, litellm will force ipv4 for all LLM requests. Some users have seen httpx ConnectionError when using ipv6 + Anthropic API
  
  set_verbose: boolean # sets litellm.set_verbose=True to view verbose debug logs. DO NOT LEAVE THIS ON IN PRODUCTION
  json_logs: boolean # if true, logs will be in json format

  # Fallbacks, reliability
  default_fallbacks: ["claude-opus"] # set default_fallbacks, in case a specific model group is misconfigured / bad.
  content_policy_fallbacks: [{"gpt-3.5-turbo-small": ["claude-opus"]}] # fallbacks for ContentPolicyErrors
  context_window_fallbacks: [{"gpt-3.5-turbo-small": ["gpt-3.5-turbo-large", "claude-opus"]}] # fallbacks for ContextWindowExceededErrors



  # Caching settings
  cache: true 
  cache_params:        # set cache params for redis
    type: redis        # type of cache to initialize

    # Optional - Redis Settings
    host: "localhost"  # The host address for the Redis cache. Required if type is "redis".
    port: 6379  # The port number for the Redis cache. Required if type is "redis".
    password: "your_password"  # The password for the Redis cache. Required if type is "redis".
    namespace: "litellm.caching.caching" # namespace for redis cache
  
    # Optional - Redis Cluster Settings
    redis_startup_nodes: [{"host": "127.0.0.1", "port": "7001"}] 

    # Optional - Redis Sentinel Settings
    service_name: "mymaster"
    sentinel_nodes: [["localhost", 26379]]

    # Optional - Qdrant Semantic Cache Settings
    qdrant_semantic_cache_embedding_model: openai-embedding # the model should be defined on the model_list
    qdrant_collection_name: test_collection
    qdrant_quantization_config: binary
    similarity_threshold: 0.8   # similarity threshold for semantic cache

    # Optional - S3 Cache Settings
    s3_bucket_name: cache-bucket-litellm   # AWS Bucket Name for S3
    s3_region_name: us-west-2              # AWS Region Name for S3
    s3_aws_access_key_id: os.environ/AWS_ACCESS_KEY_ID  # us os.environ/<variable name> to pass environment variables. This is AWS Access Key ID for S3
    s3_aws_secret_access_key: os.environ/AWS_SECRET_ACCESS_KEY  # AWS Secret Access Key for S3
    s3_endpoint_url: https://s3.amazonaws.com  # [OPTIONAL] S3 endpoint URL, if you want to use Backblaze/cloudflare s3 bucket

    # Common Cache settings
    # Optional - Supported call types for caching
    supported_call_types: ["acompletion", "atext_completion", "aembedding", "atranscription"]
                          # /chat/completions, /completions, /embeddings, /audio/transcriptions
    mode: default_off # if default_off, you need to opt in to caching on a per call basis
    ttl: 600 # ttl for caching


callback_settings:
  otel:
    message_logging: boolean  # OTEL logging callback specific settings

general_settings:
  completion_model: string
  disable_spend_logs: boolean  # turn off writing each transaction to the db
  disable_master_key_return: boolean  # turn off returning master key on UI (checked on '/user/info' endpoint)
  disable_retry_on_max_parallel_request_limit_error: boolean  # turn off retries when max parallel request limit is reached
  disable_reset_budget: boolean  # turn off reset budget scheduled task
  disable_adding_master_key_hash_to_db: boolean  # turn off storing master key hash in db, for spend tracking
  enable_jwt_auth: boolean  # allow proxy admin to auth in via jwt tokens with 'litellm_proxy_admin' in claims
  enforce_user_param: boolean  # requires all openai endpoint requests to have a 'user' param
  allowed_routes: ["route1", "route2"]  # list of allowed proxy API routes - a user can access. (currently JWT-Auth only)
  key_management_system: google_kms  # either google_kms or azure_kms
  master_key: string
  maximum_spend_logs_retention_period: 30d # The maximum time to retain spend logs before deletion.
  maximum_spend_logs_retention_interval: 1d # interval in which the spend log cleanup task should run in.

  # Database Settings
  database_url: string
  database_connection_pool_limit: 0  # default 100
  database_connection_timeout: 0  # default 60s
  allow_requests_on_db_unavailable: boolean  # if true, will allow requests that can not connect to the DB to verify Virtual Key to still work 

  custom_auth: string
  max_parallel_requests: 0  # the max parallel requests allowed per deployment 
  global_max_parallel_requests: 0  # the max parallel requests allowed on the proxy all up 
  infer_model_from_keys: true
  background_health_checks: true
  health_check_interval: 300
  alerting: ["slack", "email"]
  alerting_threshold: 0
  use_client_credentials_pass_through_routes: boolean  # use client credentials for all pass through routes like "/vertex-ai", /bedrock/. When this is True Virtual Key auth will not be applied on these endpoints

litellm_settings - 参考

名称	类型	描述
success_callback	字符串数组	成功回调列表。文档代理日志记录回调, 文档指标
failure_callback	字符串数组	失败回调列表文档代理日志记录回调, 文档指标
callbacks	字符串数组	回调列表 - 在成功和失败时运行文档代理日志记录回调, 文档指标
service_callbacks	字符串数组	系统健康监控 - 记录指定服务（例如 datadog, prometheus）上的 redis, postgres 故障文档指标
turn_off_message_logging	布尔值	如果为 true，则阻止消息和响应记录到回调，但请求元数据仍会记录。代理日志记录
modify_params	布尔值	如果为 true，则允许在将请求发送到 LLM 提供商之前修改请求参数
enable_preview_features	布尔值	如果为 true，则启用预览功能 - 例如支持流式传输的 Azure O1 模型。
redact_user_api_key_info	布尔值	如果为 true，则从日志中删除有关用户 API 密钥的信息代理日志记录
langfuse_default_tags	字符串数组	Langfuse 日志记录的默认标签。如果要控制 LiteLLM 代理将哪些 LiteLLM 特定字段记录为标签，请使用此项。默认情况下，LiteLLM 代理不将任何 LiteLLM 特定字段记录为标签。更多文档
set_verbose	布尔值	如果为 true，则设置 litellm.set_verbose=True 以查看详细调试日志。请勿在生产环境中开启此项
json_logs	布尔值	如果为 true，日志将采用 json 格式。如果需要将日志存储为 JSON，只需设置 `litellm.json_logs = True`。我们目前仅将 litellm 的原始 POST 请求记录为 JSON 更多文档
default_fallbacks	字符串数组	如果特定模型组配置错误/损坏，则使用的回退模型列表。更多文档
request_timeout	整数	请求超时（秒）。如果未设置，默认值为 `6000 秒`。参考 OpenAI Python SDK 默认值为 `600 秒`。
force_ipv4	布尔值	如果为 true，litellm 将对所有 LLM 请求强制使用 ipv4。一些用户在使用 ipv6 + Anthropic API 时遇到 httpx ConnectionError
content_policy_fallbacks	对象数组	遇到 ContentPolicyViolationError 时使用的回退。更多文档
context_window_fallbacks	对象数组	遇到 ContextWindowExceededError 时使用的回退。更多文档
cache	布尔值	如果为 true，则启用缓存。更多文档
cache_params	对象	缓存参数。更多文档
disable_end_user_cost_tracking	布尔值	如果为 true，则关闭 prometheus 指标和代理上的 litellm 费用日志表中的终端用户费用跟踪。
disable_end_user_cost_tracking_prometheus_only	布尔值	如果为 true，则仅关闭 prometheus 指标中的终端用户费用跟踪。
key_generation_settings	对象	限制谁可以生成密钥。更多文档
disable_add_transform_inline_image_block	布尔值	对于 Fireworks AI 模型 - 如果为 true，并且模型不是视觉模型，则关闭自动向 image_url 的 URL 添加 `#transform=inline`。
disable_hf_tokenizer_download	布尔值	如果为 true，则默认为所有模型（包括 huggingface 模型）使用 openai 分词器。

general_settings - 参考

名称	类型	描述
completion_model	字符串	请求中未指定 `model` 时用于完成的默认模型
disable_spend_logs	布尔值	如果为 true，则关闭将每笔事务写入数据库
disable_spend_updates	布尔值	如果为 true，则关闭数据库的所有费用更新。包括密钥/用户/团队费用更新。
disable_master_key_return	布尔值	如果为 true，则关闭在 UI 上返回主密钥。（在 '/user/info' 端点上检查）
disable_retry_on_max_parallel_request_limit_error	布尔值	如果为 true，则在达到最大并行请求限制时关闭重试
disable_reset_budget	布尔值	如果为 true，则关闭重置预算计划任务
disable_adding_master_key_hash_to_db	布尔值	如果为 true，则关闭在数据库中存储主密钥哈希
enable_jwt_auth	布尔值	允许代理管理员通过包含 'litellm_proxy_admin' 声明的 jwt 令牌进行身份验证。JWT 令牌文档
enforce_user_param	布尔值	如果为 true，则要求所有 OpenAI 端点请求都包含 'user' 参数。调用挂钩文档
allowed_routes	字符串数组	用户可以访问的允许的代理 API 路由列表控制允许的路由文档
key_management_system	字符串	指定密钥管理系统。密钥管理器文档
master_key	字符串	代理的主密钥设置虚拟密钥
database_url	字符串	数据库连接 URL 设置虚拟密钥
database_connection_pool_limit	整数	数据库连接池的限制设置数据库连接池限制
database_connection_timeout	整数	数据库连接超时（秒）设置数据库连接池限制，超时
allow_requests_on_db_unavailable	布尔值	如果为 true，则即使数据库不可访问，也允许请求成功。仅当在 VPC 中运行 LiteLLM 时使用此选项这将允许请求正常工作，即使 LiteLLM 无法连接到数据库来验证虚拟密钥。优雅处理数据库不可用文档
custom_auth	字符串	编写自己的自定义身份验证逻辑自定义身份验证文档
max_parallel_requests	整数	每个部署允许的最大并行请求数
global_max_parallel_requests	整数	代理整体允许的最大并行请求数
infer_model_from_keys	布尔值	如果为 true，则根据提供的密钥推断模型
background_health_checks	布尔值	如果为 true，则启用后台健康检查。健康检查文档
health_check_interval	整数	健康检查间隔（秒）健康检查文档
alerting	字符串数组	警报方法列表 Slack 警报文档
alerting_threshold	整数	触发警报的阈值 Slack 警报文档
use_client_credentials_pass_through_routes	布尔值	如果为 true，则对所有直通路由使用客户端凭据。直通路由文档
health_check_details	布尔值	如果为 false，则隐藏健康检查详细信息（例如剩余速率限制）。健康检查文档
public_routes	列表[str]	（企业版功能）控制公共路由列表
alert_types	列表[str]	控制要发送到 Slack 的警报类型列表（警报类型文档）[./alerting.md]
enforced_params	列表[str]	（企业版功能）必须包含在所有代理请求中的参数列表
enable_oauth2_auth	布尔值	（企业版功能）如果为 true，则启用 oauth2.0 身份验证
use_x_forwarded_for	str	如果为 true，则使用 X-Forwarded-For 头部获取客户端 IP 地址
service_account_settings	List[Dict[str, Any]]	如果要创建仅适用于服务账户密钥的设置，请设置 `service_account_settings`（服务账户文档）[./service_accounts.md]
image_generation_model	str	用于图像生成的默认模型 - 忽略请求中设置的模型
store_model_in_db	布尔值	如果为 true，则启用在数据库中存储模型 + 凭据信息。
store_prompts_in_spend_logs	布尔值	如果为 true，则允许将提示和响应存储在费用日志表中。
max_request_size_mb	整数	请求的最大大小（MB）。超过此大小的请求将被拒绝。
max_response_size_mb	整数	响应的最大大小（MB）。超过此大小的 LLM 响应将不会发送。
proxy_budget_rescheduler_min_time	整数	在检查数据库以重置预算之前的最短等待时间（秒）。默认值为 597 秒
proxy_budget_rescheduler_max_time	整数	在检查数据库以重置预算之前的最长等待时间（秒）。默认值为 605 秒
proxy_batch_write_at	整数	在批量将费用日志写入数据库之前的等待时间（秒）。默认值为 10 秒
alerting_args	字典	Slack 警报参数 Slack 警报文档
custom_key_generate	str	自定义密钥生成函数自定义密钥生成文档
allowed_ips	列表[str]	允许访问代理的 IP 列表。如果未设置，则允许所有 IP。
embedding_model	str	用于嵌入的默认模型 - 忽略请求中设置的模型
default_team_disabled	布尔值	如果为 true，则用户无法创建“个人”密钥（没有 team_id 的密钥）。
alert_to_webhook_url	字典[str]	为每种警报类型指定一个 webhook URL。
key_management_settings	List[Dict[str, Any]]	密钥管理系统设置（例如 AWS KMS, Azure Key Vault）密钥管理文档
allow_user_auth	布尔值	（已弃用）用户身份验证的旧方法。
user_api_key_cache_ttl	整数	在内存中缓存用户 API 密钥的时间（秒）。
disable_prisma_schema_update	布尔值	如果为 true，则关闭数据库的自动模式更新
litellm_key_header_name	str	如果设置，则允许将 LiteLLM 密钥作为自定义头部传递。自定义头部文档
moderation_model	str	用于审核的默认模型。
custom_sso	str	实现自定义 SSO 逻辑的 python 文件路径。自定义 SSO 文档
allow_client_side_credentials	布尔值	如果为 true，则允许将客户端凭据传递给代理。（在测试微调模型时有用）客户端凭据文档
admin_only_routes	列表[str]	（企业版功能）仅管理员用户可访问的路由列表。仅管理员路由文档
use_azure_key_vault	布尔值	如果为 true，则从 Azure 密钥保管库加载密钥
use_google_kms	布尔值	如果为 true，则从 Google KMS 加载密钥
spend_report_frequency	str	指定发送费用报告的频率（例如，“1 天”、“2 天”、“30 天”）更多信息
ui_access_mode	字面量["admin_only"]	如果设置，则将对 UI 的访问限制为仅管理员用户。文档
litellm_jwtauth	字典[str, Any]	JWT 身份验证设置。文档
litellm_license	str	代理的许可证密钥。文档
oauth2_config_mappings	字典[str, str]	定义 OAuth2 配置映射
pass_through_endpoints	List[Dict[str, Any]]	定义直通端点。文档
enable_oauth2_proxy_auth	布尔值	（企业版功能）如果为 true，则启用 oauth2.0 身份验证
forward_openai_org_id	布尔值	如果为 true，则将 OpenAI 组织 ID 转发到后端 LLM 调用（如果是 OpenAI）。
forward_client_headers_to_llm_api	布尔值	如果为 true，则将客户端头部（任何 `x-` 头部）转发到后端 LLM 调用
maximum_spend_logs_retention_period	str	用于设置数据库中费用日志的最长保留时间，超过该时间后将自动清除
maximum_spend_logs_retention_interval	str	用于设置费用日志清理任务应运行的间隔。

router_settings - 参考

信息

大多数值也可以通过 litellm_settings 进行设置。如果看到重叠的值，router_settings 上的设置将覆盖 litellm_settings 上的设置。

router_settings:
  routing_strategy: usage-based-routing-v2 # Literal["simple-shuffle", "least-busy", "usage-based-routing","latency-based-routing"], default="simple-shuffle"
  redis_host: <your-redis-host>           # string
  redis_password: <your-redis-password>   # string
  redis_port: <your-redis-port>           # string
  enable_pre_call_checks: true            # bool - Before call is made check if a call is within model context window 
  allowed_fails: 3 # cooldown model if it fails > 1 call in a minute. 
  cooldown_time: 30 # (in seconds) how long to cooldown model if fails/min > allowed_fails
  disable_cooldowns: True                  # bool - Disable cooldowns for all models 
  enable_tag_filtering: True                # bool - Use tag based routing for requests
  retry_policy: {                          # Dict[str, int]: retry policy for different types of exceptions
    "AuthenticationErrorRetries": 3,
    "TimeoutErrorRetries": 3,
    "RateLimitErrorRetries": 3,
    "ContentPolicyViolationErrorRetries": 4,
    "InternalServerErrorRetries": 4
  }
  allowed_fails_policy: {
    "BadRequestErrorAllowedFails": 1000, # Allow 1000 BadRequestErrors before cooling down a deployment
    "AuthenticationErrorAllowedFails": 10, # int 
    "TimeoutErrorAllowedFails": 12, # int 
    "RateLimitErrorAllowedFails": 10000, # int 
    "ContentPolicyViolationErrorAllowedFails": 15, # int 
    "InternalServerErrorAllowedFails": 20, # int 
  }
  content_policy_fallbacks=[{"claude-2": ["my-fallback-model"]}] # List[Dict[str, List[str]]]: Fallback model for content policy violations
  fallbacks=[{"claude-2": ["my-fallback-model"]}] # List[Dict[str, List[str]]]: Fallback model for all errors

名称	类型	描述
routing_strategy	字符串	用于路由请求的策略。选项："simple-shuffle", "least-busy", "usage-based-routing", "latency-based-routing"。默认值为 "simple-shuffle"。此处有更多信息
redis_host	字符串	Redis 服务器的主机地址。仅当您有多个 LiteLLM 代理实例并希望在它们之间共享当前 tpm/rpm 跟踪时才设置此项
redis_password	字符串	Redis 服务器的密码。仅当您有多个 LiteLLM 代理实例并希望在它们之间共享当前 tpm/rpm 跟踪时才设置此项
redis_port	字符串	Redis 服务器的端口号。仅当您有多个 LiteLLM 代理实例并希望在它们之间共享当前 tpm/rpm 跟踪时才设置此项
enable_pre_call_check	布尔值	如果为 true，则在发起调用之前检查调用是否在模型的上下文窗口内。此处有更多信息
content_policy_fallbacks	对象数组	为内容策略违规指定回退模型。此处有更多信息
fallbacks	对象数组	为所有类型的错误指定回退模型。此处有更多信息
enable_tag_filtering	布尔值	如果为 true，则对请求使用基于标签的路由基于标签的路由
cooldown_time	整数	如果模型超过允许的故障次数，则冷却模型的时间（秒）。
disable_cooldowns	布尔值	如果为 true，则禁用所有模型的冷却。此处有更多信息
retry_policy	对象	指定不同类型异常的重试次数。此处有更多信息
allowed_fails	整数	在冷却模型之前允许的故障次数。此处有更多信息
allowed_fails_policy	对象	指定在冷却部署之前允许的不同错误类型的故障次数。此处有更多信息
default_max_parallel_requests	可选[int]	部署的默认最大并行请求数。
default_priority	（可选[int])	请求的默认优先级。仅适用于 '.scheduler_acompletion()'。默认值为 None。
polling_interval	（可选[float])	轮询队列的频率。仅适用于 '.scheduler_acompletion()'。默认值为 3ms。
max_fallbacks	可选[int]	在退出调用之前尝试的最大回退次数。默认值为 5。
default_litellm_params	可选[dict]	添加到所有请求的默认 litellm 参数（例如 `temperature`, `max_tokens`）。
timeout	可选[float]	请求的默认超时时间。默认值为 10 分钟。
stream_timeout	可选[float]	流式请求的默认超时时间。如果未设置，则使用 'timeout' 值。
debug_level	字面量["DEBUG", "INFO"]	路由器中日志记录库的调试级别。默认值为 "INFO"。
client_ttl	整数	缓存客户端的存活时间（秒）。默认值为 3600。
cache_kwargs	字典	缓存初始化的附加关键字参数。
routing_strategy_args	字典	路由策略的附加关键字参数 - 例如最低延迟路由默认 TTL
model_group_alias	字典	模型组别名映射。例如 `{"claude-3-haiku": "claude-3-haiku-20240229"}`
num_retries	整数	请求的重试次数。默认值为 3。
default_fallbacks	Optional[List[str]]	如果未定义特定模型组的回退，则尝试的回退。
caching_groups	Optional[List[tuple]]	跨模型组缓存的模型组列表。默认值为 None。- 例如 caching_groups=[("openai-gpt-3.5-turbo", "azure-gpt-3.5-turbo")]
alerting_config	AlertingConfig	[仅限 SDK 参数]Slack 警报配置。默认值为 None。更多文档
assistants_config	AssistantsConfig	通过 `assistant_settings` 在代理上设置。更多文档
set_verbose	布尔值	已弃用参数 - 请参阅调试文档如果为 true，则将日志记录级别设置为详细。
retry_after	整数	在重试请求之前等待的时间（秒）。默认值为 0。如果从 LLM API 接收到 `x-retry-after`，则此值会被覆盖。
provider_budget_config	ProviderBudgetConfig	提供商预算配置。使用此项设置 LLM 提供商预算限制。例如，OpenAI $100/天，Azure $100/天等。默认值为 None。更多文档
enable_pre_call_checks	布尔值	如果为 true，则在发起调用之前检查调用是否在模型的上下文窗口内。此处有更多信息
model_group_retry_policy	字典[str, RetryPolicy]	[仅限 SDK 参数]设置模型组的重试策略。
context_window_fallbacks	List[Dict[str, List[str]]]	上下文窗口违规的回退模型。
redis_url	str	Redis 服务器 URL。已知 Redis URL 存在性能问题。
cache_responses	布尔值	如果 router_settings 下设置了缓存，则启用缓存 LLM 响应的标志。如果为 true，则缓存响应。默认值为 False。
router_general_settings	RouterGeneralSettings	[仅限 SDK]路由器通用设置 - 包含 'async_only_mode' 等优化。文档
optional_pre_call_checks	列表[str]	要添加到路由器的预调用检查列表。目前支持：'router_budget_limiting', 'prompt_caching'

环境变量 - 参考

名称	描述
ACTIONS_ID_TOKEN_REQUEST_TOKEN	在 GitHub Actions 中请求 ID 的令牌
ACTIONS_ID_TOKEN_REQUEST_URL	在 GitHub Actions 中请求 ID 令牌的 URL
AGENTOPS_ENVIRONMENT	AgentOps 日志记录集成的环境
AGENTOPS_API_KEY	AgentOps 日志记录集成的 API 密钥
AGENTOPS_SERVICE_NAME	AgentOps 日志记录集成的服务名称
AISPEND_ACCOUNT_ID	AI Spend 的账户 ID
AISPEND_API_KEY	AI Spend 的 API 密钥
ALLOWED_EMAIL_DOMAINS	允许访问的电子邮件域名列表
ARIZE_API_KEY	Arize 平台集成的 API 密钥
ARIZE_SPACE_KEY	Arize 平台的 Space 密钥
ARGILLA_BATCH_SIZE	Argilla 日志记录的批量大小
ARGILLA_API_KEY	Argilla 平台的 API 密钥
ARGILLA_SAMPLING_RATE	Argilla 日志记录的采样率
ARGILLA_DATASET_NAME	Argilla 日志记录的数据集名称
ARGILLA_BASE_URL	Argilla 服务的基本 URL
ATHINA_API_KEY	Athina 服务的 API 密钥
ATHINA_BASE_URL	Athina 服务的基本 URL（默认为 `https://log.athina.ai`）
AUTH_STRATEGY	用于身份验证的策略（例如 OAuth、API 密钥）
AWS_ACCESS_KEY_ID	AWS 服务的访问密钥 ID
AWS_PROFILE_NAME	要使用的 AWS CLI 配置文件名称
AWS_REGION_NAME	服务交互的默认 AWS 区域
AWS_ROLE_NAME	AWS IAM 使用的角色名称
AWS_SECRET_ACCESS_KEY	AWS 服务的秘密访问密钥
AWS_SESSION_NAME	AWS 会话名称
AWS_WEB_IDENTITY_TOKEN	AWS 的 Web 身份令牌
AZURE_API_VERSION	正在使用的 Azure API 版本
AZURE_AUTHORITY_HOST	Azure 授权主机 URL
AZURE_CLIENT_ID	Azure 服务的客户端 ID
AZURE_CLIENT_SECRET	Azure 服务的客户端密钥
AZURE_TENANT_ID	Azure Active Directory 的租户 ID
AZURE_USERNAME	Azure 服务的用户名，与 AZURE_PASSWORD 结合使用，用于通过基本用户名/密码工作流获取 azure ad 令牌
AZURE_PASSWORD	Azure 服务的密码，与 AZURE_USERNAME 结合使用，用于通过基本用户名/密码工作流获取 azure ad 令牌
AZURE_FEDERATED_TOKEN_FILE	Azure 联合令牌的文件路径
AZURE_KEY_VAULT_URI	Azure Key Vault 的 URI
AZURE_OPERATION_POLLING_TIMEOUT	Azure 操作轮询超时（秒）
AZURE_STORAGE_ACCOUNT_KEY	用于对 Azure Blob Storage 日志进行身份验证的 Azure 存储帐户密钥
AZURE_STORAGE_ACCOUNT_NAME	用于将日志记录到 Azure Blob Storage 的 Azure 存储帐户名称
AZURE_STORAGE_FILE_SYSTEM	用于将日志记录到 Azure Blob Storage 的 Azure 存储文件系统名称。（通常是容器名称）
AZURE_STORAGE_TENANT_ID	用于对 Azure Blob Storage 日志进行身份验证的应用程序租户 ID
AZURE_STORAGE_CLIENT_ID	用于对 Azure Blob Storage 日志进行身份验证的应用程序客户端 ID
AZURE_STORAGE_CLIENT_SECRET	用于对 Azure Blob Storage 日志进行身份验证的应用程序客户端密钥
BATCH_STATUS_POLL_INTERVAL_SECONDS	轮询批量状态的间隔（秒）。默认值为 3600（1 小时）
BATCH_STATUS_POLL_MAX_ATTEMPTS	轮询批量状态的最大尝试次数。默认值为 24（24 小时）
BEDROCK_MAX_POLICY_SIZE	Bedrock 策略的最大大小。默认值为 75
BERRISPEND_ACCOUNT_ID	BerriSpend 服务的账户 ID
BRAINTRUST_API_KEY	Braintrust 集成的 API 密钥
CACHED_STREAMING_CHUNK_DELAY	缓存流式块的延迟（秒）。默认值为 0.02
CIRCLE_OIDC_TOKEN	CircleCI 的 OpenID Connect 令牌
CIRCLE_OIDC_TOKEN_V2	CircleCI 的 OpenID Connect 令牌版本 2
CONFIG_FILE_PATH	配置文件的文件路径
CUSTOM_TIKTOKEN_CACHE_DIR	Tiktoken 缓存的自定义目录
DATABASE_HOST	数据库服务器的主机名
DATABASE_NAME	数据库名称
DATABASE_PASSWORD	数据库用户的密码
DATABASE_PORT	数据库连接的端口号
DATABASE_SCHEMA	数据库中使用的模式名称
DATABASE_URL	数据库的连接 URL
DATABASE_USER	数据库连接的用户名
DATABASE_USERNAME	数据库用户的别名
DATABRICKS_API_BASE	Databricks API 的基本 URL
DAYS_IN_A_MONTH	用于计算目的的每月天数。默认值为 28
DAYS_IN_A_WEEK	用于计算目的的每周天数。默认值为 7
DAYS_IN_A_YEAR	用于计算目的的每年天数。默认值为 365
DD_BASE_URL	Datadog 集成的基本 URL
DATADOG_BASE_URL	（DD_BASE_URL 的替代）Datadog 集成的基本 URL
_DATADOG_BASE_URL	（DD_BASE_URL 的替代）Datadog 集成的基本 URL
DD_API_KEY	Datadog 集成的 API 密钥
DD_SITE	Datadog 的站点 URL（例如 datadoghq.com）
DD_SOURCE	Datadog 日志的源标识符
DD_ENV	Datadog 日志的环境标识符。仅支持 `datadog_llm_observability` 回调
DD_SERVICE	Datadog 日志的服务标识符。默认值为 "litellm-server"
DD_VERSION	Datadog 日志的版本标识符。默认值为 "unknown"
DEBUG_OTEL	启用 OpenTelemetry 的调试模式
DEFAULT_ALLOWED_FAILS	模型冷却前允许的最大故障次数。默认值为 3
DEFAULT_ANTHROPIC_CHAT_MAX_TOKENS	Anthropic 聊天完成的默认最大 token 数。默认值为 4096
DEFAULT_BATCH_SIZE	操作的默认批量大小。默认值为 512
DEFAULT_COOLDOWN_TIME_SECONDS	模型故障后冷却的持续时间（秒）。默认值为 5
DEFAULT_CRON_JOB_LOCK_TTL_SECONDS	cron 作业锁的存活时间（秒）。默认值为 60（1 分钟）
DEFAULT_FAILURE_THRESHOLD_PERCENT	冷却部署的故障阈值百分比。默认值为 0.5 (50%)
DEFAULT_FLUSH_INTERVAL_SECONDS	刷新操作的默认间隔（秒）。默认值为 5
DEFAULT_HEALTH_CHECK_INTERVAL	健康检查的默认间隔（秒）。默认值为 300（5 分钟）
DEFAULT_IMAGE_HEIGHT	图像的默认高度。默认值为 300
DEFAULT_IMAGE_TOKEN_COUNT	图像的默认 token 数。默认值为 250
DEFAULT_IMAGE_WIDTH	图像的默认宽度。默认值为 300
DEFAULT_IN_MEMORY_TTL	内存缓存的默认存活时间（秒）。默认值为 5
DEFAULT_MAX_LRU_CACHE_SIZE	LRU 缓存的默认最大大小。默认值为 16
DEFAULT_MAX_RECURSE_DEPTH	默认最大递归深度。默认值为 100
DEFAULT_MAX_RECURSE_DEPTH_SENSITIVE_DATA_MASKER	敏感数据掩码的默认最大递归深度。默认值为 10
DEFAULT_MAX_RETRIES	默认最大重试尝试次数。默认值为 2
DEFAULT_MAX_TOKENS	LLM 调用的默认最大 token 数。默认值为 4096
DEFAULT_MAX_TOKENS_FOR_TRITON	Triton 模型的默认最大 token 数。默认值为 2000
DEFAULT_MOCK_RESPONSE_COMPLETION_TOKEN_COUNT	模拟响应完成的默认 token 数。默认值为 20
DEFAULT_MOCK_RESPONSE_PROMPT_TOKEN_COUNT	模拟响应提示的默认 token 数。默认值为 10
DEFAULT_MODEL_CREATED_AT_TIME	模型的默认创建时间戳。默认值为 1677610602
DEFAULT_PROMPT_INJECTION_SIMILARITY_THRESHOLD	提示注入相似度的默认阈值。默认值为 0.7
DEFAULT_POLLING_INTERVAL	调度器的默认轮询间隔（秒）。默认值为 0.03
DEFAULT_REASONING_EFFORT_HIGH_THINKING_BUDGET	默认高推理努力思考预算。默认值为 4096
DEFAULT_REASONING_EFFORT_LOW_THINKING_BUDGET	默认低推理努力思考预算。默认值为 1024
DEFAULT_REASONING_EFFORT_MEDIUM_THINKING_BUDGET	默认中等推理努力思考预算。默认值为 2048
DEFAULT_REDIS_SYNC_INTERVAL	默认 Redis 同步间隔（秒）。默认值为 1
DEFAULT_REPLICATE_GPU_PRICE_PER_SECOND	Replicate GPU 的默认每秒价格。默认值为 0.001400
DEFAULT_REPLICATE_POLLING_DELAY_SECONDS	Replicate 轮询的默认延迟（秒）。默认值为 1
DEFAULT_REPLICATE_POLLING_RETRIES	Replicate 轮询的默认重试次数。默认值为 5
DEFAULT_SLACK_ALERTING_THRESHOLD	Slack 警报的默认阈值。默认值为 300
DEFAULT_SOFT_BUDGET	LiteLLM 代理密钥的默认软预算。默认值为 50.0
DEFAULT_TRIM_RATIO	从提示末尾修剪 token 的默认比例。默认值为 0.75
DIRECT_URL	服务端点的直接 URL
DISABLE_ADMIN_UI	切换禁用管理界面
DISABLE_SCHEMA_UPDATE	切换禁用模式更新
DOCS_DESCRIPTION	文档页面的描述文本
DOCS_FILTERED	指示过滤文档的标志
DOCS_TITLE	文档页面的标题
DOCS_URL	Swagger API 文档的路径。默认值为 "/"
EMAIL_LOGO_URL	电子邮件中使用的徽标 URL
EMAIL_SUPPORT_CONTACT	支持联系电子邮件地址
EXPERIMENTAL_MULTI_INSTANCE_RATE_LIMITING	启用新的多实例速率限制的标志。默认值为 False
FIREWORKS_AI_4_B	Fireworks AI 4B 模型的大小参数。默认值为 4
FIREWORKS_AI_16_B	Fireworks AI 16B 模型的大小参数。默认值为 16
FIREWORKS_AI_56_B_MOE	Fireworks AI 56B MOE 模型的大小参数。默认值为 56
FIREWORKS_AI_80_B	Fireworks AI 80B 模型的大小参数。默认值为 80
FIREWORKS_AI_176_B_MOE	Fireworks AI 176B MOE 模型的大小参数。默认值为 176
FUNCTION_DEFINITION_TOKEN_COUNT	函数定义的 token 数。默认值为 9
GALILEO_BASE_URL	Galileo 平台的基本 URL
GALILEO_PASSWORD	Galileo 身份验证的密码
GALILEO_PROJECT_ID	Galileo 用途的项目 ID
GALILEO_USERNAME	Galileo 身份验证的用户名
GCS_BUCKET_NAME	Google Cloud Storage 存储桶的名称
GCS_PATH_SERVICE_ACCOUNT	Google Cloud 服务账户 JSON 文件的路径
GCS_FLUSH_INTERVAL	GCS 日志记录的刷新间隔（秒）。指定您希望多久将日志发送到 GCS。默认值为 20 秒
GCS_BATCH_SIZE	GCS 日志记录的批量大小。指定在记录多少日志后将日志刷新到 GCS。如果 `BATCH_SIZE` 设置为 10，则每 10 条日志刷新一次。默认值为 2048
GCS_PUBSUB_TOPIC_ID	用于向其发送 LiteLLM 费用日志的 PubSub Topic ID。
GCS_PUBSUB_PROJECT_ID	用于向其发送 LiteLLM 费用日志的 PubSub Project ID。
GENERIC_AUTHORIZATION_ENDPOINT	通用 OAuth 提供商的授权端点
GENERIC_CLIENT_ID	通用 OAuth 提供商的客户端 ID
GENERIC_CLIENT_SECRET	通用 OAuth 提供商的客户端密钥
GENERIC_CLIENT_STATE	通用客户端身份验证的状态参数
GENERIC_INCLUDE_CLIENT_ID	在 OAuth 请求中包含客户端 ID
GENERIC_SCOPE	通用 OAuth 提供商的范围设置
GENERIC_TOKEN_ENDPOINT	通用 OAuth 提供商的令牌端点
GENERIC_USER_DISPLAY_NAME_ATTRIBUTE	通用身份验证中用户显示名称的属性
GENERIC_USER_EMAIL_ATTRIBUTE	通用身份验证中用户电子邮件的属性
GENERIC_USER_FIRST_NAME_ATTRIBUTE	通用身份验证中用户名字的属性
GENERIC_USER_ID_ATTRIBUTE	通用身份验证中用户 ID 的属性
GENERIC_USER_LAST_NAME_ATTRIBUTE	通用身份验证中用户姓氏的属性
GENERIC_USER_PROVIDER_ATTRIBUTE	指定用户提供商的属性
GENERIC_USER_ROLE_ATTRIBUTE	指定用户角色的属性
GENERIC_USERINFO_ENDPOINT	在通用 OAuth 中获取用户信息的主机点
GALILEO_BASE_URL	Galileo 平台的基本 URL
GALILEO_PASSWORD	Galileo 身份验证的密码
GALILEO_PROJECT_ID	Galileo 用途的项目 ID
GALILEO_USERNAME	Galileo 身份验证的用户名
GREENSCALE_API_KEY	Greenscale 服务的 API 密钥
GREENSCALE_ENDPOINT	Greenscale 服务的端点 URL
GOOGLE_APPLICATION_CREDENTIALS	Google Cloud 凭据 JSON 文件的路径
GOOGLE_CLIENT_ID	Google OAuth 的客户端 ID
GOOGLE_CLIENT_SECRET	Google OAuth 的客户端密钥
GOOGLE_KMS_RESOURCE_NAME	Google KMS 中的资源名称
HEALTH_CHECK_TIMEOUT_SECONDS	健康检查超时（秒）。默认值为 60
HF_API_BASE	Hugging Face API 的基本 URL
HUGGINGFACE_API_KEY	Hugging Face API 的 API 密钥
HCP_VAULT_ADDR	Hashicorp Vault 密钥管理器的地址
HCP_VAULT_CLIENT_CERT	Hashicorp Vault 密钥管理器的客户端证书路径
HCP_VAULT_CLIENT_KEY	Hashicorp Vault 密钥管理器的客户端密钥路径
HCP_VAULT_NAMESPACE	Hashicorp Vault 密钥管理器的命名空间
HCP_VAULT_TOKEN	Hashicorp Vault 密钥管理器的令牌
HCP_VAULT_CERT_ROLE	Hashicorp Vault 密钥管理器身份验证的角色
HELICONE_API_KEY	Helicone 服务的 API 密钥
HOSTNAME	服务器的主机名，此项将作为 `HOSTNAME` 发送到`datadog` 日志
HOURS_IN_A_DAY	Hugging Face API 的基本 URL
用于计算目的的每天小时数。默认值为 24	HUGGINGFACE_API_BASE
HUGGINGFACE_API_KEY	Hugging Face API 的 API 密钥
HUMANLOOP_PROMPT_CACHE_TTL_SECONDS	Humanloop 中缓存提示的存活时间（秒）。默认值为 60
IAM_TOKEN_DB_AUTH	数据库身份验证的 IAM 令牌
INITIAL_RETRY_DELAY	重试请求的初始延迟（秒）。默认值为 0.5
JITTER	重试延迟计算的抖动因子。默认值为 0.75
JSON_LOGS	启用 JSON 格式日志记录
JWT_AUDIENCE	JWT 令牌的预期受众
JWT_PUBLIC_KEY_URL	获取用于 JWT 验证的公钥的 URL
LAGO_API_BASE	Lago API 的基本 URL
LAGO_API_CHARGE_BY	确定 Lago 收费基础的参数
LAGO_API_EVENT_CODE	Lago API 事件的事件代码
LAGO_API_KEY	访问 Lago 服务的 API 密钥
LANGFUSE_DEBUG	切换 Langfuse 的调试模式
LANGFUSE_FLUSH_INTERVAL	刷新 Langfuse 日志的间隔
LANGFUSE_HOST	Langfuse 服务的主机 URL
LANGFUSE_PUBLIC_KEY	Langfuse 身份验证的公钥
LANGFUSE_RELEASE	Langfuse 集成的发布版本
LANGFUSE_SECRET_KEY	Langfuse 身份验证的秘密密钥
LANGSMITH_API_KEY	Langsmith 平台的 API 密钥
LANGSMITH_BASE_URL	Langsmith 服务的基本 URL
LANGSMITH_BATCH_SIZE	Langsmith 中操作的批量大小
LANGSMITH_DEFAULT_RUN_NAME	Langsmith 运行的默认名称
LANGSMITH_PROJECT	Langsmith 集成的项目名称
LANGSMITH_SAMPLING_RATE	Langsmith 日志记录的采样率
LANGTRACE_API_KEY	Langtrace 服务的 API 密钥
LENGTH_OF_LITELLM_GENERATED_KEY	LiteLLM 生成的密钥长度。默认值为 16
LITERAL_API_KEY	Literal 集成的 API 密钥
LITERAL_API_URL	Literal 服务的 API URL
LITERAL_BATCH_SIZE	Literal 操作的批量大小
LITELLM_DONT_SHOW_FEEDBACK_BOX	在 LiteLLM UI 中隐藏反馈框的标志
LITELLM_DROP_PARAMS	在 LiteLLM 请求中丢弃的参数
LITELLM_MODIFY_PARAMS	在 LiteLLM 请求中修改的参数
LITELLM_EMAIL	与 LiteLLM 账户关联的电子邮件
LITELLM_GLOBAL_MAX_PARALLEL_REQUEST_RETRIES	LiteLLM 中并行请求的最大重试次数
LITELLM_GLOBAL_MAX_PARALLEL_REQUEST_RETRY_TIMEOUT	LiteLLM 中并行请求重试的超时时间
LITELLM_MIGRATION_DIR	用于 prisma 迁移的自定义迁移目录，用于在只读文件系统中建立数据库基线。
LITELLM_HOSTED_UI	LiteLLM 托管 UI 的 URL
LITELLM_LICENSE	LiteLLM 用途的许可证密钥
LITELLM_LOCAL_MODEL_COST_MAP	LiteLLM 中模型成本映射的本地配置
LITELLM_LOG	启用 LiteLLM 的详细日志记录
LITELLM_MODE	LiteLLM 的操作模式（例如生产、开发）
LITELLM_SALT_KEY	LiteLLM 中加密的盐密钥
LITELLM_SECRET_AWS_KMS_LITELLM_LICENSE	LiteLLM 的 AWS KMS 加密许可证
LITELLM_TOKEN	LiteLLM 集成的访问令牌
LITELLM_PRINT_STANDARD_LOGGING_PAYLOAD	如果为 true，则将标准日志记录有效负载打印到控制台 - 用于调试
LOGFIRE_TOKEN	Logfire 日志记录服务的令牌
MAX_EXCEPTION_MESSAGE_LENGTH	异常消息的最大长度。默认值为 2000
MAX_IN_MEMORY_QUEUE_FLUSH_COUNT	内存队列刷新操作的最大计数。默认值为 1000
MAX_LONG_SIDE_FOR_IMAGE_HIGH_RES	高分辨率图像长边的最大长度。默认值为 2000
MAX_REDIS_BUFFER_DEQUEUE_COUNT	Redis 缓冲区出队操作的最大计数。默认值为 100
MAX_SHORT_SIDE_FOR_IMAGE_HIGH_RES	高分辨率图像短边的最大长度。默认值为 768
MAX_SIZE_IN_MEMORY_QUEUE	内存队列的最大大小。默认值为 10000
MAX_SIZE_PER_ITEM_IN_MEMORY_CACHE_IN_KB	内存缓存中每个项的最大大小（KB）。默认值为 512 或 1024
MAX_SPENDLOG_ROWS_TO_QUERY	要查询的最大费用日志行数。默认值为 1,000,000
MAX_TEAM_LIST_LIMIT	要列出的最大团队数。默认值为 20
MAX_TILE_HEIGHT	图像切片的最大高度。默认值为 512
MAX_TILE_WIDTH	图像切片的最大宽度。默认值为 512
MAX_TOKEN_TRIMMING_ATTEMPTS	修剪 token 消息的最大尝试次数。默认值为 10
MAX_RETRY_DELAY	重试请求的最大延迟（秒）。默认值为 8.0
MIN_NON_ZERO_TEMPERATURE	最小非零温度值。默认值为 0.0001
MINIMUM_PROMPT_CACHE_TOKEN_COUNT	缓存提示的最小 token 数。默认值为 1024
MISTRAL_API_BASE	Mistral API 的基本 URL
MISTRAL_API_KEY	Mistral API 的 API 密钥
MICROSOFT_CLIENT_ID	Microsoft 服务的客户端 ID
MICROSOFT_CLIENT_SECRET	Microsoft 服务的客户端密钥
MICROSOFT_TENANT	Microsoft Azure 的租户 ID
MICROSOFT_SERVICE_PRINCIPAL_ID	Microsoft Enterprise Application 的 Service Principal ID。（这是一项高级功能，如果您希望 litellm 根据其 Microsoft Entra ID 组自动将成员分配到 Litellm 团队）
NO_DOCS	禁用文档生成的标志
NO_PROXY	绕过代理的地址列表
NON_LLM_CONNECTION_TIMEOUT	非 LLM 服务连接的超时时间（秒）。默认值为 15
OAUTH_TOKEN_INFO_ENDPOINT	用于检索 OAuth 令牌信息的主机点
OPENAI_BASE_URL	用于检索 OAuth 令牌信息的主机点
OpenAI API 的基本 URL	OPENAI_API_BASE
OpenAI 服务的 API 密钥	OPENAI_FILE_SEARCH_COST_PER_1K_CALLS
OpenAI 文件搜索每 1000 次调用的成本。默认值为 0.0025	OPENAI_ORGANIZATION
OpenAI 的组织标识符	OPENID_BASE_URL
OpenID Connect 服务的基本 URL	OPENID_CLIENT_ID
OpenID Connect 身份验证的客户端 ID	OPENID_CLIENT_SECRET
OpenID Connect 身份验证的客户端密钥	OPENMETER_API_ENDPOINT
OpenMeter 集成的 API 端点	OPENMETER_API_KEY
OpenMeter 服务的 API 密钥	OPENMETER_EVENT_TYPE
发送到 OpenMeter 的事件类型	OTEL_ENDPOINT
OpenTelemetry 跟踪的端点	OTEL_ENDPOINT
OTEL_EXPORTER_OTLP_ENDPOINT	OpenTelemetry 的环境名称
OTEL_EXPORTER	OpenTelemetry 的导出器类型
OTEL_EXPORTER_OTLP_PROTOCOL	OpenTelemetry 的导出器类型
OpenTelemetry 请求的头部	OTEL_HEADERS
OTEL_EXPORTER_OTLP_HEADERS	OTEL_HEADERS
OTEL_SERVICE_NAME	OpenTelemetry 的服务名称标识符
OTEL_TRACER_NAME	OpenTelemetry 跟踪的跟踪器名称
PAGERDUTY_API_KEY	PagerDuty 警报的 API 密钥
PHOENIX_API_KEY	Arize Phoenix 的 API 密钥
PHOENIX_COLLECTOR_ENDPOINT	Arize Phoenix 的 API 端点
PHOENIX_COLLECTOR_HTTP_ENDPOINT	Arize Phoenix 的 API http 端点
POD_NAME	服务器的 Pod 名称，此项将作为 `POD_NAME` 发送到`datadog` 日志
PREDIBASE_API_BASE	Predibase API 的基本 URL
PRESIDIO_ANALYZER_API_BASE	Presidio Analyzer 服务的基本 URL
PRESIDIO_ANONYMIZER_API_BASE	Presidio Anonymizer 服务的基本 URL
PROMETHEUS_BUDGET_METRICS_REFRESH_INTERVAL_MINUTES	Prometheus 预算指标的刷新间隔（分钟）。默认值为 5
PROMETHEUS_FALLBACK_STATS_SEND_TIME_HOURS	向 Prometheus 发送统计信息的回退时间（小时）。默认值为 9
PROMETHEUS_URL	Prometheus 服务的 URL
PROMPTLAYER_API_KEY	PromptLayer 集成的 API 密钥
PROXY_ADMIN_ID	代理服务器的管理员标识符
PROXY_BASE_URL	代理服务的基本 URL
PROXY_BATCH_WRITE_AT	在批量将费用日志写入数据库之前的等待时间（秒）。默认值为 10
PROXY_BUDGET_RESCHEDULER_MAX_TIME	在检查数据库以重置预算之前的最长等待时间（秒）。默认值为 605
PROXY_BUDGET_RESCHEDULER_MIN_TIME	在检查数据库以重置预算之前的最短等待时间（秒）。默认值为 597
PROXY_LOGOUT_URL	从代理服务注销的 URL
LITELLM_MASTER_KEY	代理身份验证的主密钥
QDRANT_API_BASE	Qdrant API 的基本 URL
QDRANT_API_KEY	Qdrant 服务的 API 密钥
QDRANT_SCALAR_QUANTILE	Qdrant 操作的标量分位数。默认值为 0.99
QDRANT_URL	Qdrant 数据库的连接 URL
QDRANT_VECTOR_SIZE	Qdrant 操作的向量大小。默认值为 1536
REDIS_CONNECTION_POOL_TIMEOUT	Redis 连接池超时（秒）。默认值为 5
REDIS_HOST	Redis 服务器的主机名
REDIS_PASSWORD	Redis 服务的密码
REDIS_PORT	Redis 服务器的端口号
REDIS_SOCKET_TIMEOUT	Redis socket 操作超时（秒）。默认值为 0.1
REDOC_URL	Redoc Fast API 文档的路径。默认值为 "/redoc"
REPEATED_STREAMING_CHUNK_LIMIT	重复流式块的限制，用于检测循环。默认值为 100
REPLICATE_MODEL_NAME_WITH_ID_LENGTH	带 ID 的 Replicate 模型名称的长度。默认值为 64
REPLICATE_POLLING_DELAY_SECONDS	Replicate 轮询操作的延迟（秒）。默认值为 0.5
REQUEST_TIMEOUT	请求超时（秒）。默认值为 6000
ROUTER_MAX_FALLBACKS	路由器的最大回退次数。默认值为 5
SECRET_MANAGER_REFRESH_INTERVAL	密钥管理器的刷新间隔（秒）。默认值为 86400（24 小时）
SERVER_ROOT_PATH	服务器应用程序的根路径
SET_VERBOSE	启用详细日志记录的标志
SINGLE_DEPLOYMENT_TRAFFIC_FAILURE_THRESHOLD	对于单部署冷却逻辑，被视为“合理流量”的最小请求数。默认值为 1000
SLACK_DAILY_REPORT_FREQUENCY	每日 Slack 报告的频率（例如每日、每周）
SLACK_WEBHOOK_URL	Slack 集成的 Webhook URL
SMTP_HOST	SMTP 服务器的主机名
SMTP_PASSWORD	SMTP 身份验证的密码（如果 SMTP 不需要身份验证，则不要设置）
SMTP_PORT	SMTP 服务器的端口号
SMTP_SENDER_EMAIL	在 SMTP 事务中用作发送方的电子邮件地址
SMTP_SENDER_LOGO	通过 SMTP 发送的电子邮件中使用的徽标
SMTP_TLS	启用或禁用 SMTP 连接 TLS 的标志
SMTP_USERNAME	SMTP 身份验证的用户名（如果 SMTP 不需要身份验证，则不要设置）
SPEND_LOGS_URL	SPEND_LOGS_URL
检索费用日志的 URL	SSL_CERTIFICATE
SSL 证书文件的路径	SSL_SECURITY_LEVEL[测试版]
SSL/TLS 连接的安全级别。例如 `DEFAULT@SECLEVEL=1`	SSL_VERIFY
启用或禁用 SSL 证书验证的标志	SUPABASE_KEY
Supabase 服务的 API 密钥	SUPABASE_URL
Supabase 实例的基本 URL	如果为 true，则启用在数据库中存储模型 + 凭据信息。
STORE_MODEL_IN_DB	SYSTEM_MESSAGE_TOKEN_COUNT
系统消息的 token 数。默认值为 4	TEST_EMAIL_ADDRESS
用于测试目的的电子邮件地址	TOGETHER_AI_4_B
Together AI 4B 模型的大小参数。默认值为 4	TOGETHER_AI_8_B
Together AI 8B 模型的大小参数。默认值为 8	TOGETHER_AI_21_B
Together AI 21B 模型的大小参数。默认值为 21	TOGETHER_AI_41_B
Together AI 41B 模型的大小参数。默认值为 41	TOGETHER_AI_80_B
Together AI 80B 模型的大小参数。默认值为 80	TOGETHER_AI_110_B
Together AI 110B 模型的大小参数。默认值为 110	TOGETHER_AI_EMBEDDING_150_M
Together AI 150M 嵌入模型的大小参数。默认值为 150	TOGETHER_AI_EMBEDDING_350_M
Together AI 350M 嵌入模型的大小参数。默认值为 350	TOOL_CHOICE_OBJECT_TOKEN_COUNT
工具选择对象的 token 数。默认值为 4	UI_LOGO_PATH
UI 中使用的徽标图像路径	UI_PASSWORD
访问 UI 的密码	UI_USERNAME
访问 UI 的用户名	UPSTREAM_LANGFUSE_DEBUG
为上游 Langfuse 启用调试的标志	UPSTREAM_LANGFUSE_HOST
上游 Langfuse 服务的主机 URL	UPSTREAM_LANGFUSE_PUBLIC_KEY
上游 Langfuse 身份验证的公钥	UPSTREAM_LANGFUSE_RELEASE
上游 Langfuse 的发布版本标识符	UPSTREAM_LANGFUSE_SECRET_KEY
上游 Langfuse 身份验证的秘密密钥	USE_AWS_KMS
启用 AWS 密钥管理服务进行加密的标志	USE_PRISMA_MIGRATE
使用 prisma migrate 而不是 prisma db push 的标志。建议用于生产环境。	WEBHOOK_URL
接收外部服务 webhooks 的 URL	SPEND_LOG_RUN_LOOPS

所有设置

litellm_settings - 参考​

general_settings - 参考​

router_settings - 参考​

环境变量 - 参考​

litellm_settings - 参考

general_settings - 参考

router_settings - 参考

环境变量 - 参考