> ## Documentation Index
> Fetch the complete documentation index at: https://docs.phanedge.cloud/llms.txt
> Use this file to discover all available pages before exploring further.

# 阿里百炼模型与计费

> 阿里百炼北京站在 phanedge 中的模型分类、推荐状态和默认计费口径

本文面向平台开发者，列出当前阿里百炼北京站渠道在 phanedge 中默认纳入的模型，以及对应的计量方式。最终可用性仍以你的 phanedge Token、平台渠道配置、阿里百炼账号权益和 `GET /v1/models` 返回为准。

<Warning>
  价格表为平台默认配置口径，用于帮助开发者理解成本维度；实际销售单价、折扣和客户结算以 phanedge 控制台价格配置为准。
</Warning>

## 快速选型

| 场景              | 首选模型                             | 备选模型                                                                                                    |
| --------------- | -------------------------------- | ------------------------------------------------------------------------------------------------------- |
| 通用文本、复杂推理、Agent | `qwen3.7-max`                    | `qwen3.7-plus`                                                                                          |
| 通用低延迟文本         | `qwen3.6-flash`                  | `qwen-flash`                                                                                            |
| DeepSeek 文本     | `deepseek-v4-pro`                | `deepseek-v4-flash`, `vanchin/deepseek-v4-pro`                                                          |
| GLM 文本          | `glm-5.1`                        | `ZHIPU/GLM-5.1`, `ZHIPU/GLM-5`                                                                          |
| Kimi 文本         | `kimi-k2.6`                      | `kimi-k2.5`, `kimi/kimi-k2.6`, `kimi/kimi-k2.5`                                                         |
| MiniMax 文本      | `MiniMax-M2.5`                   | `MiniMax/MiniMax-M3`, `MiniMax/MiniMax-M2.7`                                                            |
| 文本向量            | `text-embedding-v4`              | -                                                                                                       |
| 图像理解            | `qwen3-vl-plus`                  | `qwen-vl-plus`                                                                                          |
| 文生图             | `qwen-image-2.0-pro`             | `wan2.7-image-pro`, `qwen-image-2.0`, `qwen-image-max`, `qwen-image-plus`, `qwen-image`, `wan2.7-image` |
| 改图              | `qwen-image-edit-plus`           | `qwen-image-edit-max`, `qwen-image-edit`, `qwen-image-2.0`, `qwen-image-2.0-pro`                        |
| 文生视频            | `wan2.7-t2v`                     | `happyhorse-1.1-t2v`, `happyhorse-1.0-t2v`                                                              |
| 图生视频            | `wan2.7-i2v`                     | `happyhorse-1.1-i2v`, `happyhorse-1.0-i2v`                                                              |
| 参考视频/视频编辑       | `wan2.7-r2v`, `wan2.7-videoedit` | `happyhorse-1.1-r2v`, `happyhorse-1.0-r2v`, `happyhorse-1.0-video-edit`                                 |

## 文本、视觉与 Embedding

| 分类          | 模型                    | 推荐级别 | 默认输入价             | 默认输出价            | 缓存命中价           |
| ----------- | --------------------- | ---- | ----------------- | ---------------- | --------------- |
| Qwen 文本     | `qwen3.7-max`         | P0   | ￥12 / 1M tokens   | ￥36 / 1M tokens  | 输入价 20%         |
| Qwen 文本     | `qwen3.7-plus`        | P0   | ￥2 / 1M tokens    | ￥8 / 1M tokens   | 输入价 20%         |
| Qwen 文本     | `qwen3.6-max-preview` | P0   | ￥9 / 1M tokens    | ￥54 / 1M tokens  | 输入价 20%         |
| Qwen 文本     | `qwen3.6-flash`       | P0   | ￥1.2 / 1M tokens  | ￥7.2 / 1M tokens | 输入价 20%         |
| Qwen 文本     | `qwen-flash`          | P0   | ￥0.15 / 1M tokens | ￥1.5 / 1M tokens | 输入价 20%         |
| DeepSeek 文本 | `deepseek-v4-pro`     | P0   | ￥12 / 1M tokens   | ￥24 / 1M tokens  | 输入价 8.3333333%  |
| DeepSeek 文本 | `deepseek-v4-flash`   | P0   | ￥1 / 1M tokens    | ￥2 / 1M tokens   | 输入价 2%          |
| GLM 文本      | `glm-5.1`             | P0   | ￥6 / 1M tokens    | ￥24 / 1M tokens  | 输入价 21.6666667% |
| Kimi 文本     | `kimi-k2.6`           | P0   | ￥6.5 / 1M tokens  | ￥27 / 1M tokens  | 输入价 16.9230769% |
| Kimi 文本     | `kimi-k2.5`           | P0   | ￥4 / 1M tokens    | ￥21 / 1M tokens  | 输入价 17.5%       |
| MiniMax 文本  | `MiniMax-M2.5`        | P0   | ￥2.1 / 1M tokens  | ￥8.4 / 1M tokens | 输入价 10%；写入 125% |
| Embedding   | `text-embedding-v4`   | P0   | ￥0.5 / 1M tokens  | ￥0.5 / 1M tokens | -               |
| 视觉理解        | `qwen3-vl-plus`       | P0   | ￥1 / 1M tokens    | ￥10 / 1M tokens  | 输入价 20%         |
| 视觉理解        | `qwen-vl-plus`        | P1   | ￥0.8 / 1M tokens  | ￥2 / 1M tokens   | 输入价 20%         |

<Note>
  `qwen3.7-plus` 可用于文本与部分多模态理解；图像理解请求会走百炼 DashScope 原生多模态路径。
</Note>

<Note>
  `qwen3-vl-plus` 默认价格展示 0-32K 输入档；32K-128K 档为 ￥1.5 / ￥15 每百万 tokens，128K-256K 档为 ￥3 / ￥30 每百万 tokens，平台会按请求输入 token 动态升档。
</Note>

### 缓存计费口径

| 缓存类型   | 上游字段                                                  | 默认计费倍率                             | 适用说明                                                                               |
| ------ | ----------------------------------------------------- | ---------------------------------- | ---------------------------------------------------------------------------------- |
| 隐式缓存命中 | `cached_tokens`                                       | 按模型配置，百炼部署模型常见为输入价 20%，部分三方模型有专属比例 | 不需要开发者显式传 `cache_control`                                                          |
| 显式缓存创建 | `cache_creation_input_tokens`                         | 输入价 125%                           | 支持显式缓存的模型在请求中传 `cache_control` 时产生                                                 |
| 显式缓存命中 | `cached_tokens` 或 Anthropic `cache_read_input_tokens` | 输入价 10%                            | 平台会在检测到显式缓存请求时把 billing usage 归一化为 `cached_read_tokens`，避免与隐式 `cached_tokens` 重复折扣 |

<Warning>
  缓存字段来自上游 usage。最终消费仍以平台日志、渠道价格配置和账单为准；如果需要做财务对账，请同时保留请求 ID、模型名和原始 usage。
</Warning>

## 开源与厂商命名空间模型

| 分类           | 模型                        | 推荐级别 | 默认输入价            | 默认输出价             | 缓存命中价           |
| ------------ | ------------------------- | ---- | ---------------- | ----------------- | --------------- |
| Qwen 开源新版    | `qwen3.6-35b-a3b`         | P1   | ￥1.8 / 1M tokens | ￥10.8 / 1M tokens | -               |
| Qwen 开源新版    | `qwen3.6-27b`             | P1   | ￥3 / 1M tokens   | ￥18 / 1M tokens   | -               |
| Qwen 开源新版    | `qwen3.5-397b-a17b`       | P1   | ￥1.2 / 1M tokens | ￥7.2 / 1M tokens  | -               |
| Qwen 开源新版    | `qwen3.5-122b-a10b`       | P1   | ￥0.8 / 1M tokens | ￥6.4 / 1M tokens  | -               |
| Qwen 开源新版    | `qwen3.5-35b-a3b`         | P1   | ￥0.4 / 1M tokens | ￥3.2 / 1M tokens  | -               |
| Qwen 开源新版    | `qwen3.5-27b`             | P1   | ￥0.6 / 1M tokens | ￥4.8 / 1M tokens  | -               |
| Kimi 命名空间    | `kimi/kimi-k2.6`          | P1   | ￥6.5 / 1M tokens | ￥27 / 1M tokens   | 输入价 16.9230769% |
| Kimi 命名空间    | `kimi/kimi-k2.5`          | P1   | ￥4 / 1M tokens   | ￥21 / 1M tokens   | 输入价 17.5%       |
| GLM 命名空间     | `ZHIPU/GLM-5.1`           | P1   | ￥8 / 1M tokens   | ￥28 / 1M tokens   | 输入价 25%         |
| GLM 命名空间     | `ZHIPU/GLM-5`             | P1   | ￥6 / 1M tokens   | ￥22 / 1M tokens   | 输入价 25%         |
| MiniMax 命名空间 | `MiniMax/MiniMax-M3`      | P1   | ￥4.2 / 1M tokens | ￥16.8 / 1M tokens | -               |
| MiniMax 命名空间 | `MiniMax/MiniMax-M2.7`    | P1   | ￥2.1 / 1M tokens | ￥8.4 / 1M tokens  | 输入价 20%；写入 125% |
| MiniMax 命名空间 | `MiniMax/MiniMax-M2.5`    | P1   | ￥2.1 / 1M tokens | ￥8.4 / 1M tokens  | 输入价 10%；写入 125% |
| 小米开源         | `xiaomi/mimo-v2.5-pro`    | P1   | ￥7 / 1M tokens   | ￥21 / 1M tokens   | 输入价 20%         |
| VanChin 命名空间 | `vanchin/deepseek-v4-pro` | P1   | ￥12 / 1M tokens  | ￥24 / 1M tokens   | 输入价 8.3333333%  |

## 图像模型

| 能力  | 模型                     | 推荐级别 | 默认计量   | 默认价格      |
| --- | ---------------------- | ---- | ------ | --------- |
| 文生图 | `wan2.7-image-pro`     | P0   | 成功图片张数 | ￥0.50 / 张 |
| 文生图 | `wan2.7-image`         | P0   | 成功图片张数 | ￥0.20 / 张 |
| 文生图 | `qwen-image-2.0-pro`   | P0   | 成功图片张数 | ￥0.50 / 张 |
| 文生图 | `qwen-image-2.0`       | P0   | 成功图片张数 | ￥0.20 / 张 |
| 文生图 | `qwen-image-max`       | P0   | 成功图片张数 | ￥0.50 / 张 |
| 文生图 | `qwen-image-plus`      | P0   | 成功图片张数 | ￥0.20 / 张 |
| 文生图 | `qwen-image`           | P0   | 成功图片张数 | ￥0.25 / 张 |
| 改图  | `qwen-image-edit-max`  | P0   | 成功图片张数 | ￥0.50 / 张 |
| 改图  | `qwen-image-edit-plus` | P0   | 成功图片张数 | ￥0.20 / 张 |
| 改图  | `qwen-image-edit`      | P0   | 成功图片张数 | ￥0.30 / 张 |

图像生成走 `POST /v1/images/generations`，图像编辑走 `POST /v1/images/edits`。`qwen-image-2.0` 与 `qwen-image-2.0-pro` 同时支持生成和编辑；编辑请求最多携带 3 张输入图，平台会把 OpenAI multipart 图片转换为百炼原生图片内容。平台只对成功产物计量，失败请求不应产生图片张数扣费。

## 视频模型

| 能力   | 模型                          | 推荐级别 | 720p 默认价  | 1080p 默认价 |
| ---- | --------------------------- | ---- | --------- | --------- |
| 文生视频 | `happyhorse-1.1-t2v`        | P0   | ￥0.90 / 秒 | ￥1.20 / 秒 |
| 图生视频 | `happyhorse-1.1-i2v`        | P0   | ￥0.90 / 秒 | ￥1.20 / 秒 |
| 参考视频 | `happyhorse-1.1-r2v`        | P1   | ￥0.90 / 秒 | ￥1.20 / 秒 |
| 文生视频 | `happyhorse-1.0-t2v`        | P0   | ￥0.90 / 秒 | ￥1.60 / 秒 |
| 图生视频 | `happyhorse-1.0-i2v`        | P0   | ￥0.90 / 秒 | ￥1.60 / 秒 |
| 参考视频 | `happyhorse-1.0-r2v`        | P1   | ￥0.90 / 秒 | ￥1.60 / 秒 |
| 视频编辑 | `happyhorse-1.0-video-edit` | P1   | ￥0.90 / 秒 | ￥1.60 / 秒 |
| 文生视频 | `wan2.7-t2v`                | P0   | ￥0.60 / 秒 | ￥1.00 / 秒 |
| 图生视频 | `wan2.7-i2v`                | P0   | ￥0.60 / 秒 | ￥1.00 / 秒 |
| 参考视频 | `wan2.7-r2v`                | P1   | ￥0.60 / 秒 | ￥1.00 / 秒 |
| 视频编辑 | `wan2.7-videoedit`          | P1   | ￥0.60 / 秒 | ￥1.00 / 秒 |

视频任务采用异步终态计费口径：创建任务阶段返回任务 ID，任务成功后按成功输出秒数和分辨率档位计费。任务失败不应产生成功秒数扣费。

<Note>
  HappyHorse 1.1 官方参数默认 `resolution=1080P`。如果业务希望按 720p 成本生成，请在 `POST /v1/videos` 请求中显式传入 `"resolution": "720p"`；未传分辨率时，成本预估和对账应按 1080p 档位理解。
</Note>

<Note>
  支持固定随机种子的百炼视频模型应将 `seed` 作为 JSON 数字传入，例如 `"seed": 12345`。不要传字符串形式的 `"12345"`；平台会拒绝非数字或超出 `0-2147483647` 范围的 `seed`。
</Note>

<Note>
  HappyHorse 1.1 的输入口径与 1.0 有差异：`happyhorse-1.1-i2v` 使用单张首帧图，平台会映射为百炼原生 `input.media[].type=first_frame`；`happyhorse-1.1-r2v` 使用 1-9 张参考图，平台会映射为 `input.media[].type=reference_image`。`t2v` 只需要文本提示词。
</Note>

<Note>
  前端默认模型中可能出现百炼固定日期快照，例如 `wan2.7-t2v-2026-04-25` 和 `wan2.7-i2v-2026-04-25`。这些快照用于锁定上游版本，计费时会分别归一到 `wan2.7-t2v` 与 `wan2.7-i2v` 的 `#bailian-cn` SKU，并继续按 720p / 1080p 分辨率档位结算。
</Note>

## 内部计费 SKU

百炼北京站会把对外模型名映射到内部计费 SKU，避免与独立 DeepSeek、Kimi、GLM、MiniMax 渠道混价：

```text theme={null}
{model}#bailian-cn
{video-model}#bailian-cn#720p
{video-model}#bailian-cn#1080p
```

开发者请求仍然填写对外模型名，例如 `qwen3.7-plus` 或 `wan2.7-t2v`，不需要在请求体中填写 `#bailian-cn` 后缀。