智谱 GLM - CowAgent

智谱 AI 支持文本对话、图像理解、语音识别（ASR）和向量（Embedding），一份 zhipu_ai_api_key 即可启用全部能力。

通过 Web 控制台的「模型管理」页面可一站式配置以下全部能力，无需手动改配置文件。

文本对话

{
  "model": "glm-5.1",
  "zhipu_ai_api_key": "YOUR_API_KEY"
}

参数	说明
`model`	可填 `glm-5.1`、`glm-5-turbo`、`glm-5`、`glm-4.7`、`glm-4-plus`、`glm-4-flash`、`glm-4-air` 等，参考模型编码
`zhipu_ai_api_key`	在智谱 AI 控制台创建
`zhipu_ai_api_base`	可选，默认为 `https://open.bigmodel.cn/api/paas/v4`

智谱 chat 系列模型（glm-5.1、glm-5-turbo 等）不支持视觉，视觉调用统一路由到 glm-5v-turbo。配置 zhipu_ai_api_key 后 Agent 的 Vision 工具会自动使用该模型，无需在配置文件中显式指定。

{
  "voice_to_text": "zhipu",
  "voice_to_text_model": "glm-asr-2512"
}

参数	说明
`voice_to_text`	设为 `zhipu` 启用智谱 ASR
`voice_to_text_model`	可选，默认 `glm-asr-2512`

凭证自动复用 zhipu_ai_api_key。语音文件建议小于 25MB，超大文件可能被服务端拒绝。

{
  "embedding_provider": "zhipu",
  "embedding_model": "embedding-3"
}

可选模型：embedding-3、embedding-2。修改 embedding 后需执行 /memory rebuild-index 命令重建索引。