智谱 AI 支持文本对话、图像理解、语音识别(ASR)和向量(Embedding),一份Documentation Index
Fetch the complete documentation index at: https://docs.cowagent.ai/llms.txt
Use this file to discover all available pages before exploring further.
zhipu_ai_api_key 即可启用全部能力。
文本对话
图像理解
智谱 chat 系列模型(glm-5.1、glm-5-turbo 等)不支持视觉,视觉调用统一路由到 glm-5v-turbo。配置 zhipu_ai_api_key 后 Agent 的 Vision 工具会自动使用该模型,无需在配置文件中显式指定。
语音识别
| 参数 | 说明 |
|---|---|
voice_to_text | 设为 zhipu 启用智谱 ASR |
voice_to_text_model | 可选,默认 glm-asr-2512 |
zhipu_ai_api_key。语音文件建议小于 25MB,超大文件可能被服务端拒绝。
向量
embedding-3、embedding-2。修改 embedding 后需执行 /memory rebuild-index 命令重建索引。