> For the complete documentation index, see [llms.txt](https://docs.console.zenlayer.com/welcome/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://docs.console.zenlayer.com/welcome/cn/ai-gateway/ai-gateway-overview.md).

# AI 网关概览

AI 网关为多家领先的 AI 模型提供方提供统一的高性能访问层。通过单一的 API Endpoint 和 API Key，你可以无缝调用来自不同厂商的大语言模型（LLMs）、图像生成、视频生成、文本转语音（TTS）以及向量（Embedding）模型，同时享受全球加速、模型冗余和集中式管理带来的优势。

AI 网关专为在应用中集成 AI 能力时，对可靠性、低延迟和运维简化有较高要求的开发者和平台团队而设计。

## 核心特性

* **一站式访问**：通过一个统一的 API，即可访问 OpenAI、Google、Anthropic、Perplexity 等多家模型提供方的模型。
* **全球加速**：依托全球骨干网络和边缘节点，有效降低请求延迟。
* **模型冗余**：聚合多个提供方以提升可用性，并支持故障切换策略。
* **统一管理**：集中管理 API Key、配额、过期时间、使用分析和日志。
* **按量付费**：基于 Token 的简洁计费模式，与底层模型提供方定价保持一致。

## 性能与加速能力

AI 网关通过优化的边缘节点和私有全球骨干网络对请求流量进行路由，从而显著降低访问延迟。

### 加速机制说明

* 请求会在距离最近的边缘节点接入。
* 流量通过优化后的骨干网络路径进行传输。
* 系统会自动选择效率最高的模型提供方 Endpoint。

### 延迟优化示例

| 提供方    | 公网访问   | 经 AI 网关 | 提升幅度   |
| ------ | ------ | ------- | ------ |
| OpenAI | 81 ms  | 65 ms   | 19.75% |
| Google | 112 ms | 71 ms   | 36.61% |

实际性能提升效果可能因地区和模型不同而有所差异。