超高缓存命中率更稳、更省的 AI API 接入

适合高频调用、多工具接入与日常稳定使用，直接看接入方式，按工具完成配置。

查看接入方式

访问 API 站点

Cache Hit Rate

超高缓存命中率

高频请求场景下更容易命中缓存，减少重复消耗，响应更稳。

平台介绍

先看平台能做什么，以及地址、密钥、模型怎么填。

「闭坑」模型成本计算

看视频理解模型成本计算。

其他用户用量展示

查看用户真实用量截图。

CodexManager

查看 CodexManager 的接入方式和基础流程。

CC Switch

查看 CC Switch 的配置方法和使用步骤。

CherryStudio

按步骤完成 Cherry Studio 接入和测试。

QClaw

配置 QClaw 使用 iKun 平台模型。

本站文生图测试

打开快速生图站点，导入令牌后直接对话生成图片。

Claude in VS Code

查看 Claude 在 VS Code 里的接入与使用说明。

为什么其他中转站出月卡？

1、实付成本与余额一致：看似月卡，实际其他平台用余额倍率跟订阅倍率不一致。
2、其他中转站：余额跟订阅走不同渠道。就像昨晚一样其他站：嘎嘎崩，我们嘎嘎跳。
3、你用不完就是浪费，捆绑你只用这个平台，感觉用不完就亏了（ps：我原来作为用户的时候，觉得月卡没用完，就熬夜趁着零点前拼命蹬，到了零点之后，灵感大发，想睡觉也睡不着了，变相熬夜。对身体不好）。
4、上下文阶梯计费。一些无量商家，上下文达到不同的档位就开始翻倍计费。(ps：聪明的用户了解到，可以节省，codex的配置文件可以限制上下文大小，但就会导致反复上下文压缩，进而降低模型输出效果)

为什么我们不出月卡？

1、经过引流降价，走量，我们已经贴合出厂价了，开套餐纯亏本。暂时不考虑给大家用反代逆向服务（其他家很多就用这个）。
2、一旦出现上游赛道服务不可用，月卡用户将阻塞，到时候补偿扯皮大家都不愉快。
3、我们站全部模型不存在上下文阶梯计费。大家直接设置最大即可。

一般情况

别人能用，咱们快。
别人不能用，咱们慢。
咱们不能用，别人基本上不能用。
那怕是凌晨也会有专人维护宕机。“全天候宕机恢复” 吹牛逼谁都会，看看咱们实际如何就知道了。

codex配置

model_provider = "OpenAI"
model = "gpt-5.5"
model_reasoning_effort = "high"
disable_response_storage = true

model_context_window = 1000000
model_auto_compact_token_limit = 900000

[model_providers.OpenAI]
name = "OpenAI"
base_url = "https://api.monkey-tools.cn/v1"
wire_api = "responses"
requires_openai_auth = true