Skip to content

超高缓存命中率更稳、更省的 AI API 接入

适合高频调用、多工具接入与日常稳定使用,直接看接入方式,按工具完成配置。

Cache Hit Rate
缓存命中率展示图

为什么其他中转站出月卡?

1、实付成本与余额一致:看似月卡,实际其他平台用余额倍率 跟 订阅倍率 不一致。
2、其他中转站:余额跟订阅走不同渠道。就像昨晚一样其他站:嘎嘎崩,我们嘎嘎跳。
3、你用不完就是浪费,捆绑你只用这个平台,感觉用不完就亏了(ps:我原来作为用户的时候,觉得月卡没用完,就熬夜趁着零点前拼命蹬,到了零点之后,灵感大发,想睡觉也睡不着了,变相熬夜。对身体不好)。
4、上下文阶梯计费。一些无量商家,上下文达到不同的档位就开始翻倍计费。(ps:聪明的用户了解到,可以节省,codex的配置文件可以限制上下文大小,但就会导致反复上下文压缩,进而降低模型输出效果)

为什么我们不出月卡?

1、经过引流降价,走量,我们已经贴合出厂价了,开套餐纯亏本。暂时不考虑给大家用反代逆向服务(其他家很多就用这个)。
2、一旦出现上游赛道服务不可用,月卡用户将阻塞,到时候补偿扯皮大家都不愉快。
3、我们站全部模型不存在上下文阶梯计费。大家直接设置最大即可。

一般情况

别人能用,咱们快。
别人不能用,咱们慢。
咱们不能用,别人基本上不能用。
那怕是凌晨也会有专人维护宕机。“全天候宕机恢复” 吹牛逼谁都会,看看咱们实际如何就知道了。

codex配置
model_provider = "OpenAI"
model = "gpt-5.5"
model_reasoning_effort = "high"
disable_response_storage = true

model_context_window = 1000000
model_auto_compact_token_limit = 900000

[model_providers.OpenAI]
name = "OpenAI"
base_url = "https://api.monkey-tools.cn/v1"
wire_api = "responses"
requires_openai_auth = true

面向 iKun API 的接入与工具使用文档