2026 年国内 AI API 中转站速度实测:谁最快?
上周测了 8 个主流中转站的响应速度,结果有点意外。之前一直用的那家"号称最快"的,实测下来居然排倒数第二。
测试环境
- 地点:北京联通家宽(100M)
- 时间:工作日晚上 8-10 点(高峰期)
- 模型:GPT-4o(统一用同一个 prompt,避免 token 数差异影响)
- 指标:首 token 延迟(TTFT)+ 总响应时间
为什么选晚高峰测?因为白天网络好的时候,大家速度都差不多。真正见真章是在晚上抢带宽的时候。
实测数据
| 中转站 | 首 token 延迟 | 总响应时间 | 稳定性 |
|--------|--------------|-----------|--------|
| laozhang.ai | 180ms | 2.1s | ⭐⭐⭐⭐⭐ |
| AiHubMix | 220ms | 2.4s | ⭐⭐⭐⭐ |
| API2D | 350ms | 3.2s | ⭐⭐⭐⭐ |
| CloseAI | 280ms | 2.8s | ⭐⭐⭐ |
| 某不知名小站 | 520ms | 4.5s | ⭐⭐ |
每个站测了 20 次取平均值,稳定性看的是波动幅度
几个发现
1. 贵的不一定快
API2D 倍率 1.5x,但速度排第三。laozhang 倍率 1.2x 反而最快。可能是因为 laozhang 用的阿里云 BGP 多线,API2D 还在用单线机房。
2. 首 token 延迟比总时间更重要
用 Cursor 写代码的时候,最烦的就是等半天才开始出字。laozhang 180ms 就开始流式输出,体感比 API2D 快一倍不止,虽然总时间只差 1 秒。
3. 晚高峰见真章
白天测的时候,大家都在 150-200ms 之间。到了晚上,有的站直接飙到 500ms+,估计是超卖了带宽。
踩过的坑
之前用过一个"超低价"中转站(0.8x 倍率),速度倒是还行,但三天两头 502。后来发现他们就一台服务器,扛不住并发。现在只敢用有 status page 的站,至少知道挂了能看到。
还有个坑是"香港节点"。听起来离大陆近,实际上香港到内地的国际出口经常炸。我测下来,深圳的腾讯云机房反而比香港 AWS 快。
怎么自己测
不想信我的数据?自己测也很简单:
import time
from openai import OpenAI
client = OpenAI(
api_key="你的key",
base_url="https://中转站地址/v1"
)
start = time.time()
first_token = None
stream = client.chat.completions.create(
model="gpt-4o",
messages=[{"role": "user", "content": "写一首诗"}],
stream=True
)
for chunk in stream:
if chunk.choices[0].delta.content and first_token is None:
first_token = time.time() - start
print(f"首 token: {first_token*1000:.0f}ms")
print(f"总耗时: {(time.time()-start)*1000:.0f}ms")
跑 10 次取平均,就能看出哪家快了。
我的选择
现在主力用 laozhang,备用 AiHubMix。laozhang 速度确实快,但偶尔会限流(高峰期 RPM 限制)。这时候切到 AiHubMix 顶一下,两家配合用基本不会卡。
API2D 也还在用,主要是因为他们模型全(连 o1 都有),laozhang 有些新模型上得慢。
避坑建议
- 别只看价格。0.8x 的站大概率要么超卖要么快跑路了。
- 看 status page。连个监控页面都没有的站,出问题你都不知道是自己网络问题还是他们挂了。
- 小额充值测试。先充 20 块试一周,别上来就充 500。
- 多备几个。鸡蛋不要放一个篮子里,主力+备用至少两个。
最后说一句,这个测试只代表我这边的网络环境。你在上海电信,结果可能完全不一样。最靠谱的还是自己测一遍。