Chinesische LLM-APIs - Zugänglich und erschwinglich für globale Entwickler
Token Router vereinheitlicht den Zugang zu Zhipu, Baidu, Alibaba, Tencent, MiniMax, Moonshot, Deepseek und anderen wichtigen Modellen - mit kostenlosen Modellen und API-Diensten für Flaggschiff-Hochleistungsmodelle.
Kernfunktionen
Token Router — Globale KI-Modell Zugriffs- und Verwaltungsplattform
Chinesische Modelle · Ein-Klick-Aggregation
Einheitliche API – Wechseln Sie Modelle mit einer Codezeile. Kostenloser Tarif: Täglich freie Credits für Chat, Codierung und Bildgenerierung. Bezahlupgrade: Hochleistungs-Modelle, längeren Kontext, Enterprise-SLA.
Chinesische Modelle · Globaler Zugriff
Nutzen Sie Chinas Vorteile bei Rechenleistung und Stromkosten mit Multi-Region-Bereitstellung, grenzüberschreitender Abrechnung und Optimierung für Übersee – ermöglichen Sie globalen Entwicklern den Zugriff auf kostengünstige chinesische Modelle.
Agent & Clients · Volle Kompatibilität
Kompatibel mit Claude, Codex, Trae und anderen Mainstream-Agents. Unterstützt OpenClaw, Cursor, Deep Code und andere Client-Tools. Einfache Konfiguration erforderlich.
Open Source · Selbst gehostet
Sekundärbereitstellung basierend auf Llama 3, Qwen, DeepSeek und anderen Open-Source-Modellen. Unterstützt Hybrid-Cloud und benutzerdefinierte Feinabstimmung.
Modellplatz
Alle Modelle — 统一 API 接入,按量计费
Kimi K2.6
Kimi K2.6 是 Kimi 最新最智能的模型,Kimi K2.6 的通用 Agent、代码、视觉理解等综合能力得到全面提升,其中在博士级难度的完整版人类最后的考试(Humanity’s Last Exam)、在考察模型真实软件工程能力的 SWE-Bench Pro、评估 Agent 深度检索能力的 DeepSearchQA 等基准测试中均取得行业领先的成绩,同时支持文本、图片与视频输入,思考与非思考模式,对话与 Agent 任务。
Kimi K2.5
Kimi K2.5 支持文本、图片与视频输入,思考与非思考模式,对话与 Agent 任务
DeepSeek-V4-Flash
DeepSeek-V4-Flash 是 DeepSeek 于 2026年4月推出的高效能大语言模型(304B参数,激活13B)。它主打极低延迟与超高性价比,原生支持100万token超长上下文(可处理整本书),在长文本任务中的算力需求仅为旗舰版的10%。
DeepSeek-V4-Pro
DeepSeek-V4-Pro 是 DeepSeek 于 2026年4月发布的第四代旗舰大语言模型(总参数未公开,激活参数约70-100B)。它采用混合专家(MoE)架构与创新的混合注意力机制(CSA+HCA),原生支持 1M token 超长上下文。
GLM-4.7-Flash
最新基座模型的普惠版本。GLM-4.7-Flash 作为 30B 级 SOTA 模型,提供了一个兼顾性能与效率的新选择。面向 Agentic Coding 场景强化了编码能力、长程任务规划与工具协同,并在多个公开基准的当期榜单中取得同尺寸开源模型中的出色表现。在执行复杂智能体任务,在工具调用时指令遵循更强,Artifacts 与 Agentic Coding 的前端美感和长程任务完成效率进一步提升。
GLM-4.6V-Flash
GLM-4.6V-Flash 是 GLM-4.6V 的免费版本,是 GLM 系列在多模态方向上的一次重要迭代,支持开启或关闭思考模式。它将训练时上下文窗口提升到128k tokens,在 视觉理解精度上达到同参数规模 SOTA,并首次在模型架构中将 Function Call(工具调用)能力原生融入视觉模型,打通从「视觉感知」到「可执行行动(Action)」的链路,为真实业务场景中的多模态 Agent 提供统一的技术底座。适用于图片OCR信息提取、图片内容理解与其相关属性提取,多模态时序融合、动态内容分析
Zeitlich begrenztes Angebot
Registrierung: 5M kostenlose Tokens. Einladungsbonus: 2M für Einladender, 500K für Eingeladener. Zeitlich begrenzt: 20% Aufladungsrabatt.
Kostenlos startenEnterprise: Pay-as-you-go / Monatlich
Höhere Parallelität, stärkere Modelle, dedizierter technischer Support.