PingToken — 中国一站式大模型API的桥梁

模型广场

已选筛选: 免费 × 清除全部

全部模型 MiniMax 其他字节跳动智谱AI 月之暗面深度求索阿里云

全部标签免费付费

全部分类文本音频视频图像编程推理研究医生律师其他

其他免费文本

活跃

阶跃星辰Step-3.5-Flash

★ ★ ★ ★ ★

Step 3.5 Flash 是由 StepFun 开发的一款稀疏混合专家（MoE）大语言模型，旨在以卓越的效率提供前沿推理与智能体能力。该模型总参数量为 1968.1 亿，但每个 token 仅激活约 110 亿参数，在具备顶级模型推理深度的同时，仍能保持 100-300 token/秒（编码任务峰值可达 350 token/秒）的吞吐量，实现实时响应。

输入价格

¥0.0000

/百万Token

输出价格

¥0.0000

/百万Token

参数量

196.81B

上下文限制

250K Tokens

速率限制

40 次/分钟

阿里云免费文本

活跃

Qwen3-Coder-480B-A35B-Instruct

★ ★ ★ ★ ★

Qwen3-Coder-480B-A35B-Instruct 是一款专为代码生成与智能体编码任务设计的最先进的大语言模型。该模型采用混合专家（MoE）架构，总参数量为 4800 亿，激活参数量为 350 亿，原生支持 262,144 个 token 的上下文长度，并可通过 YaRN 方法扩展至 100 万个 token。

输入价格

¥0.0000

/百万Token

输出价格

¥0.0000

/百万Token

参数量

480B

上下文限制

256K Tokens

速率限制

智谱AI 免费文本

活跃

GLM-Z1-Flash

★ ★ ★ ★ ★

核心定位：一款轻量级、高速的免费推理模型，旨在降低使用门槛。擅长领域：在数学逻辑推理、代码生成、长文档处理等复杂任务上表现出色。

输入价格

¥0.0000

/百万Token

输出价格

¥0.0000

/百万Token

上下文限制

128K Tokens

速率限制

60 次/分钟

智谱AI 免费文本

活跃

GLM-4.6V-Flash

★ ★ ★ ★ ★

GLM-4.6V-Flash 是 GLM-4.6V 的免费版本，是 GLM 系列在多模态方向上的一次重要迭代，支持开启或关闭思考模式。它将训练时上下文窗口提升到128k tokens，在视觉理解精度上达到同参数规模 SOTA，并首次在模型架构中将 Function Call（工具调用）能力原生融入视觉模型，打通从「视觉感知」到「可执行行动（Action）」的链路，为真实业务场景中的多模态 Agent 提供统一的技术底座。适用于图片OCR信息提取、图片内容理解与其相关属性提取，多模态时序融合、动态内容分析

输入价格

¥0.0000

/百万Token

输出价格

¥0.0000

/百万Token

上下文限制

128K Tokens

速率限制

智谱AI 免费文本

活跃

GLM-4.7-Flash

★ ★ ★ ★ ★

最新基座模型的普惠版本。GLM-4.7-Flash 作为 30B 级 SOTA 模型，提供了一个兼顾性能与效率的新选择。面向 Agentic Coding 场景强化了编码能力、长程任务规划与工具协同，并在多个公开基准的当期榜单中取得同尺寸开源模型中的出色表现。在执行复杂智能体任务，在工具调用时指令遵循更强，Artifacts 与 Agentic Coding 的前端美感和长程任务完成效率进一步提升。

输入价格

¥0.0000

/百万Token

输出价格

¥0.0000

/百万Token

参数量

30B

上下文限制

200K Tokens

速率限制

60 次/分钟

模型详情

-

模型标识

-

模型规格

价格信息

输入价格 - /1K Tokens

输出价格 - /1K Tokens

能力支持

客户端配置