模型广场
阶跃星辰Step-3.5-Flash
Step 3.5 Flash 是由 StepFun 开发的一款稀疏混合专家(MoE)大语言模型,旨在以卓越的效率提供前沿推理与智能体能力。该模型总参数量为 1968.1 亿,但每个 token 仅激活约 110 亿参数,在具备顶级模型推理深度的同时,仍能保持 100-300 token/秒(编码任务峰值可达 350 token/秒)的吞吐量,实现实时响应。
GLM-4.6V-Flash
GLM-4.6V-Flash 是 GLM-4.6V 的免费版本,是 GLM 系列在多模态方向上的一次重要迭代,支持开启或关闭思考模式。它将训练时上下文窗口提升到128k tokens,在 视觉理解精度上达到同参数规模 SOTA,并首次在模型架构中将 Function Call(工具调用)能力原生融入视觉模型,打通从「视觉感知」到「可执行行动(Action)」的链路,为真实业务场景中的多模态 Agent 提供统一的技术底座。适用于图片OCR信息提取、图片内容理解与其相关属性提取,多模态时序融合、动态内容分析
GLM-4.7-Flash
最新基座模型的普惠版本。GLM-4.7-Flash 作为 30B 级 SOTA 模型,提供了一个兼顾性能与效率的新选择。面向 Agentic Coding 场景强化了编码能力、长程任务规划与工具协同,并在多个公开基准的当期榜单中取得同尺寸开源模型中的出色表现。在执行复杂智能体任务,在工具调用时指令遵循更强,Artifacts 与 Agentic Coding 的前端美感和长程任务完成效率进一步提升。
GLM-Z1-Flash
核心定位:一款轻量级、高速的免费推理模型,旨在降低使用门槛。 擅长领域:在数学逻辑推理、代码生成、长文档处理等复杂任务上表现出色。
Qwen3-Coder-480B-A35B-Instruct
Qwen3-Coder-480B-A35B-Instruct 是一款专为代码生成与智能体编码任务设计的最先进的大语言模型。该模型采用混合专家(MoE)架构,总参数量为 4800 亿,激活参数量为 350 亿,原生支持 262,144 个 token 的上下文长度,并可通过 YaRN 方法扩展至 100 万个 token。
模型详情
-
-
-