모델 광장
阶跃星辰Step-3.5-Flash
Step 3.5 Flash 是由 StepFun 开发的一款稀疏混合专家(MoE)大语言模型,旨在以卓越的效率提供前沿推理与智能体能力。该模型总参数量为 1968.1 亿,但每个 token 仅激活约 110 亿参数,在具备顶级模型推理深度的同时,仍能保持 100-300 token/秒(编码任务峰值可达 350 token/秒)的吞吐量,实现实时响应。
GLM-4.6V-Flash
GLM-4.6V-Flash 是 GLM-4.6V 的免费版本,是 GLM 系列在多模态方向上的一次重要迭代,支持开启或关闭思考模式。它将训练时上下文窗口提升到128k tokens,在 视觉理解精度上达到同参数规模 SOTA,并首次在模型架构中将 Function Call(工具调用)能力原生融入视觉模型,打通从「视觉感知」到「可执行行动(Action)」的链路,为真实业务场景中的多模态 Agent 提供统一的技术底座。适用于图片OCR信息提取、图片内容理解与其相关属性提取,多模态时序融合、动态内容分析
GLM-4.7-Flash
最新基座模型的普惠版本。GLM-4.7-Flash 作为 30B 级 SOTA 模型,提供了一个兼顾性能与效率的新选择。面向 Agentic Coding 场景强化了编码能力、长程任务规划与工具协同,并在多个公开基准的当期榜单中取得同尺寸开源模型中的出色表现。在执行复杂智能体任务,在工具调用时指令遵循更强,Artifacts 与 Agentic Coding 的前端美感和长程任务完成效率进一步提升。
GLM-Z1-Flash
核心定位:一款轻量级、高速的免费推理模型,旨在降低使用门槛。 擅长领域:在数学逻辑推理、代码生成、长文档处理等复杂任务上表现出色。
Kimi K2.5
Kimi K2.5 支持文本、图片与视频输入,思考与非思考模式,对话与 Agent 任务
Kimi K2.6
Kimi K2.6 是 Kimi 最新最智能的模型,Kimi K2.6 的通用 Agent、代码、视觉理解等综合能力得到全面提升,其中在博士级难度的完整版人类最后的考试(Humanity’s Last Exam)、在考察模型真实软件工程能力的 SWE-Bench Pro、评估 Agent 深度检索能力的 DeepSearchQA 等基准测试中均取得行业领先的成绩,同时支持文本、图片与视频输入,思考与非思考模式,对话与 Agent 任务。
DeepSeek-V4-Flash
DeepSeek-V4-Flash 是 DeepSeek 于 2026年4月推出的高效能大语言模型(304B参数,激活13B)。它主打极低延迟与超高性价比,原生支持100万token超长上下文(可处理整本书),在长文本任务中的算力需求仅为旗舰版的10%。
DeepSeek-V4-Pro
DeepSeek-V4-Pro 是 DeepSeek 于 2026年4月发布的第四代旗舰大语言模型(总参数未公开,激活参数约70-100B)。它采用混合专家(MoE)架构与创新的混合注意力机制(CSA+HCA),原生支持 1M token 超长上下文。
Qwen3-Coder-480B-A35B-Instruct
Qwen3-Coder-480B-A35B-Instruct 是一款专为代码生成与智能体编码任务设计的最先进的大语言模型。该模型采用混合专家(MoE)架构,总参数量为 4800 亿,激活参数量为 350 亿,原生支持 262,144 个 token 的上下文长度,并可通过 YaRN 方法扩展至 100 万个 token。
모델 상세
-
-
-