可用模型

浏览并比较 LLM Gateway 提供的大语言模型。

85 个模型

模型	输入	输出	输入价格	输出价格	缓存读取	缓存写入	上下文	最大输出
Claude Haiku 4.5 Claude Haiku 4.5 是速度最快、性价比最高的模型，在编码、计算机使用和代理任务方面的表现与 Sonnet 4 相当。	TextImage	Text	$1	$5	$0.1	$1.25	200K	64K
Claude Opus 4.5 Claude Opus 4.5是Anthropic公司推出的前沿推理模型，专为复杂软件工程、智能体工作流及长周期计算机任务优化设计。该模型具备强大的多模态能力，在现实场景的编程与推理基准测试中展现出卓越性能，并显著提升了对提示注入攻击的防御能力。其创新设计支持开发者根据任务需求灵活调整运行强度，在响应速度、思考深度和令牌使用量之间实现精准平衡。该模型支持高级工具调用、扩展上下文管理与协同多智能体架构，特别适用于自主研究、代码调试、多步骤规划及电子表格/浏览器操作等场景。相较于前代Opus系列，在结构化推理、执行可靠性和指令遵循方面实现重大突破，同时有效降低令牌开销，显著提升长时任务的运行效能。	TextImage	Text	$5	$25	$0.5	$6.25	200K	64K
Claude Opus 4.6 Anthropic 发布新一代 Claude Opus 4.6 模型，支持 1M 上下文窗口，最大输出 token 数提升至 128K，较前代 64K 限制翻倍。该模型引入自适应思考模式，可根据问题复杂度动态调整思考深度，并新增最高级别的 max effort 参数。	TextImage	Text	$5	$25	$0.5	$6.25	1M	128K
Claude Opus 4.7 Opus 4.7 在高级软件工程方面相较 Opus 4.6 有显著改进，在最难的任务上有显著提升。他们能够自信地将最难的编码工作——之前需要密切监督的工作——交给 Opus 4.7。Opus 4.7 以严谨和一致的方式处理复杂且长期运行的任务，精确关注指令，并设计方法在报告前验证自身输出。	TextImage	Text	$5	$25	$0.5	$6.25	1M	128K
Claude Sonnet 4.5 Claude Sonnet 4.5 是世界上最好的编码模型。它是构建复杂代理的最强大模型。它是使用计算机的最佳模型。它在推理和数学方面表现出显著的进步。	TextImage	Text	$3	$15	$0.3	$3.75	200K	64K
Claude Sonnet 4.6 Sonnet 4.6是Anthropic迄今为止最强大的Sonnet系列模型，在编程、智能代理和专业工作领域均达到前沿性能水平。它在以下方面表现卓越：迭代开发、复杂代码库导航、具备记忆功能的端到端项目管理、专业文档撰写，以及在网页问答和工作流自动化方面的可靠计算机操作能力。	TextImage	Text	$3	$15	$0.3	$3.75	1M	64K
Claude Sonnet 5 Claude Sonnet 5 被打造为迄今为止最具主导性的sonnet模型。它可以制定计划，使用浏览器和终端等工具，并自主运行，达到几个月前还需要更大更昂贵型号的水平。对许多开发者来说，代理型AI时代始于Sonnet类模型：Claude Sonnet 3.5、3.6和3.7是首批展现出令人惊叹编码和工具使用能力的模型。然而，最近，代理能力最明显的提升出现在我们的Opus级模型中。	TextImage	TextImage	$2	$10	$0.2	$2.5	1M	128K
Deepseek V4 Pro DeepSeek-V4-Pro 是DeepSeek推出的高性能开源大模型，具备顶尖推理与Agent能力，支持超长上下文，适配国产昇腾芯片，性价比极高	Text	Text	$0.42857143	$0.85714286	$0.00357143	-	1M	384K
Deepseek V4 Flash DeepSeek-V4-Flash 是DeepSeek V4系列的轻量化版本，主打高性价比与高吞吐效率，适合通用对话和基础文本任务，同时支持百万Token长上下文和高效推理	Text	Text	$0.143	$0.286	$0.029	-	1M	384K
Doubao Seedance 2.0 260128 Seedance 2.0 是豆包大模型团队推出的新一代专业级多模态创作视频模型。支持图像、视频、音频等多种模态作为参考输入生成视频，打破单一素材的创作局限，同时具备视频编辑、视频延长等能力，可高精度还原物品细节、材质、音色、视效风格、运镜等，角色特征亦可稳定保持，赋予创作者如同导演般的掌控权。	Text	Video	$7.286	$7.286	-	-	-	-
Doubao Seedance 2.0 fast 260128 Seedance 2.0 fast支持图片、视频、音频等多模态素材参考生成视频，同时具备视频编辑与延长能力，使生视频工具进入可精准生成、可复用迭代的工业化新阶段。模型对物理规律的理解持续深化、更贴合真实世界，意图理解能力显著提升，能严格遵循指令细节约束，从而保障专业级叙事的可信度。	Text	Video	$5.286	$5.286	-	-	-	-
GLM 4.7 GLM-4.7 是智谱最新旗舰模型，GLM-4.7 面向 Agentic Coding 场景强化了编码能力、长程任务规划与工具协同，并在多个公开基准的当期榜单中取得开源模型中的领先表现。通用能力提升，回复更简洁自然，写作更具沉浸感。	TextImage	Text	$0.286	$1.143	$0.057	-	200K	128K
GLM 5 GLM-5 是智谱新一代的旗舰基座模型，面向 Agentic Engineering 打造，能够在复杂系统工程与长程 Agent 任务中提供可靠生产力。在 Coding 与 Agent 能力上，GLM-5 取得开源 SOTA 表现，在真实编程场景的使用体感逼近 Claude Opus 4.5，擅长复杂系统工程与长程 Agent 任务，是通用 Agent 助手的理想基座。	Text	Text	$0.571	$2.571	$0.143	-	200K	128K
GLM 5.2 GLM-5.2 是面向长任务时代的旗舰模型。支持真正可用的 1M 上下文，实测可承载项目级工程上下文，长程任务执行更稳定、工程规范遵循更可靠，开发场景成功率进一步提升。一次任务即可完成“从需求到多端可部署产物”的完整开发链路。	Text	Text	$1.143	$4	$0.286	-	1M	128K
GLM-5.1 glm-5.1是智谱平台推出的最新旗舰模型。	Text	Text	$0.857	$3.429	$0.186	-	200K	128K
GPT 5.1 Codex Max GPT‑5.1‑Codex‑Max 基于基础推理模型的更新版本构建，该模型经过训练，能够处理软件工程、数学、研究、医学、计算机应用等领域的代理任务。这是我们首个支持跨多个上下文窗口的原生训练模型，通过压缩 (compaction) 的过程，能够在单个任务中连贯处理数百万个词元。与其前身一样，GPT‑5.1‑Codex‑Max 经过了实际软件工程任务的训练，例如拉取请求 (PR) 创建、代码审查、前端开发和问答。	TextImageAudioVideo	TextImageAudioVideo	$1.25	$10	$0.125	-	1M	256K
GPT 5.1 Codex Mini GPT-5.1-Codex mini是GPT-5.1-Codex的轻量级、高性价比变体，针对编码、软件开发和交互式编程任务进行了优化。	TextImage	Text	$0.25	$2	$0.025	-	400K	64K
GPT 5.4 Nano Gpt-5.4-Nano 是 OpenAI 模型，适合通用推理、代码、指令遵循、工具调用和生产级聊天场景，具体速度、推理深度和成本取决于所选版本。	TextImage	Text	$0.2	$1.25	-	-	400K	272K
GPT Image 1.5 GPT Image 1.5是我们最新的图像生成模型，拥有更好的指令跟踪和对提示的遵循。	Text	Image	$7	$10	-	-	64K	16K
GPT Image 2 GPT Image 2 是最先进的图像生成模型，支持快速、高质量的图像生成和编辑。它支持灵活的图像尺寸和高保真图像输入。	TextImage	Image	$8	$30	$1.25	-	32K	32K
GPT- 4.1 GPT-4.1 是 OpenAI 于 2025 年 4 月 15 日发布的高性能多模态模型，定位为 GPT-4o 的全面升级版。主打超强代码生成、长上下文理解、高速推理与多模态处理，核心优势是百万级上下文（1M tokens）与更低成本，专为软件开发、复杂指令执行、长文档分析场景设计。	TextImage	Text	$2	$8	$0.5	-	1M	32K
GPT-4.1 Mini GPT-4.1 Mini 是 OpenAI 推出的轻量级多模态大模型，兼顾高推理能力、百万级超长上下文与超低使用成本，延迟低、吞吐高，适合大规模高并发业务、长文档处理、日常对话及轻量化多模态应用场景。	TextImage	Text	$0.1	$0.4	$0.025	-	1M	32K
GPT-4.1 Nano GPT-4.1 Nano 是 OpenAI GPT-4.1系列中最小、成本最低的模型，适合高并发、低成本的大规模任务，例如文本分类、信息抽取、简单推理、轻量代码辅助、数据清洗、格式转换和自动化处理。它支持长上下文文本处理和图片理解，但整体推理、代码和复杂任务能力通常弱于 GPT-4.1 Mini 和完整 GPT-4.1。	TextImage	Text	$0.1	$0.4	$0.025	-	1M	32K
GPT-5 Gpt-5 是 OpenAI 模型，适合通用推理、代码、指令遵循、工具调用和生产级聊天场景，具体速度、推理深度和成本取决于所选版本。	TextImage	Text	$1.25	$10	$0.125	-	400K	128K
GPT-5 Chat Latest GPT-5 Chat Latest 是 OpenAI 推出的新一代旗舰对话多模态大模型，具备极强逻辑推理、超低幻觉、超长上下文理解与优秀多模态解析能力，兼顾响应速度与专业级生成质量，适用于日常对话、复杂问题求解、长文档分析、创意内容创作与多模态智能交互场景。	TextImage	Text	$1.25	$10	$0.125	-	400K	128K
GPT-5 Codex GPT-5-Codex 是 OpenAI 于 2025 年 9 月 15 日发布的、基于 GPT-5 专为智能体编程（Agentic Coding）与软件工程深度优化的专业大模型OpenAI。它以真实开发场景训练，兼具快速交互响应与超长时独立任务能力（可连续工作超 7 小时），精通代码生成、审查、调试、重构、多语言开发与系	Text	Text	$1.25	$10	$0.125	-	400K	128K
GPT-5 Mini GPT-5 Mini 是 OpenAI 模型，适合通用推理、代码、指令遵循、工具调用和生产级聊天场景，具体速度、推理深度和成本取决于所选版本。	TextImage	Text	$0.25	$2	$0.025	-	400K	128K
GPT-5 Nano Gpt-5-Nano 是 OpenAI 模型，适合通用推理、代码、指令遵循、工具调用和生产级聊天场景，具体速度、推理深度和成本取决于所选版本。	TextImage	Text	$0.05	$0.4	$0.005	-	400K	128
GPT-5 Pro Gpt-5-Pro 是 OpenAI 模型，适合通用推理、代码、指令遵循、工具调用和生产级聊天场景，具体速度、推理深度和成本取决于所选版本。	TextImage	Text	$15	$120	-	-	400K	128K
GPT-5.1 Gpt-5.1 是 OpenAI 模型，适合通用推理、代码、指令遵循、工具调用和生产级聊天场景，具体速度、推理深度和成本取决于所选版本。	TextImage	Text	$1.25	$10	$0.125	-	400K	128K
GPT-5.1 Chat Latest Gpt-5.1-Chat-Latest 是 OpenAI 模型，适合通用推理、代码、指令遵循、工具调用和生产级聊天场景，具体速度、推理深度和成本取决于所选版本。	TextImage	Text	$1.25	$10	$0.125	-	400K	128K
GPT-5.2 GPT-5.2适用于各行各业的编码和智能任务的最佳模型	TextImage	Text	$1.75	$14	$0.175	-	400K	128K
GPT-5.2 Chat Latest Gpt-5.2-Chat-Latest 是 OpenAI 模型，适合通用推理、代码、指令遵循、工具调用和生产级聊天场景，具体速度、推理深度和成本取决于所选版本。	TextImage	Text	$1.75	$14	$0.175	-	400K	128K
GPT-5.2 Codex Gpt-5.2-Codex 是 OpenAI 模型，适合通用推理、代码、指令遵循、工具调用和生产级聊天场景，具体速度、推理深度和成本取决于所选版本。	Text	Text	$1.75	$14	$0.175	-	400K	128K
GPT-5.2 Pro Gpt-5.2-Pro 是 OpenAI 模型，适合通用推理、代码、指令遵循、工具调用和生产级聊天场景，具体速度、推理深度和成本取决于所选版本。	TextImage	Text	$21	$168	-	-	400K	272K
GPT-5.3 Codex GPT-5.3-Codex通过性能提升、功能泛化和安全性升级，重新定义了AI在编程及泛生产力领域的角色。	TextImage	Text	$1.75	$14	$0.175	-	400K	128K
GPT-5.4 GPT-5.4是我们用于复杂专业工作的前沿模型。	TextImage	Text	$2.5	$15	$0.25	-	1M	128K
GPT-5.4 Pro GPT-5.4pro使用更多计算资源来更深入地思考并提供始终更好的答案。仅可通过响应API访问，以在响应API请求前支持多轮模型交互功能，以及未来其他高级API特性。	TextImage	Text	$30	$180	-	-	1.1M	128K
GPT-5.5 GPT-5.5（内部代号 "Spud"）是 OpenAI 于 2026 年 4 月 23 日发布的旗舰多模态大模型。作为 GPT-4.5 以来首个从零完整重训的模型，其核心定位是面向真实工作的智能体级模型，主打原生电脑控制、自主智能体、百万级上下文、深度推理、代码与科学计算，专为复杂专业工作流、自主编程、长文档分析、企业级智能应用设计。	TextImage	Text	$5	$30	$0.5	-	1M	128K
Gemini 2.5 Flash Gemini 2.5 Flash 是 Google DeepMind 于 2025 年 4 月推出的多模态大模型，主打极速响应、百万级上下文、可控推理（Thinking Budget）与高性价比，是 Gemini 2.5 家族中面向大规模实时应用的主力版本。	Text	TextImage	$0.3	$2.5	$0.03	$1	1M	64K
Gemini 2.5 Flash Lite Gemini 2.5 Flash-Lite 是 Google DeepMind 于 2025 年 6 月推出的超轻量级多模态大模型，主打极致低成本、超低延迟、超高吞吐量，支持100 万 token 上下文与可控推理（Thinking Budget），是 Gemini 2.5 家族中面向大规模高并发、轻量实时应用（如分类、翻译、数据处理）的经济版主力。	Text	TextImageAudioVideo	$0.1	$0.4	$0.01	$1	1M	64K
Gemini 2.5 Pro Gemini 2.5 Pro 是谷歌推出的最新 AI 模型迄今为止最先进的型号，擅长编码和复杂提示。通过“深度思考”，能在回应前进行推理，提升性能和准确性。模型在多个基准测试中表现卓越，在推理和代码生成方面，在 LMArena 排行榜上位居第一。支持文本、图像、音频、视频及代码的多模态输入。	TextImageAudioVideo	Text	$2.5	$15	$0.25	$4.5	1M	65.5K
Gemini 3 Flash Preview Gemini 3 Flash Preview 是 Google DeepMind 于 2025 年 12 月推出的预览版多模态大模型。主打极速推理、接近 Pro 级的智能水平、百万级上下文、多模态输入（文本 / 图像 / 音频 / 视频）与可控思考（Thinking Levels），专为智能代理、交互式开发、长文档分析、代码编程等高并发实时场景设计。	Text	TextImageAudioVideo	$0.5	$3	$0.05	$1	1M	64K
Gemini 3 Pro Gemini 3 Pro Preview是谷歌迄今为止最智能的模型系列，以先进的推理能力为基础。它旨在通过掌握智能体工作流、自主编码和复杂的多模态任务，将任何想法变为现实。	TextImageAudioVideo	Text	$2	$12	$0.2	$4.5	1M	64K
Gemini 3.1 Pro Gemini 3.1 是谷歌迄今为止最智能的模型系列，以先进的推理能力为基础。它旨在通过掌握智能体工作流、自主编码和复杂的多模态任务，将任何想法变为现实。gemini-3.1-pro-preview 最适合需要广泛的世界知识和跨模态的高级推理的复杂任务。	TextImageAudioVideo	Text	$2	$12	$0.2	$4.5	1M	64K
Glm 5 Turbo GLM-5-Turbo 是面向 OpenClaw 龙虾场景深度优化的基座模型。其从训练阶段就针对龙虾任务的核心需求进行专项优化，增强如工具调用、指令遵循、定时与持续性任务、长链路执行等核心能力，使其在复杂、动态、长链路的任务中也真正具备可执行性。	Text	Text	$0.714	$3.143	$0.171	-	200K	128K
Grok 4 Grok 4 模型具备深度推理能力，经过 xAI 的 Colossus 超级计算机训练，承诺提供更强的逻辑推理和文本生成能力。xAI声称是全球最强 AI 模型，在处理学术问题上的表现，已达到博士级别。在实时速度、推理能力和高级视觉等方面成绩突出。	TextImage	Text	$3	$15	$0.75	-	256K	16K
Grok 4 Fast Non Reasoning Grok-4-Fast-Non-Reasoning 是 xAI Grok 系列模型，面向对话推理、实时辅助、代码和智能体工作流，Fast 与 Reasoning 等版本分别优化延迟和推理深度。	TextImage	Text	$0.2	$0.5	$0.05	-	2M	30K
Grok 4 Fast Reasoning Grok-4-Fast-Reasoning 是 xAI Grok 系列模型，面向对话推理、实时辅助、代码和智能体工作流，Fast 与 Reasoning 等版本分别优化延迟和推理深度。	TextImage	Text	$0.2	$0.5	$0.05	-	2M	30K
Grok 4.1 Fast Non Reasoning Grok-4-1-fast-non-reasoning是xAI开发的一款 AI 模型，专为在生成响应和执行代理任务时实现最大速度而优化。与它的“推理”对应版本不同，这一变体省去了使用“思考标记”的过程，从而能够针对简单、直白的查询立即提供模式匹配式的答案。	TextImage	Text	$0.2	$0.5	$0.05	-	2M	64K
Grok 4.1 Fast Reasoning Grok 4.1 在创造性、情感化和协作式交互方面表现卓越，能够更敏锐地捕捉细微意图，对话体验更具吸引力，人格特质保持高度一致，同时完整继承了前代产品犀利的智能表现与可靠性能。	TextImage	Text	$0.2	$0.5	$0.05	-	2M	64K
Grok Code Fast 1 Grok-Code-Fast-1 是 xAI Grok 系列模型，面向对话推理、实时辅助、代码和智能体工作流，Fast 与 Reasoning 等版本分别优化延迟和推理深度。	Text	Text	$0.2	$1.5	$0.02	-	2M	30K
Kimi K2.5 Kimi K2.5 是 Kimi 迄今最智能的模型，在 Agent、代码、视觉理解及一系列通用智能任务上取得开源 SoTA 表现。同时 Kimi K2.5 也是 Kimi 迄今最全能的模型，原生的多模态架构设计，同时支持视觉与文本输入、思考与非思考模式、对话与 Agent 任务。	TextImage	Text	$0.6	$3	$0.1	-	256K	32K
Kimi K2.6 Kimi-K2.6 是 Moonshot AI Kimi 模型，面向长上下文理解、多语言聊天、代码、文档分析和智能体任务，较新的 K2 版本强调更强的推理和工具使用能力。	TextImage	Text	$0.95	$4	$0.16	-	256K	64K
Llama 4 Maverick Meta 最新的混合专家模型	TextImage	Text	$0.5	$0.75	$0.125	$0.5	1M	65.5K
MiMo V2.5 pro MiMo-V2.5-Pro。它是我们迄今为止最强大的型号，在整体智能能力、复杂软件工程和长远任务方面相比前代MiMo-V2-Pro实现了显著提升。MiMo-V2.5-Pro 是一款参数为 1.02T 的专家混合模型，拥有 42B 主动参数，基于混合注意力架构，具有 100 万令牌上下文窗口。	Text	Text	$0.429	$0.857	$0.00357	-	1M	128K
Mimo V2.5 MiMo-V2.5 是一个参数为 310B 的稀疏 MoE（15B 激活）模型，使用 48T 令牌训练。其语言骨干继承了MiMo-V2-Flash混合滑动窗口注意力架构，并配备了专用的视觉和音频编码器（均为预先培训的内部编码器），通过轻量投影仪连接。	Text	Text	$0.143	$0.286	$0.00286	-	1M	128K
MiniMax M2.1 MiniMax-M2.1是一款轻量级、前沿的大语言模型，针对编码、代理工作流程和现代应用开发进行了优化。仅激活了100亿个参数，它实现了在现实世界能力上的重大飞跃，同时保持了卓越的延迟、可扩展性和成本效率。	Text	Text	$0.3	$1.2	$0.03	$0.375	204.8K	1.3M
MiniMax M2.5 MiniMax-M2.5 在编程、工具调用和搜索、办公等生产力场景都达到或刷新了行业的 SOTA。	Text	Text	$0.3	$1.2	$0.03	$0.375	204.8K	131.1K
MiniMax M2.7 MiniMax-M2.7 是 MiniMax 模型，适合多语言聊天、推理、代码和智能体工作流，通常定位为高吞吐、成本有竞争力、适合企业场景的文本模型。	Text	Text	$0.3	$1.2	$0.06	$0.375	204.8K	131.1K
MiniMax M3 M3在编码和代理工作等专业任务上达到前沿性能。它采用了我们团队提出的新注意力架构 MSA（MiniMax Sparse Attention），并支持最多 100 万个令牌的超长上下文窗口。令人期待的是，它也是一款原生多模态模型，支持图像和视频输入，并能操作台式电脑。	Text	Text	$0.3	$1.2	$0.06	-	1M	128K
Mistral Large Mistral 旗舰模型，适用于复杂任务	Text	Text	$2	$6	$0.5	$2	131.1K	8.2K
Nano Banana Gemini 2.5 Flash Image（代号 “纳米香蕉”）是 Google DeepMind 于 2025 年 8 月推出的图像生成与编辑模型，主打极速文生图、精准自然语言编辑、多图融合、角色一致性与现实物理推理，是 Gemini 2.5 家族中面向创意设计、电商、内容创作的专业图像模型。	Text	TextImage	$0.3	$2.5	$0.03	$1	32K	32K
Nano Banana 2 Nano Banana 2 以主流价格和低延迟，提供高质量的图像生成与对话式编辑功能	TextImage	TextImage	$0.5	$60	-	-	131.1K	32.8K
Nano Banana Pro Gemini 3 pro image preview（Nano Banana pro）是Google Gemini系列中的下一代AI图像生成与编辑模型,是Gemini 2.5 Flash Image(Nano Banana)的升级版。该模型融合多模态Transformer和扩散模型,原生支持2K(2048×2048)及4K分辨率输出,在图像质量、文字渲染、物理推理等方面实现显著提升。	TextImage	TextImage	$2	$120	$0.2	$4.5	65.5K	32.8K
O3 O3 是 OpenAI 模型，适合通用推理、代码、指令遵循、工具调用和生产级聊天场景，具体速度、推理深度和成本取决于所选版本。	TextImage	Text	$2	$8	$0.5	-	200K	100K
O3 Mini O3-Mini 是 OpenAI 模型，适合通用推理、代码、指令遵循、工具调用和生产级聊天场景，具体速度、推理深度和成本取决于所选版本。	Text	Text	$1.1	$4.4	$0.55	-	200K	100K
O3 pro O3-Pro 是 OpenAI 模型，适合通用推理、代码、指令遵循、工具调用和生产级聊天场景，具体速度、推理深度和成本取决于所选版本。	TextImage	Text	$20	$80	-	-	200K	100K
O4 Mini O4-Mini 是 OpenAI 模型，适合通用推理、代码、指令遵循、工具调用和生产级聊天场景，具体速度、推理深度和成本取决于所选版本。	TextImage	Text	$1.1	$4.4	$0.275	-	200K	100K
QwQ Plus 通义千问QwQ推理模型增强版，基于Qwen2.5模型训练的QwQ推理模型，通过强化学习大幅度提升了模型推理能力。模型数学代码等核心指标（AIME 24/25、livecodebench）以及部分通用指标（IFEval、LiveBench等）达到DeepSeek-R1 满血版水平。	Text	Text	$0.229	$0.571	-	-	128K	7K
Qwen 3.5 397B A17B Qwen3.5系列397B-A17B原生视觉语言模型，基于混合架构设计，融合了线性注意力机制与稀疏混合专家模型，实现了更高的推理效率。在语言理解、逻辑推理、代码生成、智能体任务、图像理解、视频理解、图形用户界面（GUI）等多种任务中，均展现出与当前顶尖前沿模型相媲美的卓越性能。具备强大的代码生成与智能体能力，对于各类智能体场景具有良好的泛化性。	TextImageVideo	Text	$0.429	$2.571	-	-	256K	64K
Qwen 3.5 Flash Qwen3.5原生视觉语言系列Flash模型，基于混合架构设计，融合了线性注意力机制与稀疏混合专家模型，实现了更高的推理效率。模型效果在纯文本与多模态方面相较3系列均实现飞跃式进步；响应速度快，兼具推理速度和性能。	TextImage	Text	$0.171	$1.714	$0.017	$0.214	1M	64K
Qwen 3.5 Plus Qwen3.5原生视觉语言系列Plus模型，基于混合架构设计，融合了线性注意力机制与稀疏混合专家模型，实现了更高的推理效率。在多项任务评测中，3.5系列均展现出与当前顶尖前沿模型相媲美的卓越性能，模型效果在纯文本与多模态方面相较3系列均实现飞跃式进步。	TextImageVideo	Text	$0.57	$3.426	$0.06	$0.714	1M	64K
Qwen3 Max Preview 最新的Qwen3-Max-Preview模型：Qwen3 系列Max模型Preview版本，相较Qwen 2.5系列整体通用能力有大幅度提升，中英文通用文本理解能力、复杂指令遵循能力、主观开放任务能力、多语言能力、工具调用能力均显著增强；模型知识幻觉更少	Text	Text	$2.143	$8.571	$0.429	-	256K	64K
Step 3.5 Flash Step 3.5 Flash 模型在 Agent 场景和数学任务上能力逼近闭源模型，能够胜任复杂、长链条任务，是阶跃星辰迄今最强的开源基座模型。	Text	Text	$0.1	$0.3	-	-	256K	128K
Text Embedding 3 Large OpenAI 第三代嵌入模型，比 small 版本更强大，适用于需要最高性能的任务	Text	Text	$0.13	$0.13	-	-	-	-
claude-sonnet-5 Claude Sonnet 5 被打造为迄今为止最具主导性的sonnet模型。它可以制定计划，使用浏览器和终端等工具，并自主运行，达到几个月前还需要更大更昂贵型号的水平。对许多开发者来说，代理型AI时代始于Sonnet类模型：Claude Sonnet 3.5、3.6和3.7是首批展现出令人惊叹编码和工具使用能力的模型。然而，最近，代理能力最明显的提升出现在我们的Opus级模型中。	Text	Text	$2	$10	$0.2	$2.5	-	-
gpt-5.6-luna 可以从GPT-5.6 Sol开始，用于复杂的推理和编码，选择GPT-5.6 Terra以平衡智能与成本，或者使用GPT-5.6 Luna处理成本敏感、高流量的工作。	TextImage	Text	$1	$6	$0.1	$1.25	-	-
gpt-5.6-sol 可以从GPT-5.6 Sol开始，用于复杂的推理和编码，选择GPT-5.6 Terra以平衡智能与成本，或者使用GPT-5.6 Luna处理成本敏感、高流量的工作。	TextImage	Text	$5	$30	$0.5	$6.25	-	-
gpt-5.6-terra 可以从GPT-5.6 Sol开始，用于复杂的推理和编码，选择GPT-5.6 Terra以平衡智能与成本，或者使用GPT-5.6 Luna处理成本敏感、高流量的工作。	TextImage	Text	$2.5	$15	$0.25	$3.125	-	-
kimi-k2.7-code Kimi K2.7 Code是Kimi最智能的编程模型，能在长上下文中以更高成功率完成编程任务。其采用原生多模态架构，支持文本、图像、视频输入及思考模式，可处理对话与代理任务。 Kimi K2.7 Code HighSpeed是Kimi K2.7 Code的高速版本，与Kimi K2.7 Code同属同一模型，但在短文本场景下输出速度可达约180个标记/秒至260个标记/秒，提供更为极致的编码体验。上下文长度达256k，支持深度思考与推理。支持自动上下文缓存功能、工具调用、JSON模式、部分模式。	TextImageVideo	Text	$0.95	$4	$0.19	-	-	-
qvq-max 千问QVQ视觉推理模型，支持视觉输入及思维链输出，在数学、编程、视觉分析、创作以及通用任务上都表现了更强的能力。	TextImageAudioVideo	TextImageAudioVideo	$1.14	$4.57	-	-	-	-
qwen-coder-plus 千问系列代码及编程模型是专门用于编程和代码生成的语言模型，性能出色，效果突出。	TextImageAudioVideo	TextImageAudioVideo	$0.5	$1	-	-	-	-
qwen3-max 通义千问3系列Max模型，相较preview版本在智能体编程与工具调用方向进行了专项升级。本次发布的正式版模型达到领域SOTA水平，适配场景更加复杂的智能体需求。	TextImageAudioVideo	TextImageAudioVideo	$0.3571	$1.4286	$0.714	$0.4464	-	-
qwen3.6-plus Qwen3.6原生视觉语言系列Plus模型，展现出与当前顶尖前沿模型相媲美的卓越性能，模型效果相较3.5系列显著提升。模型在Agentic coding、前端编程、Vibe coding等代码能力、多模态万物识别、OCR、物体定位等能力上显著增强。	TextImageAudioVideo	TextImageAudioVideo	$0.167	$1.714	$0.286	$0.3571	-	-