Skip to main content
Codzen

可用模型

浏览并比较 LLM Gateway 提供的大语言模型。

57 个模型
模型输入输出输入价格输出价格缓存读取缓存写入上下文最大输出
Claude
Claude Haiku 4.5
Claude Haiku 4.5 是速度最快、性价比最高的模型,在编码、计算机使用和代理任务方面的表现与 Sonnet 4 相当。
TextImage
Text
$1$5$0.1$1.25200K64K
Claude
Claude Opus 4.5
Claude Opus 4.5是Anthropic公司推出的前沿推理模型,专为复杂软件工程、智能体工作流及长周期计算机任务优化设计。该模型具备强大的多模态能力,在现实场景的编程与推理基准测试中展现出卓越性能,并显著提升了对提示注入攻击的防御能力。其创新设计支持开发者根据任务需求灵活调整运行强度,在响应速度、思考深度和令牌使用量之间实现精准平衡。该模型支持高级工具调用、扩展上下文管理与协同多智能体架构,特别适用于自主研究、代码调试、多步骤规划及电子表格/浏览器操作等场景。相较于前代Opus系列,在结构化推理、执行可靠性和指令遵循方面实现重大突破,同时有效降低令牌开销,显著提升长时任务的运行效能。
TextImage
Text
$5$25$0.5$6.25200K64K
Claude
Claude Opus 4.6
Anthropic 发布新一代 Claude Opus 4.6 模型,支持 1M 上下文窗口,最大输出 token 数提升至 128K,较前代 64K 限制翻倍。该模型引入自适应思考模式,可根据问题复杂度动态调整思考深度,并新增最高级别的 max effort 参数。
TextImage
Text
$5$25$0.5$6.251M128K
Claude
Claude Opus 4.7
Opus 4.7 在高级软件工程方面相较 Opus 4.6 有显著改进,在最难的任务上有显著提升。他们能够自信地将最难的编码工作——之前需要密切监督的工作——交给 Opus 4.7。Opus 4.7 以严谨和一致的方式处理复杂且长期运行的任务,精确关注指令,并设计方法在报告前验证自身输出。
TextImage
Text
$5$25$0.5$6.251M128K
Claude
Claude Sonnet 4.5
Claude Sonnet 4.5 是世界上最好的编码模型。它是构建复杂代理的最强大模型。它是使用计算机的最佳模型。它在推理和数学方面表现出显著的进步。
TextImage
Text
$3$15$0.3$3.75200K64K
Claude
Claude Sonnet 4.6
Sonnet 4.6是Anthropic迄今为止最强大的Sonnet系列模型,在编程、智能代理和专业工作领域均达到前沿性能水平。它在以下方面表现卓越:迭代开发、复杂代码库导航、具备记忆功能的端到端项目管理、专业文档撰写,以及在网页问答和工作流自动化方面的可靠计算机操作能力。
TextImage
Text
$3$15$0.3$3.751M64K
DeepSeek
DeepSeek V3.2
DeepSeek 发布 V3.2 正式版,显著强化了 Agent 和推理能力,在主流测试中达到 GPT-5 水平并支持思考模式下的工具调用;同时推出的 Speciale 探索版在多项国际竞赛中取得金牌级表现。模型已全面开放使用。
Text
Text
$0.286$0.429$0.029-128K8K
DeepSeek
DeepSeek V3.2 Thinking
DeepSeek-V3.2-thinking 是我们推出的首个将思考融入工具使用的模型,是DeepSeek-V3.2的思考模式
Text
Text
$0.286$0.429$0.029-128K64K
DeepSeek
Deepseek V4 Pro
DeepSeek-V4-Pro 是DeepSeek推出的高性能开源大模型,具备顶尖推理与Agent能力,支持超长上下文,适配国产昇腾芯片,性价比极高
Text
Text
$1.714$3.429$0.143-1M384K
DeepSeek
Deepseek V4 Flash
DeepSeek-V4-Flash 是DeepSeek V4系列的轻量化版本,主打高性价比与高吞吐效率,适合通用对话和基础文本任务,同时支持百万Token长上下文和高效推理
Text
Text
$0.143$0.286$0.029-1M384K
ChatGLM
GLM 4.7
GLM-4.7 是智谱最新旗舰模型,GLM-4.7 面向 Agentic Coding 场景强化了编码能力、长程任务规划与工具协同,并在多个公开基准的当期榜单中取得开源模型中的领先表现。通用能力提升,回复更简洁自然,写作更具沉浸感。
TextImage
Text
$0.571$2.286$0.114-200K128K
ChatGLM
GLM 5
GLM-5 是智谱新一代的旗舰基座模型,面向 Agentic Engineering 打造,能够在复杂系统工程与长程 Agent 任务中提供可靠生产力。在 Coding 与 Agent 能力上,GLM-5 取得开源 SOTA 表现,在真实编程场景的使用体感逼近 Claude Opus 4.5,擅长复杂系统工程与长程 Agent 任务,是通用 Agent 助手的理想基座。
Text
Text
$0.857$3.142$0.214-200K128K
ChatGLM
GLM-5.1
glm-5.1是智谱平台推出的最新旗舰模型。
Text
Text
$0.857$1.143$0.186-200K128K
OpenAI
GPT Image 1.5
GPT Image 1.5是我们最新的图像生成模型,拥有更好的指令跟踪和对提示的遵循。
Text
Image
$7$10--64K16K
OpenAI
GPT- 4.1
GPT-4.1 是 OpenAI 于 2025 年 4 月 15 日 发布的高性能多模态模型,定位为 GPT-4o 的全面升级版。主打超强代码生成、长上下文理解、高速推理与多模态处理,核心优势是百万级上下文(1M tokens)与更低成本,专为软件开发、复杂指令执行、长文档分析场景设计。
TextImage
Text
$2$8$0.5-1M32K
OpenAI
GPT-4.1 Mini
GPT-4.1 Mini 是 OpenAI 推出的轻量级多模态大模型,兼顾高推理能力、百万级超长上下文与超低使用成本,延迟低、吞吐高,适合大规模高并发业务、长文档处理、日常对话及轻量化多模态应用场景。
TextImage
Text
$0.4$1.6$0.1-1M32K
OpenAI
GPT-4.1 Nano
GPT-4.1 Nano 是 OpenAI GPT-4.1系列中最小、成本最低的模型,适合高并发、低成本的大规模任务,例如文本分类、信息抽取、简单推理、轻量代码辅助、数据清洗、格式转换和自动化处理。它支持长上下文文本处理和图片理解,但整体推理、代码和复杂任务能力通常弱于 GPT-4.1 Mini 和完整 GPT-4.1。
TextImage
Text
$0.1$0.4$0.025-1M32K
OpenAI
GPT-5
Gpt-5 是 OpenAI 模型,适合通用推理、代码、指令遵循、工具调用和生产级聊天场景,具体速度、推理深度和成本取决于所选版本。
TextImage
Text
$1.25$10$0.125-400K128K
OpenAI
GPT-5 Chat Latest
GPT-5 Chat Latest 是 OpenAI 推出的新一代旗舰对话多模态大模型,具备极强逻辑推理、超低幻觉、超长上下文理解与优秀多模态解析能力,兼顾响应速度与专业级生成质量,适用于日常对话、复杂问题求解、长文档分析、创意内容创作与多模态智能交互场景。
TextImage
Text
$1.25$10$0.125-400K128K
OpenAI
GPT-5 Codex
GPT-5-Codex 是 OpenAI 于 2025 年 9 月 15 日 发布的、基于 GPT-5 专为智能体编程(Agentic Coding)与软件工程深度优化的专业大模型OpenAI。它以真实开发场景训练,兼具快速交互响应与超长时独立任务能力(可连续工作超 7 小时),精通代码生成、审查、调试、重构、多语言开发与系
Text
Text
$1.25$10$0.125-400K128K
OpenAI
GPT-5 Mini
GPT-5 Mini 是 OpenAI 模型,适合通用推理、代码、指令遵循、工具调用和生产级聊天场景,具体速度、推理深度和成本取决于所选版本。
TextImage
Text
$0.25$2$0.025-400K128K
OpenAI
GPT-5 Nano
Gpt-5-Nano 是 OpenAI 模型,适合通用推理、代码、指令遵循、工具调用和生产级聊天场景,具体速度、推理深度和成本取决于所选版本。
TextImage
Text
$0.05$0.4$0.005-400K128
OpenAI
GPT-5 Pro
Gpt-5-Pro 是 OpenAI 模型,适合通用推理、代码、指令遵循、工具调用和生产级聊天场景,具体速度、推理深度和成本取决于所选版本。
TextImage
Text
$15$120--400K128K
OpenAI
GPT-5.1
Gpt-5.1 是 OpenAI 模型,适合通用推理、代码、指令遵循、工具调用和生产级聊天场景,具体速度、推理深度和成本取决于所选版本。
TextImage
Text
$1.25$10$0.125-400K128K
OpenAI
GPT-5.1 Chat Latest
Gpt-5.1-Chat-Latest 是 OpenAI 模型,适合通用推理、代码、指令遵循、工具调用和生产级聊天场景,具体速度、推理深度和成本取决于所选版本。
TextImage
Text
$1.25$10$0.125-400K128K
OpenAI
GPT-5.2
GPT-5.2适用于各行各业的编码和智能任务的最佳模型
TextImage
Text
$1.75$14$0.175-400K128K
OpenAI
GPT-5.2 Chat Latest
Gpt-5.2-Chat-Latest 是 OpenAI 模型,适合通用推理、代码、指令遵循、工具调用和生产级聊天场景,具体速度、推理深度和成本取决于所选版本。
TextImage
Text
$1.75$14$0.175-400K128K
OpenAI
GPT-5.2 Codex
Gpt-5.2-Codex 是 OpenAI 模型,适合通用推理、代码、指令遵循、工具调用和生产级聊天场景,具体速度、推理深度和成本取决于所选版本。
Text
Text
$1.75$14$0.175-400K128K
OpenAI
GPT-5.2 Pro
Gpt-5.2-Pro 是 OpenAI 模型,适合通用推理、代码、指令遵循、工具调用和生产级聊天场景,具体速度、推理深度和成本取决于所选版本。
TextImage
Text
$21$168--400K272K
OpenAI
GPT-5.3 Codex
GPT-5.3-Codex通过性能提升、功能泛化和安全性升级,重新定义了AI在编程及泛生产力领域的角色。
TextImage
Text
$1.75$14$0.175-400K128K
OpenAI
GPT-5.4
GPT-5.4是我们用于复杂专业工作的前沿模型。
TextImage
Text
$2.5$15$0.25-1M128K
OpenAI
GPT-5.4 Pro
GPT-5.4pro使用更多计算资源来更深入地思考并提供始终更好的答案。仅可通过响应API访问,以在响应API请求前支持多轮模型交互功能,以及未来其他高级API特性。
TextImage
Text
$30$180--1.1M128K
OpenAI
GPT-5.5
GPT-5.5(内部代号 "Spud")是 OpenAI 于 2026 年 4 月 23 日 发布的旗舰多模态大模型。作为 GPT-4.5 以来首个从零完整重训的模型,其核心定位是面向真实工作的智能体级模型,主打原生电脑控制、自主智能体、百万级上下文、深度推理、代码与科学计算,专为复杂专业工作流、自主编程、长文档分析、企业级智能应用设计。
TextImage
Text
$5$30$0.5-1M128K
Gemini
Gemini 2.5 Flash
Gemini 2.5 Flash 是 Google DeepMind 于 2025 年 4 月 推出的多模态大模型,主打极速响应、百万级上下文、可控推理(Thinking Budget)与高性价比,是 Gemini 2.5 家族中面向大规模实时应用的主力版本。
Text
TextImage
$0.3$2.5$0.03$11M64K
Gemini
Gemini 2.5 Flash Lite
Gemini 2.5 Flash-Lite 是 Google DeepMind 于 2025 年 6 月推出的超轻量级多模态大模型,主打极致低成本、超低延迟、超高吞吐量,支持100 万 token 上下文与可控推理(Thinking Budget),是 Gemini 2.5 家族中面向大规模高并发、轻量实时应用(如分类、翻译、数据处理)的经济版主力。
Text
TextImageAudioVideo
$0.1$0.4$0.01$0.083331M64K
Gemini
Gemini 2.5 Pro
Gemini 2.5 Pro 是谷歌推出的最新 AI 模型迄今为止最先进的型号,擅长编码和复杂提示。通过“深度思考”,能在回应前进行推理,提升性能和准确性。模型在多个基准测试中表现卓越,在推理和代码生成方面,在 LMArena 排行榜上位居第一。支持文本、图像、音频、视频及代码的多模态输入。
TextImageAudioVideo
Text
$2.5$15$0.25$4.51M65.5K
Gemini
Gemini 3 Flash Preview
Gemini 3 Flash Preview 是 Google DeepMind 于 2025 年 12 月推出的预览版多模态大模型。主打极速推理、接近 Pro 级的智能水平、百万级上下文、多模态输入(文本 / 图像 / 音频 / 视频)与可控思考(Thinking Levels),专为智能代理、交互式开发、长文档分析、代码编程等高并发实时场景设计。
Text
TextImageAudioVideo
$0.5$3$0.05$11M64K
Gemini
Gemini 3 Pro
Gemini 3 Pro Preview是谷歌迄今为止最智能的模型系列,以先进的推理能力为基础。它旨在通过掌握智能体工作流、自主编码和复杂的多模态任务,将任何想法变为现实。
TextImageAudioVideo
Text
$2$12$0.2$4.51M64K
Gemini
Gemini 3.1 Pro
Gemini 3.1 是谷歌迄今为止最智能的模型系列,以先进的推理能力为基础。它旨在通过掌握智能体工作流、自主编码和复杂的多模态任务,将任何想法变为现实。gemini-3.1-pro-preview 最适合需要广泛的世界知识和跨模态的高级推理的复杂任务。
TextImageAudioVideo
Text
$2$12$0.2$4.51M64K
ChatGLM
Glm 5 Turbo
GLM-5-Turbo 是面向 OpenClaw 龙虾场景深度优化的基座模型。 其从训练阶段就针对龙虾任务的核心需求进行专项优化,增强如工具调用、指令遵循、定时与持续性任务、长链路执行等核心能力,使其在复杂、动态、长链路的任务中也真正具备可执行性。
Text
Text
$1$3.714$0.257-200K128K
Grok
Grok 4.1 Fast Non Reasoning
Grok-4-1-fast-non-reasoning是xAI开发的一款 AI 模型,专为在生成响应和执行代理任务时实现最大速度而优化。与它的“推理”对应版本不同,这一变体省去了使用“思考标记”的过程,从而能够针对简单、直白的查询立即提供模式匹配式的答案。
TextImage
Text
$0.2$0.5$0.05-2M64K
Grok
Grok 4.1 Fast Reasoning
Grok 4.1 在创造性、情感化和协作式交互方面表现卓越,能够更敏锐地捕捉细微意图,对话体验更具吸引力,人格特质保持高度一致,同时完整继承了前代产品犀利的智能表现与可靠性能。
TextImage
Text
$0.2$0.5$0.05-2M64K
Kimi
Kimi K2.5
Kimi K2.5 是 Kimi 迄今最智能的模型,在 Agent、代码、视觉理解及一系列通用智能任务上取得开源 SoTA 表现。同时 Kimi K2.5 也是 Kimi 迄今最全能的模型,原生的多模态架构设计,同时支持视觉与文本输入、思考与非思考模式、对话与 Agent 任务。
TextImage
Text
$0.571$3$0.1-256K32K
Kimi
Kimi k2
Kimi K2是一个突破性的混合专家模型,专为前沿知识、推理和编程任务中的卓越性能而设计。为自主行动和智能问题解决而构建。
Text
Text
$0.571$2.286$0.143-262.1K32K
Llama 4 Maverick
Meta 最新的混合专家模型
TextImage
Text
$0.5$0.75$0.125$0.51M65.5K
Minimax
MiniMax M2.1
MiniMax-M2.1是一款轻量级、前沿的大语言模型,针对编码、代理工作流程和现代应用开发进行了优化。仅激活了100亿个参数,它实现了在现实世界能力上的重大飞跃,同时保持了卓越的延迟、可扩展性和成本效率。
Text
Text
$0.3$1.2$0.03$0.375204.8K1.3M
Minimax
MiniMax M2.5
MiniMax-M2.5 在编程、工具调用和搜索、办公等生产力场景都达到或刷新了行业的 SOTA。
Text
Text
$0.3$1.2$0.06$0.375204.8K131.1K
Mistral
Mistral Large
Mistral 旗舰模型,适用于复杂任务
Text
Text
$2$6$0.5$2131.1K8.2K
Gemini
Nano Banana
Gemini 2.5 Flash Image(代号 “纳米香蕉”)是 Google DeepMind 于 2025 年 8 月推出的图像生成与编辑模型,主打极速文生图、精准自然语言编辑、多图融合、角色一致性与现实物理推理,是 Gemini 2.5 家族中面向创意设计、电商、内容创作的专业图像模型。
Text
TextImage
$0.3$2.5$0.03$132K32K
Gemini
Nano Banana 2
Nano Banana 2 以主流价格和低延迟,提供高质量的图像生成与对话式编辑功能
TextImage
TextImage
$0.5$60--131.1K32.8K
Gemini
Nano Banana Pro
Gemini 3 pro image preview(Nano Banana pro)是Google Gemini系列中的下一代AI图像生成与编辑模型,是Gemini 2.5 Flash Image(Nano Banana)的升级版。该模型融合多模态Transformer和扩散模型,原生支持2K(2048×2048)及4K分辨率输出,在图像质量、文字渲染、物理推理等方面实现显著提升。
TextImage
TextImage
$2$120--65.5K32.8K
Qwen
QwQ Plus
通义千问QwQ推理模型增强版,基于Qwen2.5模型训练的QwQ推理模型,通过强化学习大幅度提升了模型推理能力。模型数学代码等核心指标(AIME 24/25、livecodebench)以及部分通用指标(IFEval、LiveBench等)达到DeepSeek-R1 满血版水平。
Text
Text
$0.229$0.571--128K7K
Qwen
Qwen 3.5 397B A17B
Qwen3.5系列397B-A17B原生视觉语言模型,基于混合架构设计,融合了线性注意力机制与稀疏混合专家模型,实现了更高的推理效率。在语言理解、逻辑推理、代码生成、智能体任务、图像理解、视频理解、图形用户界面(GUI)等多种任务中,均展现出与当前顶尖前沿模型相媲美的卓越性能。具备强大的代码生成与智能体能力,对于各类智能体场景具有良好的泛化性。
TextImageVideo
Text
$0.429$2.571--256K64K
Qwen
Qwen 3.5 Flash
Qwen3.5原生视觉语言系列Flash模型,基于混合架构设计,融合了线性注意力机制与稀疏混合专家模型,实现了更高的推理效率。模型效果在纯文本与多模态方面相较3系列均实现飞跃式进步;响应速度快,兼具推理速度和性能。
TextImage
Text
$0.171$1.714$0.017$0.2141M64K
Qwen
Qwen 3.5 Plus
Qwen3.5原生视觉语言系列Plus模型,基于混合架构设计,融合了线性注意力机制与稀疏混合专家模型,实现了更高的推理效率。在多项任务评测中,3.5系列均展现出与当前顶尖前沿模型相媲美的卓越性能,模型效果在纯文本与多模态方面相较3系列均实现飞跃式进步。
TextImageVideo
Text
$0.57$3.426$0.06$0.7141M64K
Qwen
Qwen3 Max Preview
最新的Qwen3-Max-Preview模型:Qwen3 系列Max模型Preview版本,相较Qwen 2.5系列整体通用能力有大幅度提升,中英文通用文本理解能力、复杂指令遵循能力、主观开放任务能力、多语言能力、工具调用能力均显著增强;模型知识幻觉更少
Text
Text
$2.143$8.571$0.429-256K64K
Stepfun
Step 3.5 Flash
Step 3.5 Flash 模型在 Agent 场景和数学任务上能力逼近闭源模型,能够胜任复杂、长链条任务,是阶跃星辰迄今最强的开源基座模型。
Text
Text
$0.1$0.3--256K128K