可用模型
浏览并比较 LLM Gateway 提供的大语言模型。
57 个模型
| 模型 | 输入 | 输出 | 输入价格 | 输出价格 | 缓存读取 | 缓存写入 | 上下文 | 最大输出 |
|---|---|---|---|---|---|---|---|---|
Claude Haiku 4.5 Claude Haiku 4.5 是速度最快、性价比最高的模型,在编码、计算机使用和代理任务方面的表现与 Sonnet 4 相当。 | TextImage | Text | $1 | $5 | $0.1 | $1.25 | 200K | 64K |
Claude Opus 4.5 Claude Opus 4.5是Anthropic公司推出的前沿推理模型,专为复杂软件工程、智能体工作流及长周期计算机任务优化设计。该模型具备强大的多模态能力,在现实场景的编程与推理基准测试中展现出卓越性能,并显著提升了对提示注入攻击的防御能力。其创新设计支持开发者根据任务需求灵活调整运行强度,在响应速度、思考深度和令牌使用量之间实现精准平衡。该模型支持高级工具调用、扩展上下文管理与协同多智能体架构,特别适用于自主研究、代码调试、多步骤规划及电子表格/浏览器操作等场景。相较于前代Opus系列,在结构化推理、执行可靠性和指令遵循方面实现重大突破,同时有效降低令牌开销,显著提升长时任务的运行效能。
| TextImage | Text | $5 | $25 | $0.5 | $6.25 | 200K | 64K |
Claude Opus 4.6 Anthropic 发布新一代 Claude Opus 4.6 模型,支持 1M 上下文窗口,最大输出 token 数提升至 128K,较前代 64K 限制翻倍。该模型引入自适应思考模式,可根据问题复杂度动态调整思考深度,并新增最高级别的 max effort 参数。
| TextImage | Text | $5 | $25 | $0.5 | $6.25 | 1M | 128K |
Claude Opus 4.7 Opus 4.7 在高级软件工程方面相较 Opus 4.6 有显著改进,在最难的任务上有显著提升。他们能够自信地将最难的编码工作——之前需要密切监督的工作——交给 Opus 4.7。Opus 4.7 以严谨和一致的方式处理复杂且长期运行的任务,精确关注指令,并设计方法在报告前验证自身输出。 | TextImage | Text | $5 | $25 | $0.5 | $6.25 | 1M | 128K |
Claude Sonnet 4.5 Claude Sonnet 4.5 是世界上最好的编码模型。它是构建复杂代理的最强大模型。它是使用计算机的最佳模型。它在推理和数学方面表现出显著的进步。 | TextImage | Text | $3 | $15 | $0.3 | $3.75 | 200K | 64K |
Claude Sonnet 4.6 Sonnet 4.6是Anthropic迄今为止最强大的Sonnet系列模型,在编程、智能代理和专业工作领域均达到前沿性能水平。它在以下方面表现卓越:迭代开发、复杂代码库导航、具备记忆功能的端到端项目管理、专业文档撰写,以及在网页问答和工作流自动化方面的可靠计算机操作能力。 | TextImage | Text | $3 | $15 | $0.3 | $3.75 | 1M | 64K |
DeepSeek V3.2 DeepSeek 发布 V3.2 正式版,显著强化了 Agent 和推理能力,在主流测试中达到 GPT-5 水平并支持思考模式下的工具调用;同时推出的 Speciale 探索版在多项国际竞赛中取得金牌级表现。模型已全面开放使用。 | Text | Text | $0.286 | $0.429 | $0.029 | - | 128K | 8K |
DeepSeek V3.2 Thinking DeepSeek-V3.2-thinking 是我们推出的首个将思考融入工具使用的模型,是DeepSeek-V3.2的思考模式 | Text | Text | $0.286 | $0.429 | $0.029 | - | 128K | 64K |
Deepseek V4 Pro DeepSeek-V4-Pro 是DeepSeek推出的高性能开源大模型,具备顶尖推理与Agent能力,支持超长上下文,适配国产昇腾芯片,性价比极高 | Text | Text | $1.714 | $3.429 | $0.143 | - | 1M | 384K |
Deepseek V4 Flash DeepSeek-V4-Flash 是DeepSeek V4系列的轻量化版本,主打高性价比与高吞吐效率,适合通用对话和基础文本任务,同时支持百万Token长上下文和高效推理 | Text | Text | $0.143 | $0.286 | $0.029 | - | 1M | 384K |
GLM 4.7 GLM-4.7 是智谱最新旗舰模型,GLM-4.7 面向 Agentic Coding 场景强化了编码能力、长程任务规划与工具协同,并在多个公开基准的当期榜单中取得开源模型中的领先表现。通用能力提升,回复更简洁自然,写作更具沉浸感。 | TextImage | Text | $0.571 | $2.286 | $0.114 | - | 200K | 128K |
GLM 5 GLM-5 是智谱新一代的旗舰基座模型,面向 Agentic Engineering 打造,能够在复杂系统工程与长程 Agent 任务中提供可靠生产力。在 Coding 与 Agent 能力上,GLM-5 取得开源 SOTA 表现,在真实编程场景的使用体感逼近 Claude Opus 4.5,擅长复杂系统工程与长程 Agent 任务,是通用 Agent 助手的理想基座。 | Text | Text | $0.857 | $3.142 | $0.214 | - | 200K | 128K |
GLM-5.1 glm-5.1是智谱平台推出的最新旗舰模型。 | Text | Text | $0.857 | $1.143 | $0.186 | - | 200K | 128K |
GPT Image 1.5 GPT Image 1.5是我们最新的图像生成模型,拥有更好的指令跟踪和对提示的遵循。 | Text | Image | $7 | $10 | - | - | 64K | 16K |
GPT- 4.1 GPT-4.1 是 OpenAI 于 2025 年 4 月 15 日 发布的高性能多模态模型,定位为 GPT-4o 的全面升级版。主打超强代码生成、长上下文理解、高速推理与多模态处理,核心优势是百万级上下文(1M tokens)与更低成本,专为软件开发、复杂指令执行、长文档分析场景设计。 | TextImage | Text | $2 | $8 | $0.5 | - | 1M | 32K |
GPT-4.1 Mini GPT-4.1 Mini 是 OpenAI 推出的轻量级多模态大模型,兼顾高推理能力、百万级超长上下文与超低使用成本,延迟低、吞吐高,适合大规模高并发业务、长文档处理、日常对话及轻量化多模态应用场景。 | TextImage | Text | $0.4 | $1.6 | $0.1 | - | 1M | 32K |
GPT-4.1 Nano GPT-4.1 Nano 是 OpenAI GPT-4.1系列中最小、成本最低的模型,适合高并发、低成本的大规模任务,例如文本分类、信息抽取、简单推理、轻量代码辅助、数据清洗、格式转换和自动化处理。它支持长上下文文本处理和图片理解,但整体推理、代码和复杂任务能力通常弱于 GPT-4.1 Mini 和完整 GPT-4.1。 | TextImage | Text | $0.1 | $0.4 | $0.025 | - | 1M | 32K |
GPT-5 Gpt-5 是 OpenAI 模型,适合通用推理、代码、指令遵循、工具调用和生产级聊天场景,具体速度、推理深度和成本取决于所选版本。
| TextImage | Text | $1.25 | $10 | $0.125 | - | 400K | 128K |
GPT-5 Chat Latest GPT-5 Chat Latest 是 OpenAI 推出的新一代旗舰对话多模态大模型,具备极强逻辑推理、超低幻觉、超长上下文理解与优秀多模态解析能力,兼顾响应速度与专业级生成质量,适用于日常对话、复杂问题求解、长文档分析、创意内容创作与多模态智能交互场景。 | TextImage | Text | $1.25 | $10 | $0.125 | - | 400K | 128K |
GPT-5 Codex GPT-5-Codex 是 OpenAI 于 2025 年 9 月 15 日 发布的、基于 GPT-5 专为智能体编程(Agentic Coding)与软件工程深度优化的专业大模型OpenAI。它以真实开发场景训练,兼具快速交互响应与超长时独立任务能力(可连续工作超 7 小时),精通代码生成、审查、调试、重构、多语言开发与系 | Text | Text | $1.25 | $10 | $0.125 | - | 400K | 128K |
GPT-5 Mini GPT-5 Mini 是 OpenAI 模型,适合通用推理、代码、指令遵循、工具调用和生产级聊天场景,具体速度、推理深度和成本取决于所选版本。
| TextImage | Text | $0.25 | $2 | $0.025 | - | 400K | 128K |
GPT-5 Nano Gpt-5-Nano 是 OpenAI 模型,适合通用推理、代码、指令遵循、工具调用和生产级聊天场景,具体速度、推理深度和成本取决于所选版本。
| TextImage | Text | $0.05 | $0.4 | $0.005 | - | 400K | 128 |
GPT-5 Pro Gpt-5-Pro 是 OpenAI 模型,适合通用推理、代码、指令遵循、工具调用和生产级聊天场景,具体速度、推理深度和成本取决于所选版本。
| TextImage | Text | $15 | $120 | - | - | 400K | 128K |
GPT-5.1 Gpt-5.1 是 OpenAI 模型,适合通用推理、代码、指令遵循、工具调用和生产级聊天场景,具体速度、推理深度和成本取决于所选版本。
| TextImage | Text | $1.25 | $10 | $0.125 | - | 400K | 128K |
GPT-5.1 Chat Latest Gpt-5.1-Chat-Latest 是 OpenAI 模型,适合通用推理、代码、指令遵循、工具调用和生产级聊天场景,具体速度、推理深度和成本取决于所选版本。
| TextImage | Text | $1.25 | $10 | $0.125 | - | 400K | 128K |
GPT-5.2 GPT-5.2适用于各行各业的编码和智能任务的最佳模型 | TextImage | Text | $1.75 | $14 | $0.175 | - | 400K | 128K |
GPT-5.2 Chat Latest Gpt-5.2-Chat-Latest 是 OpenAI 模型,适合通用推理、代码、指令遵循、工具调用和生产级聊天场景,具体速度、推理深度和成本取决于所选版本。
| TextImage | Text | $1.75 | $14 | $0.175 | - | 400K | 128K |
GPT-5.2 Codex Gpt-5.2-Codex 是 OpenAI 模型,适合通用推理、代码、指令遵循、工具调用和生产级聊天场景,具体速度、推理深度和成本取决于所选版本。
| Text | Text | $1.75 | $14 | $0.175 | - | 400K | 128K |
GPT-5.2 Pro Gpt-5.2-Pro 是 OpenAI 模型,适合通用推理、代码、指令遵循、工具调用和生产级聊天场景,具体速度、推理深度和成本取决于所选版本。
| TextImage | Text | $21 | $168 | - | - | 400K | 272K |
GPT-5.3 Codex GPT-5.3-Codex通过性能提升、功能泛化和安全性升级,重新定义了AI在编程及泛生产力领域的角色。 | TextImage | Text | $1.75 | $14 | $0.175 | - | 400K | 128K |
GPT-5.4 GPT-5.4是我们用于复杂专业工作的前沿模型。 | TextImage | Text | $2.5 | $15 | $0.25 | - | 1M | 128K |
GPT-5.4 Pro GPT-5.4pro使用更多计算资源来更深入地思考并提供始终更好的答案。仅可通过响应API访问,以在响应API请求前支持多轮模型交互功能,以及未来其他高级API特性。 | TextImage | Text | $30 | $180 | - | - | 1.1M | 128K |
GPT-5.5 GPT-5.5(内部代号 "Spud")是 OpenAI 于 2026 年 4 月 23 日 发布的旗舰多模态大模型。作为 GPT-4.5 以来首个从零完整重训的模型,其核心定位是面向真实工作的智能体级模型,主打原生电脑控制、自主智能体、百万级上下文、深度推理、代码与科学计算,专为复杂专业工作流、自主编程、长文档分析、企业级智能应用设计。 | TextImage | Text | $5 | $30 | $0.5 | - | 1M | 128K |
Gemini 2.5 Flash Gemini 2.5 Flash 是 Google DeepMind 于 2025 年 4 月 推出的多模态大模型,主打极速响应、百万级上下文、可控推理(Thinking Budget)与高性价比,是 Gemini 2.5 家族中面向大规模实时应用的主力版本。 | Text | TextImage | $0.3 | $2.5 | $0.03 | $1 | 1M | 64K |
Gemini 2.5 Flash Lite Gemini 2.5 Flash-Lite 是 Google DeepMind 于 2025 年 6 月推出的超轻量级多模态大模型,主打极致低成本、超低延迟、超高吞吐量,支持100 万 token 上下文与可控推理(Thinking Budget),是 Gemini 2.5 家族中面向大规模高并发、轻量实时应用(如分类、翻译、数据处理)的经济版主力。 | Text | TextImageAudioVideo | $0.1 | $0.4 | $0.01 | $0.08333 | 1M | 64K |
Gemini 2.5 Pro Gemini 2.5 Pro 是谷歌推出的最新 AI 模型迄今为止最先进的型号,擅长编码和复杂提示。通过“深度思考”,能在回应前进行推理,提升性能和准确性。模型在多个基准测试中表现卓越,在推理和代码生成方面,在 LMArena 排行榜上位居第一。支持文本、图像、音频、视频及代码的多模态输入。 | TextImageAudioVideo | Text | $2.5 | $15 | $0.25 | $4.5 | 1M | 65.5K |
Gemini 3 Flash Preview Gemini 3 Flash Preview 是 Google DeepMind 于 2025 年 12 月推出的预览版多模态大模型。主打极速推理、接近 Pro 级的智能水平、百万级上下文、多模态输入(文本 / 图像 / 音频 / 视频)与可控思考(Thinking Levels),专为智能代理、交互式开发、长文档分析、代码编程等高并发实时场景设计。 | Text | TextImageAudioVideo | $0.5 | $3 | $0.05 | $1 | 1M | 64K |
Gemini 3 Pro Gemini 3 Pro Preview是谷歌迄今为止最智能的模型系列,以先进的推理能力为基础。它旨在通过掌握智能体工作流、自主编码和复杂的多模态任务,将任何想法变为现实。 | TextImageAudioVideo | Text | $2 | $12 | $0.2 | $4.5 | 1M | 64K |
Gemini 3.1 Pro Gemini 3.1 是谷歌迄今为止最智能的模型系列,以先进的推理能力为基础。它旨在通过掌握智能体工作流、自主编码和复杂的多模态任务,将任何想法变为现实。gemini-3.1-pro-preview 最适合需要广泛的世界知识和跨模态的高级推理的复杂任务。 | TextImageAudioVideo | Text | $2 | $12 | $0.2 | $4.5 | 1M | 64K |
Glm 5 Turbo GLM-5-Turbo 是面向 OpenClaw 龙虾场景深度优化的基座模型。 其从训练阶段就针对龙虾任务的核心需求进行专项优化,增强如工具调用、指令遵循、定时与持续性任务、长链路执行等核心能力,使其在复杂、动态、长链路的任务中也真正具备可执行性。 | Text | Text | $1 | $3.714 | $0.257 | - | 200K | 128K |
Grok 4.1 Fast Non Reasoning Grok-4-1-fast-non-reasoning是xAI开发的一款 AI 模型,专为在生成响应和执行代理任务时实现最大速度而优化。与它的“推理”对应版本不同,这一变体省去了使用“思考标记”的过程,从而能够针对简单、直白的查询立即提供模式匹配式的答案。 | TextImage | Text | $0.2 | $0.5 | $0.05 | - | 2M | 64K |
Grok 4.1 Fast Reasoning Grok 4.1 在创造性、情感化和协作式交互方面表现卓越,能够更敏锐地捕捉细微意图,对话体验更具吸引力,人格特质保持高度一致,同时完整继承了前代产品犀利的智能表现与可靠性能。 | TextImage | Text | $0.2 | $0.5 | $0.05 | - | 2M | 64K |
Kimi K2.5 Kimi K2.5 是 Kimi 迄今最智能的模型,在 Agent、代码、视觉理解及一系列通用智能任务上取得开源 SoTA 表现。同时 Kimi K2.5 也是 Kimi 迄今最全能的模型,原生的多模态架构设计,同时支持视觉与文本输入、思考与非思考模式、对话与 Agent 任务。 | TextImage | Text | $0.571 | $3 | $0.1 | - | 256K | 32K |
Kimi k2 Kimi K2是一个突破性的混合专家模型,专为前沿知识、推理和编程任务中的卓越性能而设计。为自主行动和智能问题解决而构建。 | Text | Text | $0.571 | $2.286 | $0.143 | - | 262.1K | 32K |
Llama 4 Maverick Meta 最新的混合专家模型 | TextImage | Text | $0.5 | $0.75 | $0.125 | $0.5 | 1M | 65.5K |
MiniMax M2.1 MiniMax-M2.1是一款轻量级、前沿的大语言模型,针对编码、代理工作流程和现代应用开发进行了优化。仅激活了100亿个参数,它实现了在现实世界能力上的重大飞跃,同时保持了卓越的延迟、可扩展性和成本效率。 | Text | Text | $0.3 | $1.2 | $0.03 | $0.375 | 204.8K | 1.3M |
MiniMax M2.5 MiniMax-M2.5 在编程、工具调用和搜索、办公等生产力场景都达到或刷新了行业的 SOTA。 | Text | Text | $0.3 | $1.2 | $0.06 | $0.375 | 204.8K | 131.1K |
Mistral Large Mistral 旗舰模型,适用于复杂任务 | Text | Text | $2 | $6 | $0.5 | $2 | 131.1K | 8.2K |
Nano Banana Gemini 2.5 Flash Image(代号 “纳米香蕉”)是 Google DeepMind 于 2025 年 8 月推出的图像生成与编辑模型,主打极速文生图、精准自然语言编辑、多图融合、角色一致性与现实物理推理,是 Gemini 2.5 家族中面向创意设计、电商、内容创作的专业图像模型。 | Text | TextImage | $0.3 | $2.5 | $0.03 | $1 | 32K | 32K |
Nano Banana 2 Nano Banana 2 以主流价格和低延迟,提供高质量的图像生成与对话式编辑功能 | TextImage | TextImage | $0.5 | $60 | - | - | 131.1K | 32.8K |
Nano Banana Pro Gemini 3 pro image preview(Nano Banana pro)是Google Gemini系列中的下一代AI图像生成与编辑模型,是Gemini 2.5 Flash Image(Nano Banana)的升级版。该模型融合多模态Transformer和扩散模型,原生支持2K(2048×2048)及4K分辨率输出,在图像质量、文字渲染、物理推理等方面实现显著提升。 | TextImage | TextImage | $2 | $120 | - | - | 65.5K | 32.8K |
QwQ Plus 通义千问QwQ推理模型增强版,基于Qwen2.5模型训练的QwQ推理模型,通过强化学习大幅度提升了模型推理能力。模型数学代码等核心指标(AIME 24/25、livecodebench)以及部分通用指标(IFEval、LiveBench等)达到DeepSeek-R1 满血版水平。 | Text | Text | $0.229 | $0.571 | - | - | 128K | 7K |
Qwen 3.5 397B A17B Qwen3.5系列397B-A17B原生视觉语言模型,基于混合架构设计,融合了线性注意力机制与稀疏混合专家模型,实现了更高的推理效率。在语言理解、逻辑推理、代码生成、智能体任务、图像理解、视频理解、图形用户界面(GUI)等多种任务中,均展现出与当前顶尖前沿模型相媲美的卓越性能。具备强大的代码生成与智能体能力,对于各类智能体场景具有良好的泛化性。 | TextImageVideo | Text | $0.429 | $2.571 | - | - | 256K | 64K |
Qwen 3.5 Flash Qwen3.5原生视觉语言系列Flash模型,基于混合架构设计,融合了线性注意力机制与稀疏混合专家模型,实现了更高的推理效率。模型效果在纯文本与多模态方面相较3系列均实现飞跃式进步;响应速度快,兼具推理速度和性能。 | TextImage | Text | $0.171 | $1.714 | $0.017 | $0.214 | 1M | 64K |
Qwen 3.5 Plus Qwen3.5原生视觉语言系列Plus模型,基于混合架构设计,融合了线性注意力机制与稀疏混合专家模型,实现了更高的推理效率。在多项任务评测中,3.5系列均展现出与当前顶尖前沿模型相媲美的卓越性能,模型效果在纯文本与多模态方面相较3系列均实现飞跃式进步。 | TextImageVideo | Text | $0.57 | $3.426 | $0.06 | $0.714 | 1M | 64K |
Qwen3 Max Preview 最新的Qwen3-Max-Preview模型:Qwen3 系列Max模型Preview版本,相较Qwen 2.5系列整体通用能力有大幅度提升,中英文通用文本理解能力、复杂指令遵循能力、主观开放任务能力、多语言能力、工具调用能力均显著增强;模型知识幻觉更少 | Text | Text | $2.143 | $8.571 | $0.429 | - | 256K | 64K |
Step 3.5 Flash Step 3.5 Flash 模型在 Agent 场景和数学任务上能力逼近闭源模型,能够胜任复杂、长链条任务,是阶跃星辰迄今最强的开源基座模型。 | Text | Text | $0.1 | $0.3 | - | - | 256K | 128K |