← 全部指南
TUTORIAL2026/06/10· 4 min read

image-2 (gpt-image-2) 怎么用?2026 OpenAI 生图 API 完整教程(含 prompt 模板)

image-2(gpt-image-2)是 OpenAI 2026 年最新的生图模型,这篇是面向小白的完整上手教程。文章讲清它和 DALL-E 3、Midjourney、Flux 的画质与风格差异、API 怎么调用、生图按什么计费、商用许可边界,并附 7 个可直接套用的 prompt 模板,涵盖产品图、海报、头像等常见场景。

G

Glouth 编辑部

原创内容 · 真实落地

image-2 是啥:OpenAI 2026 年发布的新一代生图模型,API 里叫 gpt-image-2。相对 DALL-E 3 的代差级升级:中文 prompt 不再"先翻译再理解"丢细节,文字渲染(海报 / 表情包里的字)是它最大的优势

跟 DALL-E 3 / Midjourney / Flux 怎么比

维度image-2DALL-E 3Midjourney v7Flux 1.1 Pro
文字渲染★★★★★★★★★★★★★★
中文 prompt 直出★★★★★★★★★★★★★★
API 可用性否(只 Discord)
上手门槛低(OpenAI 兼容接口)高(学权重语法)

选型逻辑很简单:要走 API、要出带中文文字的图(海报 / 封面 / 表情包),image-2 基本是唯一解;纯艺术风、不需要 API 的,Midjourney 仍有一席之地。价格以 Glouth Link 定价页 实时为准。

API 调用 — 最简示例

from openai import OpenAI
client = OpenAI(base_url="https://www.glouth.com/link/v1", api_key="sk-glouth-...")

resp = client.images.generate(
    model="gpt-image-2",
    prompt="一只穿着唐装的橘猫,水墨风格",
    size="1024x1024",
    quality="hd",
    n=1,
)
print(resp.data[0].url)

参数说明

参数类型默认说明
modelstring必填gpt-image-2
promptstring必填中英文都行,中文无需先译成英文
sizestring1024x1024方图;横 / 竖版尺寸以接口实际支持为准
qualityenumstandardstandard / hd,出片质量与价格双升
styleenumvividvivid(浓郁)/ natural(自然)
response_formatenumurlurl / b64_json
nint1一次出几张

计费怎么算

按张计费,价格随分辨率和质量档变化(hd 比 standard 贵),实时单价看 Link 定价页。省钱三招:

  1. 草稿阶段用 standard,定稿再上 hd;
  2. prompt 调试时 n=1,别一上来就批量;
  3. 同一构图反复改字 / 改色,把"底版 prompt"存成模板复用,别每次从零生成。

prompt 工程 7 个实战模板

1. 电商商品图(白底)

[商品名],纯白背景,studio lighting,产品摄影,1:1,锐利细节,
材质:[木质/金属/塑料],角度:[斜 45 度/正面]

2. 头像(写实 / 半身)

半身肖像,[男/女],[年龄],[发型/眼神/服装],
摄影:[Sony A7R5/85mm f1.4],光线:[柔光箱/自然窗光],
氛围:[职业/温暖/冷峻],4k

3. 海报(带文字)

海报设计,[文字内容] 居中大字,[字体风格],
背景:[渐变/纹理/插画],色调:[主色#FFD400 + 辅色#1A1F2E],
版式:[杂志风/Bauhaus/极简]

4. 插画(扁平 / 描边)

扁平插画,[主体与动作],[场景],
风格:[Notion 风/孟菲斯/手绘描边],色板:[3-4 个主色],
构图:[居中/黄金分割],细节适中,矢量感

5. 平面 / Logo 草案

极简 logo 概念,[品牌名/首字母],行业:[行业],
形状语言:[几何/圆润/锐利],单色优先,
背景纯白,居中,留白充足(注:成稿仍需设计师矢量重绘)

6. 写实场景

[场景描述,谁在哪干什么],真实摄影感,
镜头:[35mm 广角/85mm 人像],时间:[清晨/黄昏/夜晚],
天气与光线:[逆光/阴天柔光],胶片颗粒轻微

7. 卡通 / 表情包

Q 版卡通,[角色],[夸张表情:汗/泪/星星眼],
上方大字:[文案],粗描边,贴纸风,白色描边外框,
背景透明或纯色

文生图 / 图生图 / 编辑,走哪个接口

  • /v1/images/generations文生图:一段 prompt 出新图,本文主角;
  • /v1/images/edits编辑(inpainting):原图 + 蒙版 + prompt,只改蒙版区域(换背景、p 掉杂物);
  • /v1/images/variations变体:喂一张图出 N 张同风格变体,适合"这张感觉对了,再来几张挑"。

商用注意 3 件事

  1. 按 OpenAI 条款,你对自己生成的图拥有使用权,可以商用;
  2. 但 prompt 里别指名模仿在世艺术家、真人肖像、注册商标 — 图能出来,法律风险是你的;
  3. 给客户交付前过一遍:有没有躺枪的真人脸、有没有相似度过高的知名 IP 元素、文字内容是否合规。

在 Glouth 调用和官方有什么差别

接口和参数完全 OpenAI 兼容,代码一行不用改(只换 base_url)。差别在体验:人民币余额直充(微信 / 支付宝)、不用海外卡、生图这种长请求做了超时与重试优化、出问题有中文客服。生图单价以 Link 定价页 为准。

FAQ

Q:中文 prompt 和英文 prompt 哪个效果好? image-2 对中文的理解已经不需要"先想好英文再翻译"。中文场景词(水墨、国潮、春联)直接写中文反而更准;涉及摄影术语(focal length、studio lighting)用英文更稳。

Q:生成的图字还是糊 / 错字怎么办? 把要渲染的文字用引号括起来、放在 prompt 最前面、控制在 10 个字以内;一次只渲染一段文字,多段分多张图再合成。

Q:一张图大概多久? 正常几秒到几十秒,hd 档更久。接到自己系统里时把超时设到 120 秒以上,Glouth 网关对生图长请求已做保活。

相关:更多指南

继续读

看全部 →
TUTORIAL

ChatGPT 成品号(mail.com 邮箱)怎么用?登录 + 邮箱收验证码完整教程(2026)

买的 mail.com 进阶版 ChatGPT 成品号怎么用?本文手把手教你看懂账号和邮箱两张卡、登录 chatgpt.com、登录要的 6 位验证码怎么去 www.mail.com 收件箱里收、收不…

TUTORIAL

AI 能直接操作你的电脑了:Computer Use / Agent / Operator 是什么、能干啥、怎么安全用(2026)

2026 年的 AI 已经能看屏幕、动鼠标、跨网站把一整件事做完,Computer Use、Agent、Operator 这些词到底是什么意思?本文一次讲清这三类能直接操作电脑的 AI 分别指什么、擅…

TUTORIAL

ChatGPT 变笨/降智了是真的吗?GPT 降智真相 + 怎么用才一直满血(2026)

ChatGPT 变笨、降智是真的还是错觉?截至2026年,答案是一半真一半假。真有其事的情况包括高峰期限速、被自动路由到小模型、上下文被截断、账号触发风控、共享号被多人挤占;而错觉往往来自选错了模型档…

下一步

动手试试 Glouth

注册赠 ¥5 通用额度,几分钟跑通你的第一次调用。

注册 →看 Chat看 Link API 文档