image-2 (gpt-image-2) 怎么用?2026 OpenAI 生图 API 完整教程(含 prompt 模板)

image-2(gpt-image-2)是 OpenAI 2026 年最新的生图模型,这篇是面向小白的完整上手教程。文章讲清它和 DALL-E 3、Midjourney、Flux 的画质与风格差异、API 怎么调用、生图按什么计费、商用许可边界,并附 7 个可直接套用的 prompt 模板,涵盖产品图、海报、头像等常见场景。

image-2 是啥:OpenAI 2026 年发布的新一代生图模型,API 里叫 gpt-image-2。相对 DALL-E 3 的代差级升级:中文 prompt 不再"先翻译再理解"丢细节,文字渲染(海报 / 表情包里的字)是它最大的优势。

跟 DALL-E 3 / Midjourney / Flux 怎么比

维度	image-2	DALL-E 3	Midjourney v7	Flux 1.1 Pro
文字渲染	★★★★★	★★	★★★	★★★★
中文 prompt 直出	★★★★★	★★★	★★★	★★★
API 可用性	是	是	否(只 Discord)	是
上手门槛	低(OpenAI 兼容接口)	低	高(学权重语法)	中

选型逻辑很简单:要走 API、要出带中文文字的图(海报 / 封面 / 表情包),image-2 基本是唯一解;纯艺术风、不需要 API 的,Midjourney 仍有一席之地。价格以 Glouth Link 定价页实时为准。

API 调用 — 最简示例

from openai import OpenAI
client = OpenAI(base_url="https://www.glouth.com/link/v1", api_key="sk-glouth-...")

resp = client.images.generate(
    model="gpt-image-2",
    prompt="一只穿着唐装的橘猫,水墨风格",
    size="1024x1024",
    quality="hd",
    n=1,
)
print(resp.data[0].url)

参数说明

参数	类型	默认	说明
model	string	必填	`gpt-image-2`
prompt	string	必填	中英文都行,中文无需先译成英文
size	string	`1024x1024`	方图;横 / 竖版尺寸以接口实际支持为准
quality	enum	`standard`	`standard` / `hd`,出片质量与价格双升
style	enum	`vivid`	`vivid`(浓郁)/ `natural`(自然)
response_format	enum	`url`	`url` / `b64_json`
n	int	1	一次出几张

计费怎么算

按张计费,价格随分辨率和质量档变化(hd 比 standard 贵),实时单价看 Link 定价页。省钱三招:

草稿阶段用 standard,定稿再上 hd;
prompt 调试时 n=1,别一上来就批量;
同一构图反复改字 / 改色,把"底版 prompt"存成模板复用,别每次从零生成。

prompt 工程 7 个实战模板

1. 电商商品图(白底)

[商品名],纯白背景,studio lighting,产品摄影,1:1,锐利细节,
材质:[木质/金属/塑料],角度:[斜 45 度/正面]

2. 头像(写实 / 半身)

半身肖像,[男/女],[年龄],[发型/眼神/服装],
摄影:[Sony A7R5/85mm f1.4],光线:[柔光箱/自然窗光],
氛围:[职业/温暖/冷峻],4k

3. 海报(带文字)

海报设计,[文字内容] 居中大字,[字体风格],
背景:[渐变/纹理/插画],色调:[主色#FFD400 + 辅色#1A1F2E],
版式:[杂志风/Bauhaus/极简]

4. 插画(扁平 / 描边)

扁平插画,[主体与动作],[场景],
风格:[Notion 风/孟菲斯/手绘描边],色板:[3-4 个主色],
构图:[居中/黄金分割],细节适中,矢量感

5. 平面 / Logo 草案

极简 logo 概念,[品牌名/首字母],行业:[行业],
形状语言:[几何/圆润/锐利],单色优先,
背景纯白,居中,留白充足(注:成稿仍需设计师矢量重绘)

6. 写实场景

[场景描述,谁在哪干什么],真实摄影感,
镜头:[35mm 广角/85mm 人像],时间:[清晨/黄昏/夜晚],
天气与光线:[逆光/阴天柔光],胶片颗粒轻微

7. 卡通 / 表情包

Q 版卡通,[角色],[夸张表情:汗/泪/星星眼],
上方大字:[文案],粗描边,贴纸风,白色描边外框,
背景透明或纯色

文生图 / 图生图 / 编辑,走哪个接口

/v1/images/generations — 文生图:一段 prompt 出新图,本文主角;
/v1/images/edits — 编辑(inpainting):原图 + 蒙版 + prompt,只改蒙版区域(换背景、p 掉杂物);
/v1/images/variations — 变体:喂一张图出 N 张同风格变体,适合"这张感觉对了,再来几张挑"。

商用注意 3 件事

按 OpenAI 条款,你对自己生成的图拥有使用权,可以商用;
但 prompt 里别指名模仿在世艺术家、真人肖像、注册商标 — 图能出来,法律风险是你的;
给客户交付前过一遍:有没有躺枪的真人脸、有没有相似度过高的知名 IP 元素、文字内容是否合规。

在 Glouth 调用和官方有什么差别

接口和参数完全 OpenAI 兼容,代码一行不用改(只换 base_url)。差别在体验:人民币余额直充(微信 / 支付宝)、不用海外卡、生图这种长请求做了超时与重试优化、出问题有中文客服。生图单价以 Link 定价页为准。

FAQ

Q:中文 prompt 和英文 prompt 哪个效果好? image-2 对中文的理解已经不需要"先想好英文再翻译"。中文场景词(水墨、国潮、春联)直接写中文反而更准;涉及摄影术语(focal length、studio lighting)用英文更稳。

Q:生成的图字还是糊 / 错字怎么办? 把要渲染的文字用引号括起来、放在 prompt 最前面、控制在 10 个字以内;一次只渲染一段文字,多段分多张图再合成。

Q:一张图大概多久? 正常几秒到几十秒,hd 档更久。接到自己系统里时把超时设到 120 秒以上,Glouth 网关对生图长请求已做保活。