image-2 是啥:OpenAI 2026 年发布的新一代生图模型,API 里叫
gpt-image-2。相对 DALL-E 3 的代差级升级:中文 prompt 不再"先翻译再理解"丢细节,文字渲染(海报 / 表情包里的字)是它最大的优势。
跟 DALL-E 3 / Midjourney / Flux 怎么比
| 维度 | image-2 | DALL-E 3 | Midjourney v7 | Flux 1.1 Pro |
|---|---|---|---|---|
| 文字渲染 | ★★★★★ | ★★ | ★★★ | ★★★★ |
| 中文 prompt 直出 | ★★★★★ | ★★★ | ★★★ | ★★★ |
| API 可用性 | 是 | 是 | 否(只 Discord) | 是 |
| 上手门槛 | 低(OpenAI 兼容接口) | 低 | 高(学权重语法) | 中 |
选型逻辑很简单:要走 API、要出带中文文字的图(海报 / 封面 / 表情包),image-2 基本是唯一解;纯艺术风、不需要 API 的,Midjourney 仍有一席之地。价格以 Glouth Link 定价页 实时为准。
API 调用 — 最简示例
from openai import OpenAI
client = OpenAI(base_url="https://www.glouth.com/link/v1", api_key="sk-glouth-...")
resp = client.images.generate(
model="gpt-image-2",
prompt="一只穿着唐装的橘猫,水墨风格",
size="1024x1024",
quality="hd",
n=1,
)
print(resp.data[0].url)
参数说明
| 参数 | 类型 | 默认 | 说明 |
|---|---|---|---|
| model | string | 必填 | gpt-image-2 |
| prompt | string | 必填 | 中英文都行,中文无需先译成英文 |
| size | string | 1024x1024 | 方图;横 / 竖版尺寸以接口实际支持为准 |
| quality | enum | standard | standard / hd,出片质量与价格双升 |
| style | enum | vivid | vivid(浓郁)/ natural(自然) |
| response_format | enum | url | url / b64_json |
| n | int | 1 | 一次出几张 |
计费怎么算
按张计费,价格随分辨率和质量档变化(hd 比 standard 贵),实时单价看 Link 定价页。省钱三招:
- 草稿阶段用
standard,定稿再上hd; - prompt 调试时
n=1,别一上来就批量; - 同一构图反复改字 / 改色,把"底版 prompt"存成模板复用,别每次从零生成。
prompt 工程 7 个实战模板
1. 电商商品图(白底)
[商品名],纯白背景,studio lighting,产品摄影,1:1,锐利细节,
材质:[木质/金属/塑料],角度:[斜 45 度/正面]
2. 头像(写实 / 半身)
半身肖像,[男/女],[年龄],[发型/眼神/服装],
摄影:[Sony A7R5/85mm f1.4],光线:[柔光箱/自然窗光],
氛围:[职业/温暖/冷峻],4k
3. 海报(带文字)
海报设计,[文字内容] 居中大字,[字体风格],
背景:[渐变/纹理/插画],色调:[主色#FFD400 + 辅色#1A1F2E],
版式:[杂志风/Bauhaus/极简]
4. 插画(扁平 / 描边)
扁平插画,[主体与动作],[场景],
风格:[Notion 风/孟菲斯/手绘描边],色板:[3-4 个主色],
构图:[居中/黄金分割],细节适中,矢量感
5. 平面 / Logo 草案
极简 logo 概念,[品牌名/首字母],行业:[行业],
形状语言:[几何/圆润/锐利],单色优先,
背景纯白,居中,留白充足(注:成稿仍需设计师矢量重绘)
6. 写实场景
[场景描述,谁在哪干什么],真实摄影感,
镜头:[35mm 广角/85mm 人像],时间:[清晨/黄昏/夜晚],
天气与光线:[逆光/阴天柔光],胶片颗粒轻微
7. 卡通 / 表情包
Q 版卡通,[角色],[夸张表情:汗/泪/星星眼],
上方大字:[文案],粗描边,贴纸风,白色描边外框,
背景透明或纯色
文生图 / 图生图 / 编辑,走哪个接口
/v1/images/generations— 文生图:一段 prompt 出新图,本文主角;/v1/images/edits— 编辑(inpainting):原图 + 蒙版 + prompt,只改蒙版区域(换背景、p 掉杂物);/v1/images/variations— 变体:喂一张图出 N 张同风格变体,适合"这张感觉对了,再来几张挑"。
商用注意 3 件事
- 按 OpenAI 条款,你对自己生成的图拥有使用权,可以商用;
- 但 prompt 里别指名模仿在世艺术家、真人肖像、注册商标 — 图能出来,法律风险是你的;
- 给客户交付前过一遍:有没有躺枪的真人脸、有没有相似度过高的知名 IP 元素、文字内容是否合规。
在 Glouth 调用和官方有什么差别
接口和参数完全 OpenAI 兼容,代码一行不用改(只换 base_url)。差别在体验:人民币余额直充(微信 / 支付宝)、不用海外卡、生图这种长请求做了超时与重试优化、出问题有中文客服。生图单价以 Link 定价页 为准。
FAQ
Q:中文 prompt 和英文 prompt 哪个效果好? image-2 对中文的理解已经不需要"先想好英文再翻译"。中文场景词(水墨、国潮、春联)直接写中文反而更准;涉及摄影术语(focal length、studio lighting)用英文更稳。
Q:生成的图字还是糊 / 错字怎么办? 把要渲染的文字用引号括起来、放在 prompt 最前面、控制在 10 个字以内;一次只渲染一段文字,多段分多张图再合成。
Q:一张图大概多久? 正常几秒到几十秒,hd 档更久。接到自己系统里时把超时设到 120 秒以上,Glouth 网关对生图长请求已做保活。