GPT-Image 1.5
GPT-Image 1.5 是 OpenAI 的下一代旗舰图像生成模型,现已在 ChatGPT Images 体验和 API 中作为 GPT-Image-1.5 提供。它提供更快的生成速度、增强的指令遵循能力,以及保留照明、构图和文本清晰度等关键视觉特征的精细编辑工具。官方博客介绍请参见此链接:全新 ChatGPT Images 已上线。立即在Piooy AI 图像生成器中试用!
GPT-Image 1.5
关于 GPT-Image 1.5
GPT-Image 1.5 专注于创建难以与真实照片区分的照片级真实图像。该模型在保持光照、构图和角色一致性的同时,提供精确的编辑控制,使其成为需要高度真实感的专业项目的理想选择。

核心特性
探索 GPT-Image 1.5 在照片级真实图像生成、精准编辑和复杂指令理解方面的强大能力
核心功能概览
精准编辑能力
GPT-Image 1.5 在图像编辑方面表现出色,能够根据用户意图进行精确的局部修改,同时完美保持原图的光照效果、整体构图和角色特征。无论是更换服装、调整发型还是添加配饰,都能确保编辑后的图像自然真实,没有违和感。
make his shirt red, his hat yellow, and add a skateboard under his arm
展示精准的服装颜色修改能力,保持光照和背景一致

add chaotic kids in the background throwing things
在保持原有主体的同时添加背景元素

无与伦比的角色一致性
这是 GPT-Image 1.5 最强大的核心能力之一。模型能够在多张图像、多次编辑中始终保持同一角色的外貌、表情和特征完全一致。这对于创建连续的故事板、品牌角色设计或需要多场景展示的项目至关重要。
Combine the two men and the dog in a 2000s film camera-style photo of them looking bored at a kids birthday party
成功合并三个独立主体,同时保持原始外貌特征

复杂指令遵循
GPT-Image 1.5 能够理解和执行极其复杂的创作指令,包括精确的网格布局、多对象排列、特定的构图要求等。模型不仅能理解「做什么」,还能精确理解「怎么做」和「放在哪里」,确保生成的图像完全符合您的详细规划。
draw a 6x6 grid. Make a 6 (columns) by 6 (rows) grid of: Row 1: the Greek letter beta, a beach ball, a lemon, a robot, a red pepper, a tennis ball. Row 2: a coffee mug, a pineapple, a stop sign, a basketball, a light bulb, a strawberry...
生成数学上完美的 6x6 网格,所有 36 个项目位置精确

顶级文本渲染
GPT-Image 1.5 在文本渲染方面达到了行业领先水平,能够生成清晰可读的小字体、复杂的 Markdown 格式、表格数据等。无论是报纸版面、技术文档还是信息图表,都能呈现出专业级的排版效果。
There is a newspaper on a desk. The newspaper shows the markdown below laid out as a natural newspaper article. Preserve all content, formatting, and numbers exactly. Include headers, paragraphs, and a benchmark comparison table.
渲染包含标题、段落和基准测试表格的完整报纸页面

创意风格转换
模型能够理解并执行复杂的风格转换指令,将普通照片转换为特定时代的艺术作品、电影海报或其他创意形式。在转换过程中,模型会智能调整构图、色彩、排版等元素,同时保持角色的可识别性。
Make an old school golden age hollywood movie poster of a movie called 'CODEX' from the image of these two men. Change the background to a dramatic scene. Change costumes to period-appropriate attire. Change names to Wojciech Zaremba and Greg Brockman.
将现代照片转换为复古电影海报,保持角色一致性

4 倍生成速度
GPT-Image 1.5 在保持高质量输出的同时,实现了显著的速度提升。相比前代模型,生成速度提高了 4 倍,让您能够更快地迭代创意、测试不同方案,大幅提升工作效率。
A 1970s London street scene with clear text 'ImageGen 1.5' on a storefront sign, showing many people and detailed architecture
复杂场景快速生成,展示 4 倍速度提升

常见问题
GPT-Image 1.5 FAQ
GPT-Image 1.5 专注于照片级真实感,在保持光照、构图和角色一致性方面表现出色。它比前代模型快4倍,同时提供更精确的编辑控制。
用户评价
GPT-Image 1.5 的照片真实感令人惊叹。我用它为客户创建产品摄影,效果几乎与专业摄影师拍摄的无异。
莎拉·陈
内容创作者
准备开始创作了吗?
立即体验 GPT-Image 1.5 的强大功能