跳转到主要内容

标签(标签)

资源精选(342) Go开发(108) Go语言(103) Go(99) LLM(84) angular(83) 大语言模型(67) 人工智能(56) 前端开发(50) LangChain(43) golang(43) 机器学习(40) Go工程师(38) Go程序员(38) Go开发者(36) React(34) Go基础(29) Python(24) Vue(23) Web开发(20) 深度学习(20) Web技术(19) 精选资源(19) Java(19) ChatGTP(17) Cookie(16) android(16) 前端框架(13) JavaScript(13) Next.js(12) ChatGPT(11) LLMOps(11) 聊天机器人(11) 安卓(11) typescript(10) 资料精选(10) mlops(10) NLP(10) 第三方Cookie(9) 智能体(9) Redwoodjs(9) RAG(9) Go语言中级开发(9) 自然语言处理(9) PostgreSQL(9) 区块链(9) 安全(9) 全栈开发(8) OpenAI(8) Linux(8) AI(8) GraphQL(8) iOS(8) 数据科学(8) 软件架构(7) 提示工程(7) Go语言高级开发(7) AWS(7) C++(7) whisper(6) Prisma(6) 隐私保护(6) Agent(6) JSON(6) DevOps(6) 数据可视化(6) wasm(6) 计算机视觉(6) 算法(6) Rust(6) 微服务(6) 隐私沙盒(5) FedCM(5) 语音识别(5) Angular开发(5) 快速应用开发(5) 生成式AI(5) LLaMA(5) 低代码开发(5) Go测试(5) gorm(5) REST API(5) kafka(5) 推荐系统(5) WebAssembly(5) GameDev(5) 数据分析(5) CMS(5) CSS(5) machine-learning(5) 机器人(5) 游戏开发(5) Blockchain(5) Web安全(5) nextjs(5) Kotlin(5) 低代码平台(5) 机器学习资源(5) Go资源(5) Nodejs(5) PHP(5) Swift(5) RAG架构(4) devin(4) LLM Agent(4) Blitz(4) javascript框架(4) Redwood(4) GDPR(4) 生成式人工智能(4) Angular16(4) Alpaca(4) 编程语言(4) SAML(4) JWT(4) JSON处理(4) Go并发(4) 移动开发(4) 移动应用(4) security(4) 隐私(4) spring-boot(4) 物联网(4) 网络安全(4) API(4) Ruby(4) 信息安全(4) flutter(4) MCP(3) 专家智能体(3) Chrome(3) CHIPS(3) 3PC(3) SSE(3) 人工智能软件工程师(3) Remix(3) Ubuntu(3) GPT4All(3) 模型评估(3) 软件开发(3) 问答系统(3) 开发工具(3) 最佳实践(3) RxJS(3) SSR(3) Node.js(3) Dolly(3) 移动应用开发(3) 低代码(3) IAM(3) Web框架(3) CORS(3) 基准测试(3) Go语言数据库开发(3) Oauth2(3) 并发(3) 主题(3) Theme(3) earth(3) nginx(3) 软件工程(3) azure(3) keycloak(3) 生产力工具(3) gpt3(3) 工作流(3) C(3) jupyter(3) 认证(3) prometheus(3) GAN(3) Spring(3) 逆向工程(3) 应用安全(3) Docker(3) Django(3) Machine Learning(3) R(3) .NET(3) 大数据(3) Hacking(3) 渗透测试(3) C++资源(3) Mac(3) 微信小程序(3) Python资源(3) JHipster(3) SQL(2) Apache(2) Hashicorp Vault(2) Spring Cloud Vault(2) Go语言Web开发(2) Go测试工程师(2) WebSocket(2) 容器化(2) AES(2) 加密(2) 输入验证(2) ORM(2) Fiber(2) Postgres(2) Gorilla Mux(2) Go数据库开发(2) 模块(2) 泛型(2) 指针(2) HTTP(2) PostgreSQL开发(2) Vault(2) K8s(2) Spring boot(2) R语言(2) 深度学习资源(2) 半监督学习(2) semi-supervised-learning(2) architecture(2) 普罗米修斯(2) 嵌入模型(2) productivity(2) 编码(2) Qt(2) 前端(2) Rust语言(2) NeRF(2) 神经辐射场(2) 元宇宙(2) CPP(2) spark(2) 流处理(2) Ionic(2) 人体姿势估计(2) human-pose-estimation(2) 视频处理(2) deep-learning(2) kotlin语言(2) kotlin开发(2) burp(2) Chatbot(2) npm(2) quantum(2) OCR(2) 游戏(2) game(2) 内容管理系统(2) MySQL(2) python-books(2) pentest(2) opengl(2) IDE(2) 漏洞赏金(2) Web(2) 知识图谱(2) PyTorch(2) 数据库(2) reverse-engineering(2) 数据工程(2) swift开发(2) rest(2) robotics(2) ios-animation(2) 知识蒸馏(2) 安卓开发(2) nestjs(2) solidity(2) 爬虫(2) 面试(2) 容器(2) C++精选(2) 人工智能资源(2) 备忘单(2) 编程书籍(2) angular资源(2) 速查表(2) cheatsheets(2) SecOps(2) mlops资源(2) R资源(2) DDD(2) 架构设计模式(2) 量化(2) Hacking资源(2) 强化学习(2) flask(2) 设计(2) 性能(2) Sysadmin(2) 系统管理员(2) Java资源(2) 机器学习精选(2) android资源(2) android-UI(2) Mac资源(2) iOS资源(2) Vue资源(2) flutter资源(2) JavaScript精选(2) JavaScript资源(2) Rust开发(2) deeplearning(2) RAD(2)

category

要在Vertex AI上使用Imagen,您必须提供要生成或编辑的内容的文本描述。这些描述称为提示,这些提示是您在Vertex AI上与Generative AI沟通的主要方式。

本指南向您展示了修改文本到图像提示的部分内容如何产生不同的结果,并为您提供了可以创建的图像示例。本指南还提供了如何使用文本提示和迭代编辑图像的指导。

产品使用


要查看与Vertex AI上的Imagen相关的使用标准和内容限制,请参阅使用指南。

内容过滤-输入文本、上传的图像和生成的图像


生成的图像会被过滤掉不需要或有害的内容。同样,Vertex AI上的Imagen接收到的任何输入都会被检查是否有冒犯性内容。这包括图像编辑时的输入文本提示和上传的照片。有关更多信息,请参阅Imagen的负责任人工智能和使用指南。

您还可以使用Google Cloud上的报告可疑滥用表单,报告Vertex AI上Imagen的可疑滥用行为或任何包含不适当材料或不准确信息的生成输出。

快速写作基础(主题、上下文和风格)


虽然没有一种方法可以写出好的提示,但添加一些关键字和修饰语将帮助你更接近最终目标。提示不需要很长或很复杂,但大多数好的提示都是描述性和清晰的。

一个好的起点可以是考虑主题、背景和风格。

强调主题、语境和风格
图文:一座被摩天大楼环绕的现代公寓楼(主题)的草图(风格)(上下文和背景)。


主题:

在任何提示下,首先要考虑的是主题:你想要拍摄的对象、人、动物或风景。

上下文和背景:

同样重要的是主题所处的背景或语境。试着把你的主题放在各种背景中。例如,白色背景的工作室,户外或室内环境。

样式:

最后,添加您想要的图像样式。风格可以是一般的(绘画、照片、素描),也可以是非常具体的(粉彩画、木炭画、等距3D)。

编写提示的第一个版本后,通过添加更多详细信息来优化提示,直到找到所需的图像。迭代很重要。首先确立你的核心想法,然后完善和扩展这个核心想法,直到生成的图像接近你的愿景。


提示:春天湖边的公园

提示:一个公园在春天的湖边,太阳从湖面上落下,黄金时段

提示:一个公园在春天的湖边,太阳从湖面上落下,金色的时刻,红色的野花
 

Imagen 3提示写作


查看Imagen for Generation模型卡(https://console.cloud.google.com/vertex-ai/publishers/google/model-garden/imagen-4.0-generate-preview-06-06)

Imagen 3可以将你的想法转化为详细的图像,无论你的提示是短是长,都是详细的。通过反复提示来完善你的愿景,添加细节,直到你达到完美的结果。

简短的提示可让您快速生成图像。

Imagen 3简短提示示例
提示:一位20多岁女性的特写照片、街头摄影、电影剧照、柔和的橙色暖色调
 

较长的提示允许您添加特定细节并构建图像。

Imagen 3长提示示例
提示:一张20多岁的女性使用街头摄影风格的迷人照片。图像应该看起来像一部静止的电影,带有柔和的橙色暖色调。
Imagen 3提示写作的其他建议:

  • 使用描述性语言:使用详细的形容词和副词为图像3描绘一幅清晰的画面。
  • 提供背景:如有必要,包括背景信息以帮助人工智能理解。
  • 参考特定的艺术家或风格:如果你有特定的审美观,参考特定的画家或艺术运动可能会有所帮助。
  • 使用提示工程工具:考虑探索提示工程工具或资源,以帮助您完善提示并获得最佳结果。
  • 增强个人和团体图像中的面部细节:
    • 指定面部细节作为照片的焦点(例如,在提示中使用“肖像”一词)。
    • 考虑使用更大的模型,如Imagen 3,而不是Imagen 3 Fast,以提高细节。

在图像中生成文本


Imagen 3在图像中添加文本的能力开辟了创造性图像生成的可能性。使用以下指南充分利用此功能:

  • 自信地迭代:你可能需要重新生成图像,直到达到你想要的外观。Imagen的文本集成仍在发展中,有时多次尝试会产生最佳结果。
  • 保持简短:将文本限制在25个字符或更少,以实现最佳生成。
  • 多个短语:尝试使用两三个不同的短语来提供额外的信息。为了更简洁的作文,避免超过三个短语。

Imagen 3生成文本示例
提示:一张以粗体字“Summerland”为标题的海报,下面是“Summer never feel so good”的口号

  • 指南放置:虽然Imagen可以尝试按照指示定位文本,但您应该预料到偶尔会有变化。此功能正在不断改进。
  • 激发字体风格:指定一种通用字体风格,以微妙地影响Imagen的选择。不要依赖精确的字体复制,而是期待创造性的解释。
  • 字体大小:指定字体大小或大小的一般指示(例如,小、中、大)以影响字体大小的生成。

提示参数化


为了更好地控制输出结果,在使用Imagen API或Vertex AI SDK for Python时,您可能会发现将输入参数化为Imagen很有帮助。例如,假设您希望您的客户能够为他们的业务生成徽标,并且您希望确保徽标始终在纯色背景上生成。您还希望限制客户端可以从菜单中选择的选项。

在此示例中,您可以创建类似于以下内容的参数化提示:

一个{company_arease}公司的{logo_style}徽标,背景为纯色。包括文本{company_name}。


在您的自定义用户界面中,客户可以使用菜单输入参数,他们选择的值将填充Imagen收到的提示。

例如:

提示:一家医疗保健公司的极简主义标志,背景为纯色。包括“旅程”文本。

Imagen 3提示参数化示例1

提示:一家软件公司的现代标志,背景为纯色。包括文本筒仓。

Imagen 3提示参数化示例2

提示:一家烘焙公司的传统标志,背景为纯色。包含文本“种子”。

Imagen 3提示参数化示例3

风格:摄影


提示包括:“一张…的照片”


要使用这种风格,首先使用关键字,清楚地告诉顶点AI上的Imagen你正在寻找一张照片。以“…的照片”开始提示。例如:

逼真的样本图像1
提示:厨房里的咖啡豆放在木制表面上的照片


逼真的样本图像2
提示:厨房柜台上一块巧克力棒的照片


真实感样本图像3
提示:一张以水为背景的现代建筑照片
图像来源:每张图像都是使用Imagen 3模型的相应文本提示生成的。

风格:插图与艺术


提示包括:“一幅画…”,“一幅…的素描”
艺术风格从铅笔素描等单色风格到超现实数字艺术各不相同。例如,以下图像使用相同的提示,但风格不同:

“一种以摩天大楼为背景的棱角运动型电动轿车的[艺术风格或创作技巧]”

艺术样本图像
提示:一幅有棱角的技术铅笔画。..
艺术样本图像


提示:一幅有棱角的木炭画。..


艺术样本图像
提示:一幅有棱角的彩色铅笔画。..


艺术样本图像
提示:一幅棱角分明的粉彩画。..


艺术样本图像
提示:一种棱角分明的数字艺术。..
艺术样本图像


提示:一张棱角分明的装饰艺术海报。..
图像来源:每张图像都是使用Imagen 2模型的相应文本提示生成的。

高级提示写作技巧


使用以下示例根据属性创建更具体的提示:摄影描述符、形状和材质、历史艺术运动和图像质量修改器。

摄影修改器


在以下示例中,您可以看到几个特定于摄影的修改器和参数。

相机接近-特写,从远处拍摄


特写相机样本图像
提示:咖啡豆特写照片


缩小的相机样本图像
提示:一张缩小的小袋照片
凌乱厨房里的咖啡豆


相机位置-空中,从下方

航空照片样本图像


提示:摩天大楼城市航拍
从样本图像下方观察


提示:一张从下面看到蓝天的森林树冠照片


灯光-自然、戏剧性、温暖、寒冷

自然光照样本图像
提示:现代扶手椅的工作室照片,自然采光
戏剧性的照明样本图像


提示:现代扶手椅的工作室照片,戏剧性的灯光


相机设置-运动模糊、柔焦、散景、肖像

运动模糊样本图像


提示:从汽车内部拍摄的一座摩天大楼城市的照片,带有运动模糊效果
柔焦样本图像


提示:夜间城市桥梁的柔焦照片


镜头类型-35mm、50mm、鱼眼、广角、微距

 

微距镜头样本图像


提示:树叶照片,微距镜头
鱼眼镜头样本图像


提示:街头摄影,纽约市,鱼眼镜头


胶片类型-黑白、宝丽来

极谱照片样品图像


提示:一只戴墨镜的狗的宝丽来肖像
黑白照片样本图像
提示:一只戴墨镜的狗的黑白照片


图像来源:每张图像都是使用Imagen 3模型的相应文本提示生成的。

形状和材料


提示包括:“…由…制成”,“…呈…形状”


这项技术的一个优点是,你可以创造出原本困难或不可能的图像。例如,您可以用不同的材料和纹理重新创建公司徽标。

形状和材料示例图像1
提示:一个奶酪做的行李袋


形状和材料示例图像2
提示:鸟形霓虹灯管


形状和材料示例图像3
提示:纸制扶手椅,工作室照片,折纸风格
图像来源:每张图像都是使用Imagen 3模型的相应文本提示生成的。

历史艺术参考


提示包括:“…风格…”
多年来,某些风格已经成为标志性的。以下是一些你可以尝试的历史绘画或艺术风格的想法。

“以[艺术时期或运动]的风格生成图像:风电场”

印象主义示例图像
提示:生成印象派绘画风格的图像:风电场


文艺复兴时期的典型形象
提示:生成文艺复兴时期绘画风格的图像:风电场


波普艺术示例图像
提示:生成波普艺术风格的图像:风电场
图像来源:每张图像都是使用Imagen 3模型的相应文本提示生成的。

图像质量修改器


某些关键字可以让模型知道您正在寻找高质量的资产。质量调节剂的示例包括以下内容:

  • 通用改性剂-高品质、美观、风格化
  • 照片-4K、HDR、工作室照片
  • 艺术,插图-由专业,详细


以下是一些没有质量修饰符的提示和有质量修饰符的相同提示的示例。

无修改器的玉米示例图像
提示(无质量调节剂):玉米秸秆的照片


带有修改器的玉米示例图像
提示(带质量修改器):4k HDR美观
玉米秸秆照片由
专业摄影师
图像来源:每张图像都是使用Imagen 3模型的相应文本提示生成的。

纵横比


Imagen 3图像生成允许您设置五个不同的图像纵横比。

  • 正方形(1:1,默认)-标准正方形照片。这种纵横比的常见用途包括社交媒体帖子。
  • 全屏(4:3)-这种宽高比通常用于媒体或电影。这也是大多数老式(非宽屏)电视和中画幅相机的尺寸。它可以水平捕捉更多的场景(与1:1相比),使其成为摄影的首选纵横比。

纵横比示例


提示:音乐家弹奏钢琴的手指特写,黑白电影,复古(4:3宽高比)
纵横比示例
提示:一张为高端餐厅拍摄的炸薯条的专业工作室照片,采用食品杂志的风格(4:3宽高比)
肖像全屏(3:4)-这是旋转90度的全屏纵横比。与1:1的纵横比相比,这可以垂直捕获更多的场景。

纵横比示例
提示:一位女士正在徒步旅行,她的靴子在水坑中反射出来,背景是大山,广告风格,戏剧性的角度(3:4纵横比)
纵横比示例
提示:一条河流向神秘山谷的航拍(3:4纵横比)
宽屏(16:9)-这个比例已经取代了4:3,现在是电视、显示器和手机屏幕(横向)最常见的宽高比。当您想捕捉更多背景(例如风景)时,请使用此纵横比。

纵横比示例
提示:一个穿着全白衣服的男人坐在海滩上,特写,黄金时段照明(16:9宽高比)
肖像(9:16)-此比例为宽屏但旋转。这是一种相对较新的宽高比,已被短视频应用程序(例如YouTube短片)普及。将其用于具有强烈垂直方向的高大物体,如建筑物、树木、瀑布或其他类似物体。

纵横比示例
提示:一座巨大的摩天大楼的数字渲染,现代、宏伟、史诗般的,背景是美丽的日落(9:16纵横比)

负面提示
前面的示例侧重于为您希望Imagen创建的内容编写提示,但您也可以在原始提示的同时提供否定提示,以帮助产品生成或编辑图像。这些负面提示可以是一个强大的工具,有助于指定从图像中省略哪些元素。简单地描述一下你不想要什么。

推荐——坦率地描述你不想看到的东西。例如“墙、框架”。

不推荐——避免使用有教育意义的语言或“不”或“不要”这样的词。例如,避免使用“没有墙壁”或“不显示墙壁”这样的短语。

无负面提示的绘画示例图像
提示(无负面提示):4K视频游戏概念艺术、城市丛林、赛博朋克城市、详细渲染
绘制带有否定提示的示例图像
提示:4K视频游戏概念艺术、城市丛林、赛博朋克城市、详细渲染
负面提示:绿化、植物、森林、树木
无负面提示的绘画示例图像
提示(无负面提示):神话中飞越山脉的韦文鸟的插图
绘制带有否定提示的示例图像
提示:神话中飞越山脉的韦文鸟的插图
负面提示:雪、霜
照片级真实感图像
不同版本的图像生成模型可能会提供艺术和照片级真实感输出的混合。在提示中使用以下措辞,根据要生成的主题生成更逼真的输出。

注意:当您尝试创建逼真的图像时,请将这些关键字作为一般指导。他们不需要实现你的目标。
用例镜头类型焦距其他详细信息
人物(肖像)Prime,变焦24-35mm黑白胶片,黑色胶片,景深,双色调(提到两种颜色)
食物、昆虫、植物(物体、静物)宏观60-105mm高细节、精确聚焦、可控照明
运动,野生动物(运动)远摄变焦100-400mm快速快门速度,动作或运动跟踪
天文、风景(广角)广角10-24mm长曝光时间、清晰聚焦、长曝光、平滑水或云
肖像
用例镜头类型焦距其他详细信息
人物(肖像)Prime,变焦24-35mm黑白胶片,黑色胶片,景深,双色调(提到两种颜色)
使用表中的几个关键字,Imagen可以生成以下肖像。

肖像摄影示例肖像摄影示例
提示:一个女人,35毫米肖像,蓝色和灰色双色调
型号:图像3(图像-3.0-generate-002)

肖像摄影示例肖像摄影示例
提示:一个女人,35毫米肖像,黑色电影
型号:图像3(图像-3.0-generate-002)

对象
用例镜头类型焦距其他详细信息
食物、昆虫、植物(物体、静物)宏观60-105mm高细节、精确聚焦、可控照明
使用表中的几个关键字,Imagen可以生成以下对象图像。

物体摄影示例物体摄影示例
提示:祈祷植物的叶子,微距镜头,60mm
型号:图像3(图像-3.0-generate-002)

物体摄影示例物体摄影示例
提示:一盘意大利面,100mm微距镜头
型号:图像3(图像-3.0-generate-002)

运动
用例镜头类型焦距其他详细信息
运动,野生动物(运动)远摄变焦100-400mm快速快门速度,动作或运动跟踪
使用表中的几个关键字,Imagen可以生成以下运动图像。

运动摄影示例运动摄影示例
提示:一次成功的触地得分,快速快门速度,运动跟踪
型号:图像3(图像-3.0-generate-002)

运动摄影示例运动摄影示例
提示:一只鹿在森林里奔跑,快门速度快,运动追踪
型号:图像3(图像-3.0-generate-002)

广角
用例镜头类型焦距其他详细信息
天文、风景(广角)广角10-24mm长曝光时间、清晰聚焦、长曝光、平滑水或云
使用表中的几个关键字,Imagen可以生成以下广角图像。

广角摄影示例广角摄影示例
提示:广阔的山脉,景观广角10mm
型号:图像3(图像-3.0-generate-002)

广角摄影示例广角摄影示例
提示:月球照片,天文摄影,广角10mm
型号:图像3(图像-3.0-generate-002)

下一个是什么
在Vertex AI产品上阅读有关Imagen和其他生成式AI的文章:

文章链接