Google 发布 AI 图像创意工具「Whisk」

Google 发布 AI 图像创意工具「Whisk」

工具介绍

Whisk是Google Labs推出的一款创新的AI图像生成工具,它通过图像输入快速生成并重混创意图片。以下是Whisk的一些主要特点和功能:

  1. 图像驱动的生成:Whisk允许用户通过上传图像来确定主体、场景和风格,而不是使用文本提示,这为不擅长撰写文本提示的用户提供了更便捷的方式。
  2. 自动生成详细字幕:Gemini模型会自动为用户上传的图像编写详细的字幕描述,这些描述会被输入到Imagen 3模型中,以更好地捕捉图像的关键特征并生成符合用户意图的新图像。
  3. 创意重新混合:Whisk能够将不同的主体、场景和风格图像进行重新混合,创造出独特的设计,如数字玩偶、珐琅别针等各种创意产品。
  4. 本质捕捉而非复制:Whisk捕捉的是输入图像的本质特征,而不是精确复制,这使得生成的图像具有更多的创意变化空间,但也可能导致结果与用户预期不完全一致。
  5. 可编辑提示:用户可以查看和编辑底层的提示信息,以便根据自己的需求对生成的图像进行调整和优化,例如修改颜色、图案等特征。
  6. 适用场景:Whisk主要定位于创意探索,旨在帮助用户快速生成和迭代各种创意想法,而非用于精确的图像编辑。
  7. 技术原理:Whisk的背后是Google的Gemini视觉理解与描述模型和Imagen 3图像生成模型。Gemini模型负责为用户的图像生成详细的文字描述,这些描述精准捕捉了图片的主题、情感和风格特征。随后,这些描述被传递给Imagen 3模型,该模型基于这些丰富的信息,运用深度学习算法,创造出既符合用户意图又充满惊喜的新图像。
  8. 访问方式:目前,Whisk仅对美国用户(美国IP)开放,用户可在labs.google/whisk上使用该工具并提供反馈。

Whisk的推出,标志着Google在图像生成领域的一次重要布局,这款工具不仅简化了图像创作的流程,更在技术上实现了质的飞跃,为用户提供了一种独特的图像生成方法

工具地址

地址:https://blog.google/technology/google-labs/whisk/

使用地址:https://labs.google/fx/zh/tools/whisk

目前仅支持美国(ip)地区

版权声明 1 本网站名称:Applnn
2 本站永久网址:www.applnn.com
3 GitHub无法访问下载解决教程:点击查看
4 本站发布的文章及附件仅限用于学习和研究,不得用于商业或非法用途,否则后果请用户自负!
5 本站信息来自网络收集整理,版权争议与本站无关,仅供学习研究,如有侵权请联系客服删除!
6 如果您喜欢该程序和内容,请支持正版,购买注册,得到更好的正版服务。
7 本站资源大多存储在云盘,如发现链接失效,请联系我们我们会第一时间更新。

给TA打赏
共{{data.count}}人
人已打赏
!
也想出现在这里? 联系我们
     广告位
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索