2月2日,谷歌在官网对生成式AI产品进行了大更新,包括类ChatGPT聊天助手Bard可以通过文本提示生成图像;

全新的文生音乐平台MusicFX;新的文生图像平台ImageFX;新的文本扩写平台TextFX;在谷歌地图中增加生成式AI功能,用文本提示快速查找路线、店铺等。

值得一提的是,这5大功能目前都是免费使用。其中,文生图像平台ImageFX的功能非常强悍,支持对文本提示中的“关键元素”进行可视化控制。

目前,无论是Midjourney还是DALL·E 3都无法做到(二者无法可视化控制,只能用文本),这对于生成高精准图像、制作连环画等帮助巨大!

Bard支持文生图

文生图像、音乐的多模态功能,对于现在大模型来说已经不是什么新鲜事了,但谷歌一直没有停止追赶OpenAI的脚步。现在,Bard终于能用文本生成图像了,该功能由谷歌自研的Imagen 2模型提供技术支持。

根据「AIGC开放社区」的实际体验,只需要输入文本提示就能生3D、动漫、素描、朋克、写实、油画等风格图像,效果非常棒。

例如,生成一只站在冲浪板上的狗狗。

生成一个混乱的炼金术士工作室的图像,充满了冒泡的烧瓶,发光的晶体,以及瓶子内旋转的微小发光世界。

生成一盘令人有食欲,色泽鲜艳的鸡翅。

生成一个蒸汽朋克风格的数字艺术女人图像,放大她的脸部。

需要注意的是,目前该功能已经免费开放,但只能用英文提示才能生成图像。

文生音乐平台MusicFX、文生图ImageFX和扩写平台TextFX

自2023年谷歌发布MusicFX以来,全球用户通过该产品已创造了超1000万条音乐。现在,谷歌对该产品进行了大量优化。

可以创建70秒音乐,音乐样本比之前多3倍等,并且该产品目前免费开放使用。

例如,生成一首90年代的爵士音乐,节奏感非常强。MusicFX可以一次生成4个同类音乐,用户选择最佳那款即可。

ImageFX是谷歌发布的一款纯文生图像平台,同样由Imagen 2模型提供技术支持。使用方法与效果基本和Bard一样,类似OpenAI的DAll-3。

例如,生成一只在火星奔跑的哈士奇,身穿宇航服,面带微笑,非常幸福,3D效果,4K,纹理逼真。

ImageFX比较牛的地方在于,用户可以对所有关键元素的提示词进行选择性修改。

同样以上面这个提示词为例,我们直接可以将“微笑”选择为“沮丧”,就能在不改变环境等情况下直接生成图像内容。

下拉菜单就能进行多种提示词选择

扩写平台TextFX

还在为写文本内容没灵感烦恼吗?谷歌与Lancaster Fiasco合作推出了扩写平台TextFX,用户只需要提供一句话,甚至一组词就能快速完成文本扩写。

例如,某个夜深人静的夜晚,我独自走在荒废的大街上。TextFX就能快速帮你完成故事内容的扩写。

谷歌地图支持生成式AI搜索

为了帮助用户快速搜索地址、餐厅、健身房等内容,谷歌地图引入了生成式AI功能。

该功能由谷歌的大语言模型提供支持,并结合2.5亿个真实地理位置数据进行了微调。用户通过自然文本问答的方式就能快速完成地图搜索。

例如,推荐附近的素食餐厅或找一个评分超过4星的健身房,谷歌地图很快就能列出符合标准的店铺。

此外,还能向谷歌提出一些旅游、拍摄的相关问题,例如,我想拍一组复古婚纱照,旧金山地区有哪些复古氛围非常浓厚的建筑和街道?

目前,该功能在谷歌地图处于测试阶段,谷歌非常看好其应用场景和商业价值。

本文素材来源谷歌官网,如有侵权请联系删除

END

好文阅读

评论可见,请评论后查看内容,谢谢!!!
 您阅读本篇文章共花了: