谷歌 Gemini 接入 Veo 3 AI 模型: 照片进去, 带音频的视频出来

IT之家7月10日消息，谷歌今天在Gemini应用中上线了基于Veo3模型的图像转视频功能，用户可以将照片变成带有背景音效、环境声、语音的8秒钟短视频。

谷歌表示，这项视频功能现已在部分地区向AIUltra和AIPro用户开放，今起先在网页版推出，移动端将在本周逐步上线。

使用时，Gemini用户只需点击提示栏的“工具”，选择“视频”，上传照片并添加提示词，描述希望照片如何动起来。用户还可以加入对白、音效或环境声等音频描述，谷歌表示音频和画面会实现“完美同步”。最终视频为720p、16:9横屏的MP4格式。

谷歌表示，用户可以为日常物品赋予动画效果，让绘画作品“活”起来，或为自然景象添加动态，尽情发挥创意。据IT之家了解，所有生成视频均带有明显的AI水印和隐形的SynthID数字水印。

人生有很多分叉口发布网,提供人生有很多分叉口发布信息,第一时间发布列表及资讯,人生的分叉口是人生的分叉口首选资讯平台。