谷歌 Gemini 接入 Veo 3 AI 模型: 照片进去, 带音频的视频出来
- 2025-07-11 03:39:34
- 486
IT之家7月10日消息,谷歌今天在Gemini应用中上线了基于Veo3模型的图像转视频功能,用户可以将照片变成带有背景音效、环境声、语音的8秒钟短视频。
谷歌表示,这项视频功能现已在部分地区向AIUltra和AIPro用户开放,今起先在网页版推出,移动端将在本周逐步上线。
使用时,Gemini用户只需点击提示栏的“工具”,选择“视频”,上传照片并添加提示词,描述希望照片如何动起来。用户还可以加入对白、音效或环境声等音频描述,谷歌表示音频和画面会实现“完美同步”。最终视频为720p、16:9横屏的MP4格式。
谷歌表示,用户可以为日常物品赋予动画效果,让绘画作品“活”起来,或为自然景象添加动态,尽情发挥创意。据IT之家了解,所有生成视频均带有明显的AI水印和隐形的SynthID数字水印。