谷歌推出 Flow——一个全新的 AI 电影制作平台
在昨天的Google I/O 2025大会上,谷歌发布了多项重磅AI更新。他们推出了一款全新的图像模型Imagen 4,同时发布了升级版视频生成器Veo 3、增强版Gemini Pro模型,以及一系列令人印象深刻的技术升级。
但将这些生成式媒体工具(generative media tools)串联起来的关键,是一个名为Flow的功能。
Flow是VideoFX的升级版,后者是谷歌实验室去年推出的实验性产品。它能帮助你创作电影感的短片,无缝衔接多个场景,并保持足够的连贯性来讲好一个故事。
Flow 是专为配合 Google DeepMind 最先进的模型而设计的。这些模型包括视频生成模型 Veo、图像生成模型 Imagen,以及负责语言处理和任务编排的 Gemini。
Flow 的主要特性1. 静态类型检查(Static Type Checking)- 在代码运行前就能发现类型错误- 不需要实际运行代码就能捕获潜在问题2. 渐进式类型(Gradual Typing)- 可以逐步为现有 JavaScript 代码添加类型- 不需要一次性重写整个项目3. 类型推断(Type Inference)- 自动推断变量类型,减少手动标注的工作量- 即使不写类型注解也能进行类型检查4. 实时反馈(Real-time Feedback)- 编辑器集成提供即时错误提示- 开发过程中就能看到类型问题5. 与 JavaScript 兼容- 完全支持现有 JavaScript 语法- 可以平滑迁移现有项目
以下是 Flow 的全部功能列表:
Flow 的工作原理Flow 是一个静态类型检查器(static type checker),专门为 JavaScript 设计。它的核心工作方式可以概括为以下几个步骤:1. 类型注解(Type Annotations)通过在代码中添加类型注解,开发者可以明确指定变量、函数参数和返回值的类型。例如:```javascriptfunction add(a: number, b: number): number {return a + b;}```2. 类型推断(Type Inference)即使没有显式类型注解,Flow 也能根据上下文自动推断出变量的类型。比如:```javascriptconst x = 42; // Flow 自动推断 x 是 number 类型```3. 实时检查Flow 会在后台持续监控代码变化,即时标记出类型不匹配的地方。这比传统的编译时类型检查更高效。4. 渐进式采用Flow 允许项目逐步引入类型检查,可以只对部分文件启用类型检查,其他文件保持动态类型。5. 类型系统Flow 提供了完整的类型系统支持,包括:- 基本类型(string, number, boolean)- 复杂类型(对象、数组)- 联合类型(Union Types)- 泛型(Generics)- 类型别名(Type Aliases)6. 错误报告当检测到类型错误时,Flow 会清晰地指出问题位置和原因,帮助开发者快速定位问题。通过这种方式,Flow 在不改变 JavaScript 运行方式的前提下,为大型项目提供了可靠的类型安全保障。
进入后,点击"新建项目"开始。界面看起来有点像聊天机器人,中央有一个大型文本输入框,还有几个切换开关用于选择视频生成方式。
你可以选择以下方式:
洞穴中央矗立着一尊佛像,周围是正在打坐的僧侣。
Flow 会接收你的文字描述,并利用 Gemini(谷歌多模态 AI)将其转化为视觉化的电影场景。当你点击生成按钮时,Flow 会将提示词传递给 Veo 3(视频生成模型),由它将这些文字转换成高质量的视频片段。
只需选中视频片段,然后点击"延长"(Extend)选项。在文字提示框中描述你希望延长后的片段效果即可。
"帧转视频"工具(Frames to Video)的功能非常简单:它接收一张输入图片,然后将其转换成视频。你可以自由指定起始帧和结束帧。
谷歌还在探索与YouTube Shorts(短视频)及其他内容管道的整合,让创作者能够轻松实现从创意到触达受众的无缝衔接。
最后总结
自从 Kling 1.0 发布以来,人们就一直在期待一款真正的人工智能(AI)视频制作工具。长期以来,拼接 AI 生成片段的唯一方法就是先导出素材,再用 Premiere 或 Final Cut 这类剪辑软件处理。虽然可行,但这种工作流程实在太耗时了。所以谷歌最终推出 Flow 这样的工具,确实在情理之中。
Flow 目前仅支持谷歌的 AI 模型(如 Gemini、Veo 和 Imagen),这对部分用户可能是个缺点。但说实话,大多数人不会在意,因为这些最新模型确实很出色。尤其是具备原生音频和对话生成能力的 Veo 3,这甚至是当前多数 AI 视频工具尚未实现的功能。
我对价格和可用性方面不太满意。Veo 3 仅限每月 250 美元套餐才能使用,这让人失望。而且目前仅在美国可用,这让美国以外的用户产生了严重的错失恐惧症(FOMO)。
无论如何,我迫不及待想看看创作者们能用Flow做出什么作品。期待它全球发布和价格下降的那一天。
文创“黑科技”亮相京交会“褪色”文化重焕生机
光明网 见习记者黎梦竹
走进博物馆,你发现许多文物年久失修色彩黯淡观感下降;翻出一部老电影,你发现画质太渣根本看不下去……近日,亮相于中国国际服务贸易交易会(以下简称“京交会”)的博物馆复原、电影修复等吸晴“黑科技”,则能够一一改善这些观感,让“褪色”文化重新焕发生机。
在京交会主会场国家会议中心5G展区,观众可手持像放大镜一样的终端观看修复后的文物。据工作人员介绍,手持终端实际是一台平板电脑,能将博物馆里没办法修复的残缺佛像,通过后期软件建模复原,让观众看到“修复”后的文物并以3D立体的方式呈现出来,生动展示藏品背后的故事,也可以识别出素材图片或展物的局部特征值并进行音视频讲解。

博物院“复原”设备(黎梦竹/摄)
在文化创意专题展区,多家文创企业的经典项目,围绕“文化创新引领高质量发展”主题,展现了北京在科技文创、智慧文创方面取得的成绩。
在一面挂满中国20世纪音乐戏曲名人照片的展墙跟前,一组包装精美的黑胶唱片吸引不少观众驻足观看。华韵文化公司负责人介绍,这套《梅兰芳黑胶唱片全集》由梅葆玖先生担任主编,曾在他亲自监督下将梅兰芳生前录制的全部唱片加以修复重新出版发行。由于“老唱片”载体特殊、年代久远、保存条件简陋,导致出现受潮、霉变、腐蚀、变形等现象,通过运用最先进的机器和高科技的技术手段,将这些老唱片修复完成,然后再次以黑胶唱片的形式出版,“复活”经典唱段。

修复后的黑胶唱片展示(黎梦竹/摄)
“这套作品花费了近5年时间,我们为梅兰芳先生的唱腔进行重新收集、整理、修复,解决了音质、曲目、断代等诸多问题,实现了60多年来唯一全套梅兰芳制作完结。这对于有声文化遗产保护来说,老唱片修复出版是一项样板工程。”该负责人说。而这种修复工作,目前已将自清朝末年至新中国成立之初的1万首珍贵音频资料修复再造形成“中国音网”曲库。据了解,这种有声文化遗产的保护与修复,已经服务于故宫等多家文博机构,修复发行了《四大名旦唱片全集》等多套珍贵唱片。
在刚刚过去的戛纳国际电影节,一部33年前的“老”电影《盗马贼》惊艳亮相。这部电影首次采用4K+48帧的修复放映技术,既保留了老电影的质感,让人看着很亲切,同时画面更加清晰、颜色也令人赏心悦目。这部电影的修复由中国电影资料馆携手三维六度公司共同完成。
三维六度公司工作人员介绍,一部90分钟的老电影胶片有10至12卷,每卷胶片达上万帧,一部电影就有数十万帧。修复师需要一帧帧完成修复,工作量很大。曾参与这项修复工作的修复师李思感慨:“这部电影我们陆陆续续修复了一年,从2K到4K电影的修复,我们也是在摸索中完成,但从反馈情况来看,这次修复还是很令人满意。未来有望通过AI技术将算法植入到修复软件,将能大量替代、减少繁琐的人力。”

图左为修复后,右为修复前
近年来,随着文化与科技的深度融合,许多传统文化经过包装重新走入大众视野,并掀起一波波怀旧热潮。除了此次亮相京交会的文创黑科技,还有如《清明上河图3.0》,让人不仅能细致入微地观察大到汴河风景、小至船只铆钉的名作风貌,更把大家直接带入到画卷之中,切身体会汴京的风土人情;3D建模技术让古代碑刻轻松“复原”,受到不少文雅人士的喜爱;AR月历通过“扫一扫”即可展示古代人的生活百态……随着移动互联网向智能互联网演进,科技力量正不断撬动文化新动能。
相关问答
木雕,佛像等做三维立体雕刻,用什么软件做三维建模好?
3DCOAT和ZBrush。强烈推荐3DCOAT+PowerMill+geomagicwrap3DCoat刷浮雕,POWERMILL搞加工。wrap做模具的逆向。最好再加个UG做分模。不过你是木...