当前位置：首页 > 科技 > 正文

Google人工智能技术“Transframer”可根据一张图片创立短视频

这个新结构的称号（及在某些方面的概念）是对另一个依据人工智能的模型Transformer的点赞。Transformer开始于2017年推出，是一个新颖的神经网络架构，它有才能经过建模和比较语句中的其他词来生成文本。尔后，该模型被纳入了规范的深度学习结构如TensorFlow和PyTorch。

据悉，Transframer运用具有相似特点的布景图画，结合查询注释来创立短视频。虽然在原始图画输入中没有供给任何几许数据，但发生的视频在方针图画周围移动并将精确的视角可视化。

这项新技能运用Google的DeepMind人工智能渠道进行了演示，其功用是剖析单一的相片布景图画以此来取得要害的图画数据并生成额定的图画。在这一剖析过程中，体系确认了图片的结构，这反过来又协助体系猜测图片的周围环境。

然后，语境图画被用来进一步猜测图片从不同视点会呈现的状况。猜测依据数据、注释及语境结构中的任何其他信息对额定图画结构的概率进行建模。

该结构经过供给依据十分有限的数据集生成合理精确的视频的才能，这标志着视频技能的巨大进步。Transframer使命在其他跟视频有关的使命和基准上也显示出极有远景的成果，如语义切割、图画分类和光流猜测。

对依据视频的职业如游戏开发或许具有潜在的巨大影响。现在的游戏开发环境依赖于中心烘托技能，如上色、纹路映射、景深和光线追寻。像Transframer这样的技能有或许经过运用人工智能和机器学习来构建他们的环境并与此同时来削减创立环境所需的时刻、资源和精力认为开发者供给一个全新的开发途径。

本文由幽冥于2022-08-21发表在悠哉头条，如有疑问，请联系我们。
本文链接：https://www.yz0417.com/html/77837.html