封面新闻记者 欧阳宏宇
上线的528天后,面对中国造AI视频模型,OpanAI将会回想起,Sora曾经在视频领域赛场之上创造出的神话。
7月28日晚,一款国产电影级视频生成开源模型发布。据介绍,该模型为通义万相Wan2.2,能对光影、色彩、镜头语言等三大电影元素,60多个参数进行控制,可大幅提升电影级画面的制作效率。
在文生视频赛道,Sora曾是该领域的佼佼者,被众多玩家作为对标的对象。不过,随着时间的推移,可灵AI、即梦AI等中国玩家崛起,其在视频生成领域展示出的能力已不逊色于Sora。
根据通义万相官方展示的样片,其目前单次已可生成5s的高清视频。用户可通过多轮提示词进一步完成短剧制作,未来还将继续提升单次视频生成的时长,让视频创作更高效。
比如,输入提示词:白天,晴天光,边缘光,暖色调,低饱和度,极端全景,平衡构图,画面中有两名穿着宇航服的人,他们正站在一片广阔的水域中。他们都穿着白色为主、带有深色拼接和标记的厚重宇航服,并头戴配有面罩的头盔。位于前方的人正朝着观看者的方向涉水前行,水面淹及他的大腿,他的面部表情严肃。另一人站在他身后稍远的位置,同样身处水中。在他们身后,一艘外形具有未来感的飞行器停泊在水面上。这艘飞行器有着扁平、宽大的机翼和棱角分明的设计。整个场景的背景是布满云彩的天空和无边无际的水面。该大模型即可生成一段复刻电影《星际穿越》中宇航员在米勒星球的经典画面。
据介绍,目前Wan2.2共开源了文生视频(Wan2.2-T2V-A14B)、图生视频(Wan2.2-I2V-A14B)和统一视频生成(Wan2.2-TI2V-5B)三款模型,其中文生视频模型和图生视频模型均为业界首个使用MoE架构的视频生成模型,总参数量为27B,激活参数14B,均由高噪声专家模型和低噪专家模型组成,分别负责视频的整体布局和细节完善。
对于AI视频领域竞争,业内人士分析称,目前行业非常激烈,大模型行业是一个“高危”行业。随着推理成本不断下降,用户使用AI视频模型的成本也在逐步降低。
金勺子配资-金勺子配资官网-线上股指配资-辽宁股票配资公司提示:文章来自网络,不代表本站观点。