Sora来临,它能抢了谁的饭碗?
继ChatGPT后,OpenAI在2024年初又掀起了人们的讨论热情。
2月16日清晨,OpenAI发布了文生视频AI模型Sora,引爆全球网络。与以往的文生视频模型Runway和Pika不同,Sora可以持续地模拟人物、动物和物体,并生成同一角色的多个景别的镜头,在整个视频中保持其外观和背景。
此外,Sora还可以生成图片。与以往相比,这些图片中的细节更清晰,包括脸上的斑点和嘴唇上的细纹,分辨率最高可达2048×2048。
一石激起千层浪,Sora发布后,一众科技圈大佬纷纷下场讨论。马斯克表示“gg humans”(gg/good games原指游戏结束时玩家互相致意,后引申为“游戏结束”);周鸿祎预言:“这可能给广告业、电影预告片、短视频行业带来巨大颠覆”;前阿里副总裁贾扬清则评价:“真的非常牛”。
“霸榜”近日科技板块热点的Sora大模型亮点在哪里?具体来看,这会对影视制作行业起到怎样的影响?
01 高质量、长时间、多景别
简单来讲,Sora能够根据文本提示,创建60秒的视频、扩展现有视频以及从图像中生成视频,视频中还包含复杂的场景和镜头运动。
OpenAI官网展现了多段Sora制作的视频,身着黑色皮衣、红色裙子的女子在雨后的夜晚行走在东京市区街道上,女子皮肤毛孔色沉清晰可见,路面积水反映着路灯倒影,视频真实度十分之高,如果不是偶尔穿帮的左右腿,很难一眼判断是AI制作的视频。
在运镜、构图等方面,Sora视频都呈现出大幅度的提升,一举将AI视频提升至“next level” 。
图源OpenAI
此外,Sora不仅能够生成完整的60秒视频,还能延长已生成的视频。也就是说,给Sora一段视频,它可以自动生成前面或者后面的视频。
更离谱的是,Sora可以生成不同机位、不同景别的视频,并进行剪辑。且在不同的机位下,无论是广角、中景、近景、特写,室内还是室外,视频中人物和背景的关系都一致,不受影响。
图源OpenAI
也就是说,仅需要一段文字,Sora模型就可以生成一段60s的1080p视频,包含不同景别镜头。不由得让人感叹——“真实和虚幻的差别,到底还有多大距离?”
值得注意的是,文生视频早已存在,根据知名投资机构a16z统计,截至2023年底,市场上共有21个公开的AI视频模型,例如Google的Lumiere、Stability AI的SVD、以及视频生成大模型Gen-2的开发商Runway。其中,Runway2023年6月底完成C轮融资后,估值则是超过15亿美元。
Sora 公开后,东吴证券对目前主要的视频生成模型做了对比。他将Sora、W.A.L.T、Gen-2和Emu Video、Pika 1.0、Stable Video六个模型的特点、生成视频表现等特点进行对比分析。结论是,Sora在生成时长、一致性等方面都有显著的优势,具有突破性的语义理解能力。
图源东吴证券
去年年初,ChatGPT横空出世,而一年后,Sora就实现了视频的快速创作,如此快的发展速度令人心惊。毕竟一年前,AI生成视频还是这样。
图源网络
有B站网友表示:“小时候还想过,未来会不会有这样一种拍电影的技术,戴上脑机后靠人脑的想象来生成各种各样壮丽恢宏的电影画面,谁知这个现实已经不远了。”
虽然目前Sora还处于测试阶段,只面向邀请的制作者和安全专家开放测试(据称是一些视觉艺术家、设计师和电影制作人)。然而资本端已然闻风而动,CB Insights的数据则显示,OpenAI目前是世界上最有价值的科技初创企业之一,仅次于字节跳动和SpaceX。
在根据Thrive牵头的收购要约进行现有股票出售后,当前OpenAI的估值已经达到800亿美元以上,达到九个月前的近3倍。
只不过,有人欢喜有人愁,对于一些影视行业从业者和AGI视频初创公司,Sora的问世很难说是喜事。
02 风暴来袭
Sora发布,最直观的影响就是AGI视频创业公司。
曾在2023年热映影片《瞬息全宇宙》中参与制作的Runway,其 CEO瓦伦祖拉在Sora发布后,在X平台上发布了两个字,“Game On.”(竞争开始了)。
图源X平台
对于字节跳动来说,Sora的出现无疑是对于剪映的一大威胁。今年,就在Sora问世的一周前,原抖音集团CEO张楠卸任,转而投入剪映,反映出抖音对于AIGC工具的重视。随着Sora的不断发展,剪映如何才能学习Sora并创新,成为了当务之急。
除此之外,Sora类AI模型对于好莱坞以及电影、电视、广告等领域的影响是最直观的。
美国行业调查公司CVL Economics,上个月发布的一项对300位好莱坞行业领袖的调查显示,75%的受访者承认,生成式AI(工具、软件、模型)已经促使他们业务部门削减与合并工作岗位,担忧情绪弥漫在整个好莱坞。
那些掌控着好莱坞行业秩序的大佬预计,未来三年好莱坞总计会有超过20万人的工作岗位会遭受AI冲击,尤其是视觉特效、音效师、画图师等后期工作岗位。
图源OpenAI
不过,回顾内容创作的历史,工具的发展无法阻挡,进步是常态,比起抵制,创作者更要思考哪些环节和内容变得更有价值。
从AI 制作视频的流程上来看,当前的Sora需要先输入一段文字,随后再生成视频,视频的原创性还是在依赖着创作者的审美,Sora的工具属性更加突出。比起原创内容,Sora的优势更在于,那些需要耗费大量人力物力的特效片段。
所以,也有网友预测,虽然未来视频制作流程中的剪辑师、特效师等后期岗位会面临更为严峻的处境。但过往那些受限于拍摄成本、拍摄技术的内容,则会更受关注。
理想的情况下,Sora未来能够代替更多机械、重复的工作,使得创作者可以集中精力于创新的、深度的解读,给文化消费者们提供更优质的内容。
此外,由于AI的理解内容更加偏向于输入“关键词”,而非剧本。所以在未来,如何创作出适合AI 理解的剧本,从而生成视频,也是值得关注的问题。
03 Sora的价值,不止视频
目前来看,Sora最直观的影响是视频制作行业,但他的野心,或者是众多大模型的野心远不止于此。
OpenAI官网上,将Sora定位为世界模拟器。OpenAI认为,其能够有效地模拟物理和数字世界,包括其中的物体、动物和人类等各种因素。根据OpenAI的报告显示,Sora在理解地球物理世界的规律层面,取得了巨大的进展。
当然,目前的Sora作为一个模拟器当前还存在着一定的缺陷,世界模型仍然不够完善。在OpenAI发布的48个Sora生成的视频中,就出现了不少穿帮的画面。
例如玻璃杯还没有破碎,但是液体已经流出;人们在沙漠中挖出变形塑料椅子;一个男人在倒着跑跑步机等不符合逻辑的视频内容。简单来说,一些对于人类来说约定俗成的因果规律,Sora模型短期内无法推理。
图源OpenAI
就已有信息来看,目前的Sora仍处于1.0阶段,在处理精细的背景时常常出现力不从心的情况,但没人会否认Sora对于AGI实现路程上的里程碑地位。
AI风口下,Sora的出现让我们看到了AGI实现的可能,也逼迫着同行业内不断创新发展。毕竟泡沫过后,赢家只能有一个。
作者:光也
来源公众号:TopKlout克劳锐(ID:TopKlout),一个集好看和有料于一身的自媒体生态观察号
版权声明
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!