被Sora刷屏,听说我又双叒要被AI取代了?
时代的变革,从来不会提前给我们打声招呼~
Sora降世,未来已来,欢迎大家步入AI时代!
一、Sora是什么?
“Sora”这个词语,有些人可能还没听过,但“OpenAi”这个名字,大家肯定是耳熟能详了吧,毕竟这家公司,在2022年底,推出了轰动全世界的“ChatGPT”。
然后龙年开端,这家公司又重磅发布了“Sora”!
那么Sora是什么呢?
简单来说,Sora就是可以通过文本提示,生成视频的一个AI工具。
比如,输入这样一段文字:
一位时尚女性走在充满温暖霓虹灯和动画城市标牌的东京街道上。她穿着黑色皮夹克、红色长裙和黑色靴子,拎着黑色钱包。她戴着太阳镜,涂着红色口红。她走路自信又随意。街道潮湿且反光,在彩色灯光的照射下形成镜面效果。许多行人走来走去。
然后Sora就生成了一段视频。
或许有人会说,在这个时代,通过AI生成一段视频,没什么大不了的。
是的,AI生成个视频,确实没啥大不了的,但是,但是,但是,这可是60S的超长视频啊,而且整个视频看起来是如此的逼真,如此的丝滑!
看看下图这个雀斑的细节处理,试问,有哪个AI视频软件,能够做到?而且其他所谓的AI生成视频,都还在4S连贯性的边缘苦苦挣扎。。。
再来一张对比图,你就会知道Sora到底有多么强大了:
我们再来看看OpenAi给出的官方说辞:
Sora并不是单纯的视频模型,而是作为“世界模拟器”,该模型了解这些物体在物理世界中的存在方式,可以深度模拟真实物理世界,能生成具有多个角色、包含特定运动的复杂场景。
听完这段话的第一感觉,是不是这样的:
第二感觉是不是这样的:
内心os是不是这样的:
听起来挺流弊的,但到底想表达啥,啥是“世界模拟器”啊?
我用“人话”来翻译一下:
比如你去拿一杯咖啡,你的“记忆”中,知道一杯咖啡的重量,所以当你想拿起一杯咖啡时,大脑准确“预测”了应该用多大的力,于是,杯子被顺利拿起来。
但如果,杯子里碰巧没有咖啡呢?你就会用很大的力,去拿很轻的空杯子,你的手,立刻能感觉到不对,然后,你的“记忆”里会加上一条:杯子也有可能是空的。
当你下次再拿起杯子时,“记忆”会告诉你,需要先确认杯子是不是空的,然后再“预测”应该用多大的力。
先记忆,再预测,这种理解世界的方式,是人类独有的理解世界的方式,这种思维模式就叫做:世界模型。
所以说,OpenAI最终想做的,其实不是一个“文生视频”的工具,而是一个通用的“物理世界模拟器”,也就是世界模型,为真实世界建模。
小结:
来聊一哈,读了以上这些内容之后,有什么感受?
反正我的脑海中,涌现出《三体》杨冬说的那句话:
“物理学,不存在了”
套用这句话,那就是,“现实,不存在了”
文本、图片都已经被AI攻占,而现在,AI视频,这个人类最后的最坚固的堡垒,在OpenAI的Sora攻势下,也已经很难再分清,AI和现实的界限了。
什么以前的AI视频工作流,全部成了往日泡影,全都滚犊子吧。
都跪下,都给OpenAI喊爸爸。
二、Sora影响的五大职业领域
我们再来说一下,Sora影响的五大职业领域,快来看看,你有没有身在其中?
先用四句话,总结一下Sora的影响:
Sora影响:
- 让资深岗位乐呵
- 让入门岗位转向
- 让精通以下迷茫
- 让外行直呼内行
1. 娱乐影视领域
原先动画影视公司为让动物的数百万根毛发、皮肤纹理、衣物等细节在3D建模中表现得如现实场景般真实。需要投入不菲的成本和时间才能得以实现。
而如今,Sora只需要一行描述、几次提示便能自动完成。
原本传统影视行业,分工极其精细:从前期到后期,从舞美、化妆、道具到灯光、摄像、摄影,从演员、编剧、剧务到动画特效,哪一环节出问题,就可能功亏一篑。
而如果AI视频按照现在的发展速度,在不久的将来,完全可能实现一个想法创作出一部电影,省去高昂的成本。
可以说游戏、电影、动画等内容创作,在被Sora模型快速生成的情境之下,将迎来颠覆性变革。
2. 新闻社交领域
新闻社交领域讲究时效性,也就是要速度。
倘若今天发生的热点事件,后天报道也就不叫新闻了,在这一过程中影响时效性的通常有三部分,采访、编辑、播出。
利用Sora直接生成画面,至少能省略其中两个环节,保障了时效性。
对于短视频、自媒体等社交领域,跟进热点,仅仅需要一句指令,就快速生成相关的虚拟视频内容,保障了时效性,也就保证了一定的流量。
另一方面,Sora或将拉进头部创作者与尾部创作者的创作成本。
我们或许将来到一个创意与特色比拼的时代,倘若从业者缺少创意或者没有特色,将很难应对这股浪潮。
3. 广告营销领域
Sora模型可以快速生成吸引人的广告视频,帮助品牌在竞争激烈的市场中脱颖而出,同时降低制作成本。
例如,我们看到某些品牌的广告片,短短几分钟的视频,传统广告公司报价基本在百万级别。
Sora的到来,将使品牌方成本压缩到一个极致,而对于广告公司来说,这或许意味着商业模式的直接变革。
4. 教育学习领域
对于教育学习领域的影响大致分为两方面。
一方面,不少大学都开设了如影视制作、动画设计、多媒体设计、数字媒体艺术等专业。
Sora的到来,可能会使学了四年的专业技艺的学子们,比不上一个懂得如何指挥AI的门外汉。
另一方面,老师可以利用Sora模型,将文字教材转化为生动的视频教程。
提高学生的学习兴趣和效果,为特殊教育群体提供个性化的学习材料,帮助他们更好地融入社会,加速教育普适性和均衡性。
5. 科学研究领域
Sora是根据现实物理规则建立的模型,也就是说能在一定程度上模拟现实物理现象。
例如,在物理学、化学、生物学等领域,科研人员可以利用Sora创建复杂的动态模拟,再现难以在实验室条件下实现或观察的过程。
将科学实验的变得虚拟化和可视化。
三、面对Sora,我们该怎么办?
Sora这么强大,对于各大行业影响这么深远,我们是又双叒要被AI取代了么?
放心,本文并不是一篇贩卖焦虑的文章,不信你往下看:
翻开历史的画卷,其实每一次工业革命之后,都会带来劳动力市场的变革。
第一次工业革命:
是一个以农业为主的农村社会过渡到工业和城市的时期,实现了从手工劳动生产到机器生产的跃迁。
在这次革命中,有着大量的农民失地失业,但经过技能培训,农民很快学习到了锅炉制造,钢铁,机械等技能。
同时技术、行业的发展,也催生出制造和维修等方面的大量岗位,创造了以前不存在的不同就业机会。
第二次工业革命:
是一个原有产业的增长时期,也是钢铁、石油和电力等新产业扩张的时期,并利用电力创造大规模的生产。
随着从蒸汽动力向电力的过渡,也出现短期失业的现象。
但如果需求量减小的蒸汽机械师能够提早或重新培训转入到电力、电气方面,则非常好就业。
这一时期需要快速掌握一些以前不存在的新技能。
此外,通过大规模生产线,整个社会开始创造比以前更多的就业机会。
第三次工业革命:
是指从模拟电子和机械设备到当今可用的数字技术的技术性进步。
这期间的技术进步包括个人计算机,互联网以及信息和通信技术(ICT),一些工作被计算机和机器人取代。
如果你不懂计算机,那么毫无疑问你可能会失去工作。
同时也再一次创造了以前不存在的新工作,例如软件和硬件工程师。
回顾历史之后,我们会发现:
其实任何被红利激增出来的职业都有其生命周期,随着新技术的革新和迭代(通常为20到40年),大部分偏后台以执行为主的工作又会形成洗牌,进入一个新的循环之中。
所以只有真正能为人类带来价值或满足某种根本需求的事业,才能真正脱离这种循环,意味着无论你从事何种职能,最终都要提升它的深度:
会计不会被替代,但只能写底稿者一定会被替代;文字工作不会被替代,但只会抄袭者一定会被替代;软件开发者不会被替代,但只会复制粘贴者一定会被代替…..
这样的时代,我们要做的不是对抗,而是配合,就比如Sora让生产一个视频变得更加简单,那我们就可以有以下的几条思考路径,去配合这样的AI潮流:
1.思考该技术的瑕疵,从而诞生的新需求
目前的Sora没有声音,所以对于配音的需求(场景声,人声)在短期会急速上涨。
2.思考技术与内容如何转化
热门小说可以通过Sora,做出成系列的电视剧 (这应该还需要进一步的技术迭代才可以达成)。
3.思考个人的特异性是否吃到了技术革新的红利
内容为王的时代来临了,如果有好的创意,剧本,与导演视角,那就自己用Sora做一个电影出来。
4. 建立生态:搭建 多对多的视频生产平台
( 小团队与市场上的需求者直接对接,打破大公司的垄断地位)
如何理解?不是所有人都可以通过Sora,生成一个符合其预期的视频的。
因为Sora的文本包含了运镜,视角,机位,风格,场景描述,这些仍需1个专业的视频制作人来提供专业术语来执导AI生成视频,再配备一个在视频的某些细节上可以进行修改的人,那就需要一个小团队,来满足个人/公司的需求。
而搭建这样的平台就是建立供应与需求的链接,之前是需求方搜索哪些公司可以生产视频,而现在需求方可以像定外卖一样,对更多的服务供应者进行挑选和下单。
四、Sora如何申请使用?
Sora这么强大,怎么才能用的上呢?
渠道一(官方)∶
https://forum.openai.com
OpenAl的官方论坛,据消息透露加入论坛有机会获得内测资格
渠道二(官方)∶
Red Team开始公开招募了,要求比较高。Sam之前说过,如果进入到红队,可以有Sora的内测机会https://openai.com/form/red-teaming-network
五、Sora之后是什么?
时代的变迁似乎越来越快了,我们能否畅享一下,Sora之后又是什么呢?答案有可能在以下几个方面之中!
1. 多模态数据
定义:整合了文本、图像、音频、视频等不同形式的数据。多模态数据能够提供更丰富的上下文信息,帮助AI系统更好地理解世界的复杂性。
应用:通过处理多模态数据,AI可以学习如何在视觉、听觉和语言之间建立联系,模仿人类如何通过多种感官信息来理解环境。
2. 丰富的交互数据
定义:包括人机交互中产生的数据,如聊天记录、问答对话、用户行为数据等。这些数据反映了人类的思考模式、偏好和决策过程。
应用:通过分析交互数据,AI可以学习如何与人类自然交流,理解人类的需求和意图,并作出适当的响应。
3. 结构化知识库和语义网络
定义:结构化的知识表示,如知识图谱、本体论和语义网络,这些工具能够描述概念之间的关系和属性。
应用:利用这些结构化知识,AI可以执行复杂的推理任务,理解和生成符合逻辑的内容,模仿人类的学习和思考过程。
4. 模拟环境和虚拟世界数据
定义:创建虚拟环境或模拟器,让AI在这些环境中进行实验和学习,类似于人类通过实践学习。
应用:通过与模拟环境的交互,AI可以学习物理规律、社会规则和行为模式,提高解决现实世界问题的能力。
5. 强化学习环境中的反馈数据
定义:在强化学习中,AI通过与环境的交互获得的奖励和惩罚,用以评价其行为的好坏。
应用:这种基于反馈的学习机制可以让AI在试错中学习如何做出更优的决策,模仿人类在实践中学习和进步的过程。
我想说,其实这些答案,也是AI告诉我的。。。
版权声明
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!