让“郭德纲”说英语相声,HeyGen的视频生意不好做
听郭德纲的新相声了吗?飙英语的那种。
最近,一段“郭德纲用英语说相声”的视频在社交平台传疯了。视频中,老郭用自己声音说的英语不仅发音准确,嘴型自然,语法错误都少。
实际上,这段视频又是AI技术参与的二创作品,这个“没有翻译腔的真正翻译”作品被网友怒赞,不少人觉得,即使是真人配音也无法达到这样传神的效果。
深扒一下发现,这段爆款视频的背后有一家名叫诗云科技的中国公司,他们的产品HeyGen就是把郭德纲相声中译英的“神器”,AI翻译仿声打得其实是视频制作生意的算盘。
如果说“AI孙燕姿”显示了AI仿声的能力,妙鸭相机展示了AI处理图片的技艺,HeyGen用则用“英语相声”呈现了AI的多语言能力。
过去以高端示人的人工智能,正在以人民群众喜闻乐见的方式走进大众视野。娱乐过后,“AI孙燕姿”的话题降温,妙鸭相机也因非高频、刚需而昙花一现,HeyGen又如何不步后尘?它的出现真的能直击视频制作的痛点吗?
一、AI仿声再进化,能说外语了
今年10月,“郭德纲说英语相声”的视频在全网火了,B站浏览量达到几百万,并迅速带动UP主们创作名人说外语的反差视频。
于是,老郭不但能说英语相声,还能用英语访问本山大叔,对方也是说的英语,访谈节目一下变得International(国际化)起来;而“于谦大爷”也能唱英语Rap了,“泰勒·斯威夫特”和“艾玛·沃森”甚至在访谈节目中用中文对答如流。
这可不是给人物配外语字幕或译制片一样的配音,而是真正让人物操上了一口流利的外语,不仅声音神似本人,连在嘴型都能对上,这样的视频在海外视频平台也火了。
爆火的翻译配音视频背后是AI工具HeyGen在发挥作用,即展现了AI对语言翻译的能力,也再次炫技了AI仿声,效果被网友怒赞。
在排队等待7000个视频后,网友@Gorden Sun在HeyGen上只上传了一段原素材就制作出了霉霉说中文的视频,“效果绝对目前最好,没有之一,”他也表示,“声音克隆稍有缺陷”、“情感还原度稍有欠缺”。从他的体验感受看,属于瑕不掩瑜了。
网友排队7000个视频,生成霉霉说中文视频
借助HeyGen工具,用户只需上传视频,选择语言,就能自动翻译,调整音色,生成嘴型匹配的外语视频。
很快,一大批AI翻译仿声的有趣视频就此出现,很多视频的观看量都破百万,HeyGen也因此大圈了一波流量,最火爆的时候,生成一段视频,前面排队的都有几万个。比前段时间人们用妙鸭相机生成写真照片的时间都长了去了。
值得注意的是,HeyGen背后是一家名为诗云科技的中国公司,2020年11月成立,该公司官网显示,其产品除了AI翻译仿声,还有AI数字头像生成、AI脚本生成等服务。
天眼查显示,诗云科技已完成两轮数百万美元融资。其中2021年3月,诗云科技获得红杉中国种子基金和真格基金的天使轮投资;同年8月,又获得数百万美元Pre-A轮融资,由IDG资本领投,红杉中国和真格跟投。
据悉,HeyGen的目标是要做到AI视频创作领域的Midjourney。目前,它背后的团队团队大概30人。尽管HeyGen尚未达到Midjourney的用户体量,但也成功成为了国内市场上继“妙鸭相机”之后最新的一款爆款AI应用。
根据社交平台X上一位网友的统计,今年8-9月,各大文生图、文生视频类AI网站的访问量均开始呈现下降趋势,但HeyGen的访问量实现了逆势上涨,上升高达92%。
HeyGen的访问量逆势上涨
创始人Joshua Xu曾透露,HeyGen产品正式上线后,在7个月内实现了100万美元的ARR(年度经常性收入),并保持连续9个月50%的月环比增长率。
二、推出付费版,击中视频创作者痛点了吗?
访问量持续上升,HeyGen这样的态势还能保持多久?这与它是否能切中视频制作的痛点有关。
AI生成写真的“妙鸭相机”一度被誉为“能暴打海马体”。而如今,海马体活得好好的,以小程序形态面市的妙鸭相机,流量指标经历了约3个月的短暂高峰后出现断崖式下跌。微信指数显示,目前“妙鸭相机”的指数趋势已经回到爆火前的水平。
“妙鸭相机”的火爆昙花一现
以“写真”走红的妙鸭相机走不长,是因为面向C端的写真照片并不是普通大众高频且刚需的场景,尽管也需要付费,但妙鸭相机没能在写真之外创造更多的功能,用户的付费意愿大大降低,用完即丢也就成了必然命运。
HeyGen也是因大众在短视频娱乐中再次发现了AI的亮点而走红,进而进入了视频创作者的工具库里。但这个工具真的能直击视频创作者的痛点吗?
在知乎、抖音上,不少视频博主们分享过视频制作的真实痛点。爆款视频的背后是脚本创作、拍摄、后期剪辑等制作环节的高成本投入,AI生产力的确能解决成本问题,但创意仍需要人类发挥。
目前,HeyGen主要提供四项功能,可以用AI视频工具制作各种用途的视频,比如产品营销、内容营销、销售推广、学习培训等;用户可以使用平台自带数字人形象、真实形象或AI绘画形象,让人物说不同语言。目前,HeyGen支持40多种语言。
可以看出,HeyGen在尽力引导产品扩展视频创作的应用场景,但似乎并不是要解决视频创作者的痛点,更多是利用AI的仿声翻译能力让视频内容跨国、跨地域传播。
目前,HeyGen推出了免费版和付费版两种版本。付费版最便宜的需要每月24美元,未来将逐步开放API接口、团队协作和企业功能。而免费版仅限于生成1分钟时长视频,且生成需要排队等待很长时间。
很明显,HeyGen的盈利来源主要在B端。10月底,商业版本上市,新功能包括可以生成长达3小时的内容;画质最高提升至4K;能帮助用户制作PPT;可以文本转视频,支持音频上传、视频分享等。商业版HeyGen可以满足广告、电商、新闻等行业各种需求。
升级后到的HeyGen仍然重场景,回避了视频制作者在创作环节上的刚需。
而在视频制作场景中,AI工具依然不少,几乎都冲着制作环节而去。例如能直接将脚本转化成视频的Pictory.AI,可以实现AI语音、匹配素材与音乐的功能;腾讯智影、一帧秒创、万彩微影这些应用也利用了AI技术来简化视频创作过程,并提供了文本配音、文章转视频、数字人播报等功能。
但所有做视频生意的AI工具都绕不过版权问题,而这个问题是最令视频创作们瑟瑟发抖的困境之一。技艺从AI仿声进化到译制的HeyGen也不能解决版权问题,难题还是抛给了视频制作者。
当前,HeyGen被广泛应用于短视频的二次创作,比如AI换声等。对此,有律师表示,用AI技术为他人更换声音、做“翻译”并发布视频,可能涉嫌著作权、肖像权、声音权三个方面的侵权。比如,相声、小品等都属于《中华人民共和国著作权法》保护的“作品”。网友用AI软件将相声、小品等“翻译”成其他语言,需经过著作权人授权,否则就存在侵权问题。
此外,网友用他人形象制作视频,并在网站发布,需要取得肖像权人的同意,否则涉嫌侵权。最后是声音权,根据《中华人民共和国民法典》规定,对自然人声音的保护,参照适用肖像权保护的有关规定。也就是说,需要取得声音权人的同意,才能够使用他人的声音。
从去年年底至今,由ChatGPT打开的AI魔盒仍在不断展现新魔法,人类似乎拿到了人工智能的车票,但顺利搭上这列提升生产力的高速列车,似乎还得等很久。
作者:木沐,编辑:文刀
来源公众号:元宇宙日爆(ID:yuanyuzhouribao),在这里,看见未来。
版权声明
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!