最强文生视频大模型Sora发布后,马斯克跳脚急眼了?

科技创新潮流 2024-02-29 16:17:58

开年来,AI圈大事件不断。

Sora的发布,是最近这个月的一枚深水炸弹。

Open AI总是不鸣则已一鸣惊人,在没有任何预告的情况下,直接发布了这一文生视频大模型。

用户只需输入文字来描述场景,Sora就能生成类似电影的逼真场景,而且还可以涵盖多个角色、不同类型动作和背景细节等。目前,Sora至多能生成1分钟左右的1080P高清视频,被看作“人工智能领域的一次重大突破”。

(网络热传的由Sora生成的视频作品)

Sora发布后数小时,特斯拉CEO埃隆·马斯克在社交媒体上回复了“gg humans”。这是游戏中专用术语,后引申为认赌服输、心服口服的意思。

这条推文看起来,是为Sora的能力所叹服,但傲娇如马斯克,又怎么会轻易认输?

现在引发大家下一波期待的,是传言将在今年一季度举办的特斯拉AI DAY。

每一次特斯拉的AI DAY都有大惊喜,而且马斯克从不画饼,在AI DAY上所介绍的技术,基本都在较快时间内落入到了实际应用之中。

2021年首届特斯拉AI Day上,特斯拉首次介绍Dojo超算,可利用海量视频数据,完成“无人监管”的数据标注和训练,帮助特斯拉实现其自动驾驶目标。

去年7月,特斯拉开始生产Dojo,上月美国纽约州州长新闻发布会上宣布,特斯拉Dojo项目落户该州的布法罗市,首期投资5亿美元。

摩根士丹利(大摩)估计,Dojo会为特斯拉带来巨大优势,使其市值增加近6000亿美元,相较如今基本实现翻番。

22年举办的AI DAY上,特斯拉Optimus机器人「擎天柱」正式亮相,当时的「擎天柱」还只能被几名壮汉抬上来与观众打招呼。

去年,「擎天柱」最新视频公开。在端到端神经网络加持下,它已经能够精准分类物体、找准身体平衡感,能够自我精确操控手部,以及腿部的动作,更高效学习各种任务。

这一次的AI DAY正逢文生视频AI大模型风头正劲之时,不知道特斯拉会带来什么惊喜?

其实,在Sora发布之后,马斯克忍不住揭秘了:特斯拉研发“真实世界视频生成工具”大约已有一年时间。也就是说,在过去这一年里,特斯拉都在钻研与Sora类似的大模型。

Sora被认为能重塑视频影视行业,而特斯拉则是通过这一技术来赋能自动驾驶——

最近,特斯拉向在美用户推送了版本号为V12.1.2 Beta的端到端全自动驾驶(FSD)系统。从原理层面看,端到端大模型就是对海量驾驶视频片段的压缩,具体来说,就是特斯拉将上千万个视频片段里包含的人类驾驶知识,压缩到了端到端神经网络的参数里。其实这一原理,和Sora的训练过程正好重合。

去年中,马斯克曾经介绍过端到端FSD的训练规模:特斯拉花了大约一个季度的时间,完成了1000万个视频片段的训练。

训练视频片段当然不会止步于1000万,而正是基于这样大基数视频的训练,大模型拥有了对于各种路况更丰富的理解能力,用户的感受则更直观——就是自动驾驶更好用了。

大模型能给我们带来的便利还不止这些。

以ChatGPT发布为起点,大模型席卷全球各行各业。金融大模型协助金融决策,完善内容发布;医疗大模型堪比全科专家,在分级诊疗上逐渐有着更多的应用;教育大模型则同时为老师和学生减负,助力学习效率进一步提升。

手机+AI大模型也成了新的趋势。不久前,IDC发布中国AI 手机市场预测,认为新一代AI手机所占份额将在2024年后迅速攀升,2027年达到1.5亿部,市场份额超过50%。

各大手机厂商明显都察觉到了这一趋势,都早早开始AI布局。

比如OPPO,早在 2020年就推出了首个 AI 大模型,并持续进行投入,去年 OPPO 发布自主训练的安第斯大模型(AndesGPT)更是在 Super CLUE 知识与百科能力排行榜上仅次于 GPT 4。

龙年伊始,OPPO陈明永又发布公开信,表示2024年是AI手机元年,AI手机时代将成为继功能机、智能手机之后,手机行业的第三阶段。不久后,OPPO又专门召开AI发布会,足见其对AI这一全新赛道的重视程度。

发布会上,OPPO正式发布由OPPO AI超级智能体和AI Pro智能体开发平台组成的“OPPO 1+N智能体生态战略”,同日,OPPO AI中心正式成立,未来还将不断加大对AI的投入。

或许大家对于手机+AI大模型始终感到模糊,甚至会怀疑手机后面加上AI二字会不会止步于噱头,那我们不妨来看看今年1月OPPO发布的Find X7系列,这是OPPO旗下首款AI手机,也是全球首个搭载了端侧70亿大模型的手机。

除了一贯的影像优势,基于自研大模型,Find X7系列更新了很多有趣的功能,比如颇受欢迎的OPPO AI消除功能。

相信大家日常拍照时都遇到过这样的情况:好不容易找好角度摆好pose,却突然出现路人乱入,破坏了照片整体氛围感。以前为了不损害照片画质,我们往往会通过电脑端PS来修复问题,现在只要在Find X7系列的相册中打开照片进入「编辑」,用手指圈选待消除对象,系统就可以智能识别并进行消除,还会智能补充背景,修图效果自然的同时,也还能不降低原片的清晰度。

可能你会说,这样类似的功能,以前手机上也出现过。但AI大模型加持下,OPPO AI消除功能所呈现的效果是其他友商同类功能不能比的——圈选人or物更便捷,动动手指就可以,智能识别也更迅速,后期背景填充更是神来之笔,完全看不出痕迹。

在需要拍摄合影的场合,也能看到AI大模型加入之后的明显变化。

以前的合影人数一多,总是难以照顾到所有人面容的清晰度,这也是移动影像难以破解的一个痛点。现在AI加持下,OPPO AI超清合影可以智能识别并增强合影中人脸的清晰度,这也是全球首个实现端侧 AI 人脸优化的合影功能。

以后再也不用抢C位,因为人人都拥有C位的清晰度。

现在移动办公的场景越来越多,通话中的内容有时涉及重要工作事项,要是能够实时被记录为文本,可以帮打工人省下不少精力。

OPPO通话语音摘要就做到了这一点。在通话界面点击“智能摘要”开启这一功能后,它就会自动生成通话摘要,并且自动整理出待办事项。

以上举例的三个功能,只是OPPO Find X7系列中上百个AI赋能的实用功能中的代表。而这百余个功能,又是AI逐步改变我们生活、工作方式的小支点。伴随着对手机厂商们对于AI大模型不断的开发,相信这样的“小支点”会越来越多,最终会撬动地球,颠覆我们现有的智能手机使用体验。

所以OPPO中国区总裁刘波呼吁,大家一起来卷(AI手机),才能越卷越好用。

AI手机绝不是噱头,甚至是目前“最佳AI终端”。这是因为,手机是每个人都能够接触到 AI 的窗口。从某种程度上说,AI 或者说大模型的普及,可能将由手机率先完成。

在未来,我们用户究竟需要什么样的AI手机?

首先,当然是实实在在能方便用户的技术。像OPPO一样找准落地场景,开发实用功能是正解。

当我们发现AI手机操作简单,能给日常生活带来便利,自然也就接受了这一新生事物。

手机如此,其他落地产品亦是。

如同马斯克的AI Day从不画大饼一样,再前沿的科技,依旧是要落到实际生活应用中。归根到底,还是希望更多的AI终端研发者们,从用户实际需求出发,才能真正让AI走进千家万户,切实服务我们的生活。

0 阅读:5

科技创新潮流

简介:为大家带来一手的科技资讯