分析师观点:Sora正式发布前,多模态大模型爆发前夜的10个思考

智能计算 时间:2024-02-21来源:IDC

OpenAI发布使用Sora大模型生成的1分钟短视频后,正式全面打开了生成式AI的想象空间。尽管目前尚未正式对外开放使用,也无法了解到更多技术细节,但可以确定的是这一波技术迭代将为AI行业参与者带来可观的机遇。

在多模态大模型爆发前夜,IDC中国研究总监卢言霞给出了以下10个思考,供您参考

Sora对于生成式AI的影响:在文生视频领域真正迈出了第一步,真正做到生成式AI驱动生成短视频。接下来也将刺激其他科技巨头加快在该领域的技术攻关力度以及产品发布速度。

不可预测的未来:具体哪些公司能在什么时间点推出与Sora类似的产品,不可预测。当前Sora生成的是1分钟的视频,对于行业已经是重大突破,下一步何时能生成2分钟5分钟以上的视频,不可预测。

最先应用的领域:将最先应用于短视频、广告、互娱、影视、媒体等领域。在这些领域采用多模态大模型能力,辅助人类员工生成视频,既可以提高生产速度又可以提高生产数量,还可以创造全新的视觉感受,能够帮助企业真正实现降本增效、提升用户体验。

哪些公司有潜力快速推出类似产品:几个最有潜力的群体——在大模型以及AI领域投入最为领先的科技巨头,如BAT、科大讯飞等;在计算机视觉领域拥有深厚积累的公司,比如商汤、海康一类的公司;以及短视频类公司;更可大胆想象,也或许会培训出多模态大模型的全新创企。

对于AI产业的影响:大语言模型为AI产业带来新的生机,然而语言模型的应用场景有限。要全面打开生成式AI的想象力,还是要依托多模态大模型。Sora的发布,以及后续科技巨头的跟进,有望对AI产业带来再一轮爆发式的增长。

对于个体的影响:不管您是否感受得到,于个人而言,生成式AI产品已经在潜移默化的改变我们的生活方式,每一个人都可以认真考虑该类产品如何能够助力我们的生活与工作。

生成式AI对于全球数据空间的改变:未来5年,生成式AI生成的文本类文件、图像类文件、视频类文件、软件代码类文件数量将会越来越平均。而这其中,与图像文件相关的数据量可能是文本文件的 100 倍,视频文件是图像文件的 10 倍。整体来看,由于 GenAI 的采用和使用日益增多,近期和远期所创建数据的增长速度都将快于近几年。

行业发展的挑战:

●   高质量数据的稀缺:图像、视频类数据掌握在少数公司手中。这些数据也需要标注,甚至重新采集,才能用于大模型的训练。

●   多模态大模型对算力的消耗更高,算力的可获取性以及成本将是挑战之一。

●   顶尖的大模型研发人才,也是行业发展的稀缺资源。

值得关注的事项:多模态大模型将带来更严峻的安全方面的挑战。一方面多模态大模型将读取更多的图像、视频类数据,这些图像视频数据是否合规是否安全,需要得到保障;另一方面,生成的视频与真实世界之间的差异,是否会影响到人身安全、社会稳定、企业安全等,也需要注意。

做好准备:大语言模型的研发历程已经能够看到数据的重要性。在多模态大模型领域,有数据资源的企业可以考虑如何将这些数据开发成可供模型训练的数据产品,缺乏数据资源的企业也需要尽早收集能够获取到的数据源。

免责声明

本文中的内容和数据均来源于IDC所发布的报告,所有内容及数据均为我公司所有。未经IDC书面许可,任何机构和个人不得以任何形式翻版、复制、刊登、发表或引用。

关键词: Sora 多模态大模型 IDC

加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW

或用微信扫描左侧二维码

相关文章


用户评论

请文明上网,做现代文明人
验证码:
查看电脑版