Sora模型推动AI多模态领域飞跃式发展,训练和推理将提升对算力基础设施需求,这家公司已向微软提供多种产品

【(电报解读】Sora模型推动AI多模态领域飞跃式发展,训练和推理将提升对算力基础设施需求,这家公司已向微软提供多种产品

电报解读
电报内容
【中信证券:文生视频Sora等模型发布 有望继续推动算力与网络需求升级】财联社2月19日电,中信证券研报指出,若Sora成为视频创作领域的超级应用,将带来巨大的网络设备升级需求。同时谷歌最新多模态大模型Gemini1.5以及英伟达本地聊天机器人Chat with RTX也在近期陆续发布。我们认为AI发展趋势已经愈发明确,AI产业成熟的商业模式与“收入一资本开支”的良性循环亦在逐步形成。这有望缓解市场对于光模块等算力设备投资持续性的担忧,从而打开龙头厂商估值空间。
电报解读
一、Sora采用基于扩散模型构建,该模型成为文生图领域的核心模型之一
2月16日,OpenAl宣布推出全新的生成式人工智能模型“Sora”通过文本指令,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头。Sora的改进点在于:1、统一处理图像和视频数据为patch,并将其进行训练;2、采用diffusiontransformer这个新架构模型。3、借助OpenAl自己的文本(GPT)和图像(DALLE)模型来帮助丰富提示词和图像训练。
Sora模型采用了扩散模型+Transformer的架构,典型应用ChatGPT其中的:"T”则表示Transformer架构,依靠海量数据及算力的支持,ChatGPT表现出较强的语义分析能力、数字逻辑能力等。而扩散模型自2015年被提出,至今已成为文生图领域的核心模型之-,Stable Diffusion与MidJourney等一些领先的图像生成应用的底层模型均是基于扩散模型所构建。
二 视觉大模型应用量的增加有望自己网络设备需求量快速增长
广发证券研报指出,相较于语言类大模型,视频类大模型的推理或需要更大的算力支持。视频的组织方式是由一系列的数据帧组成,每一帧数据又是由成千上万的像素点组成。因此,生成包含同样信息量的数据时,视频往往比文字的数据量更大。在视频类大模型所需处理的数据量更大、算法更复杂的情况下,其应用和推理阶段对算力的消耗也更大。随着视觉类大模型开发量和应用量的增加,AI芯片、加速卡和网络设备的需求有望快速增长。
三 相关上市公司:


付费内容
售价:1 积分
开通财联社用户或更高级的会员可免费查看该内容

登录注册购买

这里是自定义内容,请在【用户中心配置 - 销售配置 - 普通付费内容 - 未登录提示】修改

发表评论 取消回复

电子邮件地址不会被公开。 必填项已用*标注

有些内容是需要登录本网站才可以查看的,若是需要登录的话,欢迎加站长微信“laogong0311”,站长免费帮大家注册账号!

遇到问题?请给我们留言

请填写您的电话号码,我们将回复您电话