计算机行业周报:OPENAI发布视频生成模型SORA GOOGLE推出多模态GEMINI1.5版本

2024-02-21 08:15:10 和讯  中泰证券闻学臣
  OpenAI 发布首个视频模型Sora,可以根据用户输入的文本生成长达一分钟的高清视频。Sora 生成的视频可具有多个角色,特定类型的运动及主体和背景的准确细节的复杂场景。通过让模型一次性预测多帧画面,该模型可以确保被摄主体即使短暂离开镜头也可以保持不变,从而在单个生成的视频中创造多个分镜,并准确的保留角色和视觉风格。此外,Sora 还可以根据现有的静态图像生成视频,并对图像内容进行动画处理;提取现有视频,并对其进行扩展或填充缺失的帧。
  谷歌推出大模型Gemini 1.5,性能显著增强。Gemini 1.5 建立在谷歌对Transformer和MoE 架构的研究上,传统的Transformer 作为一个大型神经网络,MoE 模型则被分为更小的专家神经网络。根据给定输入的类型,MoE 模型将选择性地仅激活其神经网络中最相关的专家路径。这种专业化极大地提高了模型的效率。性能方面,Gemini 1.5 可持续运行多达100 万个tokens,该模型可以一次性处理处理大量信息,包括1 小时的视频、11 小时的音频、超过3 万行代码或超过70 万字的代码库。
  投资建议:人工智能新一轮十年级的技术和产业革命大幕已经拉开,短期调整并不影响产业的长期投资机会,当前海外已经开始进入商业落地阶段,ChatGPT、Midjourney等现象级爆品出现,微软、Adobe、Salesforce、Zoom 等软件巨头亦纷纷推出商业化产品,静待数据的持续验证;国内短期看算力最确定,模型训练拉动训练算力需求,未来应用大规模兴起亦会拉动推理算力需求。大模型仍处于群雄逐鹿、快速迭代阶段,未来空间大且会格局收敛,应用端长期空间最大,厂商百花齐放。
  算力:服务器建议关注浪潮信息、中科曙光、紫光股份等,芯片建议关注英伟达、寒武纪、海光信息、龙芯中科等;
  模型:国内建议关注科大讯飞、百度、商汤、三六零、格灵深瞳、云从科技、云天励飞等;海外建议关注微软、Meta、谷歌、特斯拉等;
  生态链:数据建议关注星环科技、海天瑞声等,安全建议关注深信服、启明星辰、安恒信息、天融信、绿盟科技、迪普科技、安博通、奇安信、永信至诚、美亚柏科等;
  应用:生产力工具建议关注金山办公、万兴科技、广联达、中望软件、彩讯股份、福昕软件等;ERP 等办公场景建议关注金蝶国际、明源云、鼎捷软件、用友网络、致远互联等;金融场景建议关注恒生电子、同花顺、中科软、宇信科技、百融云等;汽车场景建议关注中科创达、德赛西威、经纬恒润、万集科技等;医疗场景建议关注卫宁健康、创业慧康、嘉和美康、医渡科技、鹰瞳科技等;其他建议关注焦点科技、中科星图、航天宏图、拓尔思、佳发教育、神思电子等。
  风险提示: AI 技术落地不及预期、产品市场竞争加剧、数据更新不及时等
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    和讯特稿

      推荐阅读

        【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。