计算机行业点评:豆包开源视频大模型激活每个摄像头

2025-02-11 14:10:08 和讯  民生证券吕伟/杨立天
  事件:2 月10 日, 据豆包大模型团队官宣发布视频生成实验模型“VideoWorld”,不同于 Sora 、DALL-E 、Midjourney 等主流多模态模型,VideoWorld 在业界首次实现无需依赖语言模型,即可认知世界。
  开源视频生成模型最新成果,可仅靠视觉认知世界。
  视频生成成为通用知识学习方法,在现实世界充当“人工大脑”。作为一种通用视频生成实验模型,VideoWorld 去掉语言模型,实现了统一执行理解和推理任务。同时基于一种潜在动态模型,可高效压缩视频帧间的变化信息,显著提升知识学习效率和效果。且目前该项目代码与模型已开源。在不依赖任何强化学习搜索或奖励函数机制前提下,VideoWorld 达到了专业 5 段 9x9 围棋水平,并能够在多种环境中,执行机器人任务。团队认为,视频生成可以成为一种通用的知识学习方法,并在现实世界充当思考和行动的“人工大脑”。
  模型仅靠“视觉”即可学习知识 ,“预测”未来,并“理解”因果关系 。研究团队构建了两个实验环境:视频围棋对战和视频机器人模拟操控,它在保留丰富视觉信息的同时,压缩了关键决策和动作相关的视觉变化,实现了更有效的视频学习,且这种纯视觉模型可“预测”未来,并能“理解”因果关系 。在未来,豆包团队将着力解决其在真实世界环境中的应用,仍面临着高质量视频生成和多环境泛化等挑战。
  视觉认知世界的能力有望激活“视觉市场”为其打开增长空间。
  以海康威视为代表的“视觉市场”有望在视频大模型的能力催化下收益,作为全球知名的视频监控行业龙头企业,根据2024 年度全球安防50 强榜单,海康威视以97.22 亿美元的2023 年安防产品销售收入稳居第一,超过后两名的总和。2022 年,海康威视明确智能物联(AIOT)战略, 2023 年,公司正式推出“观澜大模型”助力各行业实现数字化、智能化升级。根据Omdia 报告,2022年海康威视在全球视频监控市场中的占有率达到25.9%,大幅领先于第二名。在庞大的视频监控部署网络下,开源视频大模型的诞生对海康而言无疑是一剂强心针。
  萤石网络公司2023 年智能家居摄像头业务营收占比62.07%,且作为公司的现金牛业务及第一增长曲线,市场占有率处于市场前列,且连续多年在双11、618 等购物节的天猫、抖音等平台相关类目品牌排行中位列第一。且公司在视觉技术方面拥有硬件、软件、云平台高度融合的生态闭环,端云协同,为智能检测、智能识别、AI 分析推理等功能提供了强大支持。视觉大模型的发布有望进一步助推萤石网络视觉领域业务再上台阶。
  投资建议:豆包开源视频大模型“VideoWorld”发布,让视频生成成为通用知识学习方法,在现实世界充当“人工大脑”,仅靠“视觉”即可学习知识 ,“预测”未来,并“理解”因果关系,有望激活“视觉市场”为其打开增长空间。
  建议关注:海康威视、萤石网络、大华股份、千方科技、汇纳科技、网达软件、魅视科技等。
  风险提示:技术落地不及预期,行业竞争加剧。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:刘静 HZ010)

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读