计算机:JANUS-PRO轻量化成本验证普惠技术路径

2025-02-01 08:00:07 和讯  国泰君安李博伦/伍巍
  本报告导读:
  Janus-Pro 以解耦式架构突破轻量化多模态模型技术瓶颈,验证算法创新可替代算力堆砌路径,其开源生态与模块化设计加速技术渗透,颠覆传统竞争逻辑,推动行业向算法效率与场景定制能力迁移,开启中小企业参与AI落地的新窗口。
  投资要点:
  投资建议:DeepSeek 开源多模态模型Janus-Pro 通过解耦式架构设计,以128 颗A100 训练1 周的轻量算力实现超越DALL-E 3 的性能,验证了算法创新对硬件依赖的突破性替代。该路径验证下,模型能力与算力的强绑定将会放松,具备架构设计能力的团队将主导未来技术走向。同时开源生态加速技术普惠,低成本多模态模型将助力教育、电商等场景加速渗透。推荐标的:鼎捷数智、虹软科技、福昕软件、科大讯飞,受益标的:海天瑞声、迈富时、第四范式。
  Janus-Pro 通过创新架构实现多模态能力突破。Janus-Pro 通过将视觉编码解耦为单独的路径来解决以前方法的局限性,图像理解使用SigLIP-L 提取特征、图像生成通过VQ 令牌转换,由统一自回归Transformer 进行处理。其7B 版本在GenEval 基准测试中以80%准确率超越众多主流生成方法,在DPG-Bench 获得84.19 分,且在MMBench 多模态理解测试中达到79.2 分,在多模态理解和生成两方面均表现卓越。
  架构创新显著降低算力依赖,证明大模型发展可摆脱算力竞争陷阱。Janus-Pro 在仅128 块A100 GPU 训练一周的条件下实现性能超越。这印证了算法创新对算力效率的指数级提升:主流多模态模型动辄百亿至万亿参数,而Janus-Pro 通过HAI-LLM 训练框架,将硬件投入极大压缩。该路径表明技术路线的创新在多模态领域同样能够实现,行业正从算力硬件的军备竞赛转向算法精耕阶段,具备原创架构设计能力的团队使得AI 技术的护城河不再与算力规模绑定。
  开源释放场景定制潜能,加速企业级应用落地。作为开源多模态模型,Janus-Pro1.5B/7B 参数版本及相关代码已开放,大幅降低技术应用门槛,开发者无需从头构建。Janus-Pro7B 版本在GenEval 和DPGBench基准测试关键指标上已超越闭源竞品DALL-E 3 和StableDiffusion,这使中小企业在电商图片生成、教育创作等场景能够快速部署高性价比的多模态解决方案,推动技术向产业端加速渗透。
  风险提示:开源生态引发同质化竞争,实际应用落地不确定风险。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王治强 HF013)

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读