虹软科技ArcMuse 重大升级,聚焦商拍领域,实现了输入图像生成视频功能,大幅降低商拍视频制作成本。2 月19 日,虹软科技宣布技术计算引擎ArcMuse 重大更新,可实现商品展示视频与服装模特视频的自动生成。与Sora 类似,ArcMuse 大模型视频生成基于diffusion -transformer 技术架构,但不同的是,ArcMuse 大模型聚焦商拍领域,着力于图生视频,通过图片捕捉商品质感、色彩等细节方面的精确信息,然后将静态商品图和平面模特图快速转化为生动活泼、能多维度展示产品特性与魅力的动态商拍视频,降低商拍视频生产成本的同时为商家提供高效、流畅、定制化的AI 视频生成体验,为电商行业带来了全新的展示内容和推广方式。
万兴科技发布具备“文本生成音视频”能力的多媒体大模型“天幕”,聚焦数字创意垂类创作场景,引领国内多模态大模型技术创新及生态构筑。1 月30 日,万兴科技发布国内首个多媒体创作垂类大模型 “天幕”。天幕以视频创意为核心,聚焦视频处理和生成,着眼于赋能全球创作者;以音视频生成式AI 技术为基础,由视频、音频、图片、语言大模型组成,具有“多媒体”、“垂直解决方案”以及“本土化数据”三大特点,具备一键成片、AI 美术设计、文生音乐、音频增强、音效分析、多语言对话等核心能力,有望引领AI 数字创意新浪潮。
商汤“如影”聚焦AI 数字人视频生成,具有低门槛、定制化、高质量、高效率等优势,开辟视频内容创作新范式。“商汤如影SenseAvatar”AI 数字人视频生成平台基于语言大模型、AI 文生图、数字人视频生成等多种能力,用户输入5 分钟真人视频素材就能生成超写实2D 或3D 数字分身。此外,如影平台还打通文生文、文生视频的整个流程,通过文字驱动,即可自由开展各类视频制作,例如输入一段商品文字描述,就可以用AI 文案功能一键合成AI 数字人带货短视频。
视频分析和识别领域,大模型也大有可为。2023 年8 月,云从科技宣布其All-in-One 模型实现了视觉-语言跟踪网络结构与学习范式的大一统,可根据自然语言提示和初始边界框从视频中预测目标的运动轨迹,在人机交互、视频监控、虚拟现实、自动驾驶等领域具有重要的商业应用价值。2023 年10月,大华股份发布多模态融合的行业视觉大模型“星汉”,面向智慧物联领域,通过融合图像、点云、文本、语音等多模态数据,大幅提升视觉解析能力。在2023 年三季报业绩说明会上,海康威视称其视觉大模型在防溺水监控、零售店现金入账监控等场景都具有良好的效果。
建议关注:虹软科技、万兴科技,商汤-W,海康威视,大华股份,云从科技。
风险提示:技术进展不及预期、应用落地不及预期、国际环境发生变化。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
最新评论