计算机行业跟踪报告:AI+专题系列点评(一):多模态时代下的AI扩图应用

2023-12-13 18:55:04 和讯  华创证券吴鸣远
  多模态技术高速迭代催化AI 应用落地。12 月7 日,谷歌多模态大模型Gemini1.0 正式上线,多模态大模型迎来重大突破。多模式技术旨在将不同类型数据如图像、视频、音频等融入到大语言模型。通过结合不同的模态,使模型能够更准确的理解外部世界。多模态技术的高速迭代,使得一些AI+应用场景迎来机会,AI+绘图、AI+视频等图片类AI 应用得以落地。
AI 扩图新功能横空出世,APP 竞相迎合用户需求。AI 扩图是一种利用人工智能算法对图像进行扩展处理的技术,AI 扩图属于AI 画图,是多模态的分支。
  2023 年7 月11 日,美图秀秀APP 正式上线“AI 扩图”功能,将AI 扩图带进了大众的视野,随后多款APP 均上线此功能;抖音旗下的产品剪映APP 凭借短视频的传播也拥有许多用户,其采用多元化的视频模板将成品图片输出;许多小众APP 如Wink、Uncrop 等的该功能均被广泛使用。
各AI 扩图产品使用对比。经过我们的测评,可以发现美图秀秀对于有主体的图片会沿着其基本边缘拓展,没有出现断开主体的情况,扩图偏保守,重点拓展背景且不新增要素。Wink 扩充背景效果较优,对于有主体的图片可能存在瑕疵。剪映成品输出形式为视频,需要截图保存图片,整体扩图表现优秀。
  Uncrop 扩图后会新增主体,风格偏鲜艳,但由于要素新增过多可能存在瑕疵。
  一次生成多种风格以及多要素的增加可为创作者提供新的思路。
投资建议与关注标的:多模态技术高速发展,文生图、文生视频能力未来可期,AI+绘图、AI+视频值得关注。建议关注多模态应用和大模型基座相关标的:1)AI+绘图:万兴科技;2)AI+视频:当虹科技、虹软科技;3)大模型基座:科大讯飞。
风险提示:大模型研发不及预期、政策不及预期、行业竞争加剧、扩图测试结论存在误差仅供参考。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    和讯特稿

      推荐阅读