Meta 发布SAM,零样本分割图像中一切对象。2023 年4 月6 日,Meta正式发布Segment Anything Model(SAM)AI 模型,其本质上是一种图像分割模型,但最大的升级在于可以根据任何提示prompt(点击、框、文本等)从照片或视频中对任意对象实现一键分割,这意味着SAM 模型学会了“什么是物体”这一在计算机视觉领域(Computer vision,CV)的核心能力,并将自然语言处理领域(Natural Language Processing,NLP)的prompt 范式延展到CV 领域,属于革命性的技术突破。比如AR/VR 头戴设备可通过用户实现焦点作为对象选择,同时也可以将分割输出用作其他AI 系统的输入,适用于较多3D 建模任务。
SAM 模型初步验证多模态技术,机器视觉领域的“GPT-3”时刻。SAM模型是通用的分割方法,其已经学会了物体是什么的一般概念,可以对不熟悉的物体和图像进行零样本泛化,而无需额外的训练。Meta 开源了SAM模型和1100 万张图像和11 亿个掩码的训练数据集,其模型设计灵活高效,即开源同时可以在网页中运行。我们认为,基于SAM 的图像识别模型,或将快速应用于如安防、工业机器视觉、视频会议、AR/VR 等行业。
SAM 及其衍生模型,有望快速提高下游各行业渗透。我们认为,SAM 模型在视觉识别领域具有重要意义。消费电子领域,进一步优化人脸解锁,3D 空间扫描,视频动态捕捉等基础拍摄功能,在后处理端可以对拍摄文字进行提取编辑;捕捉拍摄图片中特定对象进行提取编辑等功能,以及未来有望快速降低图像视频类创作领域门槛。AR/VR 领域,真正实现设备端的虚拟现实结合应用。结合模型将有效的视野图像中识别及分割关注对象,进行后续的提取处理等交互操作,让设备更具备智能交互性。安防领域,在特定场景会有难以覆盖及训练成本较高等情况,通过SAM 及其衍生模型,可以快速进行技术迭代及应用通用化,结合制造业及下游领域专用图像类数据训练,有望带动安防领域公司精准快速的服务下游客户及特定行业。汽车智能化领域,现有场景下有利于帮助车辆更好的理解人,道路,车内外环境等因素,进一步提升智能驾驶,智能交互等一些车载应用体验。
建议关注:
视觉芯片端:韦尔股份,龙迅股份,晶方科技,富瀚微,思特威,格科微;
光学/镜头模组:高伟电子,舜宇光学,宇瞳光学,永新光学;视觉方案:虹软科技;
安防模型及应用:海康威视,大华股份;
工业机器视觉:奥比中光,凌云光;
AR/VR:立讯精密,歌尔股份,水晶光电,创维数字,兆威机电,长盈精密。
风险提示:AI 技术迭代不及预期;经济下行超预期;行业竞争加剧。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
最新评论