AI系列跟踪(54):OPENAI揭秘「草莓」AI META多模态新技术重磅落地

2024-09-04 18:20:08 和讯  长江证券高超/杨云祺
事件描述
  OpenAI 计划最早在今年秋天推出代号为「草莓」的新人工智能,该人工智能旨在改进即将推出的「Orion(猎户座)」,以帮助OpenAI 减少模型生成的错误数量,提高答案的准确性。Meta最近发布了融合Transformer 和Diffusion 的训练能够生成文本和图像模型的统一方法Transfusion,该方法有望用于训练真正的多模态模型。此外,8 月24 日,Meta 推出了一款专为理解人类视觉任务而设计的AI 视觉模型:Sapiens,该模型能够提供高保真度的视觉输出。
  事件评论
  OpenAI 计划推出代号为「草莓」的新人工智能。1)AI 大模型技术更新推动演算能力提高。「草莓」具备解决以前从未见过的数学问题的能力,这是当今的聊天机器人所无法准确做到的。给予长时间演算时,「草莓」还能够回答用户更主观的问题,适用于对时间不太敏感的用例。2)训练数据生成能力增强。「草莓」旨在改进即将推出的「Orion(猎户座)」,可以帮助 OpenAI 克服获取足够高质量数据的限制,以便利用现实世界的数据训练新模型,并帮助OpenAI 减少模型生成的错误数量,提高答案的准确性。「草莓」的推理能力有望被整合进ChatGPT,同时,该技术还将对未来能够完成多步骤任务的智能体产品产生深远影响。
  Meta 多模态模型训练方法取得新进展,全新视觉模型性能出色。1)高性能图像与文本生成能力。Transfusion 能够生成与相似规模的扩散模型相媲美的高质量图像,而且,它同时也保持了强大的文本生成能力。在GenEval 基准上,Transfusion 模型优于DALL-E 2和SDXL 等其他流行模型,且在文本基准上达到了Llama 1 级别的性能水平。该方法使用前景十分广阔,有望用于训练真正的多模态模型。2)Sapiens 优化视觉任务。Meta 推出的全新视觉模型Sapiens 对二维姿势预估、身体部位分割、深度估计和表面法线预测四大关键视觉认为进行了优化,在多种场景均有用武之地。3)泛化能力卓越,用户使用便利。Sapiens 模型易于针对个别任务进行调整,面对真实世界数据时表现出卓越的泛化能力。即便是在标注数据稀缺或完全使用合成数据的情况下,Sapiens 依然拥有出色的性能。此外,该模型易用性强,为具有不同训练设置偏好的用户提供了多样化的安装路径选择。
  AI 技术关卡持续突破,用户体验逐步提升。OpenAI 和Meta 等头部企业对AI 技术的突破以及应用拓展将会带领全行业技术创新和用户体验的提升,AI 行业拥有广阔的发展前景。AI 技术及应用领域持续突破,建议持续关注AI 在视觉成像和内容创作等各领域的商业化落地。
  风险提示
  1、AI 技术发展不及预期风险;
  2、内容监管风险。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读