3 月16 日,百度正式发布了文心一言,能够与人对话互动,回答问题,协助创作。我们认为: 1)一些NLP 人机对话中基础的问答、总结、推理、创作能力基本具备; 2)部分特定场景的中文理解可能超过了GPT;3)具备了初步的数理逻辑能力;4)有特色的多模态生成能力,某几个功能点很实用。
但同时,我们认为相比GPT4 功能文心一言仍有较大差距,目前水平约在GPT3 左右。发布会中有部分体现大模型强大指出的核心功能尚未充分展示。包括多轮对话、代码能力、长文本理解等GPT-4 具有的能力,文心一言未进行展示。同时目前文心一言仍未全面公测,企业和个人用户可以在官网申请邀请后试用。
整体来看,文心一言展示出的水平符合我们预期:即从参数量、迭代路径看,国内NLP大模型水平介于BERT 和GPT-3 之间,与海外差距在2-3 年。2021 年GPT-3 推出时,代码、长文本、语境等能力也较弱。在此后1 年中,OPEN AI 快速迭代增加了codex、RLHF 等尝试,并继续优化了PPO,在2022 年推出instructGPT,其后能力才出现较大提升。我们认为百度文心已经初步具备LLM 底座,期待后续迭代。
技术上,我们分析了百度NLP 大模型ERNIE 1.0-3.0 迭代,优势总结如下:1)ERNIE 1.0到3.0 完整迭代,截至3.0 已是相对可用状态,3.0 模型结构便于下游二次开发部署;2)强大的百度内部特色中文语料库;3)基于BERT 结构基础加上了知识图谱等特色功能,在部分规则训练场景有更好可控性;4)国内领先的开源AI 训练框架,较强的算力基础设施。
但同时,我们也看到现阶段ERNIE 底座的一些不足:1)模型结构仍然基于BERT,但目前海外巨头主流结构转变为GPT 为代表的decoder-only,未来百度是否会在模型结构上继续迭代?2)根据3 月16 日百度文心一言发布会,目前百度在Prompt 和RLHF 已经掌握方法论,但实际训练量仍然有待提升;3)百度都使用了有特色是知识图谱训练,这一方式可以有效降低训练模型所需要消耗的算力。但当大语言模型达到千亿或者更高参数级别时,似乎自然具备了知识图谱训练下的能力。4)ERNIE 使用了百度内部特色中文数据,提升模型中文能力。但是百度体系内高质量语料库相比庞大的英文互联网语料库仍然不足。
相关标的:互联网行业重点关注计划国内推出类GPT 产品的三六零;应用相关,重点关注海外业务占比高,有望通过AI 优化运营效率和产品体验的公司,海外业务贡献较多的巨人网络(持有playtika 股权)、盛天网络、汤姆猫、昆仑万维、蓝色光标、神州泰岳、恺英网络;易点天下、鸿合科技。国内未来随着大模型迭代,合作伙伴也有望受益,关注风语筑、三人行、姚记科技、华策影视、创维数字。
计算机行业:建议重点关注跨模态应用,包括多模态应用: 1)文生图:虹软科技(基于stable diffusion 的多种2B 图像应用)、新国都、中科创达(移动端文生图工具部署);2)机器人:三花智控等;3)其他应用:润达医疗(申万医药、医疗诊断AI)、福昕软件、万兴科技;视频、图像、文本素材:大华股份(工业场景视频素材和标注),AI 领军、当虹科技;视觉和跨模态算法:商汤(港股)、云从科技、科大讯飞。
风险提示:大模型技术中美仍存在差异,部分技术尚处于早期实验室阶段,存在落地风险;实体清单等可能对训练硬件产生影响。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
最新评论