卫宁健康(300253.SZ):WiNGPT不同于通用大模型,聚焦于垂直领域-医疗

2023-06-08 19:35:56 格隆汇 

格隆汇6月8日丨有投资者向卫宁健康(300253)(300253.SZ)提问,“根据贵方介绍,WiNGPT采用通用GPT架构、60亿参数,实现了从预训练到微调的医疗大语言模型全过程自有研发。然而对于通用模型,百亿参数是入场券。GPT-3和LaMDA均显示,100亿参数以下的模型计算能力几乎为0。不知道贵方60亿参数如何应对技术迭代?”

卫宁健康回复称,之前已介绍过,卫宁健康WiNGPT不同于通用大模型,我们的大模型聚焦于垂直领域-医疗,因此所涉及的训练数据也小于通用大模型。所谓“有多少数据就用多大模型”,我们从几亿到上百亿参数模型进行了实验,是平衡成本与精度的选择,而非一味追求模型的体量。未来我们可以根据场景和产品的需要进行灵活的增减。

(责任编辑:贺翀 )
看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    和讯特稿

      推荐阅读