2024年3月16日获悉,国家知识产权局公告披露神思电子技术股份有限公司申请了一项名为“一种基于大模型的文档问答的训练样本构造方法和装置”的专利,公开号CN117709429A,申请日期为2023年12月。
该专利摘要表明,本发明涉及人工智能自然语言生成技术领域,通过利用大模型的海量先验知识,结合构造prompt集和链式推理过程,实现自动构造高质量训练样本。该方法包括准备基础文档集、构造问答对生成的prompt生成指令指定格式的数据集、判断蕴含关系和质量以及泛化判断构造相似问题集,并对问题集进行质量判断和扩充以获得训练样本。这一过程无需人工编写样本,生成的样本质量可与人工编写相媲美,有效降低构造训练样本的门槛,并提高研发人员的工作效率和质量。
最新评论