近日,清华大学逻辑学研究中心逻辑与人工智能实验室申报的国家发明专利《一种增强大语言模型逻辑推理能力的方法和系统》获得授权。本发明提供的训练方法不仅能有效提升大语言模型逻辑推理能力,减少大语言模型逻辑错误导致的误导,提高大语言模型在高危和强逻辑需求场景的应用效果,还能够使大语言模型推理过程可追溯,为构建可信 AI 系统提供技术支撑。所发明的大语言模型训练方法能够促进大语言模型在金融、医疗、法律等对逻辑准确性要求高的领域的广泛应用,推动大语言模型助力教育与科研领域的智能化升级。

专利证书
该发明专利详细信息如下:
发明名称:一种增强大语言模型逻辑推理能力的方法和系统
专利号:ZL 2025 1 1277453.3
专利权人:清华大学
发明人:刘奋荣、成凤祥、周川、李昊轩
摘要:本发明涉及一种增强大语言模型逻辑推理能力的方法和系统,属于人工智能技术领域,解决了现有技术中单阶段微调训练的大模型回答准确率低的问题。方法包括:对于训练集中的每条训练样本,将该训练样本的结论和每个前提转换为符号表示,得到该训练样本的符号语言;对于每条训练样本,基于符号语言的逻辑形式和推理难度计算该训练样本的复杂度;基于每条训练样本的复杂度对训练集进行划分得到不同复杂度等级的训练子集;按照复杂度等级从低到高的顺序基于训练子集分阶段对大语言模型进行训练,得到训练好的大语言模型。提高了大语言模型的推理准确性。
摘要附图:

更多信息:http://epub.cnipa.gov.cn/cred/CN120806171B