咨询电话:13280638997
传真:0533-3110363
邮箱:kefu@shizifang.com
著 录 项 目:
专利/申请号: | CN202411755041.1 | 专利名称: | 一种基于RoBERTa知识蒸馏的相似度文本挖掘方法及系统 |
申请日: | 2024-12-03 | 申请/专利权人 | 南京信息工程大学 |
专利类型: | 发明 | 地址: | 江苏省南京市浦口区宁六路219号 |
专利状态: | 已下证 查询审查信息 | IPC分类号: | G06F40/194 分类检索 |
公开/公告日: | 2025-04-18 | 转让价格: | 【平台担保交易】 |
公开/公告号: | CN119227665B | 交易状态: | 等待洽谈 搜索相似专利 |
浏览量: | 5 | 所属领域: | 自然语言处理 人工智能 文本分析专利转让搜索 |
应用场景:大规模文本数据相似度检测(如学术论文查重、新闻内容去重、社交媒体内容审核);智能问答系统优化;企业知识库管理与信息检索
摘 要:本发明公开了一种基于RoBERTa知识蒸馏的相似度文本挖掘方法及系统,包括:将句子嵌入映射到概率分布空间以转化为概率分布,利用KL散度衡量句子嵌入之间的语义差异,调整嵌入向量的参数,减小相似句子对的KL散度的同时增加不相似句子的KL散度;基于KL散度优化后的损失函数进行反向传播,更新词向量参数,保存优化后的句子向量,生成词向量空间;对基于RoBERTa的知识蒸馏嵌入模型进行训练,将深层模型中的丰富语义信息迁移至轻量化的学生模型;采用训练完成的学生模型执行相似度文本挖掘任务。本发明能够更好地捕捉句子之间的细微语义差异,显著提升了语义相似度计算的精度和计算效率。
交易方 | 企业 | 个人 |
买家 | 营业执照副本复印件(需盖公章) | 身份证复印件(签字) |
专利转让委托书(需盖公章)一式两份 | 专利转让委托书(需签字)一式两份 | |
专利转让协议(需盖公章)一式两份 | 专利转让协议(需签字)一式两份 | |
卖家 | 营业执照副本复印件(需盖公章) | 身份证复印件(需申请人签字) |
解除代理委托书(需盖公章)一式两份(如专利通过代理机构申请) | 解除代理委托书(需签字)一式两份(如专利通过代理机构申请) | |
专利转让协议(需盖公章)一式两份 | 专利转让协议(需签字)一式两份 | |
专利请求书或手续合格通知书、授权通知书复印件 | 专利请求书或手续合格通知书、专利授权通知书复印件 | |
专利证原件(若授权下证) | 专利证原件(若授权下证) |
日期 | 法律信息 | 备注 |
申请号 | 专利名称 | 发布日期 |
2024116432988 | 【发明】方面情感三元组提取方法、装置、设备及存储介质 | 2025/10/11 |
202311699411X | 【发明】一种融合情感的共同注意网络多模态虚假新闻检测方法 | 2025/09/29 |
2021109992318 | 【发明】基于词屏蔽数据增强与对抗学习的特定目标情感分析方法 | 2025/09/29 |
2020113105261 | 【发明】意图实体信息抽取方法、装置、计算机设备及存储介质 | 2025/09/28 |
2021112176372 | 【发明】地址信息的识别方法、装置、计算机设备及存储介质 | 2025/09/28 |
2023114737239 | 【发明】基于人工智能的自然语言数据处理方法 | 2025/09/26 |
2022100785571 | 【发明】一种基于Seq2Seq模型的情感对话生成方法 | 2025/09/23 |
2022100365999 | 【发明】一种基于双层图的文档级事件抽取方法及系统 | 2025/09/23 |
2020112168757 | 【发明】基于深度学习语言模型融合语义特征的关键词提取方法 | 2025/09/23 |
2018114454012 | 【发明】一种基于注意力卷积神经网络的用户评论情感分析系统及方法 | 2025/09/23 |