咨询电话:13280638997
传真:0533-3110363
邮箱:kefu@shizifang.com
摘 要:本发明公开了基于χ2‑C的文本相似度计算方法,具体涉及文本信息处理领域。该方法使用卷积神经网络CNN将测试数据集进行分类,根据TF‑IDF计算出检测样本中每个特征词的初始权重,再使用χ2‑C算法计算出领域关联因子,利用词位置因子α结合领域关联因子计算初始权重得出特征词权重,使用检测样本的全部特征词建立词库,结合词库与特征词权重将检测样本表达成初始文本向量。利用word2vec工具计算词库中各词之间的相似程度并形成词义相似度矩阵,利用该矩阵计算初始文本向量得出文本向量,最终通过余弦相似度算法计算文本向量,得出文本间的相似度,增加了特征词与其领域的关联度、特征词间的语义关系和特征词的位置信息,提高了文本相似度计算的准确率。
著 录 项:
专利/申请号: | CN201910811440.8 | 专利名称: | 基于χ2-C的文本相似度计算方法 |
申请日: | 2019-08-30 | 申请/专利权人 | |
专利类型: | 发明 | 地址: | |
专利状态: | 已下证 查询审查信息 | 分类号: | G06F40/194搜分类 C 港口搜索 |
公开/公告日: | 转让价格: | 面议 | |
公开/公告号: | 交易状态: | 等待洽谈 搜索相似专利 |
交易方 | 企业 | 个人 |
买家 | 营业执照副本复印件(需盖公章) | 身份证复印件(签字) |
专利转让委托书(需盖公章)一式两份 | 专利转让委托书(需签字)一式两份 | |
专利转让协议(需盖公章)一式两份 | 专利转让协议(需签字)一式两份 | |
卖家 | 营业执照副本复印件(需盖公章) | 身份证复印件(需申请人签字) |
解除代理委托书(需盖公章)一式两份(如专利通过代理机构申请) | 解除代理委托书(需签字)一式两份(如专利通过代理机构申请) | |
专利转让协议(需盖公章)一式两份 | 专利转让协议(需签字)一式两份 | |
专利请求书或手续合格通知书、授权通知书复印件 | 专利请求书或手续合格通知书、专利授权通知书复印件 | |
专利证原件(若授权下证) | 专利证原件(若授权下证) |
日期 | 法律信息 | 备注 |