咨询电话:13280638997
传真:0533-3110363
邮箱:kefu@shizifang.com
摘 要:本发明请求保护一种基于词语特征值的法律专有领域词发现方法,其包括以下步骤:首先读入待分词操作的法律领域文本数据集,根据明显的分隔符对输入的初始文本数据集进行粗切分得到一系列的短字符串,构成短字符串集;然后利用基于词典的正向最大匹配算法将短字符串集切分成多个散串及散词,通过分析法律领域专有词的构词规则,将这些散词散串进行合并提取,放入到候选分词词串集;执行基于词语特征值的法律专有领域词发现算法,计算候选分词词串集中的每个候选分词词串的词语特征值,当候选分词词串的词语特征值大于设定的阈值时,就加入到分词结果中,否则就舍弃该词串,最后完成分词,本发明提升了法律领域文档中分词工作的准确度。
著 录 项:
专利/申请号: | CN201910829161.4 | 专利名称: | 一种基于词语特征值的法律专有领域词发现方法及装置 |
申请日: | 2019-09-03 | 申请/专利权人 | |
专利类型: | 发明 | 地址: | |
专利状态: | 已下证 查询审查信息 | 分类号: | G06F40/242搜分类 其他搜索 |
公开/公告日: | 转让价格: | 面议 | |
公开/公告号: | 交易状态: | 等待洽谈 搜索相似专利 |
交易方 | 企业 | 个人 |
买家 | 营业执照副本复印件(需盖公章) | 身份证复印件(签字) |
专利转让委托书(需盖公章)一式两份 | 专利转让委托书(需签字)一式两份 | |
专利转让协议(需盖公章)一式两份 | 专利转让协议(需签字)一式两份 | |
卖家 | 营业执照副本复印件(需盖公章) | 身份证复印件(需申请人签字) |
解除代理委托书(需盖公章)一式两份(如专利通过代理机构申请) | 解除代理委托书(需签字)一式两份(如专利通过代理机构申请) | |
专利转让协议(需盖公章)一式两份 | 专利转让协议(需签字)一式两份 | |
专利请求书或手续合格通知书、授权通知书复印件 | 专利请求书或手续合格通知书、专利授权通知书复印件 | |
专利证原件(若授权下证) | 专利证原件(若授权下证) |
日期 | 法律信息 | 备注 |