咨询电话:13280638997
传真:0533-3110363
邮箱:kefu@shizifang.com
摘 要:本发明公开一种改进的用于命名实体识别的主动学习方法,包括:1、获取初始的数据集,将训练集中的实体作为已登录实体存储到实体词库;2、设置模型性能标准,基于初始训练集得到初始模型,判断模型性能是否达标;3、用当前模型对未标注样本进行预测,用实体词库对未标注样本中的已登录实体进行标记,然后在实体粒度上分别从三种情况计算不确定性;4、赋予三种不确定性权重参数,并加权求和作为最终的不确定性;5、将模型对未标注样本的的不确定性进行排序,选择不确定性最高的样本进行标注,并更新训练集和实体词库;6、基于新训练集重新训练模型,并判断模型性能是否达标。本发明在实体粒度上更加精细和全面地考虑了预测结果的不确定性。
著 录 项:
专利/申请号: | CN201811624411.2 | 专利名称: | 一种改进的用于命名实体识别的主动学习方法 |
申请日: | 2018-12-28 | 申请/专利权人 | 北京工业大学 |
专利类型: | 发明 | 地址: | 北京市朝阳区平乐园100号 |
专利状态: | 已下证 查询审查信息 | 分类号: | G06F40/295搜分类 自然语言处理 训练模型 数据算法搜索 |
公开/公告日: | 2023-01-13 | 转让价格: | 面议 |
公开/公告号: | CN109697289B | 交易状态: | 等待洽谈 搜索相似专利 |
交易方 | 企业 | 个人 |
买家 | 营业执照副本复印件(需盖公章) | 身份证复印件(签字) |
专利转让委托书(需盖公章)一式两份 | 专利转让委托书(需签字)一式两份 | |
专利转让协议(需盖公章)一式两份 | 专利转让协议(需签字)一式两份 | |
卖家 | 营业执照副本复印件(需盖公章) | 身份证复印件(需申请人签字) |
解除代理委托书(需盖公章)一式两份(如专利通过代理机构申请) | 解除代理委托书(需签字)一式两份(如专利通过代理机构申请) | |
专利转让协议(需盖公章)一式两份 | 专利转让协议(需签字)一式两份 | |
专利请求书或手续合格通知书、授权通知书复印件 | 专利请求书或手续合格通知书、专利授权通知书复印件 | |
专利证原件(若授权下证) | 专利证原件(若授权下证) |
日期 | 法律信息 | 备注 |