咨询电话:13280638997
传真:0533-3110363
邮箱:kefu@shizifang.com
摘 要:本发明提供一种基于条件随机域模型(Conditional Random Fields,CRFs)的蛋白质分子名称分析与识别方法,医学文本处理技术领域。该方法包括:输入BioNLP‑ST‑2016中一个子任务的json格式的医学文本,对文本文件预处理,提取蛋白质分子名称标记序列并分析蛋白质分子名称的特征,提取单词特征和上下文特征,构造文本特征序列X和蛋白质标记序列Y的条件随机域,利用梯度下降算法进行训练,通过训练得到各特征函数的系数也就是CRFs的模型参数,识别时采用Viterbi算法,通过计算未知文本序列条件概率,并根据最大概率对应的标记序列作为蛋白质分子识别结果。本发明能有效识别医学文本中的蛋白质分子名称,为进一步的挖掘蛋白质分子之间的调控关系奠定了基础。
著 录 项:
专利/申请号: | CN201910035592.3 | 专利名称: | 一种基于CRFs的蛋白质分子名称分析与识别方法 |
申请日: | 2019-01-15 | 申请/专利权人 | 金陵科技学院 |
专利类型: | 发明 | 地址: | 江苏省南京市江宁区弘景大道99号 |
专利状态: | 已下证 查询审查信息 | 分类号: | G06F16/28搜分类 其他搜索 |
公开/公告日: | 2023-04-18 | 转让价格: | 面议 |
公开/公告号: | CN109635046B | 交易状态: | 等待洽谈 搜索相似专利 |
交易方 | 企业 | 个人 |
买家 | 营业执照副本复印件(需盖公章) | 身份证复印件(签字) |
专利转让委托书(需盖公章)一式两份 | 专利转让委托书(需签字)一式两份 | |
专利转让协议(需盖公章)一式两份 | 专利转让协议(需签字)一式两份 | |
卖家 | 营业执照副本复印件(需盖公章) | 身份证复印件(需申请人签字) |
解除代理委托书(需盖公章)一式两份(如专利通过代理机构申请) | 解除代理委托书(需签字)一式两份(如专利通过代理机构申请) | |
专利转让协议(需盖公章)一式两份 | 专利转让协议(需签字)一式两份 | |
专利请求书或手续合格通知书、授权通知书复印件 | 专利请求书或手续合格通知书、专利授权通知书复印件 | |
专利证原件(若授权下证) | 专利证原件(若授权下证) |
日期 | 法律信息 | 备注 |