咨询电话:13280638997
传真:0533-3110363
邮箱:kefu@shizifang.com
摘 要:一种MapReduce并行化大数据文本分类方法,包括如下步骤:第一步:建立用于文本分类的基准测试数据集,进行数据预处理,包括分词、去停用词、词根还原;将该基准测试数据集随机划分为训练文本和测试文本,将所述基准测试数据集采用向量空间模型建立文本表示模型;第二步:根据上述文本表示模型采用CDMT对所述基准测试数据集进行特征选择;第三步:采用贝叶斯分类器对所述基准测试数据集进行训练学习,得到分类结果。本发明提供一种分类性能良好、区分度较高的MapReduce并行化大数据文本分类方法。
著 录 项:
专利/申请号: | CN201510297189.X | 专利名称: | 一种MapReduce并行化大数据文本分类方法 |
申请日: | 2015-06-02 | 申请/专利权人 | |
专利类型: | 发明 | 地址: | |
专利状态: | 已下证 查询审查信息 | 分类号: | G06F17/30搜分类 数据服务搜索 |
公开/公告日: | 转让价格: | 面议 | |
公开/公告号: | 交易状态: | 等待洽谈 搜索相似专利 |
交易方 | 企业 | 个人 |
买家 | 营业执照副本复印件(需盖公章) | 身份证复印件(签字) |
专利转让委托书(需盖公章)一式两份 | 专利转让委托书(需签字)一式两份 | |
专利转让协议(需盖公章)一式两份 | 专利转让协议(需签字)一式两份 | |
卖家 | 营业执照副本复印件(需盖公章) | 身份证复印件(需申请人签字) |
解除代理委托书(需盖公章)一式两份(如专利通过代理机构申请) | 解除代理委托书(需签字)一式两份(如专利通过代理机构申请) | |
专利转让协议(需盖公章)一式两份 | 专利转让协议(需签字)一式两份 | |
专利请求书或手续合格通知书、授权通知书复印件 | 专利请求书或手续合格通知书、专利授权通知书复印件 | |
专利证原件(若授权下证) | 专利证原件(若授权下证) |
日期 | 法律信息 | 备注 |
2021/07/30 | 专利权的转移 | 登记生效日: 2021.07.16 专利权人由浙江师范大学变更为浙江师大计海新技术有限公司 地址由321004 浙江省金华市迎宾大道688号变更为321000 浙江省金华市婺城区丹溪路1489号鼎泰大厦 |
2019/02/01 | 授权 | |
2015/09/23 | 实质审查的生效 | IPC(主分类): G06F 17/30 专利申请号: 201510297189.X 申请日: 2015.06.02 |
2015/08/26 | 公开 |