咨询电话:13280638997
传真:0533-3110363
邮箱:kefu@shizifang.com
摘 要:本发明提供了一种Spark框架下的稀疏多元逻辑回归模型对文本情感分类的方法,包括:将训练样本数据集存储于HDFS中;Spark平台从HDFS中读取数据生成RDD;Spark平台将数据的预处理任务分为多个任务组,对每个任务组中存储有读取数据的RDD进行预处理,将预处理的结果存入HDFS中;训练稀疏多元逻辑回归模型,经过求解得到稀疏多元逻辑回归分类器;将所述稀疏多元逻辑回归分类器输出到HDFS中;从HDFS中读取经过预处理的待预测文本的数据和训练得到的稀疏多元逻辑回归分类器;获取所述待预测文本的情感分类。本发明在Spark计算框架下使用ADMM并行方法求解优化问题,使得模型训练更加快速,更适合大数据场景下的文本情感分类;有效提升了分类的效率与精度。
著 录 项:
专利/申请号: | CN201810331615.0 | 专利名称: | Spark框架下的稀疏多元逻辑回归模型对文本情感分类的方法 |
申请日: | 2018-04-13 | 申请/专利权人 | 重庆邮电大学 |
专利类型: | 发明 | 地址: | 重庆市南岸区崇文路2号 |
专利状态: | 已下证 查询审查信息 | 分类号: | G06F17/30搜分类 R P SPA 情感搜索 |
公开/公告日: | 转让价格: | 面议 | |
公开/公告号: | 交易状态: | 等待洽谈 搜索相似专利 |
交易方 | 企业 | 个人 |
买家 | 营业执照副本复印件(需盖公章) | 身份证复印件(签字) |
专利转让委托书(需盖公章)一式两份 | 专利转让委托书(需签字)一式两份 | |
专利转让协议(需盖公章)一式两份 | 专利转让协议(需签字)一式两份 | |
卖家 | 营业执照副本复印件(需盖公章) | 身份证复印件(需申请人签字) |
解除代理委托书(需盖公章)一式两份(如专利通过代理机构申请) | 解除代理委托书(需签字)一式两份(如专利通过代理机构申请) | |
专利转让协议(需盖公章)一式两份 | 专利转让协议(需签字)一式两份 | |
专利请求书或手续合格通知书、授权通知书复印件 | 专利请求书或手续合格通知书、专利授权通知书复印件 | |
专利证原件(若授权下证) | 专利证原件(若授权下证) |
日期 | 法律信息 | 备注 |
2021/05/11 | 授权 | |
2018/10/16 | 实质审查的生效 | IPC(主分类): G06F 17/30 专利申请号: 201810331615.0 申请日: 2018.04.13 |
2018/09/18 | 公开 |