咨询电话:13280638997
传真:0533-3110363
邮箱:kefu@shizifang.com
摘 要:本发明公开了一种垃圾网页检测方法,包括以下步骤:一:对数据集进行K-Means算法,将全部对象n用数据集D存储;二:对数据集D进行IPR计算,并将IPR值按照从高到低顺序进行排序;三:在数据集中选取IPR值最大和最小的网页作为初始的聚类中心C;四:计算数据集D中的xi与cj间的距离dist(xi,cj),并将dist(xi,cj)划分到与之相距最小的中心所处的簇中;五:查看聚集结束时的聚类中心,得到新的cj表达式;六:重复步骤四至步骤六,将目标函数用SSE表示,直到SSE取最小值时算法终止;得到最终聚类结果,以此识别垃圾网页。该方法能够克服传统推荐技术在分配链接权重时忽略网页重要性的缺点,结合个性化网页排序,达到将网页以聚集的形式来检测垃圾网页的目的。
著 录 项:
专利/申请号: | CN201710198162.4 | 专利名称: | 一种垃圾网页检测方法 |
申请日: | 2017-03-29 | 申请/专利权人 | 天津大学 |
专利类型: | 发明 | 地址: | 天津市南开区卫津路92号 |
专利状态: | 已下证 查询审查信息 | 分类号: | G06F17/30搜分类 垃圾处理 互联网 检测搜索 |
公开/公告日: | 2020-07-03 | 转让价格: | 面议 |
公开/公告号: | CN107423319B | 交易状态: | 等待洽谈 搜索相似专利 |
交易方 | 企业 | 个人 |
买家 | 营业执照副本复印件(需盖公章) | 身份证复印件(签字) |
专利转让委托书(需盖公章)一式两份 | 专利转让委托书(需签字)一式两份 | |
专利转让协议(需盖公章)一式两份 | 专利转让协议(需签字)一式两份 | |
卖家 | 营业执照副本复印件(需盖公章) | 身份证复印件(需申请人签字) |
解除代理委托书(需盖公章)一式两份(如专利通过代理机构申请) | 解除代理委托书(需签字)一式两份(如专利通过代理机构申请) | |
专利转让协议(需盖公章)一式两份 | 专利转让协议(需签字)一式两份 | |
专利请求书或手续合格通知书、授权通知书复印件 | 专利请求书或手续合格通知书、专利授权通知书复印件 | |
专利证原件(若授权下证) | 专利证原件(若授权下证) |
日期 | 法律信息 | 备注 |
2020/07/03 | 授权 | |
2017/12/26 | 实质审查的生效 | IPC(主分类): G06F 17/30 专利申请号: 201710198162.4 申请日: 2017.03.29 |
2017/12/01 | 公开 |