咨询电话:13280638997
传真:0533-3110363
邮箱:kefu@shizifang.com
著 录 项 目:
专利/申请号: | CN202510027124.7 | 专利名称: | 一种基于CLIP损失与感知损失的扩散模型LoRA微调优化方法及系统 |
申请日: | 2025-01-08 | 申请/专利权人 | 南京信息工程大学 |
专利类型: | 发明 | 地址: | 江苏省南京市江北新区华富路1号数智溪谷4号楼 |
专利状态: | 已下证 查询审查信息 | IPC分类号: | G06V10/774 分类检索 |
公开/公告日: | 2025-06-10 | 转让价格: | 【平台担保交易】 |
公开/公告号: | CN119478587B | 交易状态: | 等待洽谈 搜索相似专利 |
浏览量: | 4 | 所属领域: | 人工智能 深度学习 图像生成技术 模型压缩与优化专利转让搜索 |
应用场景:扩散模型在资源受限环境下的高效部署(如移动端、嵌入式设备);图像生成任务的低显存训练;多模态数据对齐与语义一致性优化
摘 要:本发明提出了一种基于CLIP损失与感知损失的扩散模型LoRA微调优化方法及系统,所述方法包括:步骤1,在LoRA微调过程中,结合CLIP损失和感知损失,动态调整CLIP损失和感知损失的权重;步骤2,利用CLIP模型计算去噪后的中间图像与目标文本的语义相似度,并根据相似度差异优化扩散模型的噪声预测能力;步骤3,采用感知损失计算中间图像与目标图像在特征空间的差异,并优化扩散模型的噪声预测能力,提升生成图像的视觉质量与细节保真度;步骤4,根据训练进展调整是否启用CLIP损失和感知损失。通过引入CLIP损失,模型在微调训练过程中能够更好地将图像与文本进行对齐,使得生成的图像更加符合文本提示的描述。
交易方 | 企业 | 个人 |
买家 | 营业执照副本复印件(需盖公章) | 身份证复印件(签字) |
专利转让委托书(需盖公章)一式两份 | 专利转让委托书(需签字)一式两份 | |
专利转让协议(需盖公章)一式两份 | 专利转让协议(需签字)一式两份 | |
卖家 | 营业执照副本复印件(需盖公章) | 身份证复印件(需申请人签字) |
解除代理委托书(需盖公章)一式两份(如专利通过代理机构申请) | 解除代理委托书(需签字)一式两份(如专利通过代理机构申请) | |
专利转让协议(需盖公章)一式两份 | 专利转让协议(需签字)一式两份 | |
专利请求书或手续合格通知书、授权通知书复印件 | 专利请求书或手续合格通知书、专利授权通知书复印件 | |
专利证原件(若授权下证) | 专利证原件(若授权下证) |
日期 | 法律信息 | 备注 |
申请号 | 专利名称 | 发布日期 |
202111466037X | 【发明】一种端到端生成建议框的自底向上的三维目标检测方法 | 2025/10/15 |
2022101856767 | 【发明】图像金字塔特征指导的多尺度目标检测方法 | 2025/10/15 |
2021115433392 | 【发明】一种基于Resnet50结合注意力机制和特征金字塔的图像分类方法 | 2025/10/15 |
2022104498186 | 【发明】一种基于深度学习的目标检测方法 | 2025/10/15 |
2025103778427 | 【发明】一种基于血管拓扑结构的肝脏增强CT特征提取融合方法 | 2025/10/15 |
2025103994356 | 【发明】一种基于多频激励的覆盖物识别方法及检测装置 | 2025/10/15 |
2024116429843 | 【发明】一种图片分类模型训练及图片分类方法 | 2025/10/15 |
2021115226335 | 【发明】一种基于流形学习的无监督预适应图像分类方法 | 2025/10/15 |
2022100353845 | 【发明】结合多级特征依赖与多尺度上下文特征的抑郁识别方法 | 2025/10/15 |
2022103005478 | 【发明】一种用于模型授权访问控制的黑盒可逆对抗样本生成方法 | 2025/10/15 |