近日,AI修图神器DragGAN,又迎来了史诗级升级,北大团队联合腾讯ARC Lab,将扩散模型应用在AI修图上!此前,AI修图往往在泛化能力和生成图像上有很大的短板,于是北大提出使用扩散模型,在AI修图逐渐完善后,未来Stable Diffusion画图如果有残缺部分,即可拉到DragGAN中进行重绘修正,甚至再配合Stable Animation SDK可以让人物再动起来!
Dragon Diffusion
尽管现有的大规模,可以根据文本生成高质量图像,但它们往往缺乏精确编辑生成真实图像的能力,Dragon Diffusion利用扩散模型可实现拖拽式操作。
比如让山动起来,或者让太阳升起来,如果手头有一个生成好的人物,当然也可以让他动起来跳篮球操!
在原生的DragGAN中,主要利用的是生成对抗模型,但其泛化生成能力并没有那么理想,于是张健老师团队将DragGAN推广到扩散模型上!
具体来说,Dragon Diffusion根据扩散模型中的特征的强对应关系,构建引导分支(guidance branch),再基于GAN对AI编辑图构建生成分支(generation branch),通过Diffusion的逆过程,找到该图像在扩散隐空间中的表示,作为两个分支的输入,为了兼顾语义和图形上的对齐,作者在这个引导策略的基础上引入了多尺度引导对齐设计。
引导分支则起来到类似于判别器(Discriminator)的作用,生成分支结构相当于GAN中的生成器(Generator)。首先引导分支会对原图像进行重建,在重建过程中将引导原图信息,注入到生成分支,生层分支利用引导信息对原图像进行编辑,同时保持主要内容与原图一致。
值得一提的是,为了保证在泛化中编辑后的图片尽量和原图保持一致,Dragon Diffusion设计了一种跨分支的self-attention机制,利用引导分支自注意力模块中的Key和Value,替换生成分支自注意力模块中的Key和Value,以此来实现特征层面的参考信息注入。
ttps://mc-e.github.io/project/DragonDiffusion/
目前,Dragon Diffusion已经开发项目主页,有极高的商用价值!同时,北大实验室预计还将推出对标Stable Diffusion的大模型!
聊天机器人——ChatGPT全网爆红,马斯克惊叹夸赞!
聊天机器人——ChatGPT小白注册教程,勿被电商割韭菜!
ChatGPT移动端——使用教程,5分钟注册iOS账号!
ChatGPT:AI女网红交1000+男友周入50万,未来AI会如何发展?
AI大会:美团升级城市无人机,雨雪天气也可配送!
青年文学论坛——GPT-4来临,翻译会被AI取代吗?
百度文心一言:全球大厂首发,可帮助续写《三体》!
百度文心一言:中国版ChatGPT,短视频批量生成!
百度文心一言:超8万家企业排队合作!
百度文心千帆:比ChatGPT便宜,百万字仅12元!
百度李彦宏:有钱买不到创新,锐评谷歌也未做出来ChatGPT!
阿里云ChatGPT:“通义听悟”大模型,对标百度文心系列!
国产ChatGPT:支持手机芯片推理,马云谈用GPT解决实际问题!
华为版ChatGPT:重磅出炉!盘古大模型将在4月发布!
华为重磅自研:盘古NLP大模型,不打算追随ChatGPT!
华为&北大:识别ChatGPT造假,AI打假检测器来了!
华为AI大模型——重磅发布盘古3.0,千亿参数!
华为盘古大模型:上线欧洲气象中心,可精确预测台风!
中国最强ChatGPT:语言大模型“商量”,演示性能超文心一言!
ChatGPT清明节:上海云生命公司“复原”逝者,数字生命丫丫!
360自研GPT:周鸿祎长文反驳马斯克,自称“拯救派”望弯道超车!
360版ChatGPT:实机演示“翻车”,答错梅西进球数!
阿里版ChatGPT:发布“通义千问”大模型,可在支付宝测试体验!
腾讯&南航:AI游戏生成技术,3天可建设一座“机场”!
百度打假苹果:文心一言惨遭套皮,现已对苹果发起诉讼!
元宇宙大会:6大国产GPT同日推出,华为阿里等成立GPT联盟!
复旦ChatGPT:开源MOSS大模型,3090显卡即可运行!
搞钱GPT:国产首个带货AI,将颠覆全球千亿美金市场!
国产GPT:推出AI数字人员工,元宇宙+GPT震撼登场!
#免责声明#
①本站部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责。
②若您需要商业运营或用于其他商业活动,请您购买正版授权并合法使用。
③如果本站有侵犯、不妥之处的资源,请联系我们。将会第一时间解决!
④本站部分内容均由互联网收集整理,仅供大家参考、学习,不存在任何商业目的与商业用途。
⑤本站提供的所有资源仅供参考学习使用,版权归原著所有,禁止下载本站资源参与任何商业和非法行为,请于24小时之内删除!