deepfacelab中文网

 找回密码
 立即注册
查看: 788|回复: 10

香港中文大学CelebA衍生预训练集-3万头像-官方高清WF512

[复制链接]

17

主题

154

帖子

3969

积分

高级丹圣

风擎

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3969

小有贡献

 楼主| 发表于 2023-3-11 12:47:19 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:3  参与人数:1  我的评分:未评
本帖最后由 windjet 于 2023-3-28 13:11 编辑

这个预训练集合来自于香港中文大学多媒体实验室的CelebA面部属性数据集的一个新采集的相关高清数据集,共3万张WF512头像,不是那种个人随意网页爬取的粗糙头像集合,基本上具有和FFHQ一样的清晰度,也是比较有名的官方版头像集合,只是个人感觉光影和角度比FFHQ略微差一点,但更偏向于年轻的女性,预训练预览图大概率是4,5张女性脸,只有1,2张男性脸,所以更适合女性模型的训练。
原图是1024高清头像,但不能直接用于DFL,我按WF512重新切脸(手动删除了极个别不适合头像)后打包成pak文件,可以直接用于DFL的预训练模型及专有模型的预训练,尤其是女性专模的训练。
练大规模迭代万能模型的时候是否到了后期感觉FFHQ集已经没有衰减了,那么这个头像集合能帮你再继续跑下去。
CelebA数据集是香港中文大学多媒体实验室发布的一个大规模的面部属性数据集,涵盖了较大的姿势变化和背景杂波,具有多种多样,数量众多且注释丰富的特点,可用作计算机视觉任务的训练和测试集,如面部属性识别,面部检测,五官定位以及面部编辑和合成,CelebA主体头像的下载请参考本帖下面的论坛链接。
百度网盘训练头像文件下载(2.28GB):
下载请点击最下面的百度网盘下载链接


另外,与这个高清数据集配套的是37万张遮罩蒙板,包括眼镜,头发,鼻子,嘴巴等,但很可惜,我还不知道怎么把它用于DFL,也许根本就无法用,但兴许能用于PS吧,也一起公开出来,供感兴趣的朋友研究一下,虽然有37万张,但打包后很小不到300MB,所以可以放心下载,没兴趣的就不用下了,目前感觉和训练没有太大关系。
百度网盘遮罩蒙板文件下载(0.26GB):




可用于DFL训练的CelebA主体头像链接如下:
https://dfldata.xyz/forum.php?mod=viewthread&tid=13537
香港中文大学CelebA预训练集-20万头像-论坛数量最多角度最全



文件下载后就是pak文件包(faceset.pak),可以直接使用,不用再解压为图片了,除非你想加自己的资源,DFL对pak包的装载远远快于对单张图片的装载。
使用方法:
1,官方标准预训练的模型的训练(pretrain: True),把"\_internal\pretrain_faces"下面的原始faceset.pak备份,然后用这个faceset.pak包替换它。
2,非官方标准预训练的模型的训练(pretrain: False),把faceset.pak包放"\data_src\aligned"和"\data_dst\aligned"下各一份,直接用不要再解压成图片了。
3,专人模型的训练,把faceset.pak包放"\data_dst\aligned"下,直接用不要再解压成图片了。
4,想看头像图片,把faceset.pak包放"\data_dst\aligned"下,执行5.2) data_dst util faceset unpack.bat来解压图片。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x

评分

参与人数 1贡献 +1 收起 理由
GHnewbie2022 + 1 赞一个!

查看全部评分

风之引擎
回复

使用道具 举报

17

主题

154

帖子

3969

积分

高级丹圣

风擎

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3969

小有贡献

 楼主| 发表于 2023-3-11 13:26:02 | 显示全部楼层
GHnewbie2022 发表于 2023-3-11 13:03
請問文件裡面附的是百度盤嗎?有沒有google drive或者mega之類的雲端呢?怕買了連不上先問一下~謝謝! ...

是百度网盘,本人是收费会员,永久有效的。
只放了百度网盘,暂时没有放任何其它云端上。
风之引擎
回复 支持 1 反对 0

使用道具 举报

2

主题

22

帖子

209

积分

初级丹师

Rank: 3Rank: 3

积分
209
发表于 2023-3-11 13:03:57 | 显示全部楼层
請問文件裡面附的是百度盤嗎?有沒有google drive或者mega之類的雲端呢?怕買了連不上先問一下~謝謝!
回复 支持 反对

使用道具 举报

5

主题

144

帖子

3848

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3848
发表于 2023-3-11 19:08:07 | 显示全部楼层
求个原版的资源,大佬
回复 支持 反对

使用道具 举报

7

主题

91

帖子

620

积分

高级丹师

Rank: 5Rank: 5

积分
620
发表于 2023-3-11 22:32:42 | 显示全部楼层
我发过一个这个,加了好几个科研机构的图,将近百万张
回复 支持 反对

使用道具 举报

2

主题

101

帖子

686

积分

高级丹师

Rank: 5Rank: 5

积分
686
发表于 2023-3-11 23:41:27 | 显示全部楼层
感谢分享
回复

使用道具 举报

17

主题

154

帖子

3969

积分

高级丹圣

风擎

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3969

小有贡献

 楼主| 发表于 2023-3-12 01:18:53 | 显示全部楼层
7167603 发表于 2023-3-11 19:08
求个原版的资源,大佬

暂时懒得上传原版了,因为原版1024图DFL使用不了,不如直接用我已经切好的。
以后就是上传也会传WF512同一目录不会另外收费,并且会通知的,所以现在买也不亏的。
风之引擎
回复 支持 反对

使用道具 举报

17

主题

154

帖子

3969

积分

高级丹圣

风擎

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3969

小有贡献

 楼主| 发表于 2023-3-12 01:23:37 | 显示全部楼层
rangersky 发表于 2023-3-11 22:32
我发过一个这个,加了好几个科研机构的图,将近百万张

不知道你指哪个,我简单查过的,没有这个香港大学的才自己做的。
其实有现成的我也不想再切脸,整理了,直接买还省事些,毕竟下载3万张原图资源后,还要切脸,整理还是挺花时间的。
风之引擎
回复 支持 反对

使用道具 举报

5

主题

144

帖子

3848

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3848
发表于 2023-3-12 17:37:31 | 显示全部楼层
windjet 发表于 2023-3-12 01:18
暂时懒得上传原版了,因为原版1024图DFL使用不了,不如直接用我已经切好的。
以后就是上传也会传WF512同 ...

魔切什么的切的精确度不行,还是自己切比较放心
回复 支持 反对

使用道具 举报

17

主题

154

帖子

3969

积分

高级丹圣

风擎

Rank: 13Rank: 13Rank: 13Rank: 13

积分
3969

小有贡献

 楼主| 发表于 2023-3-13 11:18:44 | 显示全部楼层
7167603 发表于 2023-3-12 17:37
魔切什么的切的精确度不行,还是自己切比较放心

嗯,像这个重要的训练集什么的,我都是用默认的DFL来切的。
风之引擎
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|小黑屋|deepfacelab中文网 |网站地图

GMT+8, 2023-3-31 20:37 , Processed in 0.050575 second(s), 40 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表