绘画全部模型种类总结使用方法简易训练指导

开通VIP,畅享免费电子书等14项超值服

首页

好书

留言交流

下载APP

联系客服

引言

目前,AI绘画 的各种模型层出不穷,哪些模型都有什么用?又如何使用?对刚入坑或者不怎么下载别人模型使用的人造成了很大困扰。也没有一个统一的总结或者教程指导。

[1] 此处的AI绘画,特指 stable-diffusion 。

本文严禁转载

1  绪论

1.1 绪论

不同的模型会带来不同的画风、认识不同的概念(人物/物体/动作),这是模型众多的原因。

常说的 NovelAI 就是特指 NovelAI 制作的一款 日系二次元特化 的模型。

而 stable-diffusion 1.5 2.0 这些模型是较为通用的、现实模型,无法画出二次元图片

1.2 模型概况

当前,常见的模型可以分为两大类:大模型 [2],用于微调大模型的小型模型。

[2] 这里的大模型特指标准的 latent-diffusion 模型。拥有完整的 TextEncoder、U-Net、VAE。

由于想要炼制、微调(finetune)大模型十分困难,需要好显卡、算力,所以更多的人选择去炼制小型模型。这些小型模型通过作用在大模型的不同部分,来简单的修改大模型,从而达到目的。

常见的用于微调大模型的小型模型又分为以下几种:Textual inversion (常说的Embedding模型)、Hypernetwork模型、LoRA模型。

此外,还有一种叫做 VAE 的模型,通常来讲 VAE 可以看做是类似滤镜一样的东西[3]。他会影响出图的画面的色彩和某些极其微小的细节。大模型本身里面就自带 VAE 的,但是一些融合模型的 VAE 烂掉了 (典型:Anything-v3),需要外置 VAE 的覆盖来救救。有时画面发灰就是因为这个原因。

[3] VAE,  Variational autoencoder。变分自编码器,负责将潜空间的数据转换为正常图像。

由于模型的种类不同、作用位置也不同,所以想要使用这些模型文件必须分清这些模型类别,并且正确的使用对应的方法模型才会生效。

如何区分这些模型对新手来说是一件非常困难的事情,因为他们都可以拥有一样的后缀名(下一节将详细展开说明)。通常没有专业知识的人员应该通过文件大小来简单判断模型类别。

针对此,我特意开发了这个工具来快速辨别模型种类。只需要把模型拖进来就行

2 模型种类及使用方法一览

2.1 模型后缀名之谜

目前,常见的 AI绘画 用模型后缀名有如下几种:

1. ckpt ,2. pt ,3. pth,4. safetensors,5(特殊)webui 特殊模型保存方法:PNG、WEBP图片格式。

暂且抛开第五种不谈。这几种后缀名都是标准的模型,从后缀名是无法判断具体是哪一种类的模型。

其中,1,2,3 这三种是 pytorch[2] 的标准模型保存格式,由于使用了 Pickle,会有一定的安全风险(自行百度:pickle反序列化攻击)。第四种为一种新型的模型格式,正如同他的名字,safe。为了解决前面的这几种模型的安全风险而出现的。safetensors 格式与 pytorch 的模型可以通过工具进行任意转换,只是保存数据的方式不同,内容数据没有任何区别。

2.2 常见模型种类及使用方法

以下所有模型都可以保存为 safetensors 格式,故常见格式中都不再提及safentensors。

safetensors模型 需要 webui 更新到2022年12月底以后的版本才能用!!!!直接更新2023年!!!别再问了!!!

2.2.1 大模型

大模型。常见格式为 ckpt,一个字,大。大小在GB级别,常见有 2G、4G、7G模型。

模型大小不代表模型质量

使用方法:放在这个文件夹内。

在 webui 左上角选择对应的模型。

部分合并出来的大模型VAE烂掉了,画面会发灰,这时候需要你去设置中手动选择vae并应用保存。

2.2.1 Embedding (Textual inversion)

俗称的 embedding 模型。常见格式为 pt、png图片、webp图片。大小一般在 KB 级别。

使用方法:

放在这个文件夹里面,生成图片的时候需要带上 文件名 作为 tag。

2.2.2 Hypernetwork

常见格式为 pt。大小一般在几十兆到几百兆不等。由于这种模型可以自定义的参数非常之多,一些离谱的 Hypernetwork 模型可以达到 GB 级别。

使用方法:放在图中文件夹内。

旧版的时候在设置里面可以找到选项,选择对应的即可使用。

新版改版了(2023年第2周左右)使用方法如图所示

2.2.3 LoRA

常见格式为 pt、ckpt。大小一般在8mb~144mb不等。

使用方法:目前有两种用法。

一种是插件方式使用,参考这个视频。

另一种是新版本,原生支持lora。

模型需要放在 models/Lora 文件夹。使用方法如图所示,点击一个模型以后会向提示词列表添加类似这么一个tag, <lora:模型名:权重> 也可以直接用这个tag调用lora模型。

2.2.4 VAE 模型

常见格式为 .pt

使用方法:将其放在 models/VAE 文件夹。

放置完毕后,在设置页面进行如下选择并保存。

3 模型训练方式简易指导

3.1 Embedding (Textual inversion)

可训练:画风√ 人物√ | 推荐训练:人物

配置要求:显存6GB以上。

训练速度:中等 | 训练难度:中等

综合评价:☆☆☆

评价:比较基础的一种,局限性较大,但是可以用

训练教程:

3.2 Hypernetwork

可训练:画风√ 人物√ | 推荐训练:画风

配置要求:显存6GB以上。

训练速度:中等 | 训练难度:难

综合评价:☆☆

评价:非常强大的一种模型,但是想训练好很难,不推荐训练。

训练教程:不更新了

3.3 LoRA

可训练:画风? 人物√  概念√ | 推荐训练:人物

配置要求:显存8GB以上。

训练速度:快 | 训练难度:简单

综合评价:☆☆☆☆

评价:非常好训练 好出效果的人物训练,配置要求低,图要求少。

备注:LoRA 本身也应该归类到 Dreambooth,但是这里还是分开讲。

本地训练教程:

云端训练教程:

3.4 Dreambooth / Native Train

可训练:画风√ 人物√ 概念√ | 推荐训练:Dreambooth 推荐人物,Native Train 推荐画风

配置要求:显存12GB以上。

训练速度:慢 | 训练难度:可以简单可以很难

综合评价:☆☆☆☆☆

评价:微调大模型,非常强大的训练方式,但是使用上会不那么灵活,推荐训练画风用,人物使用 LoRA 训练。

THE END
0.AI绘画Stablediffusion必不可少的使用方法之Lora(1)这,就是Lora,所有AI绘画人都必须了解,并且要非常了解的小帮手,Lora的全称叫做Low-Rank Adaptation Model,中文意思是大模型的“低秩适应”。 我想用一个很类似的比喻来形容它--追踪导弹,在茫如瀚海的关键词之中,Lora像一个个精准无比的追踪导弹一样,能够准确又快速的捕捉道一套又一套的词组模型,包括服饰、姿势jvzquC41dnuh0lxfp0tfv8^F\CR0c{ykenk0fnyckny03<:729;45
1.AI绘画中的LoRa是什么?ai绘画lora是什么意思LoRA AI绘画模型 LoRA(Low-Rank Adaptation)是一种基于扩散模型的AI绘画工具,主要用于增强细节和提升画质。LoRA模型通过文本编码器与扩散模型的结合,能够实现画风调整、人物建模以及风格微调等功能。这种模型在全球范围内下载量极高,受到许多用户的喜爱。 LoRA的应用场景包括赛博Coser服饰更换、真人肖像生成以及特定风格的画jvzquC41dnuh0lxfp0tfv8gguvvbu~4ctvodnn4fgvgjn|4369629;:7
2.AI绘画StableDiffusion研究(十七)SDlora详解(上)大家还记得AI 绘画Stable Diffusion 研究(三)sd模型种类介绍及安装使用详解这篇文章中,曾简单介绍了Lora的安装和使用吗 ? 但是我们并不清楚LORA 的原理是什么?以及使用过程中有什么技巧 ? 其实LORA 与 embedding 、Hypernetwork 在本质上类似,不过因为携带着大量的训练数据,所以 LORA 对人物和细节特征的复刻更加细腻jvzquC41fg|fnxugt0gmk‚zp0eun1jwvkerf1:8685>5
3.AI绘画:Lora模型训练完整流程!ai绘图模型训练AI绘画:Lora模型训练完整流程! 整体来说还是比简单的,搞个别人的模型,搞个提示词就出图了。今天来一个有些难度的,自己训练一个LoRA微调模型。 0.LoRA微调模型是什么? LoRA的全称是Low-Rank Adaptation of Large Language Models,有专门的论文和开源项目。它主要解决“大模型”太大,一般人玩不转的问题。jvzquC41dnuh0lxfp0tfv8Jskso0c{ykenk0fnyckny03=:223?36
4.AI绘画的使用感受,很强,但并不完美4.loRA模型训练 6G显存的显卡是最基本的配置,但训练分辨率只有400*400左右。如果有训练模型的需求,可以去网络云租一张显卡,一天可以训练出一大堆模型。 5.AI绘画全身照的时候脸会崩 我从网上查到的原因是生成的图片分辨率太低,导致脸部的空间太小,AI不会画了。建议生成高分辨率图片,比例最好是4:3或3:2,虽然jvzq<84enwh/ijrgtuqz0lto1o5be}nxkv08<7634
5.LoRA360LoRA360,360的LoRA360是一个360推出的一个低调在线AI绘画网站,是新一代AI生图平台,也是360鸿图的升级版,LoRA可以将现实场景转换为动漫风格的360场景原创。jvzq<84yyy4zlytq0eun1|nvg1796B3jvor
6.LiblibAI·哩布哩布AI官网限时免费的LoRA炼丹炉!更全、更热门的素材,为所有AI绘画者提供更得心应手的平台,持续深耕专业领域。 标签:AI绘画工具4090AIGC热门工具Liblib AILiblibAI专业炼丹炉哩布哩布哩布哩布AI图生图在线sd在线模型训练工具文生图 链接直达手机查看 Liblib AI是什么? jvzquC41yy}/crle0et0urygu1878@:0jvsm
7.深度解析AI绘画中SD1.5SDXLCheckpointLora的含义与原理checkpoint、lora是什么意思 checkpoint和lora的区别 放轻松,我会通过设计师的视角帮大家更好地理解。 同时我给大家准备了一份完整版的AI绘画全套学习资料,已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】 问题1:SDXL、SD1.5这些版本有什么区别,到底有多少版本? jvzquC41dnuh0lxfp0tfv8F35792;;7;81gsvrhng1jfvjnnu1754A9:637
8.AI绘画SD启动器stablediffusion插件安装大模型Lora安装stable diffusionMidjourneyAI绘画向量数据库最佳实践征文活动玩转腾讯混元大模型 视频文本 温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准 00:01 本期要录制的节目呢,是给大家分享一下我们会试启动器的最新版本的一个大概的一个概况,那么当你安装完启动器之后啊,打开你的压缩包啊,解压缩,安装完基本环境,点击启动之后呢,就会jvzquC41enuvf7ygpekov7hqo1jfxnqqrgx0xrigq1=:7==
9.AI绘画:Lora模型训练完整流程!托尼不是塔克关于AI绘画(基于Stable Diffusion Webui),我之前已经写过三篇文章,分别是 软件安装,基本的使用方法,微调模型LoRA的使用。 整体来说还是比简单的,搞个别人的模型,搞个提示词就出图了。今天来一个有些难度的,自己训练一个LoRA微调模型。 ​ 编辑切换为居中 添加图片jvzquC41yy}/ewgnqiy/exr1ycthrp4r13=4:A>820nuou