前往网站首页查看更多精彩内容👉https://imyshare.com/
- Al:Artificial Intelligence,人工智能
- 模型:简单地说就是一个算法系统,将输入数据转化为指定的输出内容
各种模型:GPT类大模型、LoRA模型、Embedding模型
- 大模型、其他模型?
大模型是指模型的参数数量非常大,通常具有数亿到数万亿参数的模型,这些模型通常需要在大规模数据集上 进行训练,并且需要使用大量的计算资源进行优化和调整,GPT类AIGC属于大模型,在此之上还有超大模型
- 咒语、炼丹、魔法?
咒语是指prompt,由于Al出图是基于提供的文本信息,提供不同的文本出的图差异还挺大,有点摸不着规律,所以大家戏称这些文本信息为咒语
炼丹是指训练模型的过程,需要不断的调参,就跟炼丹不断的选各种物料一样
魔法是指使用prompt出图的过程,输入一堆文本就可以画出你想要的图片
- 什么是抽卡?
由于现在AI绘图工具并不能一次就能输出符合自己要求的图片,有概率性(通常可能几十张才能出一张可用的),就类似于游戏里的抽卡一样
sd webui 里还内置了无限抽卡神器(基于动态 prompt)插件
现在有ControlNet了,一定程度上可以控制画面的走向
- MJ——MidJourney
一个Al绘图平台,给予discord聊天平台出图(也可以部署到微信,作为聊天机器人使用),上手门槛非常低, 科学上网就行
出图的质量非常高,目前小红书上大部分玩家都是基于这个平台出图,但是收费,偶尔免费
Disco Diffusion 的原作者 Somnai 加入MJ后进行了优化改进,现在最新的版本是v5
- SD是什么?
stable diffusion的缩写,直译:稳定扩散;是一种绘画模型,文字出图,图生图;MJ的白嫖版本,自己电脑 上跑图,需要电脑配置够高,显存4G以上
是 stability ai 开源的图像生成模型,在 huggingface co/spaces/stabilityai 进行托管
- stable-diffusion-webui: SD-webui
是开源社区贡献的一个通过浏览器配置SD出图的一个软件,用于降低SD的使用门槛
项目链接:https://github.com/AUTOMATIC1111/stable-diffusion-webui
- ControlNet是什么?(绘画里用来完美控制画面,告别抽卡时代)
这是一个神经网络概念,意思是通过额外的输入控制net网络,通过这种方式可以一定程度上控制模型的输出走 向,寄希望于通过 control net告别Al绘画的抽卡时代
出圈是因为其训练的二次元模型包泄露(52G包),且由于出图效果不错,被传播开来,基于
stable-diffusion,训练了大量二次元图片,扩展了图片生成可视化角色的功能
下载链接:magnet:?xt=urn:btih:5bde442da86265b670a3e5ea3163afad2c6f8ecc&dn-novelaileak
- checkpoint(CKPT)是什么?
Checkpoint是用于描述在每次训练后保存模型参数(权重)的惯例或术语,这就像在游戏中保存
关卡时你可以随时通过加载保存文件回复游戏,你可以加载保存的模型权重重新开启训练甚至可以
之后进行一个推理
类似于项目项目管理里的检查点。
CKPT后缀名都是 safetensors
- Lora是特征模型,体积较小,是基于某个确定的角色、确定的风格或者固定的动作训练而成的
模型,可使用权重控制,确定性要远强于embedding;embedding和Lora有功能交集的部
分,也有互相不可取代的地方
Lora的后缀名也是 safetensors?
LoHA模型是一种 LORA模型的改进。
LoCon 模型也一种 LORA模型的改进,泛化能力更强
前往网站首页查看更多精彩内容👉https://imyshare.com/