图片
Stable Diffusion 是一种文本到图像生成东说念主工智能器具,这意味着它将笔墨蜕变为图像。这个过程类似于将详备的简介邮寄给一位画家,然后恭候全心创作的艺术品的复返。
将褂讪扩散视为你个东说念主的基于东说念主工智能的创意盟友。这种深度学习模子主若是为了字据文本教导生成图像而想象的,它突出了单一功能。它还可用于成就(篡改图像的部分)、掩饰(将图像推广到其现存界限除外)以及字据文本教导翻译图像。这种多功能性绝顶于领有一位多材多艺的艺术家供你使用。
褂讪扩散的力学
褂讪扩散基于深度学习模子运行,该模子字据文本描画制作图像。其支撑是扩散过程,其中图像通过一系列行为从当场噪声挪动为连贯图像。该模子经过考研可以指挥每个阶段,从而字据提供的文本教导带领从动手到完成的所有这个词这个词过程。
褂讪扩散背后的中心念念想是将噪声(当场性)蜕变为图像。该模子以一堆当场噪声(想象一下来自无信号电视的白噪声的彩色版块)来启动该过程,然后在文本教导的影响下逐渐细化为可鉴别的图像。这种细化系统地进行,褂讪地减少噪声并增强细节,直到出现高质料的图像。
跟着扩散过程的动手,初步阶段在很猛进程上决定了图像的举座构图,随后的关节字篡改仅影响较小的部分。这强调需要仔清雅致关节字权重和时辰安排,以收场你想要的拆伙。
褂讪扩散的优点和过错
褂讪扩散的优点之一是,它擅长创建详备的高质料图像,并字据特定教导进行定制想象。它可以纯粹地浏览多样艺术作风,无缝交融不同艺术家的时候,并在不同的关节词之间平滑过渡。
与 MidJourney等同类产物不同,Stable Diffusion 是免费的,这对你的预算来说是一个福音。它亦然开源的,这意味着你可以字据需要对其进行修改。不管你渴慕创造将来派表象如故动漫作风的图像,褂讪扩散皆有一个适应你的模子。稍后咱们将深入连接何如下载并字据你的喜好定制这些模子。
你可以离线运行它,无需赓续的互联网辘集或服务器走访,这使其成为顾惜隐秘的用户的宝贵器具。
关联词,也有一些过错,与 MidJourney 不同,Stable Diffusion 具有笔陡的学习弧线。要生成信得过出色的图像,你必须使用自界说模子、插件和一些教导工程。这有点像 Windows 与 Linux 的情况。
此外,该模子有时会阐扬出弗成意象的关联,从而导致不测的拆伙。教导中的隐微造作可能会导致输出出现要紧偏差。举例,在教导中指定眼睛神采可能会偶然中影响生成的变装的种族(举例,蓝眼睛时常与白种东说念主关连)。因此,为了取得最好拆伙,必须深入了解其责任旨趣。
此外,教导中需要大皆细节才能提供令东说念主印象潜入的拆伙。与 MidJourney 不同,MidJourney在“一个瑰丽的女东说念主在公园分散”等教导下阐扬邃密,而褂讪扩散需要对你但愿(或不但愿)在图像中看到的所有这个词内容进行全面描画。为冗长、详备的教导作念好准备。
操作褂讪扩散
运行褂讪扩散的行为有多种,可以通过基于云的平台,也可以获胜在腹地狡计机上。
以下是一些可让你在云中测试它的在线平台:
Leonardo AI:允许你尝试不同的模子,其中一些模子师法 MidJourney 的好意思学。
Sea Art:使用插件测试大皆褂讪扩散模子的好场合是其他高等器具。
Mage Space:提供褂讪扩散版块 v1.5 和 2.1。尽管它有大皆其他模子,但它需要会员经验。
Lexica:一个用户友好的平台,可带领你发现图像的最好教导。
Google Colabs:另一个易于走访的选项。
然则,如果你遴荐腹地安设,请确保你的狡计机具有必要的功能。
系统条件
要在腹地运行 Stable Diffusion,你的 PC 应运行 Windows 10 或更高版块,况且至少配备具有至少 4 GB VRAM 的寥落 Nvidia 显卡 (GPU)、16GB RAM 和至少 10GB 可用空间。
为了取得最好体验,提议使用具有 12GB vRAM、32GB RAM 和高速 SSD 的 RTX GPU。磁盘空间将取决于你的具体需求:你规划使用的模子和附加组件越多,你需要的空间就越多。一般来说,模子需要 2GB 到 5GB 的空间。
使用自动 1111 导航褂讪扩散
小程序开发当你动手褂讪扩散之旅时,遴荐正确的图形用户界面 (GUI) 变得至关贫穷。在绘制方面,Invoke AI处于最初地位,而SD.Next 则顾惜着力。ComfyUI是一个基于节点的超轻量级选项,由于与新的 SDXL 兼容,最近取得了很大的温雅。关联词,Automatic 1111以其流行性和用户友好性成为最受迎接的。让咱们深入探讨何如动手使用 Automatic 1111。
图片
运行褂讪扩散的两个不同的 GUI(A1111 和 ComfyUI)
成就自动 1111
由于此存储库上提供了一键式安设范例,Automatic 1111 的安设过程并不复杂。参加 Github 页面的“assets”部分,下载 .exe 文献并运行它。这可能需要一些时辰,是以请营救下去 - 请记取,耐烦是关节。
得胜安设后,“A1111 WebUI”快捷方式将在新大开的文献夹中出现。洽商将其固定到任务栏或创建桌面快捷方式以便于走访。单击此快捷方式将启动褂讪扩散,为你的创意敕令作念好准备。
最好勾选以下复选框:自动更新 WebUI(使范例保持最新)、自动更新推广(保持插件和第三方器具更新),况且,如果你的电脑功能不是那么苍劲,还应激活低 VRam (medvram) 和启用 Xformers 的选项。
图片
启动 A1111 之前出现的屏幕
了解用户界面
安设了 A1111 的褂讪扩散后,大开它时你将看到以下内容
图片
自动 1111 GUI
但不要被吓倒。以下是运行褂讪扩散时界面的简要浏览:
查验点或模子:本色上是 AI 图像操作背后的中枢,这些事先考研的褂讪扩散权重可以与收受不同家数的不同艺术家进行比拟。一个东说念主可能擅长动画,而另一个东说念主则擅长试验主义。你在这里的遴荐决定了你图像的艺术作风。
积极教导:这是你在形象中抒发你想要的东西的场合。
诡辩教导:在此指定你不但愿在你的作品中看到的内容。
创建样子:如果你但愿将正面和负面教导的特定组合保存为“样子”以供将来使用,请单击此处进行操作。
应用样子:将昔日保存的样子应用到现时教导。
生成:成就完所有这个词参数后,单击此处使你的图像活灵活现。
采样行为:此参数界说将当场噪声挪动为最终图像所选用的行为。20 到 75 之间的范围时常会产生邃密的拆伙,25-50 是实用的中间值。
采样行为:如果模子代表该范例的中枢,那么采样器即是一切背后的大脑。这是用于获取教导、编码器和每个参数并字据你的敕令将噪声蜕变为连贯图像的时候。有许多采样器,但咱们推选“DDIM”用于快速渲染,只需几个行为,“Euler a”用于皮肤光滑的东说念主的画图或像片,“DPM”用于详备图像(DPM++ 2M Karras 可能是一个可以的安全遴荐) 。以下是使用褂讪扩散的不同采样行为取得的拆伙的汇编。
批次计数:批次计数将一个接一个地运行多批生成。这将允许你使用相易的教导创建不同的图像。这需要更长的时辰,但使用更少的 vRAM,因为每个图像皆是在前一个图像完成青年景的
批次大小:这是每个批次中有些许并行图像。这将为你提供更多图像,速率更快,但也需要更多 vRAM 来惩办,因为它会在消失代中生成任何图像。
CFG比例:它决定了模子的创作解放度,在死守你的教导和我方的想象力之间取得均衡。较低的 CFG 将使模子忽略你的教导并更具创造性,较高的 CFG 会使其实足莫得解放地营救下去。5 到 12 之间的值时常是安全的,7.5 提供可靠的中间值。
宽度和高度:在此处指定图像尺寸。肇端分辨率可以是 512X512、512X768、768x512 或 768x768。关于 SDXL(Stability AI 的最新式号),基分内辨率为 1024x1024
种子:将其视为图像的独一 ID,为启动当场噪声成就参考。如果你策动复制特定拆伙,这小数至关贫穷。此外,每个图像皆有一个私有的种子,这即是为什么弗成能信得过 100% 复制特定的试验生存图像 - 因为它们莫得种子。
骰子图标:将种子成就为 -1,使其当场化。这保证了每个图像生成的独一性。
回收图标:保留前次图像生成的种子。
剧本:它是施行影响你的责任经由的高等指示的平台。作为入门者,你可能但愿暂时保持不变。
保存:将生成的图像保存在你遴荐的文献夹中。请密致,褂讪扩散还会自动将图像保存在其专用的“输出”文献夹中。
发送到 img2img:将你的输启程送到 img2img 选项卡,使其成为类似它的新一代的参考。
发送到成就:将图像定向到成就选项卡,使你或者修改特定图像区域,举例眼睛、手或伪像。
发送到非凡内容:此操作会将你的图像从头定位到“非凡内容”选项卡,你可以在其中诊治图像大小,而不会丢失大皆细节。
即是这么——一切皆准备好了!当今,让你的创造力尽情阐扬,见证褂讪扩散的神奇魔力。
教导工程 101:何如为 SD v1.5 制作邃密的教导
褂讪扩散的得胜很猛进程上取决于你的教导——将其视为指挥东说念主工智能的指南针。细节越丰富,生成的图像就越准确。
快速制作有时可能看起来令东说念主怕惧,因为褂讪扩散不死守线性模式。这是一个充满尝试和特地的过程。从教导动手,生成图像,遴荐你可爱的输出,修改你贵重或但愿拔除的元素,然后从头动手。冲洗并近似这个过程,直到你的极品通过成就诊治和不懈的改良而出现。
正面教导、负面教导和微调关节词权重
Stable Diffusion 的想象可以通过语法(关节字:因子)诊治关节字权重。低于 1 的要素会淡化其贫穷性,而高于 1 的要素会放大其贫穷性。要旁边权重,请遴荐特定关节字并按 Ctrl+Up 加多或按 Ctrl+Down 减少。此外,你可以使用括号——使用的越多,关节字的权重就越大。
修饰符为你的图像添加临了的丽都,指定情感、作风或细节(如“阴霾、复杂、高度详备、明晰的焦点”)等元素。
积极的教导详尽了你想要的元素。快速构建的可靠政策是按法例指定图像类型、主题、绪言、作风、布景或表象、艺术家、使用的器具和分辨率。civita.com 的演示可以是“真是感渲染、(数字绘画)、(最好质料)、宁静的日本花坛、通达的樱花、(((锦鲤池)))、东说念主行桥、浮屠、浮世绘艺术作风,北斋灵感,异常艺术流行,8k超写实,柔柔的配色决策,柔柔的灯光,黄金时刻,宁静的氛围,表象导向”
相背,负面教导详备证据了你但愿从图像中拔除的所有这个词内容。示例包括:阴霾的神采、丑陋、灾祸的手、太多的手指、NSFW、交融的行为、最差的质料、低质料、拖拉、水印、文本、低分辨率、长脖子、超出框架、饱胀的手指、变异的手、单色、丑陋的、近似的、病态的、不良的剖解结构、不良的比例、毁容、低分辨率、变形的手、变形的脚、变形的脸、变形的身体部位、((相易的发型))等。不要轻飘用不同的词。
洽商教导的一个好行为是“What+SVCM(主语、动词、凹凸文、修饰语) ”结构:
内容:笃定你想要的内容:肖像、像片、插图、绘画等。
主题:描画你正在洽商的主题:一个瑰丽的女东说念主、一个超等强人、一个亚洲老东说念主、一个黑东说念主士兵、小孩、瑰丽的表象。
动词:描画拍摄对象正在作念什么:女东说念主正在对着镜头摆姿势吗?超等强人是飞如故跑?亚洲东说念主是浅笑如故越过?
布景:描画你的想法中的场景:场景发生在那儿?在公园、在教室、在拥堵的城市?尽可能具有描画性
修改器:添加联系图像的附加信息:如果是图片,则使用哪个镜头。如果是一幅画,是哪位艺术家画的?使用哪种类型的照明,哪个地点会选用这种照明?你正在洽商哪种服装或前锋作风,图像吓东说念主吗?这些观念用逗号分隔。但请记取,越接近动手,它们在最终作品中就越凸起。如果你不知说念从那儿动手,如果你不想仅仅复制/粘贴其他东说念主的教导,这个网站和这个Github 存储库有许多好主意供你尝试
因此,积极教导的一个例子可以是:在一家鼓动的旅馆里对着镜头摆姿势的可儿贵客犬的肖像,(((黑尾巴)))、秋天、散景、极品、强光、胶片颗粒、佳能 5d 象征4、F/1.8、Agfacolor、不实引擎。
诡辩教导不需要顺应的结构,只需添加你不可爱的所有这个词内容,就好像它们是修饰符同样。如果你生成图片并看到一些你不可爱的内容,只需将其添加到诡辩教导中,从头运行生成并评估拆伙即可。这即是东说念主工智能图像生成的旨趣,这并不是什么古迹。负面教导的一个例子可以是:拖拉、画得不好、猫、东说念主类、东说念主、素描、恐怖、丑陋、病态、变形、标志、文本、不良剖解学、不良比例
关节词整合和实时安排
关节字夹杂或教导更动选用语法[关节字1:关节字2:因子]。该因子是一个介于 0 和 1 之间的数字,开发企业软件公司决定在哪一步从关节字 1 切换到关节字 2。
懒惰的长进:复制教导
如果你不笃定从那儿动手,请洽商哄骗各个网站的想法并进行诊治以骄矜你的需求。教导的优秀开始包括:
奇维泰
辞书
褂讪的扩散网
教导强人
或者,保存你赏玩的东说念主工智能生成的图像,将其拖放到“PNG 信息”选项卡上,褂讪扩散会提供从头创建它的教导和关连信息。如果图像不是 AI 生成的,请洽商使用 CLIP Interrogator 插件来更好地和会其描画。联系此附加组件的更多详备信息将在指南后头提供。
幸免陷坑
褂讪扩散的着力取决于它给出的教导。顾惜细节和准确性,提供明晰具体的教导并嗜好观念而不是解释至关贫穷。不要全心想象一个句子来描画广宽、天然光泽充足的场景,而只需说“广宽、天然光泽”。
请密致某些属性可能带来的不测关联,举例指定眼睛神采时的特定种族。对这些潜在陷坑保持警惕可以匡助你制定更有用的教导。
请记取,你的指示越具体,你的拆伙就越容易限定。然则,如果你假装创建长教导,请务必防御,因为使用矛盾的关节字(举例长发,然后怨家发进行排序,或者诡辩教导中的拖拉和深信教导中的拖拉)可能会导致不测拆伙:
安设新模子
安设模子是一个简便的过程。起初笃定适应你需求的模子。Civita 是一个很好的最先,它以最大的褂讪扩散器具存储库而闻名。与其他替代决策不同,Civita 饱读吹社区共享他们的教育,为模子的功能提供视觉参考。
走访 Civita,单击过滤器图标,然后在“模子类型”部分中遴荐“查验点”。
图片
Civitai 使用过滤器让用户个性化搜索/Jose Lanz/Decrypt Media
然后,浏览网站上所有这个词可用的模子。请记取,褂讪扩散未经审查,你可能会遭受 NSFW 内容。遴荐你可爱的型号并单击下载。确保模子具有 .safetensor 推广名以确保安全(旧模子使用 .ckpt 推广名,但不太安全)。
图片
从 Civitai 下载特定自界说 SD v1.5 模子的页面示例。
下载后,将其放入腹地 Automatic 1111 的模子文献夹中。为此,请导航到安设 A111 Stable Diffusion 的文献夹,然后按照以下阶梯操作:“stable-diffusion-webuimodelsStable-diffusion”
稀有百种型号可供遴荐,但作为参考,咱们的一些首选是:
如果你想玩传神的图像,请使用 Juggernaut、Photon、Realistic Vision 和 aZovya Photoreal。
Dreamshaper、RevAnimated 以及 DucHaiten 的所有这个词模子(如果你可爱 3d 艺术)。
DuelComicMix、DucHaitenAnime、iCoMix、DucHaitenAnime 如果你可爱漫画和漫画等 2D 艺术。
裁剪图像:图像到图像和成就(待办事项)
褂讪扩散还允许你使用 AI 裁剪你不可爱的图像。你可能想要篡改构图的艺术作风,在天外中添加鸟类,删除东说念主工成品,或修改手指过多的手。为此,有两种时候:图像到图像和成就。
图片
由 Stable Diffusion(右)基于用作参考的像片(左)使用 Img2img/Jose Lanz 创建的图像
图像到图像本色上是让褂讪扩散使用另一张图片作为参考来创建新图像,不管它是真是图像如故你创建的图像。为此,只需单击图像到图像 (Img2Img) 选项卡,将参考图像放入相应的框中,创建你但愿狡计机死守的教导,然后单击生成。需要密致的是,你应用的降噪强度越大,新图像与原始图像的相似进程就越低,因为褂讪扩散将具有更多的创作解放度。
知说念了这小数,你可以作念一些很酷的技能,比如扫描你祖父母的旧像片作为参考,通过低降噪强度的褂讪扩散和一个相配蒙胧的教导(如“RAW,4k 图像,高度详备”)运行它们,望望何如东说念主工智能重建你的像片。
成就允许你在原始图像中绘制或裁剪内容。为此,从消失个 Img2Img 选项卡中,遴荐成就选项并将参考绘画摈弃在那里。
然后,你只需绘制要裁剪的区域(举例,变装的头发)并添加要创建的教导(举例,直长的金发),就完成了!
图片
使用成就在金发女超东说念主的参考图像上裁剪蓝色头发。由 AI/Jose Lanz 生成
咱们提议生成多批图像,以便你可以遴荐最可爱的图像并修改教导。关联词,临了,如果你相配驻防,手头有一个像 Photoshop 这么的器具老是有平允的,这么可以得到竣工的拆伙。
增强褂讪扩散功能的 5 大推广
当今你也曾纯熟了褂讪扩散,你可能渴慕进一步阐扬你的创造力。也许你想要固定特定的手部位置、强制模子生成五指手、指定某种类型的一稔、增强细节、使用特定的脸部,或者将小图像蜕变为大型 8K 文献,同期尽可能减少细节亏本。
推广可以匡助你收场这些方针。天然有许多可用选项,但咱们要点先容了五个必备推广:
LoRA:细节决定成败
图片
不使用 LoRA 生成的图像与使用 LoRA 生成的相易图像以添加更多细节。
LoRA 是旨在增强模子特异性的文献,无需下载全新模子。这使你可以完善细节,选用特定的样貌、服装或作风。
要安设 LoRA,请按照下列行为操作:
单击“推广”选项卡并遴荐“从 URL 安设”。
在框中输入 URL:https: //github.com/kohya-ss/sd-webui-additional-networks.git ,然后单击“安设”。
完成后,单击“已安设”,然后单击“应用并从头启动 UI”。
安设 LoRA 的行为与安设模子相易。在 Civitai 上,将过滤器成就为“LoRA”,并使用以下旅途将文献放入 LoRA 文献夹中:stable-diffusion-webuimodelsLora
请记取,某些 LoRA 需要在教导中输入特定关节字才能激活,因此请务必在使用前阅读其证据。
要使用 LoRA,请导航到 text2img 选项卡,单击类似小画的图标(清楚/灭亡非凡网罗),LoRA 将出当今教导下方。
ControlNet:开释视觉魔法的力量
1、排列三最近两期百位号码分别开出2和3,历史上百位号码连续两期分别开出2和3的奖号出现了56期。前五期开出之后其下期奖号分别为:014、096、790、590、548;
图片
不使用 LoRA 生成的图像与使用 LoRA 生成的相易图像以添加更多细节。
如果你对褂讪扩散的功能尚未作念出决定,请让 ControlNet 推广成为最终的谜底。ControlNet 领有弘大的多功能性和苍劲功能,使你或者从参考图像中索求构图,阐述我方是图像生成范围的游戏端正改变者。
ControlNet 照实是万事通。不管你是需要复制姿势、模拟配色决策、从头想象你的生存空间、制作五指手、在不使 GPU 背负过重的情况下施行简直无穷的升级,如故将简便的涂鸦挪动为令东说念主惊叹的 3D 渲染或传神的视觉着力,ControlNet 皆可认为你提供匡助。方式。
安设 ControlNet 触及以下简便行为:
走访推广页面并遴荐“从 URL 安设”选项卡。
将以下 URL 粘贴到“推广存储库的 URL”字段中:https: //github.com/Mikubill/sd-webui-controlnet
单击“安设”。
关闭褂讪扩散界面。
要启用 ControlNet,你需要从此存储库下载模子:https://huggingface.co/lllyasviel/ControlNet-v1-1/tree/main
然后,将所有这个词下载的文献复制到此文献夹中:stable-diffusion-webuiextensionssd-webui-controlnetmodels
从头启动褂讪扩散后,你会密致到 text2img 选项卡中出现了一个新的“ControlNet”部分。
向你提供两个主要选项:用于拖放参考图像的框、控件类型遴荐和预惩办器。
“参考图像框”是你上传想要参考的姿势、脸部、色调组成、结构等的图像的场合。
“限定类型遴荐”是 ControlNet 魔法发生的场合。此功能允许你笃定要复制或限定的内容。
你还有其他更高等的选项可让你微解救散:预惩办器(用于激活限定网的时候)、权重(你的参考有多贫穷)和动手/拆伙点(限定网何时动手/拆伙其影响)
以下是每种控件类型的功能的快速详尽:
OpenPose:精笃定位身体的关节部位并复制姿势。你可以使用预惩办器遴荐所有这个词这个词身体、面部或手部的姿势。
Canny:将你的参考图像蜕变为带有细线的吊祭涂鸦。这允许你的创作死守这些线条作为旯旮,从而与你的参考准确相似。
深度:生成“深度图”以创建图像的 3D 印象,分别近处和辽远的对象 - 相配适应师法 3D 电影镜头和场景。
法线:法线贴图料想名义的主张,相配适应为盔甲、织物和外部结构等对象提供纹理。
MLSD:识别直线,相配适应再现建筑想象。
艺术线条:将图像蜕变为画图 - 关于动漫和卡通等 2D 视觉着力相配有用。
Softedge:与 Canny 模子类似,但旯旮更柔柔,为模子提供更多解放度,但精度稍低。
涂鸦:将图像蜕变为涂鸦,产生比 Canny 模子更通用的拆伙。此外,你还可以在绘画上创建涂鸦,并将其用作参考,无需预惩办器即可将图像造成试验的创作。
分割:创建图像的神采图,料想其中的对象。每种神采代表一种特定的物体。你可以使用它来从头遮挡你的图像,或者从头想象具有相易观念的场景(举例,将 1800 年代的像片造成赛博一又克替代试验中相易表象的传神描摹,或者仅仅用不同的床、墙壁从头遮挡你的房间不同神采等)
平铺:向图片添加细节并促进放大,而不会使 GPU 背负过重。
成就:修改图像或推广其细节。当今,借助最近的更新和“仅成就 + 骆驼”模子,你可以极其顾惜细节地绘制图像
当场播放:再现参考图像的神采结构。
参考:生成在作风、构图和偶尔的样貌方面与你的参考相似的图像。
T2IA:让你限定图像的神采和艺术构图。
图片
掌捏这些选项可能需要时辰,但它们提供的活泼性和定制性值得付出勉力。在线张望多样教程和带领视频,以充分哄骗 ControlNet。
Roop:Deepfakes易如反掌
Roop 提供了一种纯粹的行为来生成传神的深度假货。Roop 无需惩办复杂的模子或 LoRA,而是可以惩办忙活的责任,使你只需单击几下即可创建高质料的深度假货。
要下载并激活,请按照官方 Roop Github 存储库上的证据进行操作
要使用它,请创建教导,导航到 Roop 菜单,上传参考面,启用它,然青年景图像。为了取得最好着力,请使用你想要复制的脸部的高分辨率正面像片。请记取,消失个东说念主的不同图像可能会产生不同的拆伙 - 有些比其他图像更传神。
Photopea:Photoshop 褂讪扩散的力量
图片
Photopea 推广在 A1111 里面的外不雅
有时,需要手动诊治才能取得竣工的拆伙,这即是 Photopea 的用武之地。此推广将类似 Photoshop 的功能获胜引入褂讪扩散界面,使你无需切换平台即可微调生成的图像。
你可以从此存储库安设 Photopea:https://github.com/yankoliveira/sd-webui-photopea-embed
CLIP 商议器:从任何图像创建教导
如果你不知说念从那儿动手使用教导,那么这是一个很棒的器具。拍摄一张图像,将其放入框中,运行商议器,它会告诉你哪些单词可以与你提供的图像关连联。
CLIP Interrogator 是一个便捷的器具,用于从特定图像中导出关节字。通过团结 OpenAI 的 CLIP 和 Salesforce 的 BLIP,该推广可以生成与给定参考图像匹配的文本教导。
你可以从此存储库安设:https://github.com/pharmapsychotic/clip-interrogator-ext.git
论断
通过褂讪扩散,你将成为视觉管弦乐队的巨匠。不管是“艾玛·沃特森作为女巫的超试验肖像”如故“幻想环境中海盗的复杂数字绘画”,独一的截止即是你的想象力。
当今,用你新发现的常识武装起来,络续将你的联想描摹成试验,一次一个文本教导。
图片
由 Decrypt 使用 AI/Jose Lanz 创建的图像软件开发价格
本站仅提供存储服务,所有这个词内容均由用户发布,如发现存害或侵权内容,请点击举报。