当前位置:首页  /  软件评测  /  腾讯混元文生图开源模子 推出小显存版本,仅需6G显存即可运行

腾讯混元文生图开源模子 推出小显存版本,仅需6G显存即可运行

分类:软件评测

7月4日,腾讯混元文生图大模子 (混元DiT)公布 开源小显存版本,仅需6G显存即可运行,对利用 个人电脑本地 摆设 的开辟 者非常 友爱 ,该版本与LoRA、ControlNet等插件,都已适配至Diffusers库;并新增对Kohya图形化界面的支持,让开辟 者可以低门槛地练习 个性化LoRA模子 ;同时,混元DiT模子 升级至1.2版本,在图片质感与构图方面均有所提拔 。

模子 易用性再提拔 ,个人电脑可轻松运行

基于DiT架构的文生图模子 天生 图片质感更佳,但对显存的要求却非常高,让很多 开辟 者望而却步。这也是新版本Stable Diffusion模子 无法快速遍及 的缘故起因 之一。

应广大开辟 者的需求,混元DiT推出小显存版本,最低仅需6G显存即可运行优化推理框架,对利用 个人电脑本地 摆设 的开辟 者非常友爱 。颠末 与Hugging Face相助 ,小显存版本、LoRA与ControlNet插件,都已经适配到Diffusers库中。开辟 者无需下载原始代码,仅用简单 的三行代码仅可调用,大大简化了利用 本钱 。

同时,混元DiT公布 接入Kohya,让开辟 者可以低门槛地练习 专属LoRA模子 。

Kohya是一个开源的、轻量化模子 微调练习 服务,提供了图形化的用户界面,被广泛用于扩散模子 类文生图模子 的练习 。用户可以通过图形化界面,完成模子 的全参精调及LoRA练习 ,无需涉及到代码层面的细节。练习 好的模子 符合Kohya生态架构,可以低本钱 与 WebUI 等推理界面连合 ,实现一整套“练习 -生图”工作流。

别的 ,腾讯公布 混元文生图打标模子 ”混元Captioner“正式对外开源。该模子 支持中英文双语,针对文生图场景举行 专门优化,可资助 开辟 者快速制作高质量的文生图数据集。

相比起业界的开源打标模子 ,混元Captioner模子 能更好的明白 与表达中文语义,输出的图片形貌 更为布局 化、完备 和正确 ,并能精准辨认 出常见着名 流 物与地标。模子 还支持开辟 者自行增补 和导入个性化的配景 知识。

混元Captioner模子 开源之后,环球 的文生图研究者、数据标注职员 ,均可利用 混元Captioner高效地提拔 自身图像形貌 质量,天生 更全面、更正确 的图片形貌 ,提拔 模子 结果 。混元Captioner天生 的数据集不但 能用于练习 基于混元DiT的模子 ,亦可用于其他视觉模子 练习 。

浩繁 开辟 者关注,成最受欢迎 国产DiT开源模子

在提拔 模子 易用性的同时,腾讯公布 混元文生图打标模子 ”混元Captioner“正式对外开源。该模子 支持中英文双语,针对文生图场景举行 专门优化,可资助 开辟 者快速制作高质量的文生图数据集。

相比起业界的开源打标模子 ,混元Captioner模子 能更好的明白 与表达中文语义,输出的图片形貌 更为布局 化、完备 和正确 ,并能精准辨认 出常见着名 流 物与地标。模子 还支持开辟 者自行增补 和导入个性化的配景 知识。

作为首个中文原生DiT开源模子 ,混元DiT自全面开源以来,不停 连续 建立 生态。6月,混元DiT发布的专属加快 库,可将推理服从 进一步提拔 ,生图时间收缩 75%;并进一步开源了推理代码;发布LoRA和ControlNet等插件。于此同时,模子 易用性大幅提拔 ,用户可以通过Hugging Face Diffusers快讯调用混元DiT模子 及其插件,或基于Kohya和ComfyUI等图形化界面练习 与利用 混元DiT。

如今 ,在浩繁 开辟 者的支持下,混元DiT发布不到2个月,Github Star数已经高出 2.6k,成为最受欢迎 的国产DiT开源模子 。

腾讯混元文生图开源模子
推出小显存版本,仅需6G显存即可运行

(免责声明:此文内容为本网站刊发或转载企业宣传资讯,仅代表作者个人观点,与本网无关。仅供读者参考,并请自行核实相干 内容。)

(:贺