妙笔

2年前发布 2.6K 00

工具介绍:妙笔是阿里巴巴最新开源的中文文生图模型,它与经典的Stable Diffusion 1.5版本结构相同,兼容现有的lora、controlnet等主流插件及其权重。妙笔的特点是用户可以直接输入中文进行文生图操作,生成的图像效果逼真。例如,输入“枯藤老树昏鸦,小桥流水人家。水墨画。”,妙笔能够理解诗句中的意境并生成相应的图像。

收录时间:
2024-03-23

妙笔简介

妙笔是阿里巴巴最新开源的中文文生图模型,它与经典的Stable Diffusion 1.5版本结构相同,兼容现有的lora、controlnet等主流插件及其权重。妙笔的特点是用户可以直接输入中文进行文生图操作,生成的图像效果逼真。例如,输入“枯藤老树昏鸦,小桥流水人家。水墨画。”,妙笔能够理解诗句中的意境并生成相应的图像。

妙笔的训练数据包括Laion-5B中的中文子集、Midjourney相关的开源数据以及数十万的caption数据。但由于数据集在成语和古诗词方面存在偏差,对中国名胜地标建筑数据的缺少,以及大量的英译中数据,可能会导致一些理解上的混淆。目前,妙笔Beta0.9版本已经在8张4090显卡上完成训练,开发者也在计划扩展机器资源以训练更高级的模型,以期获得更优的结果。

妙笔的使用也非常简单,用户只需克隆项目并安装所需的包,下载模型权重后即可开始生成图像。此外,妙笔还提供了多种示例和教程,帮助用户快速上手和掌握使用方法。

妙笔

妙笔直接输入中文就可以完成文生图操作,使用起来非常便捷,生图的效果也十分逼真。

比如输入“枯藤老树昏鸦,小桥流水人家。水墨画。”来看秒笔生成结果。可以看出妙笔很好的表达出来诗句中的意思并生成了诗中的内容。

妙笔

再比如输入“极具真实感的复杂农村的老人肖像,黑白。”

妙笔可以看出生成的人像具有很好的完整性和真实感,以往生图模型在生成人像方面的缺点在这也都完成的很好。

项目地址

https://github.com/ShineChen1024/MiaoBi

安装运行

1.克隆项目

git clone https://github.com/ShineChen1024/MiaoBi.git

2.创建虚拟环境并安装所需要的包

conda create -n MiaoBi-SD python==3.10
conda activate MiaoBi-SD
pip install torch==2.0.1 torchvision==0.15.2 numpy==1.25.1 diffusers==0.25.1 opencv

3.下载模型

从Huggingface下载权重,并把它放在检查点文件夹。

MiaoBi checkpoints下载链接

Diffuser使用

from diffusers import StableDiffusionPipeline
from transformers import AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained(“checkpoints/miaobi_beta0.9/tokenizer”,  trust_remote_code=True)
pipe = StableDiffusionPipeline.from_pretrained(“checkpoints/miaobi_beta0.9”)

pipe.to(“cuda”)
prompt = “一只穿着铠甲的猫”
image = pipe(prompt).images[0]
image.save(“铠甲猫.png”)

模型推理

python demo

python miaobi_generate.py

###controlnet demo

python miaobi_controlnet.py

中文生图示例

一只精致的陶瓷猫咪雕像,全身绘有精美的传统花纹,眼睛仿佛会发光。

妙笔

动漫风格的风景画,有山脉、湖泊,也有繁华的小镇子,色彩鲜艳,光影效果明显。

妙笔

车水马龙的上海街道,春节,舞龙舞狮。妙笔

局限性

妙笔的训练数据包含Laion-5B中的中文子集(经过清洗过滤),Midjourney相关的开源数据(将英文提示词翻译成中文),以及收集的一批数十万的caption数据。

由于整个数据集大量缺少成语与古诗词数据,所以对成语与古诗词的理解可能存在偏差,对中国的名胜地标建筑数据的缺少以及大量的英译中数据,可能会导致出现一些对象的混乱。

妙笔Beta0.9在8张4090显卡上完成训练,目前也在拓展机器资源来训练SDXL来获得更优的结果,期待后续的更新。

妙笔官网无法访问的常见原因及解决方案

如果你经常打不开妙笔网站,最可能的原因有以下一些。别怕,还有办法帮助你顺利访问网站。

一、可能被软件屏蔽:部分应用,如微信、QQ 等自带的浏览应用可能就屏蔽了部分网址不让打开。

解决方案:采用自己手机的浏览器打开该网址,如Safari、Chrome等,而不是用微信或QQ的浏览器。

二、浏览器拦截:有时浏览器会错误地将网站判断成不安全、为不良网站而封锁。实际上,这并不一定意味着网站有问题,是因为浏览器厂商在其封锁列表之中的缘故。

解决方案:通过其它浏览器可能打开,例如:iphone用户Safari,windows用户(微软),Edge。推荐独立浏览器:Alook浏览器、X 浏览器、VIA 浏览器等

三、网络连接问题:如果你的网络速度比较慢,或所在运营商没有对该网站进行最佳化,也会出现无法打开的情况。

解决方案:切换到其他网络环境(wifi、移动数据等)用网络加速器让访问更顺畅科学上网(如访问 google 网站)

以上方法应该能解决99.99%网站打不开了。如果这些也无济于事,你可以留言咨询或微信联系我们进行寻求帮助!

关于妙笔特别声明

本站新媒派提供的妙笔内容都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由新媒派实际控制,在2024年3月23日 下午8:06收录时,该网页上的内容,都属于合规合法,后期网页的内容如有出现违规,可以直接联系网站管理员进行删除,新媒派不承担任何责任。

相关导航

53AI

53AI

53AI是一个开箱即用的企业大模型应用平台,致力于帮助企业快速部署和利用大型语言模型(LLMs),提供企业大模型落地应用、业务智能化改造、私有模型定制和大模型咨询服务。通过 53AI,企业可以轻松实现业务流程的智能化,提高运营效率和竞争力。它支持私有云部署,帮助企业实现大模型的知识库建设、模型训练和智能体开发,从而将AI技术应用于企业的各个业务流程和产品中。
沃研Turbo大模型

沃研Turbo大模型

沃研Turbo是由沃恩智慧公司专为大学生打造的科研大模型。它集成了多项科研辅助功能,包括期刊推荐、文献摘要、论文精读、翻译润色、创新点评估、个性化论文推荐和AI降重。通过多模态AIGC技术,沃研Turbo能够快速响应科研需求,提升科研效率。用户只需在网页上上传论文、文本或链接,即可享受便捷的科研辅助服务。沃研Turbo致力于简化科研过程,帮助大学生在学术道路上取得更大成就。
讯飞星辰MaaS平台

讯飞星辰MaaS平台

科大讯飞面向开发者打造的智能化模型精调服务平台,构建起贯穿 “数据 - 模型 - 服务” 全链路的工程化解决方案。平台提供数据增强处理、模型精调优化、效果量化评估及一键部署的的端到端开发能力;同时兼容主流开源模型生态,支持第三方模型托管。基于自研分布式训练架构与智能算力调度系统,结合 LoRA 等高效参数优化技术,平台实现大模型定制化开发的标准化、工程化,有效降低企业大模型相关业务开发成本与技术门槛,加速推动各行业智能化升级进程。

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...