
神力霓裳简介
文章目录
6月29日,在杭州召开的D20全球设计院长峰会上,阿里大文娱发布自研影视妆造大模型——神力霓裳,这也是首个针对影视剧服饰造型设计而打造的AI大模型。这个模型可以根据要求快速生成影视级的各朝代服饰造型,辅助造型师进行创意设计。它主要服务于古装剧,包含造型设计、妆发设计和纹样设计三大功能。
例如,造型师可以设定朝代、性别、身份等条件,输入相关提示词,2分钟内就能获得造型图片。目前,神力霓裳已经应用到《掌心》等多部古装和民国剧中。
阿里大文娱相关负责人表示,目前大模型最擅长的是唐代造型,可以生成官服、仕女服、舞女服、异族服等多种造型。

神力霓裳发布现场
神力霓裳大幅节省了造型师在概念设计阶段的时间。《掌心》造型指导高秋婉介绍,一部30集以上的古装剧,通常需要200套以上的妆造图,算上设计产生的中间版本,总量将接近1000套。如果由画师手绘,每套妆造图要耗费数小时。

唐仕女妆造图
神力霓裳的主要功能特点
- 快速生成能力:神力霓裳能够根据设定的条件(如朝代、性别、身份等)和相关的提示词,迅速生成影视级别的服饰造型。这种快速生成能力极大地提高了设计效率,使得造型师能够在短时间内获得多种造型方案,从而进行选择和优化。
- 多样化设计:该模型能够生成多种类型的服饰造型,包括但不限于不同朝代的官服、仕女服、舞女服以及异族服饰等。这种多样化的设计能力满足了影视剧中对服饰造型的多样化需求,有助于丰富剧情和角色形象。
- 辅助创意设计:神力霓裳不仅仅是一个生成工具,它还能在创意设计过程中为造型师提供灵感和多样化的方案。造型师可以利用这些方案进行进一步的修改和完善,从而创造出更加符合剧情和角色需求的服饰造型。
- 高效性:相比传统的手工设计方式,神力霓裳的自动化生成过程大大提高了设计效率。造型师可以在短时间内获得大量的造型方案,并通过筛选和优化找到最佳方案。这种高效性使得造型师能够更专注于创意和设计本身,而不是繁琐的绘制过程。
- 可定制性:虽然神力霓裳提供了多种预设的服饰造型模板,但它也支持用户根据具体需求进行定制。用户可以通过调整参数、添加细节等方式来定制符合自己需求的服饰造型。这种可定制性使得神力霓裳更加灵活和实用。
- 融合传统与现代技术:神力霓裳将传统服饰文化与现代AI技术相结合,通过大数据分析和机器学习算法来生成服饰造型。这种融合不仅保留了传统服饰文化的精髓,还赋予了它们新的生命力和表现形式。
应用场景
- 古装剧:神力霓裳已经在多部古装剧中投入使用,如《掌心》等。它可以快速生成符合历史背景的服饰、妆容和发型设计,极大地提高了设计效率和质量。
- 民国剧:除了古装剧,神力霓裳也适用于民国时期的影视作品,帮助设计师创造出符合时代特征的造型。
- 历史题材影视作品:无论是古代还是近现代的历史题材,神力霓裳都能提供精准的服饰和妆造设计,确保角色造型的历史准确性和美观度。
- 奇幻类影视作品:在奇幻类影视作品中,神力霓裳可以结合历史元素和创意设计,生成独特的角色造型,增加作品的视觉吸引力。
- 文化展示和教育:神力霓裳还可以用于文化展示和教育项目,通过生成各个历史时期的服饰和妆容,帮助观众更好地理解和欣赏中华传统文化。
数据评估
关于神力霓裳特别声明
本站新媒派提供的该工具内容都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由新媒派实际控制,在2024年7月4日 下午3:19收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,新媒派不承担任何责任。
与神力霓裳相关工具

MagicVideo-V2是字节跳动公司团队开发的一款AI视频生成模型和框架。它通过集成文本到图像模型、视频运动生成器、参考图像嵌入模块和帧插值模块到一个端到端的视频生成流程中,可以生成高保真和美观的视频,并实现高分辨率视觉质量与流畅运动的一致性。

ReSyncer
ReSyncer 是由清华大学、百度和南洋理工大学 S-Lab 实验室联合开发的多功能 AI 框架,专注于视频合成技术。它能够生成与音频高度同步的逼真口型视频,支持个性化调整、视频驱动口型同步、说话风格迁移和人脸交换。ReSyncer 在创建虚拟主持人、电影配音和多语言内容制作等领域具有广泛应用前景。

Animate Anyone
DreaMoving是一种基于扩散模型打造的可控视频生成框架,通过图文就能制作高质量人类跳舞视频。用户只需上传一张人像,以及一段提示词,就能生成对应的视频,而且改变提示词,生成的人物的背景和身上的衣服也会跟着变化。简单来说就是,一张图、一句话就能让任何人或角色在任何场景里跳舞。

Qwen2
Qwen2是由阿里云通义千问团队开源的新一代大语言模型。这个系列包括了不同规模的解码器语言模型,从0.5B到72B不等,涵盖了中文和英文以及其他27种语言的高质量数据。Qwen2的设计旨在提高模型在自然语言理解、代码编写、数学解题和多语言处理方面的能力。

53AI
53AI是一个开箱即用的企业大模型应用平台,致力于帮助企业快速部署和利用大型语言模型(LLMs),提供企业大模型落地应用、业务智能化改造、私有模型定制和大模型咨询服务。通过 53AI,企业可以轻松实现业务流程的智能化,提高运营效率和竞争力。它支持私有云部署,帮助企业实现大模型的知识库建设、模型训练和智能体开发,从而将AI技术应用于企业的各个业务流程和产品中。

心辰Lingo语音大模型
心辰Lingo语音大模型是由西湖心辰(杭州)科技有限公司开发的端到端语音大模型。该模型具备原生语音理解、多种语音风格表达、语音模态超级压缩、实时打断和控制、深度情感理解等功能,能够以超拟人化的方式进行互动。这个模型不仅能快速响应复杂指令,还能深度理解用户的情感和意图。

Yi大模型
Yi大模型是由李开复博士领导的AI公司“零一万物”发布的一款开源的中英双语预训练大模型。这个模型在多个性能指标上取得了国际最佳性能认可,被称为“全球最强开源模型”。Yi-34B模型特别之处在于它拥有全球最长的200K上下文窗口,能够处理40万汉字的超长文本输入,这在语言模型中是非常重要的,因为它对于理解和生成与特定上下文相关的文本至关重要。

Darwin
Darwin是一个开源项目,专注于自然科学领域的大型语言模型构建,主要涵盖物理、化学和材料科学。通过对科学文献和数据集进行预训练和微调,Darwin 在科学问答和多任务学习任务中表现优异。它结合了结构化和非结构化的科学知识,提升了语言模型在科学研究中的效能。

PuLID
PuLID是由字节跳动的团队开源的一种个性化文本到图像生成技术,通过对比对齐和快速采样方法,能够在无需调整模型的情况下轻松生成个性化写真。该技术能够保持高身份(ID)保真度,同时最大限度地减少对原始图像风格和背景的干扰,支持用户通过文本提示轻松编辑图像,生成逼真且个性化的图像结果。

EduChat
EduChat是一个教育领域的对话大模型,提供开放问答、作文批改、启发式教学和情感支持等教育特色功能,助力实现因材施教、公平公正、富有温度的智能教育。

GPT-4o mini
GPT-4o Mini 是 OpenAI 最新推出的小型智能模型,专为高性能和低成本的人工智能解决方案而设计。它支持文本、视觉、音频等多模态输入输出,响应速度极快,适用于实时应用场景。

UniVG
UniVG是百度推出的一种统一模态视频生成系统。它能够处理多种输入模态,如文本和图像,并生成与输入语义高度一致的视频。UniVG采用了多条件交叉注意力技术和偏置高斯噪声方法,以提高生成视频的质量和保留原始内容。

BuboGPT
BuboGPT是字节跳动推出的一种先进的大型语言模型(LLM),它具有将文本、图像和音频等多模态输入进行整合的能力,并且具备将回复与视觉对象进行对接的独特功能,可以执行跨模态交互并做到对多模态的细粒度理解。这显示出BuboGPT在对齐或未对齐的任意图像音频数据理解方面有着出色的对话能力。

Gen-3 Alpha
Gen-3 Alpha是Runway公司开发的一款先进的AI视频生成模型。它能够根据用户的输入(如文本描述、图像或视频片段)创建具有复杂场景变化、多种电影风格和详细艺术指导的高精细视频。

PengChengStarling
PengChengStarling是由 PengCheng Labs 开发的多语言自动语音识别工具,支持中文、英语、俄语、越南语、日语、泰语、印度尼西亚语和阿拉伯语。相比 Whisper-Large v3,PengChengStarling 的模型仅占其 20% 大小,但推理速度提高了 7 倍,且流式语音识别效果卓越。

Auto-GPT
Auto-GPT 是一个使用 GPT-4 语言模型来自动执行多步骤项目的开源应用程序。它可以让 GPT-4 自主行动,根据自然语言的目标,自动地分解成子任务,并利用互联网和其他工具来实现它,而无需人工提示。
暂无评论...