
神力霓裳简介
6月29日,在杭州召开的D20全球设计院长峰会上,阿里大文娱发布自研影视妆造大模型——神力霓裳,这也是首个针对影视剧服饰造型设计而打造的AI大模型。这个模型可以根据要求快速生成影视级的各朝代服饰造型,辅助造型师进行创意设计。它主要服务于古装剧,包含造型设计、妆发设计和纹样设计三大功能。
例如,造型师可以设定朝代、性别、身份等条件,输入相关提示词,2分钟内就能获得造型图片。目前,神力霓裳已经应用到《掌心》等多部古装和民国剧中。
阿里大文娱相关负责人表示,目前大模型最擅长的是唐代造型,可以生成官服、仕女服、舞女服、异族服等多种造型。

神力霓裳发布现场
神力霓裳大幅节省了造型师在概念设计阶段的时间。《掌心》造型指导高秋婉介绍,一部30集以上的古装剧,通常需要200套以上的妆造图,算上设计产生的中间版本,总量将接近1000套。如果由画师手绘,每套妆造图要耗费数小时。

唐仕女妆造图
神力霓裳的主要功能特点
- 快速生成能力:神力霓裳能够根据设定的条件(如朝代、性别、身份等)和相关的提示词,迅速生成影视级别的服饰造型。这种快速生成能力极大地提高了设计效率,使得造型师能够在短时间内获得多种造型方案,从而进行选择和优化。
- 多样化设计:该模型能够生成多种类型的服饰造型,包括但不限于不同朝代的官服、仕女服、舞女服以及异族服饰等。这种多样化的设计能力满足了影视剧中对服饰造型的多样化需求,有助于丰富剧情和角色形象。
- 辅助创意设计:神力霓裳不仅仅是一个生成工具,它还能在创意设计过程中为造型师提供灵感和多样化的方案。造型师可以利用这些方案进行进一步的修改和完善,从而创造出更加符合剧情和角色需求的服饰造型。
- 高效性:相比传统的手工设计方式,神力霓裳的自动化生成过程大大提高了设计效率。造型师可以在短时间内获得大量的造型方案,并通过筛选和优化找到最佳方案。这种高效性使得造型师能够更专注于创意和设计本身,而不是繁琐的绘制过程。
- 可定制性:虽然神力霓裳提供了多种预设的服饰造型模板,但它也支持用户根据具体需求进行定制。用户可以通过调整参数、添加细节等方式来定制符合自己需求的服饰造型。这种可定制性使得神力霓裳更加灵活和实用。
- 融合传统与现代技术:神力霓裳将传统服饰文化与现代AI技术相结合,通过大数据分析和机器学习算法来生成服饰造型。这种融合不仅保留了传统服饰文化的精髓,还赋予了它们新的生命力和表现形式。
应用场景
- 古装剧:神力霓裳已经在多部古装剧中投入使用,如《掌心》等。它可以快速生成符合历史背景的服饰、妆容和发型设计,极大地提高了设计效率和质量。
- 民国剧:除了古装剧,神力霓裳也适用于民国时期的影视作品,帮助设计师创造出符合时代特征的造型。
- 历史题材影视作品:无论是古代还是近现代的历史题材,神力霓裳都能提供精准的服饰和妆造设计,确保角色造型的历史准确性和美观度。
- 奇幻类影视作品:在奇幻类影视作品中,神力霓裳可以结合历史元素和创意设计,生成独特的角色造型,增加作品的视觉吸引力。
- 文化展示和教育:神力霓裳还可以用于文化展示和教育项目,通过生成各个历史时期的服饰和妆容,帮助观众更好地理解和欣赏中华传统文化。
数据评估
关于神力霓裳特别声明
本站新媒派提供的该工具内容都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由新媒派实际控制,在2024年7月4日 下午3:19收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,新媒派不承担任何责任。
与神力霓裳相关工具

SeamlessM4T是Meta推出的一款多语言和多任务模型,能够处理语音识别、文本翻译和语音合成等任务。它支持近100种语言,可以将语音转录为文本,再进行翻译,甚至可以将翻译后的文本转化为语音。

WiseDiag-Z1
WiseDiag-Z1是由杭州智诊科技推出的全科医学通用大语言模型,专为医疗领域设计,具有730亿参数和强大的医学知识库。它在知名的医学大模型主流榜单中名列前茅,适用于大多数复杂场景的健康咨询。

怪兽AI知识库大模型
企业知识库大模型 + 智能的AI问答机器人,零代码搭建企业知识库平台,团队多人协同与权限管理,智能回复。

星流图像大模型
星流图像大模型由 LiblibAI 发布的一款自研图像大模型,名为 Star-3 Alpha。该模型基于业界领先的 F.1 基础算法架构训练而成,辅以全球最大的 LORA 增强模型库及不断进化的 AI 图像控制能力。在图像精准度、色彩表现力、美学捕捉的细腻表达等方面实现了显著的飞跃,成为新的业界标杆。

阿里云百炼
阿里云百炼是基于通义大模型、行业大模型以及三方大模型的一站式大模型开发平台。面向企业客户和个人开发者,提供完整的模型服务工具和全链路应用开发套件,预置丰富的能力插件,提供API及SDK等便捷的集成方式,高效完成大模型应用构建。

天工
「天工」是国内首个对标 ChatGPT 的双千亿级大语言模型,也是一个对话式AI助手。「天工」通过自然语言与用户进行问答交互,AI 生成能力可满足文案创作、知识问答、逻辑推演、数理推算、代码编程等多元化需求。

Lumiere
Lumiere是谷歌发布的一个文本到视频扩散模型,于2024年正式发布。这个模型能够直接生成全帧率、低分辨率视频,通过训练海量文本和视频数据,可以将文字描述直接转化为高质量、真实、多样且连贯动作的视频。适用于多种内容创作和视频编辑应用,如图像到视频、视频修复和风格化生成。
Seed-TTS
Seed-TTS是由字节跳动开发的一系列大规模自回归文本到语音(TTS)模型。它能够生成高度自然、与人类语音几乎无法区分的语音。这个模型特别擅长学习语音上下文、说话人相似度和自然度等方面的特征,从而产生质量极高的语音输出。

Tora
Tora 是阿里团队推出的一个视频生成模型,能够根据轨迹、图像、文本或其组合,快速生成精确运动控制的视频。它支持多种输入方式,如轨迹、文本和图像,并能生成高分辨率、运动可控的视频。

千帆慧金
千帆慧金是百度智能云自主研发的金融行业垂直大模型,聚焦金融场景的智能化需求,以“专业、可靠、可扩展”为核心,为金融机构提供从基础能力到场景化应用的全链路智能化解决方案,助力行业从“数字化”向“智能化”深度升级。

M2UGen
M2UGen是一个由腾讯和新加坡国立大学共同研发的多模态音乐生成模型,它具备音乐生成、理解和编辑的能力。具体来说,M2UGen可以接收文字、图片、视频或音频作为输入,然后生成与之相匹配的音乐。

SDXL-Lightning
SDXL-Lightning是一款由字节跳动开发的开源免费的文生图开放模型,能根据文本快速生成相应的高分辨率图像。该模型能够在极短的时间内生成高质量和高分辨率的图像,是目前最快的文生图模型之一。

盘古大模型
盘古大模型 3.0 是一个面向行业的AI大模型系列,包含自然语言、视觉、多模态、预测、科学计算大模型等五个基础大模型,可以为用户提供知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力。

紫东太初
紫东太初大模型是中国科学院自动化研究所和武汉人工智能研究院推出的新一代大模型。它从三模态走向全模态,支持多轮问答、文本创作、图像生成、3D理解、信号分析等全面问答任务。这个大模型具备更强的认知、理解、创作能力,为用户带来全新的互动体验。

讯飞开放平台
讯飞开放平台是一个领先的人工智能技术与生态服务平台,致力于为开发者与企业提供全面的智能交互能力。提供语音、图像、自然语言识别等核心交互技术,还拥有丰富的行业解决方案与SaaS产品,助力您轻松构建各类智能应用。

Yi大模型
Yi大模型是由李开复博士领导的AI公司“零一万物”发布的一款开源的中英双语预训练大模型。这个模型在多个性能指标上取得了国际最佳性能认可,被称为“全球最强开源模型”。Yi-34B模型特别之处在于它拥有全球最长的200K上下文窗口,能够处理40万汉字的超长文本输入,这在语言模型中是非常重要的,因为它对于理解和生成与特定上下文相关的文本至关重要。
暂无评论...













