
神力霓裳简介
文章目录
6月29日,在杭州召开的D20全球设计院长峰会上,阿里大文娱发布自研影视妆造大模型——神力霓裳,这也是首个针对影视剧服饰造型设计而打造的AI大模型。这个模型可以根据要求快速生成影视级的各朝代服饰造型,辅助造型师进行创意设计。它主要服务于古装剧,包含造型设计、妆发设计和纹样设计三大功能。
例如,造型师可以设定朝代、性别、身份等条件,输入相关提示词,2分钟内就能获得造型图片。目前,神力霓裳已经应用到《掌心》等多部古装和民国剧中。
阿里大文娱相关负责人表示,目前大模型最擅长的是唐代造型,可以生成官服、仕女服、舞女服、异族服等多种造型。

神力霓裳发布现场
神力霓裳大幅节省了造型师在概念设计阶段的时间。《掌心》造型指导高秋婉介绍,一部30集以上的古装剧,通常需要200套以上的妆造图,算上设计产生的中间版本,总量将接近1000套。如果由画师手绘,每套妆造图要耗费数小时。

唐仕女妆造图
神力霓裳的主要功能特点
- 快速生成能力:神力霓裳能够根据设定的条件(如朝代、性别、身份等)和相关的提示词,迅速生成影视级别的服饰造型。这种快速生成能力极大地提高了设计效率,使得造型师能够在短时间内获得多种造型方案,从而进行选择和优化。
- 多样化设计:该模型能够生成多种类型的服饰造型,包括但不限于不同朝代的官服、仕女服、舞女服以及异族服饰等。这种多样化的设计能力满足了影视剧中对服饰造型的多样化需求,有助于丰富剧情和角色形象。
- 辅助创意设计:神力霓裳不仅仅是一个生成工具,它还能在创意设计过程中为造型师提供灵感和多样化的方案。造型师可以利用这些方案进行进一步的修改和完善,从而创造出更加符合剧情和角色需求的服饰造型。
- 高效性:相比传统的手工设计方式,神力霓裳的自动化生成过程大大提高了设计效率。造型师可以在短时间内获得大量的造型方案,并通过筛选和优化找到最佳方案。这种高效性使得造型师能够更专注于创意和设计本身,而不是繁琐的绘制过程。
- 可定制性:虽然神力霓裳提供了多种预设的服饰造型模板,但它也支持用户根据具体需求进行定制。用户可以通过调整参数、添加细节等方式来定制符合自己需求的服饰造型。这种可定制性使得神力霓裳更加灵活和实用。
- 融合传统与现代技术:神力霓裳将传统服饰文化与现代AI技术相结合,通过大数据分析和机器学习算法来生成服饰造型。这种融合不仅保留了传统服饰文化的精髓,还赋予了它们新的生命力和表现形式。
应用场景
- 古装剧:神力霓裳已经在多部古装剧中投入使用,如《掌心》等。它可以快速生成符合历史背景的服饰、妆容和发型设计,极大地提高了设计效率和质量。
- 民国剧:除了古装剧,神力霓裳也适用于民国时期的影视作品,帮助设计师创造出符合时代特征的造型。
- 历史题材影视作品:无论是古代还是近现代的历史题材,神力霓裳都能提供精准的服饰和妆造设计,确保角色造型的历史准确性和美观度。
- 奇幻类影视作品:在奇幻类影视作品中,神力霓裳可以结合历史元素和创意设计,生成独特的角色造型,增加作品的视觉吸引力。
- 文化展示和教育:神力霓裳还可以用于文化展示和教育项目,通过生成各个历史时期的服饰和妆容,帮助观众更好地理解和欣赏中华传统文化。
数据评估
关于神力霓裳特别声明
本站新媒派提供的该工具内容都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由新媒派实际控制,在2024年7月4日 下午3:19收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,新媒派不承担任何责任。
与神力霓裳相关工具

可灵大模型是快手AI团队自研的一款视频生成大模型,采用类似Sora的技术路线,能够生成符合物理规律的大幅度运动视频,模拟真实世界的特性。支持生成长达2分钟的30fps的超长视频,分辨率高达1080p,且支持多种宽高比。2024年6月,快手正式推出了可灵大模型,并在快影App开放邀测体验。

NineF AI
NineF AI 是一站式免费主流 AI 大模型集成平台,集成了 GPT、Claude、Llama 等全球顶尖 AI 模型,提供多角度智能解答,助您提升工作效率和决策准确性。界面简洁直观,支持图片和文档上传,满足各类创作和研究需求,是激发创新灵感的理想人工智能助手。

Cherry Studio
Cherry Studio 是一个支持多模型服务的AI桌面客户端,支持 Windows、macOS 和 Linux,未来还将支持移动端。用户可以通过Cherry Studio无缝集成多种大型语言模型 (LLM),包括 OpenAI、Anthropic 和 Gemini 等,甚至本地部署的模型,确保数据隐私和安全。

53AI
53AI是一个开箱即用的企业大模型应用平台,致力于帮助企业快速部署和利用大型语言模型(LLMs),提供企业大模型落地应用、业务智能化改造、私有模型定制和大模型咨询服务。通过 53AI,企业可以轻松实现业务流程的智能化,提高运营效率和竞争力。它支持私有云部署,帮助企业实现大模型的知识库建设、模型训练和智能体开发,从而将AI技术应用于企业的各个业务流程和产品中。

Etna模型
Etna大模型是七火山科技推出的一个文生视频的AIGC模型,它能够根据简短的文本描述生成相应的视频内容。七火山科技发布的Etna文生视频模型支持生成视频时长达到8~15秒,每秒可达60帧,分辨率最高可达4K(3840*2160),画面细腻逼真。

昇思MindSpore
昇思MindSpore是由华为自研的一种适用于端边云场景的全场景深度学习框架,MindSpore提供了友好的设计和高效的执行,旨在提升数据科学家和算法工程师的开发体验,并为Ascend AI处理器提供原生支持,以及软硬件协同优化。

Mini-Gemini
Mini-Gemini是一个简单而有效的框架,用于增强多模态视觉语言模型(VLMs),由中国香港中文大学和 SmartMore 的研究人员共同推出。Mini-Gemini支持一系列密集和MoE大型语言模型(LLMs),从2B到34B。为了增强视觉token,该框架建议在不增加视觉token数量的情况下,利用额外的视觉编码器进行高分辨率细化。同时,Mini-Gemini还构建了一个高质量的数据集,以促进精确的图像理解和基于推理的生成,从而扩大当前VLM的操作范围。

Phantom
Phantom是由字节跳动推出的一款创新视频生成框架,专注于主体一致性的视频生成任务(Subject-to-Video, S2V)。它通过跨模态对齐技术,将文本和图像提示结合起来,从参考图像中提取主体元素,并生成与文本描述一致的视频内容。

SEED-Story
SEED-Story是一个腾讯开源的基于大型语言模型(MLLM)的多模态长篇故事生成模型,它能够根据用户提供的图片和文本生成连贯的叙事文本和风格一致的图片。无论是小说创作、剧本编写还是视觉故事,SEED-Story都能提供高质量、多模态的内容,助力创意产业的发展。

MusiConGen
MusiConGen是一种基于Transformer的文本到音乐生成模型。它通过引入时间条件机制,显著提升了对音乐节奏和和弦的控制能力。该模型是在预训练的MusicGen-melody框架基础上进行微调的,主要用于生成各种风格的音乐片段。

天工
「天工」是国内首个对标 ChatGPT 的双千亿级大语言模型,也是一个对话式AI助手。「天工」通过自然语言与用户进行问答交互,AI 生成能力可满足文案创作、知识问答、逻辑推演、数理推算、代码编程等多元化需求。

Tora
Tora 是阿里团队推出的一个视频生成模型,能够根据轨迹、图像、文本或其组合,快速生成精确运动控制的视频。它支持多种输入方式,如轨迹、文本和图像,并能生成高分辨率、运动可控的视频。

InspireMusic
InspireMusic 是由阿里巴巴通义实验室推出的开源音乐生成框架,集成了多项音频领域的前沿研究成果,为开发者和研究者提供全面的音乐创作、风格转换和音效合成解决方案。该框架依托多模态大模型技术,支持通过文本描述或音频输入进行智能化创作,并提供完善的模型调优工具链。

RMBG-2.0
RMBG-2.0是由BRIA AI 开发的开源图像背景移除模型,通过先进的卷积神经网络(CNN)实现高精度的前景与背景分离。该模型在经过精心挑选的数据集(包括一般图像、电子商务、游戏和广告内容)上进行了训练,专为大规模企业内容创建的商业用例设计,其准确性、效率和多功能性可以媲美领先的 Source Available 型号。

紫东太初
紫东太初大模型是中国科学院自动化研究所和武汉人工智能研究院推出的新一代大模型。它从三模态走向全模态,支持多轮问答、文本创作、图像生成、3D理解、信号分析等全面问答任务。这个大模型具备更强的认知、理解、创作能力,为用户带来全新的互动体验。

Codex大模型
Codex大模型是一个基于GPT技术的强大编程语言模型,具备自动生成代码、文档、测试用例等功能。它能够理解和处理复杂的编程问题,提高开发效率,是编程领域的重要创新。
暂无评论...