
神力霓裳简介
6月29日,在杭州召开的D20全球设计院长峰会上,阿里大文娱发布自研影视妆造大模型——神力霓裳,这也是首个针对影视剧服饰造型设计而打造的AI大模型。这个模型可以根据要求快速生成影视级的各朝代服饰造型,辅助造型师进行创意设计。它主要服务于古装剧,包含造型设计、妆发设计和纹样设计三大功能。
例如,造型师可以设定朝代、性别、身份等条件,输入相关提示词,2分钟内就能获得造型图片。目前,神力霓裳已经应用到《掌心》等多部古装和民国剧中。
阿里大文娱相关负责人表示,目前大模型最擅长的是唐代造型,可以生成官服、仕女服、舞女服、异族服等多种造型。

神力霓裳发布现场
神力霓裳大幅节省了造型师在概念设计阶段的时间。《掌心》造型指导高秋婉介绍,一部30集以上的古装剧,通常需要200套以上的妆造图,算上设计产生的中间版本,总量将接近1000套。如果由画师手绘,每套妆造图要耗费数小时。

唐仕女妆造图
神力霓裳的主要功能特点
- 快速生成能力:神力霓裳能够根据设定的条件(如朝代、性别、身份等)和相关的提示词,迅速生成影视级别的服饰造型。这种快速生成能力极大地提高了设计效率,使得造型师能够在短时间内获得多种造型方案,从而进行选择和优化。
- 多样化设计:该模型能够生成多种类型的服饰造型,包括但不限于不同朝代的官服、仕女服、舞女服以及异族服饰等。这种多样化的设计能力满足了影视剧中对服饰造型的多样化需求,有助于丰富剧情和角色形象。
- 辅助创意设计:神力霓裳不仅仅是一个生成工具,它还能在创意设计过程中为造型师提供灵感和多样化的方案。造型师可以利用这些方案进行进一步的修改和完善,从而创造出更加符合剧情和角色需求的服饰造型。
- 高效性:相比传统的手工设计方式,神力霓裳的自动化生成过程大大提高了设计效率。造型师可以在短时间内获得大量的造型方案,并通过筛选和优化找到最佳方案。这种高效性使得造型师能够更专注于创意和设计本身,而不是繁琐的绘制过程。
- 可定制性:虽然神力霓裳提供了多种预设的服饰造型模板,但它也支持用户根据具体需求进行定制。用户可以通过调整参数、添加细节等方式来定制符合自己需求的服饰造型。这种可定制性使得神力霓裳更加灵活和实用。
- 融合传统与现代技术:神力霓裳将传统服饰文化与现代AI技术相结合,通过大数据分析和机器学习算法来生成服饰造型。这种融合不仅保留了传统服饰文化的精髓,还赋予了它们新的生命力和表现形式。
应用场景
- 古装剧:神力霓裳已经在多部古装剧中投入使用,如《掌心》等。它可以快速生成符合历史背景的服饰、妆容和发型设计,极大地提高了设计效率和质量。
- 民国剧:除了古装剧,神力霓裳也适用于民国时期的影视作品,帮助设计师创造出符合时代特征的造型。
- 历史题材影视作品:无论是古代还是近现代的历史题材,神力霓裳都能提供精准的服饰和妆造设计,确保角色造型的历史准确性和美观度。
- 奇幻类影视作品:在奇幻类影视作品中,神力霓裳可以结合历史元素和创意设计,生成独特的角色造型,增加作品的视觉吸引力。
- 文化展示和教育:神力霓裳还可以用于文化展示和教育项目,通过生成各个历史时期的服饰和妆容,帮助观众更好地理解和欣赏中华传统文化。
数据评估
关于神力霓裳特别声明
本站新媒派提供的该工具内容都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由新媒派实际控制,在2024年7月4日 下午3:19收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,新媒派不承担任何责任。
与神力霓裳相关工具

Aiuni AI 是一款基于 Unique3D 开源技术的在线 AI 图片转 3D 模型生成建模工具,它能够在 30 秒内将单张图片转换为高质量的 3D 模型。用户通过简单的图片上传和点击生成,用户即可获得 360 度无死角的 3D 模型,确保每个角度都具有一致性和高质量的细节。

MiracleVision奇想智能
MiracleVision奇想智能是由美图秀秀公司推出的自研AI视觉大模型。它具备高度的美学导向和图像处理能力,并能广泛应用于多个行业,以提高工作流效率。该模型不仅提供了简单易用的AI视觉创作工具,使用户能够快速进行图像的创作和编辑,还支持多种图像类型和视频效果的生成。

Evidently Al
Evidently Al 是一个开源的机器学习模型监测和测试平台,它可以帮助您分析和改进您的模型性能。它可以让您轻松地创建交互式的可视化报告,展示您的模型在验证和预测期间的表现,以及数据漂移的情况。

Llama 2
Llama 2是Meta AI推出的新一代大型语言模型(LLM),参数规模从70亿到700亿不等。它是为对话场景而优化的,称为Llama 2-Chat,能够在多数基准上超越开源的对话模型,并且在人类评估的有用性和安全性上,可能是闭源模型的合适替代品。

浦语·灵笔2.5
浦语·灵笔2.5 是一款开源图文多模态大模型,支持图文创作、网页生成、视频理解与语音交互,具备超长上下文、多轮多图对话与高分辨率图像处理能力,广泛应用于内容创作、教育、智能助手等场景。

FunAudioLLM
FunAudioLLM 是由阿里巴巴通义团队开发的旨在增强人类与大型语言模型(LLMs)之间的自然语音交互的框架。其核心包括两个创新模型:SenseVoice 和 CosyVoice。SenseVoice 提供高精度的多语言语音识别、情绪识别和音频事件检测,支持超过 50 种语言,并具有极低的延迟。CosyVoice 则专注于自然语音生成,支持多语言、音色和情绪控制,能够进行零样本语音生成、跨语言语音克隆和指令遵循。

VISION XL
VISION XL是一款专注于解决视频逆问题的超高清视频修复工具。利用潜在图像扩散模型,VISION XL 高效处理视频去模糊、超分辨率和修复等任务,显著提升视频清晰度。支持多种降质形式和高分辨率重建,保证时间一致性。适用于视频修复、去模糊和超分辨率增强,让用户轻松实现高清视频的清晰化处理。

UniVG
UniVG是百度推出的一种统一模态视频生成系统。它能够处理多种输入模态,如文本和图像,并生成与输入语义高度一致的视频。UniVG采用了多条件交叉注意力技术和偏置高斯噪声方法,以提高生成视频的质量和保留原始内容。

Sora
Sora是一个能以文本描述生成视频的人工智能模型,由美国人工智能研究机构OpenAI开发。它能够根据用户的文本描述生成长达 60 秒、1080P 高质量视频,其中包含精细复杂的场景、生动的角色表情以及复杂的镜头运动。并在单个生成视频中创建多个镜头,准确保留角色和视觉风格。

星火大模型
讯飞星火大模型是由科大讯飞推出的新一代认知智能大模型,可基于自然文本、语音的方式提供多场景文本生成、语言理解、知识问答、逻辑推理、数学解答、代码生成和多模态7大能力。

Gen-3 Alpha
Gen-3 Alpha是Runway公司开发的一款先进的AI视频生成模型。它能够根据用户的输入(如文本描述、图像或视频片段)创建具有复杂场景变化、多种电影风格和详细艺术指导的高精细视频。

EduChat
EduChat是一个教育领域的对话大模型,提供开放问答、作文批改、启发式教学和情感支持等教育特色功能,助力实现因材施教、公平公正、富有温度的智能教育。

心辰Lingo语音大模型
心辰Lingo语音大模型是由西湖心辰(杭州)科技有限公司开发的端到端语音大模型。该模型具备原生语音理解、多种语音风格表达、语音模态超级压缩、实时打断和控制、深度情感理解等功能,能够以超拟人化的方式进行互动。这个模型不仅能快速响应复杂指令,还能深度理解用户的情感和意图。

PixelDance
PixelDance是由字节跳动开发的一款高动态视频生成模型,它能够根据用户提供的图片和文本描述来生成具有复杂场景和动态效果的视频。这项技术特别在于它结合了图像指令(针对视频片段的首尾帧)和文本指令,使得生成的视频不仅视觉上丰富,而且动作细节丰富,能够展现出高度的动态性。

JoyGen
JoyGen是一个音频驱动的3D深度感知说话人脸视频生成框架。它通过音频驱动生成嘴唇运动和视觉外观合成,旨在实现精确的嘴唇-音频同步和高视觉质量。

Mistral AI
Mistral AI 是一家来自法国的人工智能服务商,专注于大型语言模型和生成式人工智能的构建、培训和应用。Mistral AI 的目标是与 OpenAI 和 谷歌 竞争,为企业开发生成式人工智能基础设施。
暂无评论...