
光语大模型简介
光语大模型是无限光年公司推出的一款结合大语言模型与符号推理的 AI 大模型,融合视觉与语言处理技术,拥有 10 亿视觉模型参数和 130 亿语言模型参数。该模型在金融、医疗等垂直领域表现出色,通过灰盒可信技术确保输出的稳定性和可靠性,有效解决幻觉问题,提升推理精度和可信度。光语大模型特别优化了金融服务和医疗诊断场景,提供精准搜索、高效信息总结和智能交互体验,已服务于多家一流金融机构和医院,为企业降低服务成本,实现 AI 技术的生产力转化。

光语大模型:结合大语言模型与符号推理的AI大模型
核心特点:
- 灰盒可信技术:通过灰盒可信技术,确保模型输出的稳定性和可靠性,特别适用于对准确性要求极高的领域如金融和医疗。
- 幻觉问题解决:通过神经符号计算等创新技术,有效减少模型生成内容的不真实性,增强用户对模型输出的信任。
- 垂直领域赋能:特别针对金融服务、医疗诊断等专业场景进行优化,提升推理精度,降低服务成本,实现 AI 技术的生产力转化。
- 参数规模与性能:尽管具体参数规模未详细说明,但光语大模型在特定领域的表现可能超越某些超大规模模型,如 GPT-4 Turbo。
应用场景:
- 光语金帆:金融大模型,具备财报解析、表格分析、资讯解读等能力,赋能投资研究和知识库搜索,已服务多家一流金融机构。
- 光语慧医:医疗大模型,与复旦大学附属中山医院合作开发,能够模拟医生进行体检报告解读、疾病诊断等,已在多家一流医院落地使用。
- 光语慧言:基于光语大模型的 AI Chatbot 工具,为个人和企业提供流畅的自然语言交互体验。
优势:
- 提升推理精度:在金融和医疗垂直领域的评测中,光语大模型的表现超越了许多超大规模模型,有效提升推理精度。
- 降低服务成本:通过提高模型的可信度和准确性,有助于降低企业在 AI 应用中的服务成本。
公司背景:
无限光年 是一家大模型技术和应用的创新公司,致力于研发垂直领域的可信大模型,打造深入行业需求的 AI 原生产品与解决方案。公司团队由来自知名科技公司的技术及行业专家组成,成员均毕业于 MIT、Cornell、Berkeley、UCSD、UMICH、UCL、NUS、清华、北大、复旦、交大、浙大等国内外知名高校,硕博占比超过 70%。
数据评估
关于光语大模型特别声明
本站新媒派提供的该工具内容都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由新媒派实际控制,在2024年12月3日 下午2:06收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,新媒派不承担任何责任。
与光语大模型相关工具

FramePackLoop 是基于 lllyasviel/FramePack 扩展开发的 AI 循环视频生成工具,通过在主视频首尾之间生成“连接视频”,实现平滑无缝的循环播放,适合制作直播背景、UI 动画、动态贴纸等素材。
Face Adapter
Face Adapter 是一种专门为预训练的扩散模型设计的适配器,主要用于面部重演和面部交换任务。它能够实现高精度和高保真度的面部编辑,提供精细的个体识别和属性控制功能。

讯飞星辰MaaS平台
科大讯飞面向开发者打造的智能化模型精调服务平台,构建起贯穿 “数据 - 模型 - 服务” 全链路的工程化解决方案。平台提供数据增强处理、模型精调优化、效果量化评估及一键部署的的端到端开发能力;同时兼容主流开源模型生态,支持第三方模型托管。基于自研分布式训练架构与智能算力调度系统,结合 LoRA 等高效参数优化技术,平台实现大模型定制化开发的标准化、工程化,有效降低企业大模型相关业务开发成本与技术门槛,加速推动各行业智能化升级进程。
HoloDreamer
HoloDreamer是一款文本驱动的3D场景生成框架,通过用户的文本描述生成沉浸式且视角一致的完整3D场景。它由风格化全景生成和增强型全景重建两个核心模块组成,该框架首先生成高清晰度的全景图作为完整3D场景的整体初始化,然后利用3D高斯散射(3D-GS)技术快速重建3D场景,从而实现视角一致和完全封闭的3D场景生成。HoloDreamer在虚拟现实、游戏和影视行业中有广泛应用,为这些领域提供了新的解决方案。

IndexTTS
IndexTTS是B站推出的工业级文本转语音系统,支持中英双语、零样本语音克隆与高保真音质。采用字符-拼音混合建模、BigVGAN2 解码器与情感音色分离技术,语音自然流畅,广泛应用于智能助手、有声读物、视频配音等场景。
FaceChain
FaceChain 是一款基于深度学习的工具,专注于生成个人数字形象。用户只需上传一张照片,FaceChain 即可在 10 秒内生成多种风格的个人写真。该工具支持自定义风格模型训练,兼容 ControlNet 和 LoRA 模型,广泛应用于虚拟现实、游戏设计和数字营销等领域。通过 FaceChain,用户可以轻松创建高度真实且可控的个人画像。

腾讯混元3D
腾讯混元3D,全称为 Hunyuan3D-1.0,是腾讯推出的首个同时支持文生和图生的3D开源模型,专门解决现有3D生成模型在生成速度和泛化能力方面的不足。该模型采用了基于Diffusion 技术的架构,能够同时支持文本生成和图像生成3D资产。

GPT智库
GPT智库是一款强大的人工智能大模型综合应用,提供互联网境外访问绿色通道、汇聚了全球顶尖的人工智能大模型和学术资源。它具备智能对话、文生图、图生图、音频翻译、图像分析和全球学术资料搜索等多种功能,为科研院所、新闻媒体、高校和政府部门提供安全、合规、可控的全球一流人工智能服务。

CogVideo
CogVideo是目前最大的通用领域文本到视频生成预训练模型,含94亿参数。CogVideo将预训练文本到图像生成模型(CogView2)有效地利用到文本到视频生成模型,并使用了多帧率分层训练策略。
Magic Clothing
Magic Clothing是一个专注于控制性的服装驱动图像合成的项目,它是OOTDiffusion模型的一个分支版本,旨在通过服装来控制图像的生成。

FlashVideo
FlashVideo是一个由字节跳动和香港大学联合开发的高效高分辨率视频生成框架,特别适用于文本到视频的生成。通过创新的两阶段框架设计和流匹配技术,FlashVideo 能在短时间内生成 1080p 高清视频,优化视频流畅性,并减少计算成本。

S2V.AI
S2V.Ai是由MiniMax公司推出的一项创新AI视频生成技术,通过S2V-01模型,用户只需上传一张图片,就能将图片中的主体转化为视频中的角色,并实现高度一致性和自然过渡。这项技术为用户提供了快速、低成本、高质量的视频生成解决方案。

InspireMusic
InspireMusic 是由阿里巴巴通义实验室推出的开源音乐生成框架,集成了多项音频领域的前沿研究成果,为开发者和研究者提供全面的音乐创作、风格转换和音效合成解决方案。该框架依托多模态大模型技术,支持通过文本描述或音频输入进行智能化创作,并提供完善的模型调优工具链。

Gemini 2.5 Flash Image
Gemini 2.5 Flash Image是Google最新一代AI图像生成与编辑模型,支持多图融合、角色一致性、自然语言精准编辑、视觉模板适配及基于世界知识的创作。延续低延迟与高性价比优势,生成画质更清晰细腻,适用于电商、品牌营销、教育、游戏等多场景,并为所有生成图片嵌入 SynthID 数字水印,确保合规可追溯。

天壤小白大模型
天壤小白是基于语言大模型的AI应用开放平台,无需代码开发,即可快速、灵活地搭建个性化的AI应用。通过提示词工程、语义搜索、向量数据库等各类AI工具组件,破解幻觉难题,为开发者和企业提供一站式的大模型应用服务。覆盖知识管理、市场销售、客户服务、内容生成、辅助决策、多语言翻译等多个场景。
AnimateZero
AnimateZero是腾讯AI团队发布的一款AI视频生成模型,通过改进预训练的视频扩散模型(Video Diffusion Models),能够更精确地控制视频的外观和运动,实现从静态图像到动态视频的无缝转换。
暂无评论...









