
Cherry Studio简介
Cherry Studio 是一个支持多模型服务的AI桌面客户端,支持 Windows、macOS 和 Linux,未来还将支持移动端。用户可以通过Cherry Studio无缝集成多种大型语言模型 (LLM),包括 OpenAI、Anthropic 和 Gemini 等,甚至本地部署的模型,确保数据隐私和安全。此外,Cherry Studio 还支持个性化知识库,可以导入多种格式的文件和网页内容,帮助用户高效管理和利用信息资源。无需复杂配置,用户只需填写秘钥即可开始使用,让更多人能够享受到 AI 带来的便利。

Cherry Studio – 支持多模型服务的AI桌面客户端
Cherry Studio的主要功能特点
- 多模型支持:支持多种大型语言模型 (LLM) 提供商,如 OpenAI、Anthropic、Gemini 等,以及本地部署的模型。
- 本地数据存储:确保用户数据的隐私和安全,所有数据都储存在本地,不会上传到第三方服务器。
- 个性化知识库:支持多种格式文件的导入和网页导入,帮助用户创建和管理个性化的知识库。
- 多任务处理:支持多模型同时对话,处理文本、图像、办公文件、PDF 等多种数据类型。
- 流程图可视化:提供流程图可视化功能,帮助用户更好地理解和管理任务。
- 代码语法高亮:内置代码语法高亮功能,方便开发者使用。
- 全局搜索功能:提供全局搜索功能,帮助用户快速找到所需信息。
- 主题管理系统:支持主题管理,帮助用户更好地组织和管理内容。
- AI驱动的翻译:提供 AI 驱动的翻译功能,支持多语言翻译。
- 跨平台支持:支持 Windows、macOS 和 Linux 平台,未来还将支持移动端。
使用Cherry Studio的基本步骤
- 下载安装:访问 Cherry Studio 的官网,下载适配自己操作系统的版本进行安装。
- 配置模型服务:在 Cherry Studio 中添加所需的模型,例如 DeepSeek R。需要申请 API 密钥并将其添加到 Cherry Studio 中。
- 搭建本地知识库:点击左侧的知识库按钮,添加本地文件或目录,系统会自动进行向量化处理。
- 使用知识库:在聊天窗口选择知识库,可以在聊天区域询问有关知识库的问题。
数据评估
关于Cherry Studio特别声明
本站新媒派提供的该工具内容都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由新媒派实际控制,在2025年2月10日 上午9:49收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,新媒派不承担任何责任。
与Cherry Studio相关工具

讯飞开放平台是一个领先的人工智能技术与生态服务平台,致力于为开发者与企业提供全面的智能交互能力。提供语音、图像、自然语言识别等核心交互技术,还拥有丰富的行业解决方案与SaaS产品,助力您轻松构建各类智能应用。

GPT-4o mini
GPT-4o Mini 是 OpenAI 最新推出的小型智能模型,专为高性能和低成本的人工智能解决方案而设计。它支持文本、视觉、音频等多模态输入输出,响应速度极快,适用于实时应用场景。

Loopy AI
Loopy是一个端到端音频驱动的视频生成模型,专注于生成逼真的头像动画。利用先进的 AI 技术和时间模块设计,Loopy 能够从音频中提取自然的运动模式,并生成高质量的动画效果。支持多种视觉和音频风格,适用于虚拟主播、动画制作等应用场景。

讯飞星火大模型
讯飞星火大模型是科大讯飞发布的一个基于深度学习的自然语言处理模型,以中文为核心,具备跨领域多任务上的类人理解和生成能力。注册免费领取1500万Tokens,该模型对标ChatGPT,并在多个领域表现出色。

腾讯混元大模型
腾讯混元大模型是由腾讯研发的大语言模型,具备跨领域知识和自然语言理解能力,实现基于人机自然语言对话的方式,理解用户指令并执行任务,帮助用户实现人获取信息,知识和灵感。

LongCat AI
LongCat AI是美团基于自研大模型 LongCat-Flash-Chat打造的一个支持深度思考与联网搜索的中文AI对话平台,旨在为用户提供更精准、更实时、更有逻辑链条的智能回答。它不仅能像传统大语言模型一样进行自然语言交流,还能实时抓取互联网最新信息,并在回答前进行多步推理,适合处理复杂问题与需要最新数据的场景。

Magi
Magi 的模型是一个可以自动将漫画页转录成文字并生成剧本。该模型通过识别漫画页面上的面板、文字块和角色,实现了全自动的剧本生成功能。

Gemini 2.5 Flash Image
Gemini 2.5 Flash Image是Google最新一代AI图像生成与编辑模型,支持多图融合、角色一致性、自然语言精准编辑、视觉模板适配及基于世界知识的创作。延续低延迟与高性价比优势,生成画质更清晰细腻,适用于电商、品牌营销、教育、游戏等多场景,并为所有生成图片嵌入 SynthID 数字水印,确保合规可追溯。

Waver 1.0
Waver 1.0是 FoundationVision 推出的下一代通用视频生成基础模型,基于 Rectified Flow Transformer 架构,统一支持文本生成视频(T2V)、图像生成视频(I2V)与文本生成图像(T2I)。最高可生成 1080p 高分辨率视频,分辨率、宽高比与时长(2–10 秒)灵活可调;在 T2V 与 I2V 榜单均跻身前三,画质、运动幅度与时间一致性媲美商用方案。支持可控风格与质量、APG 伪影优化及 Cascade Refiner 高效升采样,适用于影视创意、游戏动画、教育科研等多场景。

SDXL-Lightning
SDXL-Lightning是一款由字节跳动开发的开源免费的文生图开放模型,能根据文本快速生成相应的高分辨率图像。该模型能够在极短的时间内生成高质量和高分辨率的图像,是目前最快的文生图模型之一。

DDColor
DDColor是阿里达摩院研究的一种基于深度学习的图像上色模型,它可以自动将黑白或灰度图像着色,使图像更加生动逼真。

Mini-Gemini
Mini-Gemini是一个简单而有效的框架,用于增强多模态视觉语言模型(VLMs),由中国香港中文大学和 SmartMore 的研究人员共同推出。Mini-Gemini支持一系列密集和MoE大型语言模型(LLMs),从2B到34B。为了增强视觉token,该框架建议在不增加视觉token数量的情况下,利用额外的视觉编码器进行高分辨率细化。同时,Mini-Gemini还构建了一个高质量的数据集,以促进精确的图像理解和基于推理的生成,从而扩大当前VLM的操作范围。

InspireMusic
InspireMusic 是由阿里巴巴通义实验室推出的开源音乐生成框架,集成了多项音频领域的前沿研究成果,为开发者和研究者提供全面的音乐创作、风格转换和音效合成解决方案。该框架依托多模态大模型技术,支持通过文本描述或音频输入进行智能化创作,并提供完善的模型调优工具链。

Tora
Tora 是阿里团队推出的一个视频生成模型,能够根据轨迹、图像、文本或其组合,快速生成精确运动控制的视频。它支持多种输入方式,如轨迹、文本和图像,并能生成高分辨率、运动可控的视频。

Hibiki
Hibiki是一个Kyutai Labs开发的一个用于流式语音翻译(也称为同步翻译)的模型。与离线翻译不同,离线翻译需要等待源语句结束后才开始翻译,而 Hibiki 能够实时积累足够的上下文,以逐块生成正确的翻译。用户在讲话时,Hibiki 会在目标语言中生成自然的语音,并提供文本翻译。

gpt-realtime
gpt‑realtime是OpenAI 推出的 生产级语音到语音 AI 模型,具备低延迟、高保真语音、多语言切换、复杂指令遵循与函数调用能力。结合 Realtime API,可直接处理音频、文本、图片输入,并支持远程 MCP 工具接入与 SIP 电话呼叫,适用于 AI 电话客服、智能语音助理、教育培训、销售咨询等场景。相比传统管道,gpt‑realtime 以单一模型实现端到端语音交互,响应更自然流畅。
暂无评论...