
WeKnora简介
WeKnora是什么?
WeKnora(维娜拉)是腾讯开源的基于大语言模型(LLM)的文档理解与语义检索框架,专为结构复杂、内容异构的文档场景设计。它采用RAG(Retrieval-Augmented Generation,检索增强生成) 技术,将精准检索到的上下文片段与大模型推理结合,输出可控、高质量的上下文感知回答。

核心亮点
- 多格式文档支持:可解析 PDF、Word、TXT、Markdown、图片(含 OCR/Caption)等多种格式
- 多模态解析:支持图文混排、结构化提取与知识图谱构建
- 混合检索机制:关键词(BM25)+ 向量检索 + 知识图谱增强,可自由组合
- 多模型集成:支持 Qwen、DeepSeek 等本地或 API 模型,推理模式可切换
- 灵活扩展:解析、嵌入、召回、生成全流程解耦,方便二次开发
- 私有化部署:支持本地/Docker/微信对话开放平台部署,数据安全可控
- 可视化管理:Web UI 界面可管理知识库、配置模型、查看检索链路与评估指标
技术架构亮点
- 模块化设计:解析 → 嵌入 → 检索 → 生成,全流程解耦
- 向量数据库支持:兼容 PostgreSQL(pgvector)、Elasticsearch
- 多模型集成:支持本地模型与 API 接入,推理模式可配置
- Web UI + API:提供交互界面与标准接口,适配开发者与业务用户
适用场景
场景 | 应用示例 | 价值 |
---|---|---|
企业知识管理 | 内部文档问答、规章制度检索 | 提升知识获取效率、降低培训成本 |
科研文献分析 | 论文检索、学术资料整理 | 加速调研、辅助决策 |
技术支持 | 产品手册问答、故障排查 | 减少客服压力、提高响应速度 |
法律合规 | 合同条款与法规检索 | 提高审查效率、降低风险 |
医疗知识辅助 | 医学文献与诊疗指南问答 | 辅助临床决策、提升服务质量 |
项目目录结构
WeKnora/
├── cmd/ # 应用入口
├── internal/ # 核心业务逻辑
├── config/ # 配置文件
├── migrations/ # 数据库迁移脚本
├── scripts/ # 启动与工具脚本
├── services/ # 各子服务实现
├── frontend/ # 前端项目
└── docs/ # 项目文档
WeKnora官网及使用教程
官网网址:https://weknora.weixin.qq.com
开源地址:https://github.com/Tencent/WeKnora
一、环境准备
确保本地已安装以下工具:Docker、Docker Compose、Git
二、安装步骤
1. 克隆代码仓库
# 克隆主仓库
git clone https://github.com/Tencent/WeKnora.git
cd WeKnora
2.配置环境变量
# 复制示例配置文件
cp .env.example .env# 编辑 .env,填入对应配置信息
# 所有变量说明详见 .env.example 注释
3.启动服务
# 启动全部服务(含 Ollama 与后端容器)
./scripts/start_all.sh
# 或
make start-all
4.停止服务
./scripts/start_all.sh –stop
# 或
make stop-all
三、服务访问地址
启动成功后,可访问以下地址:
- Web UI:http://localhost
- 后端 API:http://localhost:8080
- 链路追踪(Jaeger):http://localhost:16686
常见问题解答(FAQ)
Q1:它的检索机制是怎样的?
A1:内置 BM25 关键词检索、稠密向量检索(Dense Retrieve)、知识图谱增强(GraphRAG) 等多种召回策略,可自由组合,以提升准确度与召回率。
Q2:我能在本地部署 WeKnora 吗?
A2:可以。支持 本地部署 / Docker 镜像 / 微信对话开放平台集成,满足私有化和离线部署需求,数据可控。
Q3:如何优化检索效果?
A3:
- 上传清晰、结构化的文档(分段合理)
- 合理选择召回策略(BM25 / 向量 / 图谱增强)
- 使用适配场景的嵌入模型(BGE、GTE 等)
- 调整召回条数与重排策略
Q4:支持哪些大语言模型?
A4:默认支持 Qwen、DeepSeek 等,也可接入本地 LLM 或第三方 API,推理模式可配置(思考/非思考)。
数据评估
本站新媒派提供的该工具内容都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由新媒派实际控制,在2025年8月19日 上午10:33收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,新媒派不承担任何责任。
与WeKnora相关工具


Twocast

腾讯混元大模型

DDColor

PixelDance

GPT-4o mini

Blinko

Prompt Optimizer

Eigent AI

星流图像大模型

Janus-Pro

Etna模型

IronRDP

MultiPost

Spark-TTS
