WeKnora

10个月前发布 8.7K 00

工具介绍:WeKnora(维娜拉)是腾讯开源的 基于大语言模型(LLM)的文档理解与语义检索框架,采用 RAG(检索增强生成)机制,将精准召回的文档片段与大模型推理结合,输出高质量、上下文感知的回答。

收录时间:
2025-08-19

WeKnora简介

WeKnora是什么?

WeKnora(维娜拉)是腾讯开源的基于大语言模型(LLM)的文档理解与语义检索框架,专为结构复杂、内容异构的文档场景设计。它采用RAG(Retrieval-Augmented Generation,检索增强生成) 技术,将精准检索到的上下文片段与大模型推理结合,输出可控、高质量的上下文感知回答。

WeKnora

核心亮点

  • 多格式文档支持:可解析 PDF、Word、TXT、Markdown、图片(含 OCR/Caption)等多种格式
  • 多模态解析:支持图文混排、结构化提取与知识图谱构建
  • 混合检索机制:关键词(BM25)+ 向量检索 + 知识图谱增强,可自由组合
  • 多模型集成:支持 Qwen、DeepSeek 等本地或 API 模型,推理模式可切换
  • 灵活扩展:解析、嵌入、召回、生成全流程解耦,方便二次开发
  • 私有化部署:支持本地/Docker/微信对话开放平台部署,数据安全可控
  • 可视化管理:Web UI 界面可管理知识库、配置模型、查看检索链路与评估指标

技术架构亮点

  • 模块化设计:解析 → 嵌入 → 检索 → 生成,全流程解耦
  • 向量数据库支持:兼容 PostgreSQL(pgvector)、Elasticsearch
  • 多模型集成:支持本地模型与 API 接入,推理模式可配置
  • Web UI + API:提供交互界面与标准接口,适配开发者与业务用户 

适用场景 

场景应用示例价值
企业知识管理内部文档问答、规章制度检索提升知识获取效率、降低培训成本
科研文献分析论文检索、学术资料整理加速调研、辅助决策
技术支持产品手册问答、故障排查减少客服压力、提高响应速度
法律合规合同条款与法规检索提高审查效率、降低风险
医疗知识辅助医学文献与诊疗指南问答辅助临床决策、提升服务质量

项目目录结构

WeKnora/
├── cmd/ # 应用入口
├── internal/ # 核心业务逻辑
├── config/ # 配置文件
├── migrations/ # 数据库迁移脚本
├── scripts/ # 启动与工具脚本
├── services/ # 各子服务实现
├── frontend/ # 前端项目
└── docs/ # 项目文档

WeKnora官网及使用教程

官网网址:https://weknora.weixin.qq.com
开源地址:https://github.com/Tencent/WeKnora

一、环境准备

确保本地已安装以下工具:Docker、Docker Compose、Git

二、安装步骤

1. 克隆代码仓库

# 克隆主仓库
git clone https://github.com/Tencent/WeKnora.git
cd WeKnora

2.配置环境变量

# 复制示例配置文件
cp .env.example .env

# 编辑 .env,填入对应配置信息
# 所有变量说明详见 .env.example 注释

3.启动服务

# 启动全部服务(含 Ollama 与后端容器)
./scripts/start_all.sh
# 或
make start-all

4.停止服务

./scripts/start_all.sh –stop
# 或
make stop-all

 三、服务访问地址

启动成功后,可访问以下地址:

  • Web UI:http://localhost
  • 后端 API:http://localhost:8080
  • 链路追踪(Jaeger):http://localhost:16686

常见问题解答(FAQ)

Q1:它的检索机制是怎样的?
A1:内置 BM25 关键词检索、稠密向量检索(Dense Retrieve)、知识图谱增强(GraphRAG) 等多种召回策略,可自由组合,以提升准确度与召回率。

Q2:我能在本地部署 WeKnora 吗?
A2:可以。支持 本地部署 / Docker 镜像 / 微信对话开放平台集成,满足私有化和离线部署需求,数据可控。

Q3:如何优化检索效果?
A3:

  • 上传清晰、结构化的文档(分段合理)
  • 合理选择召回策略(BM25 / 向量 / 图谱增强)
  • 使用适配场景的嵌入模型(BGE、GTE 等)
  • 调整召回条数与重排策略

Q4:支持哪些大语言模型?
A4:默认支持 Qwen、DeepSeek 等,也可接入本地 LLM 或第三方 API,推理模式可配置(思考/非思考)。

WeKnora官网无法访问的常见原因及解决方案

如果你经常打不开WeKnora网站,最可能的原因有以下一些。别怕,还有办法帮助你顺利访问网站。

一、可能被软件屏蔽:部分应用,如微信、QQ 等自带的浏览应用可能就屏蔽了部分网址不让打开。

解决方案:采用自己手机的浏览器打开该网址,如Safari、Chrome等,而不是用微信或QQ的浏览器。

二、浏览器拦截:有时浏览器会错误地将网站判断成不安全、为不良网站而封锁。实际上,这并不一定意味着网站有问题,是因为浏览器厂商在其封锁列表之中的缘故。

解决方案:通过其它浏览器可能打开,例如:iphone用户Safari,windows用户(微软),Edge。推荐独立浏览器:Alook浏览器、X 浏览器、VIA 浏览器等

三、网络连接问题:如果你的网络速度比较慢,或所在运营商没有对该网站进行最佳化,也会出现无法打开的情况。

解决方案:切换到其他网络环境(wifi、移动数据等)用网络加速器让访问更顺畅科学上网(如访问 google 网站)

以上方法应该能解决99.99%网站打不开了。如果这些也无济于事,你可以留言咨询或微信联系我们进行寻求帮助!

关于WeKnora特别声明

本站新媒派提供的WeKnora内容都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由新媒派实际控制,在2025年8月19日 上午10:33收录时,该网页上的内容,都属于合规合法,后期网页的内容如有出现违规,可以直接联系网站管理员进行删除,新媒派不承担任何责任。

相关导航

sese-engine

sese-engine

sese-engine是一款由 RimoChan 开源的轻量级自部署搜索引擎工具,支持在本地爬取互联网数据并建立索引,实现完全自主、可控的搜索体验。无需数据库,部署简单,适配 Windows、Linux 及树莓派,默认仅需1~2 核 CPU 和 1~2GB 内存即可运行。用户可自定义爬取规则、搜索算法与结果排序,保障隐私安全,避免商业搜索引擎的数据收集与排名干扰,适合对数据安全与个性化搜索有高要求的个人与团队。

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...