# knowledge **Repository Path**: carllee34/knowledge ## Basic Information - **Project Name**: knowledge - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-06-02 - **Last Updated**: 2026-06-03 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 金融知识库智能化系统 ## 项目概述 本项目是一个基于前后端分离架构设计的金融知识库智能化系统,旨在为金融行业提供统一的知识管理、智能检索和合规保障平台。系统采用 **FastAPI + React** 技术栈,集成大语言模型(LLM)和向量数据库技术,提供高性能、现代化的知识服务。 ## 主要特性 - **智能检索**:支持自然语言语义搜索和多维度筛选 - **智能问答**:基于知识库的AI问答系统,支持对话历史 - **合规管理**:自动化合规检查和风险评估 - **知识发现**:智能内容推荐和关联分析 - **多格式支持**:支持PDF、Word、Excel等多种文档格式 - **前后端分离**:FastAPI 高性能后端 + React 现代前端 ## 技术架构 ``` ┌─────────────────────────────────────────────────────────────┐ │ 前端 (Frontend) │ │ React 18 + TypeScript + Vite + Tailwind CSS │ │ 端口: 8080 │ └────────────────────────┬────────────────────────────────────┘ │ HTTP / WebSocket ┌────────────────────────▼────────────────────────────────────┐ │ 后端 (Backend) │ │ FastAPI + Uvicorn (4 workers) │ │ 端口: 8000 │ │ 自动 API 文档: /docs │ └────────────────────────┬────────────────────────────────────┘ │ ┌────────────────────────▼────────────────────────────────────┐ │ 数据层 (Data Layer) │ │ 内存向量索引 + Pickle 持久化 (默认) │ │ PostgreSQL / MongoDB / Redis / Neo4j (预留) │ └─────────────────────────────────────────────────────────────┘ ``` ## 技术栈 ### 后端 - **Web框架**: FastAPI (ASGI, 原生 async) - **AI框架**: OpenAI 兼容接口 - **向量检索**: 内存 FAISS-like 索引 + NumPy - **文档处理**: PyPDF2, python-docx, openpyxl, python-pptx - **数据验证**: Pydantic v2 - **部署**: Uvicorn + Docker ### 前端 - **框架**: React 18 + TypeScript - **构建工具**: Vite - **路由**: React Router v6 - **样式**: Tailwind CSS - **图标**: Lucide React - **HTTP客户端**: Axios ## 快速开始 ### 环境要求 - Docker 20.10+ - Docker Compose 2.0+ - Node.js 18+ (前端开发) - Python 3.10+ (后端开发) ### Docker 部署(推荐) 1. **克隆项目** ```bash git clone cd knowledgeS ``` 2. **配置环境变量** ```bash cp .env.example .env # 编辑 .env 文件,配置 OPENAI_API_KEY 等必要变量 ``` 3. **启动所有服务** ```bash docker compose up -d ``` 4. **验证服务状态** ```bash docker compose ps ``` ### 服务访问地址 - **前端Web界面**: http://localhost:8080 - **后端API文档**: http://localhost:8000/docs - **API健康检查**: http://localhost:8000/api/v1/health ### 手动安装(开发环境) **后端** ```bash cd backend python -m venv venv source venv/bin/activate # Linux/Mac # 或 venv\Scripts\activate # Windows pip install -r requirements.txt uvicorn app.main:app --reload --port 8000 ``` **前端** ```bash cd frontend npm install npm run dev # 访问 http://localhost:5173 ``` ## 使用指南 ### Web 界面 1. **首页/仪表盘** (http://localhost:8080/) - 系统概览、快捷入口、文档快速上传 - 系统状态和文档统计 2. **文档管理** (http://localhost:8080/documents) - 上传文档(支持多格式) - 查看文档列表和处理状态 - 删除文档 3. **智能检索** (http://localhost:8080/search) - 输入自然语言查询 - 查看相关文档和相似内容 - 相似度评分展示 4. **智能问答** (http://localhost:8080/qa) - 输入问题获取AI回答 - 查看答案来源和置信度 - 对话历史管理 5. **合规检查** (http://localhost:8080/compliance) - 管理法规库 - 对文档内容进行合规性检查 - 查看风险评估报告 6. **智能推荐** (http://localhost:8080/recommendations) - 个性化知识推荐 - 热门内容展示 ### API 接口 所有接口前缀为 `/api/v1/`,完整文档见 `/docs`。 #### 健康检查 ```bash curl http://localhost:8000/api/v1/health ``` #### 文档上传 ```bash curl -X POST "http://localhost:8000/api/v1/documents/upload" \ -F "file=@document.pdf" ``` #### 智能搜索 ```bash curl -X POST "http://localhost:8000/api/v1/search" \ -H "Content-Type: application/json" \ -d '{"query": "金融风险管理", "top_k": 10}' ``` #### 智能问答 ```bash curl -X POST "http://localhost:8000/api/v1/qa" \ -H "Content-Type: application/json" \ -d '{"question": "什么是巴塞尔协议?", "user_id": "user-1"}' ``` #### 合规检查 ```bash curl -X POST "http://localhost:8000/api/v1/compliance/check" \ -H "Content-Type: application/json" \ -d '{"process_id": "proc-001", "document_content": "文档内容..."}' ``` ## 项目结构 ``` knowledgeS/ ├── backend/ # FastAPI 后端 │ ├── app/ │ │ ├── main.py # 应用入口 │ │ ├── routers/ # API 路由 │ │ ├── dependencies.py # 依赖注入 │ │ ├── schemas.py # Pydantic 模型 │ │ └── config.py # 配置管理 │ ├── core/ # 核心逻辑 │ │ ├── knowledge.py # 知识处理 │ │ ├── search.py # 搜索引擎 │ │ ├── qa.py # 问答引擎 │ │ ├── compliance.py # 合规引擎 │ │ ├── recommend.py # 推荐引擎 │ │ ├── llm.py # LLM 调用 │ │ ├── storage.py # 存储层 │ │ └── models.py # 数据模型 │ ├── Dockerfile │ └── requirements.txt ├── frontend/ # React 前端 │ ├── src/ │ │ ├── pages/ # 页面组件 │ │ ├── components/ # 可复用组件 │ │ ├── api/ # API 客户端 │ │ ├── hooks/ # 自定义 hooks │ │ └── types/ # TypeScript 类型 │ ├── Dockerfile │ └── package.json ├── tests/ # 测试 │ └── test_api_integration.py ├── docker-compose.yml ├── pyproject.toml └── README.md ``` ## 开发指南 ### 代码规范 ```bash # 后端格式化 black backend/ tests/ isort backend/ tests/ # 前端格式化 cd frontend && npm run build ``` ### 运行测试 ```bash # 后端 API 测试 cd tests && pytest test_api_integration.py -v ``` ## 配置说明 ### 环境变量 创建 `.env` 文件并配置以下变量: ```env # AI 配置 OPENAI_API_KEY=your-openai-api-key OPENAI_API_BASE=https://ark.cn-beijing.volces.com/api/v3 LLM_MODEL=gpt-3.5-turbo AI_TEMPERATURE=0.7 # 应用配置 SECRET_KEY=your-secret-key CORS_ORIGINS=* ``` ## 性能优化 - **Uvicorn 多 Worker**: 后端默认启动 4 个 worker 进程 - **前端静态资源**: Nginx 高效服务静态文件 - **懒加载引擎**: 各核心引擎按需初始化 - **数据持久化**: 内存数据定期 pickle 持久化 ## 安全考虑 - API 密钥认证(可通过环境变量配置) - CORS 跨域控制 - 文件上传类型限制 - 请求体大小限制 ## 许可证 本项目采用 MIT 许可证。