# itops-agent-platform **Repository Path**: IT_Oline/itops-agent-platform ## Basic Information - **Project Name**: itops-agent-platform - **Description**: 国内首个企业级 IT 运维多 Agent 自动化平台 — 基于大语言模型的智能运维解决方案。ITOps Agent Platform通过可视化工作流编排,将多个AI Agent组合成智能运维自动化流水线,实现服务器管理、告警处理、故障诊断、日志分析、脚本管理、定时运维任务的自动化执行, 支持国内外主流大模型,旨在 Zabbix/Prometheus 告警自动修复闭环,Docker 一键部署多平台。 - **Primary Language**: NodeJS - **License**: Not specified - **Default Branch**: main - **Homepage**: https://gitcode.com/gcw_IM7aAihp/itops-agent-platform - **GVP Project**: No ## Statistics - **Stars**: 60 - **Forks**: 38 - **Created**: 2026-05-21 - **Last Updated**: 2026-07-05 ## Categories & Tags **Categories**: Uncategorized **Tags**: 运维, Docker, AI, devops, zabbix ## README [English](README.en.md) | [中文](README.md) | [繁體中文](README.TW.md) | [한국어](README.ko.md) | [日本語](README.ja.md) | [Deutsch](README.de.md) | [Français](README.fr.md) *** **重要许可证变更通知(2026-05-27)** 本项目自 2026年5月27日 起,所有新提交的代码采用 **Mozilla Public License 2.0 (MPL-2.0)** 许可证开源。本项目禁止闭源二次开发、打包销售、SaaS化运营等商业用途,永久开源。项目属于成千上万拥抱开源精神的工程师,而不是一个公司。 ***

⚡ ITOps Agent Platform

AI 多 Agent 协作的企业级运维自动化平台
国产开源 · PagerDuty + Rundeck + Portainer + vCenter 替代方案
一个平台,搞定告警 → 诊断 → 修复 → 审批 → 验证全闭环

CI Release License Stars Issues
Gitee GitCode
12 Agents 68 API Routes 72 Services 63 Pages 10 Workflows
React 18 TypeScript Node.js Docker
Star History Chart

🎮 [在线演示](https://agentdemo-0mwug01t6.maozi.io/)  |  📝[项目愿景与社区共建](项目愿景与社区共建.md)  |  📝[AI编程Skill](SKILL.md)  |  📝[教学书籍](https://aiopsdoc-0mwug01t6.maozi.io/book/)  |  📖[项目文档](https://aiopsdoc-0mwug01t6.maozi.io/)  |  ✍️[作者的话](https://mp.weixin.qq.com/s/NDqYrfqR0RZEvSESyVD2hg) 🌐 项目官网: 📦 代码仓库:[GitHub](https://github.com/qinshihu/itops-agent-platform)  |  [Gitee](https://gitee.com/IT_Oline/itops-agent-platform)  |  [GitCode](https://gitcode.com/gcw_IM7aAihp/itops-agent-platform) --------------------------------------------------------------- ## 🎯 谁在用 / 谁适合用? | 角色 | 典型痛点 | 本平台如何解决 | | ---------------- | --------------------------- | -------------------------- | | **运维工程师** | 半夜被告警吵醒,手动 SSH 排查 | AI 自动诊断根因 → 推送审批 → 手机一键修复 | | **SRE / DevOps** | 多套工具来回切换,信息孤岛 | 告警+诊断+执行+审批一站式闭环 | | **IT 主管 / CTO** | 运维全靠人,故障响应靠运气 | 自动化巡检 + 自愈策略,把人从重复劳动中解放 | | **中小企业 IT** | 买不起 PagerDuty/Rundeck 等商业软件 | 功能对标,开源免费,数据不出域 | | **安全合规团队** | 修复操作无审批、无审计 | HITL 人工审批 + 全链路审计 + 命令安全过滤 | *** ## 为什么需要这个项目? 凌晨 3 点,服务器 CPU 飙到 99%。传统流程是: ``` 告警通知 → 被吵醒 → 登录 VPN → SSH 上去 → 敲命令排查 → 翻文档 → 修复 → 写报告 → 睡觉 ``` **整个过程 30-60 分钟,而你本可以继续睡觉。** ITOps Agent Platform 把这个流程变成: ``` 告警触发 → AI 自动诊断根因 → 生成修复命令 → 推送手机审批 → 一键执行 → 自动验证 → 生成报告 ``` **全程 3 分钟,你只需要在手机上点一下"同意"。** *** ## 🚀 运维的终极形态:从自动化到自主化 ITOps Agent Platform 不只是一个运维工具,它瞄准的是 **IT 运维的终极演进方向** — AI 全自主运维。 ``` 手工运维 → 脚本自动化 → 平台化 → AI 辅助 → 🤖 自主运维(本项目) 2000s 2010s 2020s 2024+ 现在 & 未来 ``` | 演进阶段 | 特征 | 人的角色 | |---------|------|---------| | 手工运维 | 敲命令、登服务器 | 执行者 | | 脚本自动化 | Shell / Python 半自动化 | 脚本维护者 | | 平台化 | Ansible / Prometheus / Terraform | 平台操作者 | | AI 辅助 | Copilot 建议、告警分析 | 决策者 | | **AI 自主运维** | **AI Agent 全闭环:感知 → 诊断 → 决策 → 执行 → 验证** | **监督者** | ### 为什么说这是终极形态? | 维度 | 传统方式 | ITOps Agent Platform | |------|---------|---------------------| | 故障响应 | 人工:发现 → 定位 → 修复(30-60 分钟) | AI:自动感知 → 诊断 → 修复(< 3 分钟) | | 运维规模 | 1 人管 20-50 台 | **1 人管 500+ 节点,AI 承担 80%+ 工作量** | | 知识沉淀 | 老员工脑中、散落文档 | **知识库 + RAG,AI 持续学习,永不流失** | | 决策质量 | 依赖个人经验,不稳定 | **多 Agent 协作推理,完整推理链可审计** | | 边际成本 | 加机器 ≈ 加人 | **加机器 ≈ 加 Agent,边际成本趋近于零** | > **这不是一个运维工具,这是运维的下一代操作系统。** 当 AI Agent 能够自主完成告警接入、根因诊断、修复决策、命令执行、结果验证的全链路闭环,运维就不再是"人盯着系统",而是"人设计策略,AI 执行策略"。 ### 行业趋势:AI 自主运维是不可逆的方向 - **Gartner** 将 AIOps 列为 IT 运维战略技术趋势,预测 AI 驱动的自主运维将成为企业标配 - **CNCF** 云原生 + AI 融合是下一代基础设施的核心方向 - 运维人力成本逐年攀升,**AI Agent 是唯一能在不增加人力的情况下支撑业务规模 10 倍增长的方案** - **开源 + AI Agent 协作** 是打破商业软件垄断、实现技术普惠的关键路径 ### 我们的定位 **ITOps Agent Platform 是目前开源的 AIOps 项目中,唯一将「告警 → 诊断 → 决策 → 执行 → 验证」全链路 AI 自主闭环工程化落地的平台。** 我们的长期目标是:让 80% 的日常运维工作完全由 AI Agent 自主完成,人类运维工程师专注于架构设计、策略制定和创新性工作。**这不仅是一个开源项目,这是运维工程师解放运动的起点。** --- ## ⏰ 为什么是现在? 三个趋势在同一时间点交汇,让 AI 自主运维从"概念"变成了"必然": | 趋势 | 说明 | |------|------| | **LLM 能力跨越阈值** | GPT-4o / DeepSeek / 豆包 / 通义千问等模型已具备生产级推理能力,能胜任故障诊断、命令生成等严肃场景 | | **运维人力成本不可逆上升** | 企业 IT 规模 10 倍增长,运维团队无法同比例扩张,唯一的出路是 AI 承担 80%+ 日常工作量 | | **开源生态足够成熟** | Docker / K8s / React / TypeScript / Node.js 技术栈已足够支撑企业级产品,开源不再是"简陋"的代名词 | > **2026 年是 AI 自主运维的元年。** 当 LLM 能力 + 运维痛点 + 开源生态三者交汇,ITOps Agent Platform 站在了这个历史节点上。错过这个窗口,就是错过一个时代。 --- ### 一个 $400 亿的市场,正在被 AI 重写规则 全球 IT 运维市场规模 **$400 亿(2025 年)**,预计 2030 年突破 $700 亿。每一次范式转移都会诞生新的王者: - 云计算转移 → AWS($2 万亿市值) - 云监控转移 → Datadog($400 亿市值) - 开发工具转移 → GitLab($140 亿 IPO) - **运维自动化转移 → ?** > **问题不是"会不会发生",而是"谁会成为这个赛道的 GitLab"。** 开源 AIOps 领导者位置目前是空缺的 — 这是一个 Winner-takes-most 的市场。 | 当年 GitLab | 今天 ITOps Agent Platform | |------------|--------------------------| | 开源替代 GitHub | 开源替代 PagerDuty + Rundeck + Portainer | | 初期只有基础 CI/CD | 12 个 AI Agent + 68 个 API 路由 | | 没人相信代码托管值 $100 亿 | **没人相信运维平台值 $100 亿** | > ITOps Agent Platform 站在一个更大赛道的更早阶段。 ### 三个不可逆的顺风 | 顺风 | 为什么不可逆 | |------|------------| | **AI 能力爆发** | LLM 从"玩具"到"生产级"仅 2 年,下一步是"自主决策" | | **运维人力断层** | 70 后运维专家退休潮 + 年轻人不愿 7×24 值班 = AI 是唯一出路 | | **开源吃掉企业软件** | GitLab、Confluent、Grafana、HashiCorp — 开源 IPO 已发生 5 次,每一次都证明开源模式比闭源更具商业爆发力 | > **这不是选不选的问题,是选谁的问题。** 当上述三条曲线交汇,AI 自主运维是数学上的必然。 *** platform-screenshot platform-screenshot platform-screenshot *** ## 5 分钟体验完整闭环 ```bash # 1. 一行命令部署(需要 Docker 环境) curl -sL https://gitee.com/IT_Oline/itops-agent-platform/raw/main/deploy.sh -o deploy.sh && chmod +x deploy.sh && ./deploy.sh # 2. 打开浏览器 http://localhost:8080,默认账号 admin/admin # 3. 添加一台服务器 → 系统自动发现宿主机上的容器和资源 # 4. 配置告警 Webhook → 触发一条测试告警 → 观察 AI 自动分析 # 5. 点击"自动修复" → 手机审批 → 完成! ``` **5 分钟,从零到完整的 AI 运维闭环体验。** *** ## 这个平台到底能做什么? ### 路径1️⃣   智能告警 → AI 诊断 → 自动修复 ``` Prometheus / Zabbix 告警 → Webhook 接收 → AI 根因分析(自然语言诊断报告) → 自动生成修复命令 + 风险评估 → 企微/钉钉推送审批 → 手机一键通过 → SSH 自动执行修复 → 验证结果 → 生成报告 ```
展开查看这个流程解决了什么痛点 | 传统方式 | 本平台 | | -------------- | -------------------- | | 告警风暴,半夜被吵醒 | AI 自动降噪去重,同类告警聚合 | | 手动 ssh 排查,靠经验猜 | AI 分析日志 + 指标,给自然语言诊断 | | 翻文档找修复步骤 | 自动生成结构化修复命令(JSON) | | 修复没审批,出事没人担 | 人工审批节点,移动端一键审批 | | 担心修复出错无法回滚 | 自动验证结果,失败告警 |
### 路径2️⃣   可视化工作流 → 定时自动巡检 ``` 拖拽编排工作流(Agent + 审批 + 条件分支) → 配置 Cron 定时触发 → 自动执行多台服务器巡检 → 生成合规检查报告 → 异常自动创建告警 → 进入路径1️⃣ ``` ### 路径3️⃣   容器与虚拟化统一管理 ``` 一键添加 Docker 主机 / VMware vCenter / Proxmox VE / KVM 节点 → 自动发现所有容器和虚拟机 → 实时监控 CPU / 内存 / 网络(WebSocket 推送) → 容器日志流式查看 → Docker Compose 可视化编排 → K8s 集群导入与管理(kubeconfig 导入 + 集群状态监控) → 镜像仓库集成(Harbor / ACR / Docker Hub) ``` ### 路径4️⃣   数据中心与网络设施管理 ``` 网段规划 → IP 子网与 VLAN 管理 → IP 地址自动分配 / 预留 / 回收 → 数据中心机房建模(机柜 / PDU / 设备生命周期 / 供电管理) → 机房 3D 数字孪生监控(WebGL 实时渲染) → 网络拓扑自动发现(SNMP / LLDP / ARP) ``` *** ## 和同类开源项目有什么不同? | 能力 | ITOps Agent | GrafanaOnCall | Portainer | UptimeKuma | Rundeck | Coolify | | ----------------- | :---------: | :-----------: | :-------: | :--------: | :-----: | :-----: | | 告警接入 + 降噪 | ✅ | ✅ | ❌ | ✅ | ❌ | ❌ | | **AI 多 Agent 协作** | **✅** | ❌ | ❌ | ❌ | ❌ | ❌ | | **告警 → 自动修复闭环** | **✅** | ❌ | ❌ | ❌ | ❌ | ❌ | | **人工审批(HITL)** | **✅** | ❌ | ❌ | ❌ | ❌ | ❌ | | Docker/VM 可视化管理 | ✅ | ❌ | ✅ | ❌ | ❌ | ✅ | | K8s 集群管理 | ✅ | ❌ | ✅ | ❌ | ❌ | ❌ | | IP 子网 / VLAN 管理 | ✅ | ❌ | ❌ | ❌ | ❌ | ❌ | | 数据中心机房建模 | ✅ | ❌ | ❌ | ❌ | ❌ | ❌ | | 机房 3D 数字孪生 | ✅ | ❌ | ❌ | ❌ | ❌ | ❌ | | 工作流拖拽编排 | ✅ | ✅ | ❌ | ❌ | ✅ | ❌ | | Web SSH 终端 | ✅ | ❌ | ✅ | ❌ | ❌ | ❌ | | 知识库 + RAG | ✅ | ❌ | ❌ | ❌ | ❌ | ❌ | | 定时巡检 + 自动报告 | ✅ | ❌ | ❌ | ❌ | ✅ | ❌ | | 成本分析 + 自动伸缩 | ✅ | ❌ | ❌ | ❌ | ❌ | ❌ | | **本地 AI · 数据不出域** | **✅** | ❌ | ❌ | ❌ | ❌ | ❌ | | **国产化(信创)友好** | **✅** | ❌ | ❌ | ❌ | ❌ | ❌ | > **一句话总结**:现有开源工具各管一段 — OnCall 管告警、Portainer 管容器、Rundeck 管执行。ITOps Agent 把这一切打通,加上 **AI 多 Agent 协作大脑**,实现真正的「告警进来,修复完成」。 ### vs 商业方案 开源免费不是唯一优势。与付费商业产品正面比较: | 能力 | PagerDuty + Rundeck | ServiceNow ITOM | **ITOps Agent(开源免费)** | |------|:---:|:---:|:---:| | 年费用(100 节点) | $50,000+ | $100,000+ | **$0** | | AI 自主诊断 | ❌ 仅告警路由 | ⚠️ 需额外模块 | **✅ 多 Agent 协作推理** | | 自动修复闭环 | ❌ 需人工执行 | ⚠️ 需定制开发 | **✅ 内置全链路** | | 人工审批(HITL) | ❌ | ⚠️ 需定制 | **✅ 企微/钉钉原生推送** | | 容器/VM/K8s 管理 | ❌ | ❌ | **✅ 内置可视化** | | 数据不出域 | ❌ SaaS 强制上云 | ❌ SaaS 强制上云 | **✅ 100% 本地部署** | | 开源可控 | ❌ 闭源锁定 | ❌ 闭源锁定 | **✅ MPL-2.0 开源** | | 社区驱动 | ❌ | ❌ | **✅** | > **一个开源项目,做到三个商业产品(PagerDuty + Rundeck + Portainer)合起来都做不到的事。** 而且是免费的。 *** ## 架构一览 ```mermaid graph TB Browser["🌐 浏览器"] --> Nginx["Nginx 反向代理"] Nginx --> React["React 前端
63 个页面 | @xyflow/react 工作流编辑器"] Nginx --> Express["Express 后端
68 个路由 | 72 个服务 | JWT 认证"] React <-->|"WebSocket 实时通信"| Express Express --> SQLite[("SQLite 数据库
WAL 模式 | AES-256 加密")] Express --> LLM["🤖 LLM 模型池
豆包 | DeepSeek | 通义千问
OpenAI | 智谱 | 本地模型"] Express --> SSH["🖥️ SSH 远程服务器"] Express --> Docker["🐳 Docker Engine API"] Express --> K8s["☸️ Kubernetes API"] Express --> VMware["💻 VMware vSphere / KVM"] Express --> Webhook["🚨 告警 Webhook
Prometheus | Zabbix | Grafana"] Express --> Notify["📬 通知渠道
企业微信 | 钉钉 | 邮件"] ``` > 📐 [查看完整架构图 →](./docs/ARCHITECTURE_DIAGRAM.md) *** | 壁垒 | 说明 | |------|------| | **12 Agent 协作调度** | 不是单个 AI API 调用,是多 Agent 分工 + 协作 + 仲裁的复杂分布式系统 | | **全链路状态机** | 告警 → 诊断 → 决策 → 审批 → 执行 → 验证,7 节点状态流转已工程化打磨 | | **命令安全引擎** | 7 类危险命令策略 + 角色权限矩阵,确保 AI 生成的命令在生产环境安全执行 | | **多模型降级链** | 主模型故障自动切换备用模型,保证 AI 服务高可用,不因单点故障中断 | | **32 版本数据库迁移** | 经历 32 次 schema 迭代稳定演进,工程成熟度远超 Demo 级别项目 | ### 规模化经济学:开源模式的商业爆发力 | 指标 | 传统运维 SaaS | ITOps Agent 开源模式 | |------|:---:|:---:| | 获客成本 | 销售驱动,单个企业客户 $10,000+ | **≈ $0(社区驱动 + 开发者自传播)** | | 边际服务成本 | 随用户数线性增长 | **趋近于零(用户自托管)** | | 网络效应 | 弱 | **强(Agent 越多 → 平台越强 → 社区越大)** | | 生态锁定 | 合同到期可迁移 | **知识库 + Agent 市场 + 工作流模板(深度绑定)** | | 商业化弹性 | 只能卖订阅 | **企业版 / 托管云 / 技术支持 / Agent 市场 / 培训认证** | > 开源模式的核心优势在于获客效率与规模化能力,已被业界主流开源项目验证。这为项目的长期可持续发展提供了坚实基础。 ## 🗺️ 未来路线图 | 阶段 | 核心目标 | |------|---------| | **v3.x 工程化**(当前) | 多主机容器/VM/K8s 统一管理,告警 → 修复全链路闭环 | | **v4.x 智能化** | 多 Agent 自主协商决策、跨系统关联分析、AI 自学习策略优化 | | **v5.x 自治化** | 零人工干预自主运维、AI 驱动的容量规划与成本优化 | | **v6.x 生态化** | Agent 市场(社区共享 Agent)、多集群联邦、运维数字孪生 | > **路线图不只是一个时间表,它是运维行业对未来的承诺。** 项目会持续迭代,每一步都朝着"AI 全自主运维"的终极目标迈进。 *** ## 核心特性 ### 🤖 AI 智能运维 - **12 个预设 Agent**:告警处理、故障诊断、日志分析、系统巡检、变更执行、文档生成、合规检查、命令执行、自动巡检、命令生成专家、网络巡检专家、数据库运维 - **AI 修复闭环**:告警 → AI 分析 → 修复命令生成 → 审批 → 执行 → 验证 - **根因分析**:AI 驱动告警分析,自然语言诊断报告,完整推理链 - **AI Copilot**:自然语言运维助手,自动感知系统状态 - **知识库 + RAG**:21 条预设知识,语义检索注入 LLM 上下文 ### 🔧 可视化管理 - **工作流编辑器**:拖拽编排,串行/并行/条件分支,10 个预设模板 - **Web SSH 终端**:xterm.js 交互式终端,窗口自适应,会话管理 - **容器管理**:多主机 Docker 可视化(启停/日志/监控/Compose 编排) - **虚拟机管理**:VMware vSphere / Proxmox VE / KVM 多平台,快照管理,实时迁移 - **K8s 管理**:kubeconfig 导入集群,Pod / Deployment / Service / Node 全生命周期 - **网段管理**:IP 子网 / VLAN 规划,自动生成 IP 地址池,分配 / 预留 / 回收,批量操作 - **数据中心管理**:机房机柜建模,设备生命周期追踪,PDU/UPS 供电管理 - **机房 3D 监控**:Three.js WebGL 数字孪生,实时设备状态可视化 - **大屏仪表盘**:全屏 NOC 监控中心 ### 🏢 企业级能力 - **HITL 审批**:工作流人工审批节点,企微/钉钉推送,移动端审批 - **告警降噪**:智能去重 + 抑制 + 关联分析 - **自动伸缩**:CPU/内存指标驱动,冷却窗口,伸缩历史 - **成本分析**:容器/VM 成本估算 + 优化建议 - **定时任务**:Cron 表达式,自动执行指定工作流 - **报告系统**:自动生成 Markdown 报告 ### 🔒 安全与合规 - **AES-256-GCM 加密**:服务器密码、SSH 密钥银行级加密 - **JWT 双令牌认证**:Access Token (24h) + Refresh Token (7d),自动刷新 - **SSH 命令安全过滤**:7 类危险命令策略(rm -rf / mkfs / iptables -F 等),按角色拦截 - **登录保护**:5 次失败锁定 30 分钟,强制密码复杂度 - **审计日志**:全操作可追溯 - **非 root 运行**:Docker 容器最小权限原则 - **本地 AI**:支持 Ollama / LM Studio / vLLM,数据不出域 *** ## 支持的 AI 模型 通过统一的 AI 模型池管理,支持主备降级链,每个提供商独立熔断器。 | 类型 | 提供商/模型 | 接入方式 | 推荐场景 | | -------- | ---------------------------------- | --------- | --------------- | | **国内云** | 火山引擎 · 豆包 (Doubao) | 原生 API | 国内推荐,稳定快速 | | **国内云** | 阿里云 · 通义千问 (Qwen) | OpenAI 兼容 | 企业级应用 | | **国内云** | DeepSeek | OpenAI 兼容 | 代码生成、推理 | | **国内云** | 智谱 AI (GLM-4) | OpenAI 兼容 | 中文理解优秀 | | **国内云** | Moonshot · Kimi | OpenAI 兼容 | 长文本处理 | | **国内云** | 百度 · 文心一言 | OpenAI 兼容 | 国内企业 | | **国内云** | 零一万物 (Yi) / 百川 (Baichuan) | OpenAI 兼容 | 开源模型 | | **国际云** | OpenAI (GPT-4o) / Anthropic Claude | 原生 API | 外网环境 | | **本地部署** | Ollama / LM Studio / vLLM | OpenAI 兼容 | **数据 100% 不出域** | > ✅ 模型池统一管理   ✅ 主备降级链   ✅ 独立熔断器   ✅ 拖拽排序   ✅ 连通性测试 *** ## 快速开始 ### 方式一:一键脚本部署(推荐) ```bash # Linux/Mac curl -sL https://gitee.com/IT_Oline/itops-agent-platform/raw/main/deploy.sh -o deploy.sh && chmod +x deploy.sh && ./deploy.sh # Windows PowerShell .\deploy.ps1 ``` ### 方式二:Docker Compose ```bash cp .env.example .env docker compose up -d --build # 前端: http://localhost:8080 # 健康检查: http://localhost:3001/health ``` ### 方式三:本地开发(热重载) ```bash # Docker 本地开发环境 cd local-dev # Windows: .\start-dev.bat # Linux/Mac: ./start-dev.sh # 或传统方式 npm run dev # 前端: http://localhost:3000 # 后端: http://localhost:3001 ``` **默认管理员**: `admin` / `admin`(首次登录强制修改密码) *** ## 技术栈 | 层 | 技术 | | ------ | ----------------------------------------------- | | 前端 | React 18 + TypeScript + Vite 5 + Tailwind CSS 3 | | 状态管理 | Zustand + React Query | | 工作流编辑器 | @xyflow/react | | 后端 | Node.js + Express 4 + TypeScript | | 数据库 | SQLite (better-sqlite3, WAL 模式) | | 实时通信 | Socket.io 4 | | 远程连接 | SSH2 | | 容器操作 | Dockerode | | 部署 | Docker + Docker Compose + Nginx | *** ## 项目结构 ``` ├── backend/src/ │ ├── app.ts # Express 入口 │ ├── routes/ # 68 个 API 路由模块 │ ├── services/ # 72 个业务服务 │ ├── models/ # 数据库 + 迁移(32 版本) │ ├── presets/ # 预设数据(Agent / 工作流 / 知识库等) │ ├── middleware/ # 6 个中间件(auth / rateLimiter / validation 等) │ ├── websocket/ # Socket.io 实时通信 │ └── utils/ # 工具函数 ├── frontend/src/ │ ├── pages/ # 63 个页面组件 │ ├── components/ # 通用组件(DataRoom3D / WorkflowEditor 等) │ ├── contexts/ # React Context (Auth / Theme / Toast) │ └── lib/ # Axios 封装 / 工具库 ├── docker/ # 生产 Docker 配置 + Nginx ├── docs/ # 技术文档 ├── .github/workflows/ # CI/CD (ci.yml + release.yml) ├── docker-compose.yml # 生产编排 └── deploy.sh / deploy.ps1 # 一键部署脚本 ``` *** ## 文档导航 | 文档 | 说明 | | --------------------------------------------- | --------- | | [部署手册](./docs/DEPLOYMENT.md) | 详细部署操作 | | [API 文档](./docs/API.md) | 完整 API 接口 | | [架构设计](./docs/ARCHITECTURE.md) | 系统架构说明 | | [开发指南](./docs/DEVELOPMENT.md) | 本地开发搭建 | | [工作流指南](./docs/WORKFLOW_GUIDE.md) | 工作流编排使用 | | [自动修复设计](./docs/AUTO_REMEDIATION_DESIGN.md) | 告警自动修复 | | [网络设备巡检](./docs/NETWORK_DEVICE_INSPECTION.md) | 网络设备功能 | | [测试指南](./docs/TEST_GUIDE.md) | 功能测试说明 | | [项目愿景](./项目愿景与社区共建.md) | 愿景与共建 | *** ## 作者 **谭策** — 独立开发者 | AIOps 领域探索者 - 🌐 项目官网:[ITOpsAgentinfo](https://www.zjzwfw.cloud/ITOpsAgentinfo) - 📝 博客:[zjzwfw.cloud](https://www.zjzwfw.cloud/) - 📧 邮箱: - 💬 微信公众号:**IT Online**

IT Online 微信公众号

*** ## 🙏 致谢贡献者 | 头像 | 名称 / 用户名 | 角色 | 主要贡献 | | :-----------------------------------------------------------------------------------------------------------------------: | :-----------------------------------------------: | :--------: | :----------- | | | **热心市民高先生** | 微信贡献者 | 测试反馈 | | | **@林** | 微信贡献者 | 测试反馈 | | | **尔东辰** | 微信贡献者 | 测试 | | | **xiezhiliang89** | GitHub 贡献者 | 测试 | *** ## 🌍 社区愿景:这不只是代码,是一场运动 ITOps Agent Platform 不仅仅是一个开源项目,它是一场 **运维工程师解放运动**。 我们相信: - **运维不应该是 7×24 待命的体力劳动**,而应该是策略设计和架构创新 - **AI 不应该替代运维工程师**,而应该替代运维工程师不想做的重复工作 - **开源社区的力量** 可以做出比商业软件更好的产品 - **每一个运维工程师都值得从告警风暴中解脱出来**,去陪伴家人、去追求自己真正热爱的事 > 如果你也相信运维的未来是 AI 自主化,欢迎加入我们。**Star 是对项目最大的认可,Issues 上的每一个反馈都在让这个愿景更近一步。** --- ## 🔭 长期愿景 > **"我们正在构建运维领域的自主操作系统。"** > > 全球 5000 万运维工程师,管理着 $400 亿的 IT 基础设施。今天,他们还在凌晨 3 点爬起来手动修服务器。 > > 我们在做的是让运维从「人操作工具」变成「人制定策略、AI 自主执行」。这不是功能增强,是范式转移。 > > 项目持续迭代中,欢迎关注。每一个 Star 都是对未来的投票。 *** ## 🤝 参与贡献 我们欢迎任何形式的贡献! - 🐛 [提交 Bug](https://github.com/qinshihu/itops-agent-platform/issues/new?template=bug_report.yml) - 💡 [提出新功能](https://github.com/qinshihu/itops-agent-platform/issues/new?template=feature_request.yml) - 📝 [改进文档](https://github.com/qinshihu/itops-agent-platform/issues/new?template=docs_update.yml) - 🔒 [报告安全问题](SECURITY.md) 查看 [贡献指南](CONTRIBUTING.md) 了解详情。 *** ## ⭐ 支持项目 如果这个项目帮到了你,请给我们一个 **Star** ⭐ 让更多人看到!

Star this repo    Fork this repo

> 🌟 **Star 越多,项目越容易被 GitHub Trending 推荐,也越能吸引更多开发者加入共建。每一颗 Star 都是对项目最大的鼓励!** *** ## 📄 许可证 [MPL-2.0](./LICENSE) © 谭策