一、核心组件栈(Grafana 本身)
1. 前端(Grafana UI)
- 语言:TypeScript / JavaScript
- 框架:React 18
- 状态管理:Redux
- 图表引擎:
- Graph:uPlot(高性能时序图)
- 饼图 / 柱状图:D3.js
- 热力图 / 地图:Canvas + D3
- UI 组件库:Grafana UI(自研组件库)
- 构建工具:Yarn、Webpack、Vite
- 样式:Sass、CSS Modules
2. 后端服务(Grafana Server)
- 开发语言:Go (Golang)
- Web 框架:Gin 自研 HTTP 服务
- 内置数据库:SQLite(默认单机)
- 支持外部数据库:PostgreSQL、MySQL、MariaDB
- 认证体系:OAuth2、LDAP、SAML、JWT、API Key
- 任务调度:内置定时告警、报表任务
3. 插件体系(Grafana Plugin)
分三类插件,统一使用 grafana-plugin-sdk-go / grafana-ui 开发
- 数据源插件(Datasource):对接时序 / 关系库
- 面板插件(Panel):自定义图表
- 应用插件(App):完整功能模块(如 Loki、Alerting)
二、配套观测数据存储栈(最常用数据源)
1. 时序指标(Metrics)
- Prometheus + Promtail(最主流)
- InfluxDB v1/v2
- VictoriaMetrics(Prometheus 高性能替代)
- Graphite
- OpenTSDB
2. 日志(Logs)
- Loki(Grafana 官方日志系统,完美联动)
- Elasticsearch
- Graylog
3. 链路追踪(Trace)
- Tempo(Grafana 官方链路存储)
- Jaeger
- Zipkin
4. 关系型 / 业务数据
- MySQL / PostgreSQL
- SQL Server
- ClickHouse
- BigQuery
5. 告警专用
- Alertmanager(配合 Prometheus)
- Grafana 内置告警引擎
三、完整观测全家桶:Grafana LGTM 栈(官方标准组合)
L = Loki(日志)、G = Grafana(可视化)、T = Tempo(链路)、M = Mimir(指标存储)
- Mimir:替代 Prometheus,分布式高可用指标存储
- Loki:轻量日志存储,只存索引不存原始日志
- Tempo:分布式链路追踪,兼容 Jaeger/Zipkin
- Grafana:统一可视化面板、告警、报表 配套采集器:
- Promtail:采集日志推 Loki
- Prometheus Agent:采集 Metrics 推 Mimir
- OpenTelemetry Collector:统一采集指标、日志、Trace
四、部署 & 运维技术栈
容器化部署
- Docker / Docker Compose
- Kubernetes(主流生产方案)
- Helm Chart(官方提供 grafana、loki、mimir、tempo helm 包)
监控采集标准
- OpenTelemetry(OTel):统一埋点标准,指标 / 日志 / 链路三合一
- Prometheus Exporter:各类中间件、系统采集器(node-exporter、mysql-exporter 等)
告警通知渠道
内置对接:钉钉、企业微信、Slack、邮件、PagerDuty、Webhook、短信
存储中间件(分布式高可用必备)
- 对象存储:MinIO、S3、阿里云 OSS(Loki/Mimir/Tempo 持久化)
- 分布式缓存:Redis(Mimir、Loki 分片缓存)
- 消息队列:Kafka(日志 / 链路分流)
五、开发 & 二次开发栈
- 后端插件开发:Go + grafana-plugin-sdk-go
- 前端面板开发:TS + React + Grafana UI
- API 交互:Grafana RESTful HTTP API、Grafana SDK
- IaC 可视化管理:
- Grafana Terraform Provider(代码管理仪表盘、数据源)
- Jsonnet(Tanka,批量生成 Prometheus 配置 + Grafana 面板)
- 自动化:API 脚本(Python/Shell)批量导入仪表盘
六、典型两种落地架构
1. 轻量单机(测试 / 小型业务)
Node Exporter → Prometheus → Grafana + SQLite 日志:Filebeat → Elasticsearch → Grafana ES 数据源
2. 企业级分布式 LGTM 生产架构
业务服务(OTel 埋点) ↓ OpenTelemetry Collector ├─ Metrics → Mimir(Redis 缓存 + S3 存储) ├─ Logs → Loki(MinIO) └─ Trace → Tempo ↓ 统一可视化:Grafana(PostgreSQL 存配置) ↓ Grafana Alerting / Alertmanager → 钉钉 / 企业微信告警
七、周边生态工具
- k6:Grafana 官方压测工具,压测数据直接接入 Grafana
- Grafana OnCall:告警排班、事件管理
- Grafana Agent:一体化采集器,替代 Promtail+Prometheus Agent
- Grafana Cloud:SaaS 托管观测平台

