Loki Stack:乞丐版 EFK

简介

踩入 Kubernetes 的坑以后,不可避免的就会遇到一个需求就是日志的集中采集和检索,这方面最负盛名的就是 ElasticSearch 了,这东西的强大是毋庸置疑的——又强又大。但是我多数时间跟日志打交道只会问一个问题:特定时间范围内,某应用都输出了什么日志?强大的全文检索能力,其实是很少用到的。但无论你用或者不用,索引就在那里,吃你传输和硬盘。

Loki 给穷人们带来了福音,它是一个可水平伸缩的、高可用的以及多租户的日志集中系统,有这么多功能,唯独没有全文检索。在其简介中,自称是受到 Prometheus 的启发:仅保存和处理元数据,而对日志正文不闻不问。

和 EFK 类似,Loki Stack 也由采集端、服务端和交互端三个部分构成,其中采集端是可变的,目前支持 Promtail、FluentBit 和 Fluentd 三种,服务端和交互端分别使用的是 Loki 和 Grafana。

部署

使用 Helm 可以非常方便的部署 Loki Stack,首先使用 helm repo add loki https://grafana.github.io/loki/charts && helm repo update 加入仓库并更新。

这里使用的是 Helm 3。

helm install stable/grafana  \
    --set ingress.enabled=true \
    --set ingress.hosts={grafana.yamler.io} \
    --set persistence.enabled=true \
    --generate-name

首先安装 Grafana,并设置持久化存储以及 grafana.yamler.io 的域名。

接下来继续使用 Helm 安装 Loki:

helm install loki/loki  \
    --set persistence.enabled=true \
    --set replicas=2 --generate-name

这里为 Loki 部署了两个实例的 Statefulset。并启用了持久化存储。

最后安装 Fluentbit 作为日志采集端:

helm install fluent-bit loki/fluent-bit \
--set "loki.serviceName=loki-1581527457"

此处的服务名来自 Loki 部署的 Service 名称。

初始化

接下来登入 Grafana,添加 Loki 作为数据源,由于没有开启认证,因此只需要设置 URL 即可,例如:http://loki-1581527457:3100。添加之后,就可以点击 Explore 按钮进入查询交互了。

查询

Grafana 中为 Loki 提供了两种类型的查询,分别是 Metrics 和 Log,也就是统计数字和日志本体。

Loki 使用一种称为 LogQL 的语法来进行日志检索,语法类似 PromQL。例如假设要查询 Loki 的日志:{app="loki"}

first

当然也可以使用 nodecontainer 等标签进行查询。具体标签生成的过程完全在采集器内部进行定义。

又或者查询一个 Metrics:

sum(count_over_time({job="fluent-bit"}[5m])) by (level),统计该任务的日志生成数量:

count

结论

除了上面演示的简单功能之外,Loki 还支持认证、监控、跟踪、多租户等丰富的功能(而且免费)。因此如果对全文检索没有执着需求的话,Loki 应该是个非常合适的替代方案,能很好很便宜地满足前面提到的简单需求。

Avatar
崔秀龙

简单,是大师的责任;我们凡夫俗子,能做到清楚就很不容易了。

comments powered by Disqus
下一页
上一页

相关