Skip to main content

Command Palette

Search for a command to run...

Loki Stack:乞丐版 EFK

Updated
1 min read

简介

踩入 Kubernetes 的坑以后,不可避免的就会遇到一个需求就是日志的集中采集和检索,这方面最负盛名的就是 ElasticSearch 了,这东西的强大是毋庸置疑的——又强又大。但是我多数时间跟日志打交道只会问一个问题:特定时间范围内,某应用都输出了什么日志?强大的全文检索能力,其实是很少用到的。但无论你用或者不用,索引就在那里,吃你传输和硬盘。

Loki 给穷人们带来了福音,它是一个可水平伸缩的、高可用的以及多租户的日志集中系统,有这么多功能,唯独没有全文检索。在其简介中,自称是受到 Prometheus 的启发:仅保存和处理元数据,而对日志正文不闻不问。

和 EFK 类似,Loki Stack 也由采集端、服务端和交互端三个部分构成,其中采集端是可变的,目前支持 Promtail、FluentBit 和 Fluentd 三种,服务端和交互端分别使用的是 Loki 和 Grafana。

部署

使用 Helm 可以非常方便的部署 Loki Stack,首先使用 helm repo add loki https://grafana.github.io/loki/charts && helm repo update 加入仓库并更新。

这里使用的是 Helm 3。

helm install stable/grafana  \
    --set ingress.enabled=true \
    --set ingress.hosts={grafana.yamler.io} \
    --set persistence.enabled=true \
    --generate-name

首先安装 Grafana,并设置持久化存储以及 grafana.yamler.io 的域名。

接下来继续使用 Helm 安装 Loki:

helm install loki/loki  \
    --set persistence.enabled=true \
    --set replicas=2 --generate-name

这里为 Loki 部署了两个实例的 Statefulset。并启用了持久化存储。

最后安装 Fluentbit 作为日志采集端:

helm install fluent-bit loki/fluent-bit \
--set "loki.serviceName=loki-1581527457"

此处的服务名来自 Loki 部署的 Service 名称。

初始化

接下来登入 Grafana,添加 Loki 作为数据源,由于没有开启认证,因此只需要设置 URL 即可,例如:http://loki-1581527457:3100。添加之后,就可以点击 Explore 按钮进入查询交互了。

查询

Grafana 中为 Loki 提供了两种类型的查询,分别是 Metrics 和 Log,也就是统计数字和日志本体。

Loki 使用一种称为 LogQL 的语法来进行日志检索,语法类似 PromQL。例如假设要查询 Loki 的日志:{app="loki"}

当然也可以使用 nodecontainer 等标签进行查询。具体标签生成的过程完全在采集器内部进行定义。

又或者查询一个 Metrics:

sum(count_over_time({job="fluent-bit"}[5m])) by (level),统计该任务的日志生成数量:

结论

除了上面演示的简单功能之外,Loki 还支持认证、监控、跟踪、多租户等丰富的功能(而且免费)。因此如果对全文检索没有执着需求的话,Loki 应该是个非常合适的替代方案,能很好很便宜地满足前面提到的简单需求。

More from this blog

龙虾恐慌:AIOps 又要改名了?

ChatGPT 开始,把 AI 拉近到普罗大众的面前,让无数人感受到 AI 的亲民魅力。而龙虾,则把大模型驱动的自动化能力,突然间变得水灵灵、活泼泼地走进千家万户。它不只是“风口上的猪”,而是风口本身。热度高到让 Mac mini 一度断货,不知道这在不在库克的预料之内。 每代人都有每代人的鸡蛋,春节期间,我就领了我的鸡蛋。翻出古老的 MacBook Air M1,充值各种大模型。当然了,这个工具

Mar 9, 20261 min read

再见 2025

我猜不少人以为这个号废了吧?并没有,只是今年变化有点大,一直有种抄起键盘,无从说起的感觉,所以一直偷懒到今天,2025 的最后一天。 今年是我的第四个本命年,去年末一期播客里,大内说本命年不是灾年,是变化年,有危也有机。可是讲真啊,只看到危,没看到机。 各种因缘际会,从鹅厂跳槽到前东家,已经接近四年,第一个合同期已经进入尾声。除了前两年还在云原生领域嗷嗷叫,后两年基本都是些鸡零狗碎的东西了,用老东家的术语说是——偏离主航道,可谓是前景暗淡了。 一旦确定要滚蛋,反倒心思轻松起来,每天骑着我的小红车...

Jan 5, 20261 min read

辅助编程?dora 说:我知道你很急可是请你别急

从 OpenGPT 把大模型的火烧旺了之后,这三年来,相信很多组织或摩拳擦掌、或躬身入局,希望借助聪明能干的大模型,或想偿还技术宅,或想降本增效,或想弯道超车。一时间,沉寂许久的 AIxx 又活过来了,LLM Ops、Vibe Coding、中医大模型、GPT 算命等等,全都老树发新芽,焕发了勃勃生机。那么视角拉回从业者最关注的饭碗相关的领域之一——AI 辅助开发,产生了什么触动,应该如何拥抱呢? DORA 的年度报告中给出了很有意思的结论——强者恒强。 执行摘要部分总结了几个有趣的点: 问题...

Oct 6, 20251 min read

[译]dora:ai 辅助软件开发状态报告

执行摘要 在 2025 年,科技领导者面临的核心问题已不再是“是否要采用 AI”,而是“如何实现其价值”。 DORA 的研究基于超过 100 小时的定性访谈和来自全球近 5,000 名技术专业人士的问卷调查。研究揭示了一个关键事实:AI 在软件开发中的主要角色是“放大器”。它会放大高效能组织的优势,也会凸显组织的缺陷。 关键结论:AI 是放大器 AI 投资的最大回报并非来自工具本身,而是来自组织底层系统的战略性建设: 高质量的内部平台 清晰的工作流 团队的协同能力 缺少这些基础,AI ...

Oct 2, 202514 min read

僭越了,有人在用 Rust 写 Kubernetes

一个新语言问世,最爱做的事情之一,就是重写存量软件了。 云原生喝酒 SIG 重点扶持项目——rk8s(https://github.com/rk8s-dev/rk8s) 也可以归在这个范畴里,只不过这个项目重写的东西比较大,是 Kubernetes。 从 2025 年 1 月第一个 Commit 开始,到现在有了 200 多次 Commit,十几万行代码。当然距离 Kubernetes 的几百万行代码还差得远——老马就是喜欢整这种大无畏项目。 另外该项目也是国内第一个脱离 Cargo 转向使用 ...

Sep 27, 20253 min read

【伪】架构师

342 posts