关于如何收集,标准化和集中化处理 Golang 日志的一些建议

依赖分布式系统的公司组织和团队经常使用 Go
语言编写其应用程序,以利用 Go
语言诸如通道和 goroutine
之类的并发功能。如果你负责研发或运维 Go
应用程序,则考虑周全的日志记录策略可以帮助你了解用户行为,定位错误并监控应用程序的性能。

这篇文章将展开聊一些用于管理 Go
日志的工具和技术。我们将首先考虑要使用哪种日志记录包来满足各种记录要求。然后会介绍一些使日志更易于搜索和可靠,减少日志资源占用以及使日志消息标准化的技术。

日志包的选择

Go
标准库的日志库非常简单,仅仅提供了 print
, panic
fatal
三个函数对于更精细的日志级别、日志文件分割以及日志分发等方面并没有提供支持. 所以催生了很多第三方的日志库,流行的日志框架包括 logrus
zap
glog
等。我们先来大致看下这些日志库的特点再来根据实际应用情况选择合适的日志库。

log标准库

Go
的内置日志记录库( log
)带有一个默认记录器( logger
),该记录器可写入标准错误并自动向记录中添加时间戳,而无需进行配置。你可以使用它日志用于本地开发,和试验性的代码段。这时从代码中获得快速反馈可能比生成丰富结构化的日志更为重要。

logrus

logrus
是一个为结构化日志记录而设计的日志记录包,非常适合以 JSON
格式记录日志。  JSON
格式使机器可以轻松解析 Go
日志。而且,由于 JSON
是定义明确的标准,因此通过包含新字段可以轻松地添加上下文,解析器能够自动提取它们。

使用 logrus
,可以使用功能 WithFields
定义要添加到JSON日志中的标准字段,如下所示。然后,可以在不同日志级别调用记录器,例如 Info()
Warn()
Error()
。  logrus
库将自动以 JSON
格式写入日志,并插入标准字段以及您即时定义的所有字段。

package main
import (
log "github.com/sirupsen/logrus"
)

func main() {
log.SetFormatter(&log.JSONFormatter{})

standardFields := log.Fields{
"hostname": "staging-1",
"appname": "foo-app",
"session": "1ce3f6v",
}
requestLogger := log.withFields(standardFields)
requestLogger.WithFields(log.Fields{"string": "foo", "int": 1, "float": 1.1}).Info("My first ssl event from Golang")

}

生成的日志将在 JSON
对象中包括消息,日志级别,时间戳、标准字段以及调用记录器即时写入的字段:

{"appname":"foo-app","float":1.1,"hostname":"staging-1","int":1,"level":"info","msg":"My first ssl event from Golang","session":"1ce3f6v","string":"foo","time":"2019-03-06T13:37:12-05:00"}

glog

glog
允许启用或禁用特定级别的日志记录,这对于在开发和生产环境之间切换时保持检查日志量很有用。它使您可以在命令行中使用标志(例如,-v表示详细信息)来设置运行代码时的日志记录级别。然后,可以在 if
语句中使用 V()
函数仅在特定日志级别上写入 Go
日志。功能 Info()
Warning()
Error()
Fatal()
分别指定日志级别 0
3

  if err != nil && glog.V(2){
glog.Error(err)
}

日志库的选择

上面分析了,标准库的 log
只适合非项目级别的代码片段的快速验证和调试。 logrus
在结构化日志上做的最好,有利于日志分析。 glog
可以减少日志占用的磁盘空间。不过相比日志占用空间大的问题,利于分析的日志给应用产品带来的价值更大,所以 logrus
使用的更多一些。很多开源项目,如 Docker
, Prometheus
等都是用了 logrus
来记录他们的日志。

logrus的使用介绍

logrus
是目前 Github
上star数量最多的日志库,目前(2020.03) star
数量为14000+, fork
数为1600+。 logrus
功能强大,性能高效,而且具有高度灵活性,提供了自定义插件的功能。很多开源项目,如 Docker
, Prometheus
等都是用了 logrus
来记录他们的日志。

  • logrus
    完全兼容 Go
    标准库日志模块,拥有六种日志级别: debug
    info
    warn
    error
    fatal
    panic
    ,这是 Go
    标准库日志模块的API的超集.如果你的项目使用标准库日志模块,完全可以以最低的代价迁移到 logrus
    上.

  • 可扩展的 Hook
    机制:允许使用者通过 hook
    的方式将日志分发到任意地方,如本地文件系统、标准输出、 logstash
    elasticsearch
    或者 mq
    等。

  • logrus
    内置了两种日志格式, JSONFormatter
    TextFormatter
    还可以自己动手实现接口Formatter,来定义自己的日志格式。

  • Field
    机制: logrus
    鼓励通过 Field
    机制进行精细化的、结构化的日志记录,而不是通过冗长的消息来记录日志。

  • Entry
    logrus.WithFields
    会自动返回一个  *Entry
    , Entry
    会自动向日志记录里添加记录创建的时间 time
    字段。

基本用法

logrus
Go
标准库日志模块完全兼容,  logrus
可以通过简单的配置,来定义输出、格式或者日志级别等。

package main

import (
"os"
log "github.com/sirupsen/logrus"
)

func init() {
// 设置日志格式为json格式
log.SetFormatter(&log.JSONFormatter{})

// 设置将日志输出到指定文件(默认的输出为stderr,标准错误)
// 日志消息输出可以是任意的io.writer类型
logFile := ...
file, _ := os.OpenFile(logFile, os.O_RDWR|os.O_CREATE|os.O_APPEND, 0666)
log.SetOutput(file)

// 设置只记录日志级别为warn及其以上的日志
log.SetLevel(log.WarnLevel)
}

func main() {
log.WithFields(log.Fields{
"animal": "walrus",
"size": 10,
}).Info("A group of walrus emerges from the ocean")

log.WithFields(log.Fields{
"omg": true,
"number": 122,
}).Warn("The group's number increased tremendously!")

log.WithFields(log.Fields{
"omg": true,
"number": 100,
}).Fatal("The ice breaks!")
}

自定义Logger

如果想在一个应用里面向多个地方写 log
,可以创建多个记录器 Logger
实例。

package main

import (
"github.com/sirupsen/logrus"
"os"
)

// logrus提供了New()函数来创建一个logrus的实例.
// 项目中,可以创建任意数量的logrus实例.
var log = logrus.New()

func main() {
// 为当前logrus实例设置消息的输出,同样地,
// 可以设置logrus实例的输出到任意io.writer
log.Out = os.Stdout

// 为当前logrus实例设置消息输出格式为json格式.
// 同样地,也可以单独为某个logrus实例设置日志级别和hook,这里不详细叙述.
log.Formatter = &logrus.JSONFormatter{}

log.WithFields(logrus.Fields{
"animal": "walrus",
"size": 10,
}).Info("A group of walrus emerges from the ocean")
}

Fields

logrus
不推荐使用冗长的消息来记录运行信息,它推荐使用 Fields
来进行精细化的、结构化的信息记录. 例如下面的记录日志的方式:

log.Fatalf("Failed to send event %s to topic %s with key %d", event, topic, key)

logrus
中不太提倡, logrus
鼓励使用以下方式替代之:

log.WithFields(log.Fields{
"event": event,
"topic": topic,
"key": key,
}).Fatal("Failed to send event")

WithFields
可以规范使用者按照其提倡的方式记录日志。但是 WithFields
依然是可选的,因为某些场景下,确实只需要记录一条简单的消息。

Default Fields

通常,在一个应用中、或者应用的一部分中,始终附带一些固定的记录字段会很有帮助。比如在处理用户 HTTP
请求时,上下文中所有的日志都会有 request_id
user_ip。
为了避免每次记录日志都要使用:

log.WithFields(log.Fields{“request_id”: request_id, “user_ip”: user_ip})

我们可以创建一个 logrus.Entry
实例,为这个实例设置默认 Fields
,把 logrus.Entry
实例设置到记录器 Logger
,再记录日志时每次都会附带上这些默认的字段。

requestLogger := log.WithFields(log.Fields{"request_id": request_id, "user_ip": user_ip})
requestLogger.Info("something happened on that request") # will log request_id and user_ip
requestLogger.Warn("something not great happened")

Hook接口

logrus
最令人心动的功能就是其可扩展的 HOOK
机制。通过在初始化时为 logrus
添加 hook
logrus
可以实现各种扩展功能.

logrus
hook
接口定义如下,其原理是每次写入日志时拦截修改 logrus.Entry
.

// logrus在记录Levels()返回的日志级别的消息时会触发HOOK,
// 按照Fire方法定义的内容修改logrus.Entry.
type Hook interface {
Levels() []Level
Fire(*Entry) error
}

一个简单自定义 hook
如下, DefaultFieldHook
定义会在所有级别的日志消息中加入默认字段 appName=”myAppName”

type DefaultFieldHook struct {
}

func (hook *DefaultFieldHook) Fire(entry *log.Entry) error {
entry.Data["appName"] = "MyAppName"
return nil
}

func (hook *DefaultFieldHook) Levels() []log.Level {
return log.AllLevels
}

hook
的使用也很简单,在初始化前调用 log.AddHook(hook)
添加相应的 hook
即可。 Hook
比较常见的用法是把指定错误级别的日志记录消息提醒发送到邮件组或者错误监控系统(比如 sentry
),起到主动错误通知的作用。

logrus
官方仅仅内置了 syslog
hook
。但 Github
有很多第三方的 hook
可供使用。比方刚才说的 sentry
相关的 hook

sentry-hook

Sentry
是一个错误监控系统,可以使用厂商的服务也可以在自己的服务器上搭建 Sentry
。模式跟 GitLab
很像,也是提供一键安装包。为应用注册 Sentry
后会分配一个 DSN
用于连接 Sentry
服务。

import (
"github.com/sirupsen/logrus"
"github.com/evalphobia/logrus_sentry"
)

func main() {
log := logrus.New()
hook, err := logrus_sentry.NewSentryHook(YOUR_DSN, []logrus.Level{
logrus.PanicLevel,
logrus.FatalLevel,
logrus.ErrorLevel,
})

if err == nil {
log.Hooks.Add(hook)
}
}

logrus是线程安全的

默认情况下, Logger
mutex
保护,以进行并发写入。当钩子被调用并且日志被写入时, mutex
会被保持。如果确定不需要这种锁,则可以调用 logger.SetNoLock()
禁用该锁。
不需要锁的情况包括:

  • 没有注册 hook
    ,或者 hook
    调用是线程安全的。

  • 写入 logger.Out
    是线程安全的,比如 logger.Out
    已经被锁保护或者 logger.Out
    是一个以 Append
    模式打开的文件句柄。

日志写入和存储的一些建议

选择了项目使用的日志库后,您还需要计划在代码中调用记录器的位置,如何存储日志。在本部分中,将推荐一些整理 Go
日志的最佳实践,他们包括:

  • 从的主应用程序流程而不是 goroutine
    中调用记录器。

  • 将日志从应用程序写入本地文件,即使以后再将其发送到日志集中化处理平台也是如此。
  • 定义日志的标准化默认字段
  • 将日志发送到日志处理平台,以便进行分析和汇总。
  • 使用 HTTP
    标头携带分布式唯一ID记录微服务中的用户行为。

避免在goroutine中使用日志记录器

避免创建自己的 goroutine
来处理写日志有两个原因。首先,它可能导致并发问题,因为记录器的副本将尝试访问相同的 io.Writer
。其次,日志记录库通常会自己启动 goroutine
,在内部管理所有并发问题,而启动自己的 goroutine
只会造成干扰。

总是将日志写入文件

即使将日志发送到中央日志平台,我们也建议您先将日志写到本地计算机上的文件中。这确保您的日志始终在本地可用,并且不会在网络中丢失。此外,写入文件意味着您可以将写入日志的任务与将日志发送到中央日志平台的任务分开。您的应用程序本身无需建立连接或流式传输日志给日志平台,您可以将这些任务交给专业的软件处理,比如使用 Elasticsearch
索引日志数据的话,那么就可以用 Logstash
从日志文件里抽取日志数据。

使用日志处理平台集中处理日志

如果您的应用程序部署在多个主机群集中,应用的日志会分散到不同机器上。日志从本地文件传递到中央日志平台,以便进行日志数据的分析和汇总。关于日志处理服务的选择,开源的日志处理服务有 ELK
,各个云服务厂商也有自己的日志处理服务,根据自身情况选择即可,尽量选和云服务器同一厂商的日志服务,这样不用消耗公网的流量。

使用唯一ID跨微服务跟踪Go日志

对于构建在分布式系统之上的应用,一个请求可能会流经多个服务,每个服务都会自己记录日志。这种情况下为了查询请求对应的日志,通常的解决方案是在请求头中携带唯一ID,分布式系统中所有服务的日志记录器中增加唯一ID字段,这样每条写入的日志里都会有 HTTP
请求的唯一ID。在统一日志平台中分析日志时,通过上游服务日志记录的请求唯一 ID 即可查询到该请求在下游所有服务中产生的日志。

参考链接:

https://www.datadoghq.com/blog/go-logging/

近期文章推荐


什么是WebSocket,它与HTTP有何不同?


使用Go语言创建WebSocket服务