Cloud Logging 快速参考指南 | AI生成和翻译

Home 2026.01

Question: Google Cloud 中 Cloud Logging 的全面指南

Answer:

Cloud Logging(原名 Stackdriver Logging)是 Google Cloud 的全托管、实时日志管理服务。它允许对来自 Google Cloud 服务、Amazon Web Services(通过代理)、本地系统和自定义应用程序的日志数据进行摄取、存储、搜索、分析、监控和告警。

1. 核心概念

2. 摄取方法 (Ingestion Methods)

方法 适用场景 Structured Logging 支持 推荐代理
Ops Agent Compute Engine, GKE Autopilot, VMs 是 (2025+)
Cloud Logging libraries Applications (Java, Go, Python, Node, .NET, etc.) 极佳 (JSON)
Fluent Bit / Fluentd Kubernetes, containers, lightweight
直接 API 调用 Serverless, batch jobs
Audit Logs Admin activity, Data Access, Policy 是 (自动) 自动

2025–2026 年推荐:对于大多数 VM/GCE/GKE 工作负载,使用 Ops Agent —— 它在一个二进制文件中集成了 metrics + logs + traces。

3. 结构化日志 (Structured Logging - 强烈推荐)

输出 JSON 对象而不是纯文本日志:

{
  "severity": "INFO",
  "message": "User login succeeded",
  "user_id": "u_12345",
  "ip": "203.0.113.42",
  "latency_ms": 48,
  "http_status": 200
}

优点:

大多数官方 Google Cloud 库都开箱即用支持结构化日志。

4. 查询日志 (Logging Query Language)

基本示例:

高级模式:

resource.type="k8s_container"
resource.labels.namespace_name="prod"
severity>=WARNING
jsonPayload."error.type"="DatabaseConnectionError"

使用控制台中的 Query builder 或直接编写查询语句。

5. 基于日志的指标 (Log-Based Metrics)

两种类型:

创建后 → 在 Cloud Monitoring 仪表板和告警中使用。

6. 日志路路由与接收器 (Log Routing & Sinks)

Sinks 将日志路由到目的地:

排除过滤器 (Exclusion filters)(针对单个 sink 或全局)有助于大幅降低成本。

示例路由策略:

7. 保留期与存储类别 (Retention & Storage Classes)

Bucket 类型 默认保留期 成本级别 使用场景
_Default 30 天 标准 大多数日志
_Required 400 天 标准 审计日志 (不可变)
自定义 bucket 1 天 – 永久 视情况而定 归档, 合规性

注意: _Required bucket 中的日志无法被排除或提前删除。

8. 成本管理最佳实践 (2025–2026)

  1. 使用结构化日志 → 更好的查询和指标分析
  2. 设置积极的排除过滤器(排除健康检查、负载均衡器探测、嘈杂的 DEBUG 日志)
  3. 将高流量/低价值的日志路由到短期保留空间或 Storage
  4. 使用基于日志的指标,而不是反复查询海量数据
  5. 通过 Billing → Logs Router 指标监控摄取量
  6. 为不同的日志类别创建自定义保留 bucket
  7. 定期查看 Logs Explorer 中的 “Top log sources”

9. 与其他 Google Cloud 服务的集成

10. 快速入门清单

  1. 启用 Cloud Logging API(通常已默认开启)
  2. 在 VM 上安装 Ops Agent 或在代码中使用 client library
  3. 发送结构化日志
  4. 前往 Logs Explorer → 执行基本查询
  5. 创建 2–3 个基于日志的指标(错误数、延迟)
  6. 设置一个排除过滤器(例如:排除健康检查)
  7. 为重要日志创建一个指向 BigQuery 或 Storage 的 sink
  8. 基于日志指标设置告警策略

这涵盖了截至 2026 年在生产环境中使用 Cloud Logging 的大部分实用场景。

参考资料:


Back

x-ai/grok-4.1-fast

Donate