Небинарный код

Observability/Материалы

study checklist

Дополнительные материалы

0 / 78материалов отмечено

Observability fundamentals

The Three Pillars of Observabilityдаёт фундамент наблюдаемости распределённых системстатья · +10 XP

↗

Google SRE Book: Monitoring Distributed Systemsобъясняет мониторинг распределённых систем с позиции SREстатья · +10 XP

↗

Google SRE Workbook: Alerting on SLOsпоказывает алертинг от SLO и error budgetстатья · +10 XP

↗

Go logs и profiling

log/slog packageдаёт API структурного логирования slog в Goдоки · +10 XP

↗

Go blog: Structured Logging with slogобъясняет мотивацию и дизайн slog в Goдоки · +10 XP

↗

net/http/pprofпоказывает HTTP-эндпоинты pprof для Go-приложенийдоки · +10 XP

↗

Profiling Go Programsучит профилировать Go-программы с помощью pprofдоки · +10 XP

↗

Diagnostics in Goобобщает диагностику производительности и отладки Goдоки · +10 XP

↗

Go tool traceобъясняет анализ трасс выполнения через go traceдоки · +10 XP

↗

Русскоязычные материалы по Go logs/profiling

Перевод: структурированное логирование в Go с помощью Slogпоказывает практическое структурное логирование через slogстатья · +10 XP

↗

Непрерывное профилирование в Go / Хабрвводит профилирование Go и типовые инструменты диагностикистатья · +10 XP

↗

Go profiling lifecycle: от разработки до прода / Хабрпоказывает современные практики логирования в Goстатья · +10 XP

↗

Go: тонкости профилирования CPU / Хабрразбирает observability-подходы для Go-сервисовстатья · +10 XP

↗

pprof в golang: исправляем утечку памяти / Хабрпомогает начать с pprof и диагностики Goстатья · +10 XP

↗

Видео: Профилирование Go приложенийпоказывает профилирование Go-приложений на реальном кейсевидео · +10 XP

↗

Metrics и Prometheus

Prometheus Documentationдаёт обзор Prometheus и его модели сбора метрикдоки · +10 XP

↗

Prometheus Data Modelобъясняет модель данных и labels в Prometheusдоки · +10 XP

↗

Prometheus Metric Typesразбирает counter, gauge, histogram и summaryдоки · +10 XP

↗

Prometheus Histograms and Summariesучит правильно использовать histogram и quantileдоки · +10 XP

↗

Prometheus: Instrumenting Go applicationsпоказывает экспорт метрик из Go-приложениядоки · +10 XP

↗

client_golangдаёт API клиентской библиотеки Prometheus для Goдоки · +10 XP

↗

PromQL Basicsобъясняет основы PromQL и селекторы временных рядовдоки · +10 XP

↗

Prometheus Functionsслужит справочником функций PromQL для анализа метрикдоки · +10 XP

↗

Prometheus Recording Rulesпоказывает recording rules для предвычисленных метрикдоки · +10 XP

↗

Prometheus: Alerting rulesобъясняет правила алертинга в Prometheusдоки · +10 XP

↗

Prometheus: When to use Pushgatewayобъясняет когда Pushgateway уместен и опасендоки · +10 XP

↗

Prometheus Security Modelразбирает модель безопасности и ограничения Prometheusдоки · +10 XP

↗

Русскоязычные материалы по Prometheus, SLO и Grafana

Prometheus + Grafana: 4 golden signals и другие подходы / Хабрпоказывает практическое внедрение Prometheus и Grafanaстатья · +10 XP

↗

Как из метрик Prometheus построить график Latency / Хабробъясняет базовые метрики и алерты Prometheusстатья · +10 XP

↗

Как работает гистограмма Prometheus? / Хабркратко вводит Prometheus как систему мониторингастатья · +10 XP

↗

Человеческим языком про метрики 4: PromQL / Хабрразбирает практику Prometheus в Kubernetes-средестатья · +10 XP

↗

Как правильно использовать rate() в Grafana / Хабркратко показывает полезные приёмы работы с Prometheusстатья · +10 XP

↗

SLI/SLO. Что такое Error Budget Burn Rate на самом деле / Хабрдаёт быстрый обзор наблюдаемости и мониторингастатья · +10 XP

↗

Основы мониторинга: Prometheus и Grafana / Хабрразбирает настройку метрик и алертов на практикестатья · +10 XP

↗

Видео: Мониторинг и Логи PROD уровняобъясняет Prometheus и Grafana через практический докладвидео · +10 XP

↗

OpenTelemetry и tracing

OpenTelemetry Goдаёт вход в OpenTelemetry для Go-приложенийдоки · +10 XP

↗

OpenTelemetry Go instrumentationпоказывает ручное инструментирование Go-кода телеметриейдоки · +10 XP

↗

OpenTelemetry Go exportersобъясняет экспорт trace и metric данных из Goдоки · +10 XP

↗

OpenTelemetry Semantic Conventionsописывает semantic conventions для унифицированной телеметриидоки · +10 XP

↗

OpenTelemetry Resource Semantic Conventionsобъясняет resource attributes и идентификацию сервисовдоки · +10 XP

↗

OpenTelemetry Context Propagationпоказывает распространение контекста между сервисамидоки · +10 XP

↗

OpenTelemetry Baggageобъясняет baggage для передачи сквозных атрибутовдоки · +10 XP

↗

OpenTelemetry Collectorвводит Collector как центральный компонент телеметриидоки · +10 XP

↗

OpenTelemetry Collector Configurationразбирает конфигурацию receivers, processors и exportersдоки · +10 XP

↗

W3C Trace Contextзадаёт стандарт передачи trace context через HTTPстатья · +10 XP

↗

Русскоязычные материалы по OpenTelemetry

OpenTelemetry стек в Go: Metrics, Tracing, Logs / Хабрразбирает OpenTelemetry и практическое трассирование сервисовстатья · +10 XP

↗

Трейсинг в Go — это просто / Хабрпоказывает внедрение распределённой трассировки через OpenTelemetryстатья · +10 XP

↗

Наблюдаемость "по-взрослому": опыт внедрения OpenTelemetry / Хаброписывает взрослое внедрение OpenTelemetry в инфраструктурестатья · +10 XP

↗

Кастомный процессор для OpenTelemetry Collector / Хабрпоказывает создание кастомного процессора OpenTelemetry Collectorстатья · +10 XP

↗

OpenTelemetry на практике / Илья Казначеев, Golang Channelразбирает OpenTelemetry на практике для Go-сервисоввидео · +10 XP

↗

OpenTelemetry для самых маленьких / Александр Гольдебаевдаёт короткое резюме материала по наблюдаемостистатья · +10 XP

↗

Grafana stack

Grafana documentationслужит входом в документацию Grafana и дашбордовдоки · +10 XP

↗

Grafana Lokiвводит Loki как систему хранения и поиска логовдоки · +10 XP

↗

Grafana Loki labels and cardinalityобъясняет кардинальность labels и цену плохих метокдоки · +10 XP

↗

Promtail EOL noticeпоказывает отправку логов в Loki через Promtailдоки · +10 XP

↗

Grafana Loki OTLPобъясняет отправку логов в Loki через OpenTelemetryдоки · +10 XP

↗

Grafana Tempoвводит Tempo как хранилище распределённых трассдоки · +10 XP

↗

Tempo: set up Collectorпоказывает отправку трасс в Tempo через Collectorдоки · +10 XP

↗

Grafana Alloyвводит Grafana Alloy как агент сбора телеметриидоки · +10 XP

↗

ELK/EFK и logs pipeline

Elastic Stack documentationдаёт вход в документацию Elastic Stackдоки · +10 XP

↗

Elastic OpenTelemetry intake APIпоказывает приём OTLP-данных в Elastic Observabilityстатья · +10 XP

↗

Fluent Bit Documentationслужит основной документацией Fluent Bit для логовдоки · +10 XP

↗

OpenSearch Documentationдаёт вход в документацию OpenSearch и observabilityдоки · +10 XP

↗

Русскоязычные материалы по logs stack

Kubernetes Observability: логгинг с EFK / Хабркратко показывает EFK-логирование в Kubernetesстатья · +10 XP

↗

Логирование в Kubernetes: как собирать, хранить, парсить и обрабатывать логи / Хабрразбирает сбор и хранение логов в Kubernetesстатья · +10 XP

↗

Централизованное логирование Docker контейнеров с Lokiпоказывает централизованное логирование Docker через Lokiстатья · +10 XP

↗

Видео: Как логи превращаются в метрики: Fluent Bit в делепоказывает превращение логов в метрики через Fluent Bitвидео · +10 XP

↗

Incident response

Google SRE Book: Postmortem Cultureобъясняет культуру blameless postmortem после инцидентовстатья · +10 XP

↗

Google SRE Workbook: Incident Responseдаёт практики реагирования на инциденты в SREстатья · +10 XP

↗

Google SRE Workbook: On-Callразбирает организацию on-call и дежурствстатья · +10 XP

↗

Incident Management at Atlassianобъясняет процесс incident management для команд разработкистатья · +10 XP

↗

PagerDuty Incident Response Docsдаёт практическое руководство по реагированию на инцидентыдоки · +10 XP

↗

Prometheus alerting practicesобъясняет хорошие практики алертинга в Prometheusдоки · +10 XP

↗

Alertmanager documentationразбирает Alertmanager, маршрутизацию и подавление алертовдоки · +10 XP

↗

Русскоязычные материалы по incident response

Постмортем инцидентов для начинающих / Хабркратко объясняет постмортемы без поиска виноватыхстатья · +10 XP

↗

SRE: управление инцидентами / Хабрразбирает SRE-подход к управлению инцидентамистатья · +10 XP

↗

Инцидент-менеджмент с нуля / Хабрдаёт практический гайд по incident managementстатья · +10 XP

↗

Руководство по проведению постмортемов / Хабрпоказывает структуру постмортема и root cause analysisстатья · +10 XP

↗