Программирование [Виталий Лихачев] [Balun.Courses] Observability, как в BigTech. Тариф Стандарт (2025)

Cuddlies · Вторник в 16:01

[Виталий Лихачев] [Balun.Courses] Observability, как в BigTech. Тариф Стандарт (2025)

Слив курса Observability, как в BigTech [Тариф Стандарт] [Balun.Courses] [Виталий Лихачев]
Глубокий курс о том, как поставлять логи, метрики, трейсы, делать информативные дашборды, быстро устранять инциденты и правильно интерпретировать данные

Вопросы, на которые ответит курс:

Как правильно строить дашборды, алерты и как интерпретировать данные на уровне Senior’ов и TeamLead'ов
Как строить полезные метрики, которые не расходуют лишние ресурсы на хранение
Как писать логи, в которых потом легко разобраться
Как правильно оценить нагрузку для новой фичи или сервиса и уменьшить количество инцидентов
Как найти причину инцидента за пару минут и всегда держать руку на пульсе
Как с помощью Observability экономить деньги работодателю, показывать бизнес-метрики и повышать себе ЗП на perfomance review

За 2,5 месяца изучаем best practices, которые используют в BigTech
Глубоко изучишь основы и лучшие практики Observability: метрики, логи, трейсы и многое другое
Научишься инструментировать любые сервисы для достижения хорошего observability
Научишься эксплуатировать сервисы: настройка, масштабирование и оптимизация инфраструктуры для сбора метрик, настройка хранилищ и систем алертинга
Построишь эффективные и не перегруженные дашборды для мониторинга состояния системы и приложений
Научишься управлять стабильностью системы и предсказывать ее поведение
Изучишь все плюсы и минусы Prometheus, Grafana Loki, Jaeger и поймешь, что и когда нужно использовать

Программа курса:

Урок 1. Введение в Observability
Урок 2. Метрики: основные концепции и работа с ними
Урок 3. Хранилища метрик и их выбор
Урок 4. Визуализация и управление метриками
Урок 5. Логирование и структурированные логи
Урок 6. Трейсинг
Урок 7. Оптимизация наблюдаемости и оптимизация сервисов
Урок 8. Управление алертингом
Урок 9. Использование метрик для управления поведением приложения
Урок 10. Observability как часть SRE — практики и проблемы эксплуатации
Урок 11. Стратегии для больших систем

Спойлер: Подробная программа:
Урок 1
Введение в Observability

Теория:
• Что такое Observability: основные аспекты (метрики, логи, трейсы, профили).
• Зачем нужна наблюдаемость для микросервисов.
• Структурные отличия observability для монолитов и микросервисов.
• Инструменты Observability: обзор (Prometheus, Graphite, Grafana, Grafana Alloy, Grafana Pyroscope, Grafana Tempo, OpenTelemetry, Loki, Jaeger, Clickhouse).

Практика:
• Настройка базового проекта на Go.
• Интеграция базового мониторинга с Prometheus и с push gateway.
• Интеграция с graphite
• Интеграция с Loki
• Примеры использования инструментов observability
• Пример сбора runtime-метрик golang приложения.

Урок 2
Метрики: основные концепции и работа с ними

Теория:
• Разные подходы к работе с метриками: push vs pull.
• Архитектура Prometheus.
• Кардинальность метрик: что это и почему важно.
• Влияние системы сбора метрик на производительность.
• Эффективное именование метрик
• Разница бизнес метрик и технических метрик
• Влияние метрик на принятие бизнес решений

Практика:
• Создание и экспорт пользовательских метрик: счетчики, гистограммы, таймеры, скаляры (gauges), summaries.
• Анализ влияния высокой кардинальности на производительность.

Урок 3
Хранилища метрик и их выбор

Теория:
• Особенности архитектуры хранилищ метрик (Prometheus TSDB, VictoriaMetrics, Thanos, Graphite, Clickhouse).
• Выбор хранилища в зависимости от нагрузки и объемов данных.
• Проблемы хранения большого объема данных: retention, агрегация, компрессия.

Практика:
• Оптимизация сбора метрик prometheus с тяжелых endpoints
• Антипаттерны реализации /metrics в связке с prometheus
• Настройка локального Prometheus в связке с VictoriaMetrics и удаленного хранилища.
• Использование graphite.
• Импорт/Экспорт метрик.
• Сравнение производительности при использовании разных хранилищ.

Урок 4
Визуализация и управление метриками

Теория:
• Лучшие практики построения дашбордов.
• Антипаттерны построения дашбордов.
• Типы графиков и их применение: временные ряды, heatmap, гистограммы, gauges, etc.
• Как избежать перегруженных дашбордов.
• 4 Golden Signals и их значение для мониторинга.
• RED/USE методы построения дашбордов

Практика:
• Управление метриками: агрегация, квантили, экспоненциальное скользящее среднее.
• Создание дашбордов в Grafana для анализа Golden Signals.
• Практическое задание: построить дашборд для микросервиса.
• Продвинутая настройка grafana: версионирование дашбордов, интеграция с несколькими Скачать

📥 Скрытое содержимое! Войдите или Зарегистрируйтесь

Поиск

Программирование [Виталий Лихачев] [Balun.Courses] Observability, как в BigTech. Тариф Стандарт (2025)

Cuddlies

МОДЕРАТОР

Похожие темы