Cuddlies
МОДЕРАТОР
- Регистрация
- 7 Апр 2025
- Сообщения
- 7,451
- Реакции
- 0
[Виталий Лихачев] [Balun.Courses] Observability, как в BigTech. Тариф Стандарт (2025)
Слив курса Observability, как в BigTech [Тариф Стандарт] [Balun.Courses] [Виталий Лихачев]
Глубокий курс о том, как поставлять логи, метрики, трейсы, делать информативные дашборды, быстро устранять инциденты и правильно интерпретировать данные
Вопросы, на которые ответит курс:
Глубоко изучишь основы и лучшие практики Observability: метрики, логи, трейсы и многое другое
Научишься инструментировать любые сервисы для достижения хорошего observability
Научишься эксплуатировать сервисы: настройка, масштабирование и оптимизация инфраструктуры для сбора метрик, настройка хранилищ и систем алертинга
Построишь эффективные и не перегруженные дашборды для мониторинга состояния системы и приложений
Научишься управлять стабильностью системы и предсказывать ее поведение
Изучишь все плюсы и минусы Prometheus, Grafana Loki, Jaeger и поймешь, что и когда нужно использовать
Программа курса:
Урок 1
Введение в Observability
Теория:
• Что такое Observability: основные аспекты (метрики, логи, трейсы, профили).
• Зачем нужна наблюдаемость для микросервисов.
• Структурные отличия observability для монолитов и микросервисов.
• Инструменты Observability: обзор (Prometheus, Graphite, Grafana, Grafana Alloy, Grafana Pyroscope, Grafana Tempo, OpenTelemetry, Loki, Jaeger, Clickhouse).
Практика:
• Настройка базового проекта на Go.
• Интеграция базового мониторинга с Prometheus и с push gateway.
• Интеграция с graphite
• Интеграция с Loki
• Примеры использования инструментов observability
• Пример сбора runtime-метрик golang приложения.
Урок 2
Метрики: основные концепции и работа с ними
Теория:
• Разные подходы к работе с метриками: push vs pull.
• Архитектура Prometheus.
• Кардинальность метрик: что это и почему важно.
• Влияние системы сбора метрик на производительность.
• Эффективное именование метрик
• Разница бизнес метрик и технических метрик
• Влияние метрик на принятие бизнес решений
Практика:
• Создание и экспорт пользовательских метрик: счетчики, гистограммы, таймеры, скаляры (gauges), summaries.
• Анализ влияния высокой кардинальности на производительность.
Урок 3
Хранилища метрик и их выбор
Теория:
• Особенности архитектуры хранилищ метрик (Prometheus TSDB, VictoriaMetrics, Thanos, Graphite, Clickhouse).
• Выбор хранилища в зависимости от нагрузки и объемов данных.
• Проблемы хранения большого объема данных: retention, агрегация, компрессия.
Практика:
• Оптимизация сбора метрик prometheus с тяжелых endpoints
• Антипаттерны реализации /metrics в связке с prometheus
• Настройка локального Prometheus в связке с VictoriaMetrics и удаленного хранилища.
• Использование graphite.
• Импорт/Экспорт метрик.
• Сравнение производительности при использовании разных хранилищ.
Урок 4
Визуализация и управление метриками
Теория:
• Лучшие практики построения дашбордов.
• Антипаттерны построения дашбордов.
• Типы графиков и их применение: временные ряды, heatmap, гистограммы, gauges, etc.
• Как избежать перегруженных дашбордов.
• 4 Golden Signals и их значение для мониторинга.
• RED/USE методы построения дашбордов
Практика:
• Управление метриками: агрегация, квантили, экспоненциальное скользящее среднее.
• Создание дашбордов в Grafana для анализа Golden Signals.
• Практическое задание: построить дашборд для микросервиса.
• Продвинутая настройка grafana: версионирование дашбордов, интеграция с несколькими Скачать
Слив курса Observability, как в BigTech [Тариф Стандарт] [Balun.Courses] [Виталий Лихачев]
Глубокий курс о том, как поставлять логи, метрики, трейсы, делать информативные дашборды, быстро устранять инциденты и правильно интерпретировать данные
Вопросы, на которые ответит курс:
- Как правильно строить дашборды, алерты и как интерпретировать данные на уровне Senior’ов и TeamLead'ов
- Как строить полезные метрики, которые не расходуют лишние ресурсы на хранение
- Как писать логи, в которых потом легко разобраться
- Как правильно оценить нагрузку для новой фичи или сервиса и уменьшить количество инцидентов
- Как найти причину инцидента за пару минут и всегда держать руку на пульсе
- Как с помощью Observability экономить деньги работодателю, показывать бизнес-метрики и повышать себе ЗП на perfomance review
Глубоко изучишь основы и лучшие практики Observability: метрики, логи, трейсы и многое другое
Научишься инструментировать любые сервисы для достижения хорошего observability
Научишься эксплуатировать сервисы: настройка, масштабирование и оптимизация инфраструктуры для сбора метрик, настройка хранилищ и систем алертинга
Построишь эффективные и не перегруженные дашборды для мониторинга состояния системы и приложений
Научишься управлять стабильностью системы и предсказывать ее поведение
Изучишь все плюсы и минусы Prometheus, Grafana Loki, Jaeger и поймешь, что и когда нужно использовать
Программа курса:
- Урок 1. Введение в Observability
- Урок 2. Метрики: основные концепции и работа с ними
- Урок 3. Хранилища метрик и их выбор
- Урок 4. Визуализация и управление метриками
- Урок 5. Логирование и структурированные логи
- Урок 6. Трейсинг
- Урок 7. Оптимизация наблюдаемости и оптимизация сервисов
- Урок 8. Управление алертингом
- Урок 9. Использование метрик для управления поведением приложения
- Урок 10. Observability как часть SRE — практики и проблемы эксплуатации
- Урок 11. Стратегии для больших систем
Урок 1
Введение в Observability
Теория:
• Что такое Observability: основные аспекты (метрики, логи, трейсы, профили).
• Зачем нужна наблюдаемость для микросервисов.
• Структурные отличия observability для монолитов и микросервисов.
• Инструменты Observability: обзор (Prometheus, Graphite, Grafana, Grafana Alloy, Grafana Pyroscope, Grafana Tempo, OpenTelemetry, Loki, Jaeger, Clickhouse).
Практика:
• Настройка базового проекта на Go.
• Интеграция базового мониторинга с Prometheus и с push gateway.
• Интеграция с graphite
• Интеграция с Loki
• Примеры использования инструментов observability
• Пример сбора runtime-метрик golang приложения.
Урок 2
Метрики: основные концепции и работа с ними
Теория:
• Разные подходы к работе с метриками: push vs pull.
• Архитектура Prometheus.
• Кардинальность метрик: что это и почему важно.
• Влияние системы сбора метрик на производительность.
• Эффективное именование метрик
• Разница бизнес метрик и технических метрик
• Влияние метрик на принятие бизнес решений
Практика:
• Создание и экспорт пользовательских метрик: счетчики, гистограммы, таймеры, скаляры (gauges), summaries.
• Анализ влияния высокой кардинальности на производительность.
Урок 3
Хранилища метрик и их выбор
Теория:
• Особенности архитектуры хранилищ метрик (Prometheus TSDB, VictoriaMetrics, Thanos, Graphite, Clickhouse).
• Выбор хранилища в зависимости от нагрузки и объемов данных.
• Проблемы хранения большого объема данных: retention, агрегация, компрессия.
Практика:
• Оптимизация сбора метрик prometheus с тяжелых endpoints
• Антипаттерны реализации /metrics в связке с prometheus
• Настройка локального Prometheus в связке с VictoriaMetrics и удаленного хранилища.
• Использование graphite.
• Импорт/Экспорт метрик.
• Сравнение производительности при использовании разных хранилищ.
Урок 4
Визуализация и управление метриками
Теория:
• Лучшие практики построения дашбордов.
• Антипаттерны построения дашбордов.
• Типы графиков и их применение: временные ряды, heatmap, гистограммы, gauges, etc.
• Как избежать перегруженных дашбордов.
• 4 Golden Signals и их значение для мониторинга.
• RED/USE методы построения дашбордов
Практика:
• Управление метриками: агрегация, квантили, экспоненциальное скользящее среднее.
• Создание дашбордов в Grafana для анализа Golden Signals.
• Практическое задание: построить дашборд для микросервиса.
• Продвинутая настройка grafana: версионирование дашбордов, интеграция с несколькими Скачать
 📥 Скрытое содержимое! Войдите или Зарегистрируйтесь