Программирование [Виталий Лихачев] [Balun.Courses] Observability, как в BigTech. Тариф Стандарт (2025)

Cuddlies

МОДЕРАТОР
Регистрация
7 Апр 2025
Сообщения
7,451
Реакции
0
[Виталий Лихачев] [Balun.Courses] Observability, как в BigTech. Тариф Стандарт (2025)

1755007752976



Слив курса Observability, как в BigTech [Тариф Стандарт] [Balun.Courses] [Виталий Лихачев]
Глубокий курс о том, как поставлять логи, метрики, трейсы, делать информативные дашборды, быстро устранять инциденты и правильно интерпретировать данные

Вопросы, на которые ответит курс:
  • Как правильно строить дашборды, алерты и как интерпретировать данные на уровне Senior’ов и TeamLead'ов
  • Как строить полезные метрики, которые не расходуют лишние ресурсы на хранение
  • Как писать логи, в которых потом легко разобраться
  • Как правильно оценить нагрузку для новой фичи или сервиса и уменьшить количество инцидентов
  • Как найти причину инцидента за пару минут и всегда держать руку на пульсе
  • Как с помощью Observability экономить деньги работодателю, показывать бизнес-метрики и повышать себе ЗП на perfomance review
За 2,5 месяца изучаем best practices, которые используют в BigTech
Глубоко изучишь основы и лучшие практики Observability: метрики, логи, трейсы и многое другое
Научишься инструментировать любые сервисы для достижения хорошего observability
Научишься эксплуатировать сервисы: настройка, масштабирование и оптимизация инфраструктуры для сбора метрик, настройка хранилищ и систем алертинга
Построишь эффективные и не перегруженные дашборды для мониторинга состояния системы и приложений
Научишься управлять стабильностью системы и предсказывать ее поведение
Изучишь все плюсы и минусы Prometheus, Grafana Loki, Jaeger и поймешь, что и когда нужно использовать

Программа курса:
  • Урок 1. Введение в Observability
  • Урок 2. Метрики: основные концепции и работа с ними
  • Урок 3. Хранилища метрик и их выбор
  • Урок 4. Визуализация и управление метриками
  • Урок 5. Логирование и структурированные логи
  • Урок 6. Трейсинг
  • Урок 7. Оптимизация наблюдаемости и оптимизация сервисов
  • Урок 8. Управление алертингом
  • Урок 9. Использование метрик для управления поведением приложения
  • Урок 10. Observability как часть SRE — практики и проблемы эксплуатации
  • Урок 11. Стратегии для больших систем
Спойлер: Подробная программа:
Урок 1
Введение в Observability


Теория:
• Что такое Observability: основные аспекты (метрики, логи, трейсы, профили).
• Зачем нужна наблюдаемость для микросервисов.
• Структурные отличия observability для монолитов и микросервисов.
• Инструменты Observability: обзор (Prometheus, Graphite, Grafana, Grafana Alloy, Grafana Pyroscope, Grafana Tempo, OpenTelemetry, Loki, Jaeger, Clickhouse).

Практика:
• Настройка базового проекта на Go.
• Интеграция базового мониторинга с Prometheus и с push gateway.
• Интеграция с graphite
• Интеграция с Loki
• Примеры использования инструментов observability
• Пример сбора runtime-метрик golang приложения.

Урок 2
Метрики: основные концепции и работа с ними


Теория:
• Разные подходы к работе с метриками: push vs pull.
• Архитектура Prometheus.
• Кардинальность метрик: что это и почему важно.
• Влияние системы сбора метрик на производительность.
• Эффективное именование метрик
• Разница бизнес метрик и технических метрик
• Влияние метрик на принятие бизнес решений

Практика:
• Создание и экспорт пользовательских метрик: счетчики, гистограммы, таймеры, скаляры (gauges), summaries.
• Анализ влияния высокой кардинальности на производительность.

Урок 3
Хранилища метрик и их выбор


Теория:
• Особенности архитектуры хранилищ метрик (Prometheus TSDB, VictoriaMetrics, Thanos, Graphite, Clickhouse).
• Выбор хранилища в зависимости от нагрузки и объемов данных.
• Проблемы хранения большого объема данных: retention, агрегация, компрессия.

Практика:
• Оптимизация сбора метрик prometheus с тяжелых endpoints
• Антипаттерны реализации /metrics в связке с prometheus
• Настройка локального Prometheus в связке с VictoriaMetrics и удаленного хранилища.
• Использование graphite.
• Импорт/Экспорт метрик.
• Сравнение производительности при использовании разных хранилищ.

Урок 4
Визуализация и управление метриками


Теория:
• Лучшие практики построения дашбордов.
• Антипаттерны построения дашбордов.
• Типы графиков и их применение: временные ряды, heatmap, гистограммы, gauges, etc.
• Как избежать перегруженных дашбордов.
• 4 Golden Signals и их значение для мониторинга.
• RED/USE методы построения дашбордов

Практика:
• Управление метриками: агрегация, квантили, экспоненциальное скользящее среднее.
• Создание дашбордов в Grafana для анализа Golden Signals.
• Практическое задание: построить дашборд для микросервиса.
• Продвинутая настройка grafana: версионирование дашбордов, интеграция с несколькими Скачать
 📥 Скрытое содержимое! Войдите или Зарегистрируйтесь
 
30,699Темы
30,763Сообщения
181Пользователи
edikStoНовый пользователь
Сверху