Выберите удобное для вас число,
запишитесь на курс, заполнив простую форму
Курс для аналитиков и специалистов, которые хотят углубленно изучить методы анализа данных, очистку, трансформацию, визуализацию и статистические методы.
Предварительные требования
знание Python
Цели курса
После курса вы сможете:
• Проводить комплексный анализ данных с помощью Python;
• Очищать и агрегировать большие наборы данных;
• Создавать визуализации и интерактивные отчеты;
• Применять статистические методы для проверки гипотез;
• Подготавливать данные для моделирования и машинного обучения.
Часть 1
1. Основы анализа данных
• Роль анализа данных в бизнесе
• Типы данных: структурированные и неструктурированные
• Этапы исследовательского процесса (CRISP-DM)
• Exploratory Data Analysis (EDA)
2. Среда анализа данных
• Jupyter Notebook / Google Colab
• Организация проекта
3. Загрузка и первичный анализ данных
• CSV, Excel, SQL-запросы
• Первичный обзор данных
• Типы переменных
• Проверка корректности данных
Часть 2
4. Обработка пропущенных значений
• Типы пропусков
• Удаление vs. заполнение
• Импутация данных
5. Работа с выбросами
• Методы выявления выбросов
• Z-score, IQR
• Влияние выбросов на анализ
6. Трансформация данных
• Кодирование категориальных переменных
• Нормализация и стандартизация
• Feature engineering
• Работа с датами и временем
7. Объединение и агрегация данных
• Merge, Join, Concat
• GroupBy и агрегации
• Pivot-таблицы
Часть 3
8. Описательная статистика
• Среднее, медиана, мода
• Дисперсия и стандартное отклонение
• Квартили
• Распределения
9. Корреляционный анализ
• Коэффициенты корреляции
• Интерпретация связей
• Матрица корреляций
10. Визуализация данных
• Matplotlib
• Seaborn
• Типы графиков:
o Гистограммы
o Boxplot
o Scatter plot
o Heatmap
o Pairplot
• Интерпретация визуализаций
Часть 4
11. Основы статистики
• Вероятностные распределения
• Нормальное распределение
• Центральная предельная теорема
12. Проверка гипотез
• Формулировка H0 и H1
• p-value
• Уровень значимости
• t-test
• ANOVA
• Chi-square test
13. A/B тестирование
• Постановка эксперимента
• Метрики эффективности
• Интерпретация результатов
• Типичные ошибки
Часть 5
14. Работа с временными данными
• Анализ динамики
• Скользящие средние
• Сезонность
15. Основы регрессионного анализа
• Линейная регрессия
• Интерпретация коэффициентов
• Метрики качества модели
16. Подготовка аналитического отчёта
• Визуальное представление результатов
• Storytelling с данными
• Подготовка презентации для бизнеса
• Ошибки интерпретации