Казахстан, г. Алматы, ул. Шевченко 90, БЦ «Каратал», офис 53
Казахстан, г. Астана, ул. Иманова 19, БЦ Деловой Дом "Алма-Ата", офис 612

Даты проведения курса

Выберите удобное для вас число,
запишитесь на курс, заполнив простую форму

город: Online
20.07.2026
-
24.07.2026 Идет набор группы
записаться на курс
направление: Big Data кол-во дней: 5
кол-во часов: 40
код курса: STX-DA

Курс для аналитиков и специалистов, которые хотят углубленно изучить методы анализа данных, очистку, трансформацию, визуализацию и статистические методы.

Предварительные требования

знание Python

Цели курса

После курса вы сможете:

Проводить комплексный анализ данных с помощью Python;

Очищать и агрегировать большие наборы данных;

Создавать визуализации и интерактивные отчеты;

Применять статистические методы для проверки гипотез;

Подготавливать данные для моделирования и машинного обучения.

Часть 1

1. Основы анализа данных

Роль анализа данных в бизнесе

Типы данных: структурированные и неструктурированные

Этапы исследовательского процесса (CRISP-DM)

Exploratory Data Analysis (EDA)

2. Среда анализа данных

Jupyter Notebook / Google Colab

Организация проекта

3. Загрузка и первичный анализ данных

CSV, Excel, SQL-запросы

Первичный обзор данных

Типы переменных

Проверка корректности данных

Часть 2

4. Обработка пропущенных значений

Типы пропусков

Удаление vs. заполнение

Импутация данных

5. Работа с выбросами

Методы выявления выбросов

Z-score, IQR

Влияние выбросов на анализ

6. Трансформация данных

Кодирование категориальных переменных

Нормализация и стандартизация

Feature engineering

Работа с датами и временем

7. Объединение и агрегация данных

Merge, Join, Concat

GroupBy и агрегации

Pivot-таблицы

Часть 3

8. Описательная статистика

Среднее, медиана, мода

Дисперсия и стандартное отклонение

Квартили

Распределения

9. Корреляционный анализ

Коэффициенты корреляции

Интерпретация связей

Матрица корреляций

 

10. Визуализация данных

Matplotlib

Seaborn

Типы графиков:

o Гистограммы

o Boxplot

o Scatter plot

o Heatmap

o Pairplot

Интерпретация визуализаций

Часть 4

11. Основы статистики

Вероятностные распределения

Нормальное распределение

Центральная предельная теорема

12. Проверка гипотез

Формулировка H0 и H1

p-value

Уровень значимости

t-test

ANOVA

Chi-square test

13. A/B тестирование

Постановка эксперимента

Метрики эффективности

Интерпретация результатов

Типичные ошибки

Часть 5

14. Работа с временными данными

Анализ динамики

Скользящие средние

Сезонность

15. Основы регрессионного анализа

Линейная регрессия

Интерпретация коэффициентов

Метрики качества модели

16. Подготовка аналитического отчёта

Визуальное представление результатов

Storytelling с данными

Подготовка презентации для бизнеса

Ошибки интерпретации