Главная

 / 

PYTHON для анализа данных

PYTHON для анализа данных 

(GAL - PYTHONBIGDATA)

Описание

На курсе “PYTHON для анализа данных (GAL – PYTHONBIGDATA)” рассмотрим основные возможности Python (Питон) при работе с большими объемами данных с использованием локальным и/или облачных сред.

Кому полезен курс

Инженеры по работе с данными, а также разработчики ПО, желающие изучить основы машинной обработки данных

Вступительные требования

Предварительное прохождение курса Основы программирования в Python или наличие знаний в рамках этого курса.

Результат обучения

Программа курса

Модуль 1: Введение и Среда разработки.

Модуль 1: Введение и Среда разработки

  1. Введение в анализ данных
    • Основные понятия и цели анализа данных
    • Примеры использования анализа данных в реальных проектах
  2. Установка и настройка Python и Jupyter Lab
    • Установка Python и Jupyter Lab
    • Основные возможности и интерфейс Jupyter Lab
  3. Основы Python
    • Быстрый обзор синтаксиса Python: типы данных, переменные, условные операторы и циклы
  4. Основы Numpy
    • Основные массивы и операции с ними
    • Основные математические функции и статистические методы

Примеры на Python:

  • Работа с массивами Numpy, арифметические операции, агрегатные функции

Лабораторная работа 1: Работа с Jupyter Lab и Numpy (создание массивов, выполнение базовых операций и построение простых графиков)

Модуль 2: Обработка данных с Pandas.

Модуль 2: Обработка данных с Pandas

  1. Введение в Pandas
    • Основные понятия и структура DataFrame
    • Создание, чтение и запись DataFrame
  2. Работа с DataFrame
    • Основные операции: фильтрация, сортировка, группировка и агрегатные функции
    • Преобразование данных: работа с пропущенными значениями, дублирование данных
  3. Объединение данных
    • Соединение, объединение, слияние DataFrame

Примеры на Python:

  • Работа с реальными данными в DataFrame, примеры загрузки и манипуляции данных

Лабораторная работа 2: Создание и манипуляция DataFrame в Pandas (работа с набором данных, выполнение различных операций и преобразований)

Модуль 3: Визуализация данных с Matplotlib и Seaborn.

Модуль 3: Визуализация данных с Matplotlib и Seaborn

  1. Основы Matplotlib
    • Установка и основные принципы работы
    • Простые графики: линейные, столбчатые, гистограммы и круговые диаграммы
  2. Расширенные возможности Matplotlib
    • Настройка графиков: оси, метки, легенды и стиль
  3. Введение в Seaborn
    • Основные возможности и интеграция с Matplotlib
    • Визуализация категориальных данных и тепловых карт

Примеры на Python:

  • Построение различных графиков для анализа реальных данных

Лабораторная работа 3: Визуализация данных с Matplotlib и Seaborn (создание и настройка различных типов графиков для различных наборов данных)

 

Модуль 4: Подготовка данных для машинного обучения и Feature Engineering.

Модуль 4: Подготовка данных для машинного обучения и Feature Engineering

  1. Подготовка данных
    • Очистка данных: работа с пропущенными значениями, выявление и обработка выбросов
    • Преобразование данных: нормализация, стандартизация, кодирование категориальных данных
  2. Feature Engineering
    • Процесс создания новых признаков из существующих данных
    • Методы выбора признаков

Примеры на Python:

  • Подготовка данных для машинного обучения, создание новых признаков и выбор важных признаков

Лабораторная работа 4: Подготовка данных и Feature Engineering (очистка данных, преобразование данных и создание новых признаков для набора данных)

Модуль 5: Введение в машинное обучение и глубокое обучение с TensorFlow

Модуль 5: Введение в машинное обучение и глубокое обучение с TensorFlow

  1. Основы машинного обучения
    • Введение в машинное обучение: основные концепции и терминология
    • Основные алгоритмы: линейная регрессия, классификация, кластеризация
  2. Введение в TensorFlow
    • Установка и основные принципы работы
    • Создание и обучение моделей с использованием TensorFlow
  3. Основы глубокого обучения
    • Основные концепции и архитектуры нейронных сетей
    • Обучение моделей глубокого обучения с использованием Keras

Примеры на Python:

  • Обучение простых моделей машинного обучения и глубокого обучения с использованием TensorFlow и Keras

Лабораторная работа 5: Создание и обучение моделей машинного и глубокого обучения (реализация простых моделей, их обучение и оценка на реальных данных)

PYTHON для анализа данных 

Уровень сложности курса

Средний

Направление
Длительность
40 ч./
5 дн.
Стоимость
85 000 ₽/чел.
650 000 ₽/группа
Ближайшая дата
16 марта 2026
27 июля 2026
-31 июля 2026

Оставьте заявку

Нажимая отправить Вы соглашаетесь с нашей Политикой конфиденциальности