Поиск
Расписание курсов
Поиск

+7 (495) 913-75-75 доб.221

+7 (495) 668-08-42

+7 (812) 441-33-15

+7 (901) 374-07-97

+7 (383) 263-31-70

+7 (861) 944-79-98

+7 (391) 272-07-31

Почта

edu@fors.ru

Python для анализа данных

Посмотреть расписание этого курса
  • Код курса: F.PY4DS
  • Длительность: 4 д.
  • Цена: 48 000 р.
Записаться Добавить в корзину

Описание курса

Продолжительность курса — 4 дня (32 академических часа).

На этом курсе слушатели изучают важнейшие библиотеки и инструменты Python для анализа данных (Data science). Также на курсе рассматриваются средства Python для визуализации данных, извлечения данных из всемирной паутины, основы работы с СУБД PostgreSQL, машинного обучения и обработки текстовых документов и произведений на обычных языках.

Целевая аудитория.

Курс предназначен для аналитиков, разработчиков и специалистов по статистическому анализу данных и трендов. Приветствуется базовый опыт работы с операционными системами GNU/Linux и/или UNIX, и минимальные знания в области программирования.

Результат курса.

В результате прослушивания курса слушатели:

·     Получат общее понимание процесса анализа, извлечения и визуализации данных, построения гипотез и тестирования;

·     Освоят работу с окружением Python и основными требуемыми инструментами и библиотеками;

·     Изучат работу с базовыми концепциями, понятиями, принципами и возможностями Python: типами данных, базовыми структурами данных, функциями и основами ООП;

·     Изучат высокоуровневый математический инструментарий, предоставляемый пакетом NumPy;

·     Освоят вычисления с помощью пакета SciPy;

·     Смогут производить анализ и манипулирование данными с помощью пакета Pandas;

·     Получат навыки машинного обучения с использованием Scikit-Learn;

·     Освоят визуализацию с помощью средств Mathplotlib.

·     Изучат базовые принципы машинного обучения с учителем и без него, а также основные методики, например, регрессию, кластеризацию, поиск ближайших соседей (K-NN), деревья решений, понижение размерности;

·     Изучат использование Scikit-Learn для обработки текстов на обычных языках;

·     Освоят автоматизированное получение данных из WEB;

·     Изучат основы работы с СУБД.

 

Программа курса

1      Введение и настройка рабочей среды.

1.1      Создание виртуального окружения Python.

1.2      Установка IPython.

1.3      Установка и настройка Jupyter Notebooks.

2      Основы Python.

2.1      Типы данных и объекты.

2.2      Загрузка пакетов, пространства имен.

2.3      Чтение и запись данных.

2.4      Простое рисование графиков.

2.5      Управление потоком выполнение и ветвление.

2.6      Отладка.

2.7      Профилирование кода.

3      Подготовка и доступ к данным.

3.1      Загрузка CSV.

3.2      Подключение к СУБД на примере PostgreSQL.

3.3      Устранение излишней и избыточной информации.

3.4      Нормализация данных.

3.5      Форматирование данных.

4      Анализ, исследование и визуализация данных.

4.1      Работа с NumPy.

4.2      Массивы в NumPy.

4.3      Файлы, отображаемые в память.

4.4      Визуализация с помощью Mathplotlib.

5      Извлечение и манипулирование данными  Pandas.

5.1      Манипулирование данными в Pandas.

5.2      Статистический анализ.

5.3      Анализ временных серий.

6      Машинное обучение.

6.1      Организация входных данных.

6.2      Интерфейсы оценки, предсказания и трансформации.

6.3      Препроцессинг.

6.4      Регрессия.

6.5      Классификация.

6.6      Кластеризация.

Записаться на курс: Python для анализа данных

Начало курса:



Поделиться
Отправьте другу или начальнику ссылку на почту
Заявка на обучение

Заявка на обучение

Записаться на курс:

Выберите дату начала курса: