0
Вход
Центр компетенций

Анализ данных и визуализация в R

  • Код курса: F.BDDSDAV
  • Длительность: 5 д.
  • Цена: 90 000 Р

Целевой аудиторией:

  • Аналитики, статистики и специалисты по исследованию данных, собирающиеся использовать в работе один из наиболее популярных инструментов в области статистики и науки о данных — язык R.
Предварительная подготовка:
  • Базовые знания основ статистики.
  • Минимальный опыт программирования.
Аннотация:
 
Курс предоставляет навыки программирования на языке R для решения практических задач в среде RStudio. Слушатели изучат типичный жизненный цикл проекта исследования данных. Слушатели научатся импортировать исходные данные, подготавливать и преобразовывать их для дальнейшей обработки, визуализировать, моделировать и публиковать результаты. Курс сфокусирован на практике применения основных инструментов анализа и визуализации данных. Результатом курса будет получение слушателями навыков обработки, преобразования, анализа и визуализации различных типов данных, создания отчетов, а также получения читаемого и качественно задокументированного кода.
 
Программа курса:
  1. Обзор основных методов.
    1. Классификация.
    2. Регрессия.
    3. Кластеризация.
    4. Ассоциативный анализ.
    5. Визуализация.
    6. Обнаружение аномалий.
  2. Введение в R.
    1. Обзор языка.
    2. Работа в RStudio.
    3. R Console.
    4. Code Editor.
    5. Комментарии.
    6. Структура языка R.
    7. Типы данных.
    8. Векторы.
    9. Списки.
    10. Матрицы.
    11. Объекты Data Frame.
    12. Ветвление.
    13. Циклы.
    14. Функции.
  3. Загрузка, подготовка и преобразование данных.
    1. Пакет readr.
    2. Чтение данных из файлов.
    3. Чтение данных из БД, WEB и иных источников.
    4. Генерация последовательностей.
    5. Подмножества.
    6. Векторизация.
    7. Предварительная очистка.
    8. Обработка пропусков данных.
    9. Зашумленные данные.
    10. Унификация, трансформация и дискретизация.
    11. Понижение размерности.
    12. Сжатие данных.
  4. Визуализация.
    1. Пакет ggplot2.
    2. Основные виды графиков и гистограмм.
    3. Геометрические объекты.
    4. Статистические трансформации.
    5. Подстройка.
    6. Системы координат.
  5. Операции над данными.
    1. Пакет tidyr.
    2. Пакет dplyr.
    3. Реляционные операции в dplyr.
  6. Работа со строками в R.
    1. Пакет stringr.
    2. Регулярные выражения.
    3. Строчные манипуляции.
  7. Работа с факторами.
    1. Пакет forcats.
    2. Факторизация.
    3. Манипулирование факторами.
  8. Работа с временем и датами.
    1. Пакет lubridate.
    2. Создание объектов date/time.
    3. Отрезки времени.
    4. Временные зоны.
  9. Программирование.
    1. Конвейеры, пакет magrittr.
    2. Использование функций.
    3. Работа с векторами.
    4. Итераторы purrr.
  10. Модели.
    1. Статистические.
    2. Линейная и логистическая регрессия.
    3. Кластерный анализ.
    4. Ассоциативные правила.
  11. Публикация.
    1. Разметка R Markdown.
    2. Форматы разметки.
    3. Документирование, пакет knitr.
    4. Пакет pmml.
Записаться на курс: Анализ данных и визуализация в R

Город проведения

* - обязательные поля


Поделиться
Отправьте другу или начальнику ссылку на почту
Заявка на обучение

* - обязательные поля

Заявка на обучение

Записаться на курс:

Город:

Дата:

Город проведения

* - обязательные поля