МенюКонтакты
Обучение
Москва

+7 (495) 913-75-75 доб.221

+7 (495) 668-08-42

Санкт-Петербург

+7 (812) 441-33-15

+7 (901) 374-07-97

Почта

edu@fors.ru

Data Science: Машинное обучение в R

  • Код курса: BDDSML
  • Длительность: 5 д.
  • Цена: 90 000 р.
Записаться

Описание курса

Аудитория:

Специалисты по работе с большими данными, бизнес аналитики и руководители, желающие получить расширенную теоретическую и практическую подготовку по методам Data Mining для участия в проектах анализа больших данных.

Предварительная подготовка:

  • Понимание основ статистики;
  • Опыт работы c R-Studio или знание в рамках курса BDDSDAV Data Science: Анализ данных и визуализация в R (Data Science: Data Analysis and Visualization in R).

Аннотация:

Данный курс предназначен для изучения алгоритмов машинного обучения с практическим применением техник машинного обучения реализованных в R. Рассматриваются понятия Data Mining, измерения производительности и уменьшения размерности, регрессионные модели, байессовская модель, SVM и ассоциативные правила для анализа. После успешного завершения данного курса вы сможете понимать и объяснять принципы работы алгоритмов машинного обучения и применять данные алгоритмы на реальных задачах в больших данных.

Программа курса

  1. Основы статистики и простая линейная регрессия
    • Что такое ваши данные?
    • Статистические выводы
    • Введение в машинное обучение
    • Простая линейная регрессия
    • Диагностика и трансформация
    • Коэффициент определенности
  2. Множественная линейная регрессия и обобщенная линейная модель
    • Множественная линейная регрессия
    • Допущения и диагностика
    • Обобщенные линейные модели
    • Логистическая регрессия
    • Оценка максимального правдоподобия
    • Интерпретация модели
    • Оценка соответствия модели
  3. Алгоритм ближайших соседей, наивный байессовский анализ и "проклятие размерности"
    • Алгоритм K-ближайших соседей
    • Выбор К и меры расстояния
    • Условная вероятность: теорема Байеса
    • Оценка Лапласа
    • Уменьшение размерности
    • Процедура PCA
    • Ridge и регрессия Лассо
    • Перекрестная проверка
  4. Метод опорных векторов и модели деревьев
    • Деревья решений. Bagging
    • Случайные леса. Boosting
    • Важность переменной
    • Сортировка полей и поддержка векторного классификатора
    • Метод опорных векторов
  5. Кластерный анализ и нейронные сети
    • Кластерный анализ
    • K-means кластеризация
    • Иерархическая кластеризация
    • Нейронные сети и персептроны
    • Сигмоидные нейроны
    • Сетевая топология и скрытые функции
    • Метод обратного распространения ошибки с градиентным спуском
Записаться на курс: Data Science: Машинное обучение в R

Начало курса: 02.07.2018



Поделиться
Отправьте другу или начальнику ссылку на почту
Заявка на обучение

Заявка на обучение

Записаться на курс:

Выберите дату начала курса: