Поиск
Расписание курсов
Поиск
Почта

edu@fors.ru

BigData Science: Основы работы с большими данными

  • Код курса: F.BBDS
  • Длительность: 2 д.
  • Цена: 36 000 Р

Аннотация:

В курсе рассматриваются вопросы:

  • источники информации: структурированные и неструктурированные;
  • основные характеристики больших данных и способы их анализа;
  • элементы классификации данных и машинного обучения;
  • основы статистического анализа, построение регрессионных зависимостей;

визуализация «больших данных»;

  • обзор классов задач, решаемых инструментами машинного обучения и ИИ:
  • распознавание образов, звуков, текста, прогностика, анализ соцсетей;
  • обзор математических инструментов решения: нейронные сети, графы, нечеткие и К-значные логики;
  • обзор прикладных инструментов: AWS, Azure AI, machine learning c демонстрацией применения;
  • специальности в области «больших данных» и формирование команд: аналитики данных, «ученые по данным», программисты по «большим данным», менеджеры по «большим данным» (CDO).

Целевая установка

Цель обучения:

  • Получение знаний о технологиях и инструментарии Big Data.
  • Приобретение компетенций по формированию информационных ресурсов с большим объемом данных и использованию инструментария Big Data в прикладных целях.
  • Повышение эффективности работы: сокращение времени выполнения заданий, уменьшение риска ошибок.

Категория слушателей:

  • Администраторы
  • Администраторы баз данных
  • Разработчики
  • Предварительные знания:
  • Представления о базе данных, data mining, программирование на Java

Форма обучения: очная

Трудоемкость программы: 16 ак. часов

Сроки освоения программы: по согласованию с Заказчиком

Режим занятий:

Занятия проводятся с 10 до 17 часов ежедневно (8 академических часов) с перерывом на обед, выходные дни – суббота и воскресенье.

Модуль/Дисциплина 1.  - Введение                                                       

Тема 1.1. Цели курса

Тема 1.2. Определение основных понятий

Тема 1.3. История науки о данных

Тема 1.4. Выгоды от работы с большими данными

Тема 1.5. Типовые задачи: прогноз продаж, производства, спроса. Анализ поведения. Распознавание образов. Экспертные системы.

Модуль/Дисциплина 2. - Сбор и подготовка исходных данных. Визуализация. Основы математической статистики. Анализ отличий (ANOVA)

Тема 2.1. С чего начать

Тема 2.2. Описательное и ассоциативное исследование исходных данных

Тема 2.3. Сегментирование данных (slice and dice)

Тема 2.4. Визуализация данных в Excel. Как использовать сводные таблицы и диаграммы.

Тема 2.5. Описательная статистика

Тема 2.6. Среднее, наиболее вероятное, медиана

Тема 2.7. Основная тенденция и отклонения. Дисперсия, стандартное отклонение

Тема 2.8. Виды распределений

Тема 2.9. Пакет анализа данных Excel

Тема 2.10. Обзор других прикладных средств работы с данными (R, Python, Octave, MathLab).

Модуль/Дисциплина 3. – Прогноз продаж. Понятие машинного обучения. Корреляция. Регрессионный анализ

Тема 3.1. Постановка задачи оценки взаимосвязи между различными факторами и построение прогноза

Тема 3.2. Корреляция. Коэффициент Пирсона

Тема 3.3. Критерий Стьюдента (T-анализ)

Тема 3.4. Основы машинного обучения

Тема 3.5. Регрессионный анализ

Тема 3.6. Критерий Фишера

Тема 3.7. Построение и анализ трендов в Excel

Модуль/Дисциплина 4. – Классификации и распознавания образов, видео, речи, текста. Понятие нейронных сетей. Примеры применения.

Тема 4.1. Задача сегментации дискретных данных на примере задач распознавания (графика, речь, текст)

Тема 4.2. Нейронные сети как инструмент решения задач классификации

Тема 4.3. Демонстрация на примерах Azure, AWS

Модуль/Дисциплина 5. - Исследования социальных сетей. Задача прогнозирования поведения пользователя. Социальные и направленные графы. Примеры применения

Тема 5.1. Задача классификации данных в социальных сетях

Тема 5.2. Графы как инструмент решения задач на социальных графах и прогнозирования поведения

Тема 5.3. Разбиение на выборки (обучающую, тестовую, проверочную)

Тема 5.4. Анализ ошибок обучения. Базис и отклонения. Ручная корректировка

Модуль/Дисциплина 6. – Продвинутые инструменты: глубокое машинное обучение, искусственный интеллект, нечеткие множества. Data Science: назначение, специальности.

Тема 6.1. Понятие Deep Machine Learning

Тема 6.2. Многофакторный бизнес анализ на примере нечетких логик

Тема 6.3. Роли специалистов по DS: аналитик данных, ученый по данным, программист, цифровой директор

Тема 6.4. Требования к компетенциям и взаимодействию сотрудников в области аналитики данных

Тема 6.5. Состав и требования к проектной команде для DS

Тема 6.6. Подготовка компании к применению «Big Data»

Записаться на курс: BigData Science: Основы работы с большими данными


Поделиться
Отправьте другу или начальнику ссылку на почту
Заявка на обучение

Заявка на обучение

Записаться на курс:

Город:

Дата:

Добавить в корзину