Основы базы данных Greenplum
Предварительные требования к слушателям:
Знание SQL, опыт работы с любой реляционной СУБД, представление о NoSQL, минимальное знакомство с ОС Linux, а также о работе сетей TCP/IP.
Длительность
Доступ к курсу
Документы
Кому подойдет этот курс
Слушатели:
На практике развернут кластер Greenplum.
Изучат принципы хранения данных в Greenplum.
Научатся загружать данные в Greenplum.
Узнают как выполняются запросы в Greenplum.
Изучат запросы структурированных и полуструктурированных данных, а также полнотекстовый поиск.
Познакомятся с аналитическими возможностями Greenplum.
Узнают об устройстве и применении Greenplum PXF.
Получат знания о настройке производительности.
Научатся выполнять мониторинг Greenplum.
Узнают об аспектах безопасности Greenplum.
Программа курса
Альтернативы реляционным СУБД.
Массивно-параллельная обработка.
Архитектура Greenplum.
Оценка потребной емкости.
Варианты установки.
Настройка системы для установки Greenplum.
Создание областей хранения.
Установка Greenplum.
Проверка системы gpcheckperf.
Инициализация Greenplum.
Установка дополнительных модулей.
Настройка временной зоны и локали.
Настройка iptables.
Установка утилит управления.
Переменные окружения.
Распределение данных.
Полиморфное хранилище.
Партиционирование данных.
Колоночное хранилище.
Сжатие.
Таблицы, оптимизированные для добавления данных.
Внешние таблицы.
Индексирование.
Команда COPY.
Утилита gpfdist.
Утилита gpload.
Оптимизатор GPORCA.
PostgreSQL запросы.
Common Table Expressions.
Функции и операторы.
Работа с JSON.
Работа с XML.
Полнотекстовый поиск.
Использование Greenplum MapReduce.
Производительность запросов.
Обслуживание spill файлов.
Профилирование.
Расширения для языков программирования.
Интерфейс R.
Анализ текстовых данных.
Архитектура Solr/GPText.
Интеграция с Apache Kafka.
Архитектура PXF.
Внешние таблицы в PXF.
Доступ к Apache Hadoop.
Инструменты Resource Queues.
Менеджер нагрузки Greenplum Workload Manager.
Утилиты менеджмента Greenplum.
Стандартные причины проблемы с производительностью.
Использование оперативной памяти.
Выявление узких мест.
Сетевые порты.
Аутентификация клиентов.
Настройка авторизации.
Аудит.
Шифрование данных и сетевых соединений.