Скачать [Школа Больших Данных] Аналитика больших данных для руководителей [Николай Комиссаренко]

Информация
Цена: 495 РУБ
Организатор: Kail Kail
Ссылки для скачивания
Kail
Kail
Организатор
Организатор
Регистрация
09.04.2020
Сообщения
392 204
Реакции
38 190
Монеты
1 191
Оплачено
0
Баллы
0
  • #SkladchinaVip
  • #1
[Школа Больших Данных] Аналитика больших данных для руководителей [Николай Комиссаренко]
Ссылка на картинку
Аналитика больших данных для руководителей

Все, что нужно знать для успешной работы с большими данными: методы аналитики и машинного обучения, принципы работы и функциональные возможности компонентов экосистемы Hadoop, безопасность озера данных, цифровизация бизнеса.

О продукте:

Сегодня информация — это основа любого бизнеса, инструмент эффективного управления и оптимизации рабочих процессов. Аналитика больших данных (Big Data) вашего бизнеса поможет своевременно выявить и даже предупредить множество проблем, от оттока клиентов до утечки персональных данных. Чтобы понимать возможности современных технологий и выбирать среди них наилучшее соотношение «стоимость/результат», менеджеру необходимо разбираться в базовых понятиях и прикладных решениях.
Теоретический курс «Аналитика больших данных для руководителей» ориентирован на руководство государственных предприятий и частных компаний, менеджеров и специалистов, которые хотят получить расширенные знания по инструментам и методам анализа больших данных для участия в проектах Big Data и цифровизации бизнеса, в том числе, в условиях импортозамещения.

Аудитория: Руководство государственных предприятий и частных компаний, менеджеры и специалисты.
Уровень подготовки: Предварительный опыт не требуется.

Программа курса:

1. Введение в Big Data (Большие данные)
  • Большие данные и цифровизация бизнеса.
  • Базовые принципы и отличия от классических подходов к работе с данными.
  • Обзор методологии CRISP DM — модели жизненного цикла аналитики данных: получение данных, подготовка данных, планирование модели, построение модели, проверка результатов, внедрение.
  • Отраслевая специфика аналитики больших данных. Общий разбор отраслевых сценариев (cases).
  • Тенденции в подходах Big Data и что актуально на сегодняшний день.
  • Технологии Big Data в условиях импортозамещения.
2. Понимание Бизнеса (Business Understanding)
  • Определение бизнес целей для проекта Big Data.
  • Отраслевая специфика аналитики больших данных. Общий разбор отраслевых сценариев (cases).
  • Инициация проекта — критические факторы успеха. Основные проблемы.
  • Оценка ситуации: риски, ROI, доступные ресурсы, оценка зрелости компании.
  • Приоритизация задач: Что делаем, а что нет.
  • Высокоуровневый план проекта.
  • Начинаем формировать команду проекта: специалисты и их компетенции, роли.
3. Понимание данных (Data Understanding)
  • Определение источников данных.
  • Специфика работы с потоковыми данными и batch в Big Data.
  • Принципы формирования Data Lake: выбор платформы.
  • Первичный сбор и анализ данных: инструментарий и доступные методы.
  • Описание данных и сбор метаданных.
  • Data management и Data Governance.
  • Оценка качества данных Data Quality.
  • Основные трудности и проблемы, критические факторы успеха, роли и навыки.
  • Разбор сценариев (cases) для фазы Data Understanding.
4. Подготовка данных (Data Preparation)
  • Подготовка данных – подходы Data Science: нормализация, очистка, выборки, enrichment, форматирование данных.
  • Подготовка данных – как процесс формирования Data Pipeline:
    • Процессы ETL и ELT,
    • Зонирование Data Lake и сегментирование данных,
    • Назначение и сравнительная характеристика компонент экосистемы Apache Hadoop, NoSQL, DWH, платформ потоковой обработки для хранения и обработки Big Data на примерах (отраслевые сценарии),
    • Инструменты оркестрирования и автоматизации (Data Flow).
  • И снова о Метаданных: Data Lineage, Data Provenance, Data Governance, …
  • Безопасность больших данных.
  • Основные трудности и проблемы, критические факторы успеха.
  • Специалисты и их компетенции на данной стадии.
5. Выбор и построение моделей (Modeling)
  • Классы аналитических задач и подходы к их решению.
  • Обзор техник моделирования.
  • Построение моделей и оценка моделей.
  • Что нужно для успешного моделирования.
  • Инструментарий для решения аналитических задач этапа моделирования.
  • Оценка моделей и среда тестирования моделей: технические метрики оценки качества проведенного моделирования.
  • А также песочницы, Machine & Deep learning, AI, Нейронные сети и многое другое.
  • Команда Data Science и их компетенции.
  • Основные трудности и проблемы фазы моделирования, критические факторы успеха.
  • Облачные платформы для быстрой разработки.
  • Место DevOps, MLOps для организации процессов разработки.
  • Рассмотрение фазы моделирования на сквозных сценариях (cases): место, участники, взаимодействие с другими фазами и процессами.
6. Оценка результатов (Evaluation)
  • Про бизнес-метрики оценки качества моделирования.
  • Что делать если все плохо? – возвращаемся на предыдущие фазы.
  • Рассматриваем данную стадию в рамках наших сценариев (cases).
  • Отличия среды разработки и эксплуатации.
  • Особенности этапа оценки.
7. Развертывание (Deployment)
  • Планирование развертывания модели.
  • Мониторинг и обслуживание модели.
  • Методологии автоматизации и вывода продуктов в промышленную эксплуатацию – DevOps и MLOps.
  • Задачи финального обеспечения фаз жизненного цикла Data Science: цикличность reviews, обновления и вывод из эксплуатации.
8. Финальная переоценка проекта
  • Постанализ рисков и BIA, ROI и генерация ценности.
  • Допущенные просчеты и методы их решения.
  • Оценка процессов и оценка зрелости компании.
  • Типичные ошибки применения CRISP DM.
  • Альтернативные подходы и расширения CRISP DM (Domino, TDSP, SEMMA).
Чему Вы научитесь:
  • Разбираться в основных понятиях Больших Данных, Машинного обучения (Machine Learning), Искусственного интеллекта (Artificial Intelligence)
  • понимать назначение компонентов экосистемы Hadoop, Spark, Kafka или терминов Data Lake, Delta Lake,
  • знать, в чем отличие Apache Hadoop, Arenadata, NoSQL, MPP или Greenplum,
  • выявить нюансы облачных решений, контейнеризации и применимости к вашей отрасли бизнеса,
  • знать, что такое политики Data Governance,
  • знать особенности применения методологий для реализации процессов аналитики больших данных на примере CRISP-DM.
Показать больше
 
Зарегистрируйтесь , чтобы посмотреть скрытый контент.
Поиск по тегу:
Теги
02-06-2024 аналитика больших данных для руководителей николай комиссаренко школа больших данных
Похожие складчины
Kail
Ответы
0
Просмотры
269
Kail
Kail
Kail
Ответы
0
Просмотры
263
Kail
Kail
Kail
Ответы
0
Просмотры
189
Kail
Kail
Показать больше складчин

Войдите или зарегистрируйтесь

Вы должны быть авторизованны для просмотра материала

Создать аккаунт

Создать учетную запись займет не больше минуты!

Войти

Уже зарегистрированы? Просто войдите.