1. Kail

    Скачать  [ДМК] Apache Arrow. Обработка больших данных в оперативной памяти [Мэтью Топол]

    Apache Arrow – это программная платформа с открытым исходным кодом, предназначенная для разработки приложений, эффективно выполняющих обработку и анализ табличных данных за счет размещения в оперативной памяти. В обновленном втором издании представлен обзор формата Arrow с акцентом на его...
  2. Kail

    Скачать  Apache Kafka. Потоковая обработка и анализ данных. 2-е издание [Гвен Шапира, Тодд Палино]

    При работе любого корпоративного приложения образуются данные: файлы журналов, показатели, информация об активности пользователей, исходящие сообщения и другие. Правильное управление этими данными не менее важно, чем сами данные. Если вы архитектор, разработчик или инженер-технолог, но вы пока...
  3. Kail

    Скачать  Apache Airflow и конвейеры обработки данных [Бас Харенслак, Джулиан де Руйтер]

    онвейеры обработки данных управляют потоком данных с момента их первоначального сбора до консолидации, очистки, анализа, визуализации и многого другого. Apache Airflow предоставляет единую платформу, которую можно использовать для проектирования, реализации, мониторинга и обслуживания...
  4. Kail

    Скачать  [Neuro-Wave] Очищение оперативной памяти мозга

    С возрастом мозг становится менее продуктивным: вы медленнее думаете, ваша память ухудшается, вы буквально начинаете “сбоить”. Хроническая усталость, отсутствие мотивации и неспособность сосредоточиться на цели также являются следствием “износа” мозга. На самом деле мозг не стареет. Он начинает...
  5. Kail

    Скачать  [ДМК] Инженерия данных в Python [Cuantum Technologies]

    Перед вами полноценный путеводитель в увлекательный мир обработки данных при помощи Pandas, NumPy и Scikit-learn. Она содержит множество примеров, которые помогут вам научиться преобразовывать сырые крупицы данных в настоящий шедевр из ценной информации и аналитических выводов. Книга написана...
  6. Kail

    Скачать  [ДМК] Как на самом деле работают компьютеры [Джастис Мэтью]

    Оригинальное название: "How Computers Really Work: A Hands-On Guide to the Inner Workings of the Machine" Эта книга по экосистеме персонального компьютера: от оперативной памяти, тактовых сигналов и машинного кода до языков программирования, операционных систем и интернета. Но вы не просто...
  7. Kail

    Скачать  [ДМК] Apache Pulsar в действии [Давид Хьеррумгор]

    Надежный обмен сообщениями между серверами является сердцем распределенного приложения. Apache Pulsar — это гибкая платформа обмена сообщениями в реальном времени, созданная для работы в Kubernetes и обеспечивающая масштабируемость и отказоустойчивость, необходимые для облачных систем. Pulsar...
  8. Kail

    Скачать  [Школа Больших Данных] Аналитика больших данных для руководителей [Николай Комиссаренко]

    Аналитика больших данных для руководителей Все, что нужно знать для успешной работы с большими данными: методы аналитики и машинного обучения, принципы работы и функциональные возможности компонентов экосистемы Hadoop, безопасность озера данных, цифровизация бизнеса. О продукте: Сегодня...
  9. Kail

    Скачать  Обработка больших данных [Джейд Картер]

    Книга является пособием для изучения технологий больших данных, охватывая основные и продвинутые аспекты работы с данными в распределенных системах. Начав с основ, она объясняет значение БД, их эволюцию и экосистему Hadoop, включая компоненты и инструменты: HDFS, MapReduce, Hive, Pig, HBase...
  10. Kail

    Скачать  Полный бред! Скептицизм в мире больших данных [Карл Бергстром]

    Книга о том, как распознавать ложь, дезинформацию, фейковые новости и не попасться на удочку красивых графиков, убедительной статистики и наукообразных терминов. В отличие от прямой лжи чушь звучит весьма правдоподобно. Это информация, про которую нельзя однозначно сказать, что она ложна, но...
  11. Kail

    Скачать  [Школа Больших Данных] GreenPlum для инженеров данных

    Часть 1. Основы GreenPlum: GreenPlum как реляционная MPP СУБД Введение в GreenPlum Архитектура GreenPlum Партиционирование таблиц, индексы Транзакции и блокировки Оптимизация и планы запросов Лабораторная работа Часть 2. Внешние данные и код: GreenPlum как агрегатор данных и исполнитель кода...
  12. Kail

    Скачать  Укрощение больших данных [Билл Фрэнкс]

    Описание О чем эта книга Автор этой книги понятным неспециалисту языком рассказывает о том, что такое большие данные, как они меняют мир и что нужно делать, чтобы повысить уровень аналитики в своей организации и принимать взвешенные решения, основанные на информации. Из этой книги вы узнаете...
  13. Kail

    Скачать  [ДМК] Анализ и визуализация данных в Yandex DataLens [Александр Гинько]

    Современный мир невозможно представить без данных, и от их визуального представления во многом зависит эффективность работы с ними. Эта книга подробно рассказывает о Yandex DataLens — одном из мощнейших средств анализа и визуализации данных. Среди рассматриваемых тем: • подключение к данным из...
  14. Kail

    Скачать  [ДМК] Визуализация данных при помощи дашбордов и отчетов в Excel [Дик Куслейка]

    Эта книга научит вас мыслить новыми категориями, а не просто представлять данные в виде строк и столбцов. Вы сможете перекинуть мостик от элементарной работы с данными к их систематизации и выстраиванию на их основе полноценных историй. Узнаете, как обращаться с выбросами и представлять...
  15. Kail

    Скачать  [Stepik] Apache Airflow для аналитиков данных [Дмитрий Новиков]

    Apache Airflow для аналитиков данных Какие темы затронем Разберем что такое пайплайн и зачем нам DAG Изучим основы Airflow и напишем первый скрипт Разберемся с архитектурой и интерфейсом Установим свой Airflow в Docker Погрузимся в best practices по разработке Что после? После курса полученных...
  16. Kail

    Скачать  Технология хранения и обработки больших данных Hadoop [Тимур Машнин]

    Технология хранения и обработки больших данных Hadoop (Тимур Машнин) Apache Hadoop - это платформа для распределенной обработки больших наборов данных на кластерах компьютеров с использованием простых моделей программирования. В этой книге вы познакомитесь с общей архитектурой платформы...
  17. Kail

    Скачать  [productstar] Профессия: Аналитик с 0 до PRO [Денис Соболев, Илья Чухляев]

    Профессия: Аналитик(с 0 до PRO) вы с нуля освоите профессию Аналитик продуктов, подробно разберете всю специфику и инструменты данной профессии от Google Analytics, Python и BI-инструментов до Machine Learning и DataScience Чему вы научитесь Анализировать трафик и сайт На основе данных...
  18. Kail

    Скачать  [Школа Больших Данных] KAFKA: Курс Администрирование кластера Kafka

    Программа курса Администрирование кластера Kafka 1. Введение в Kafka Что такое Apache Kafka? Сценарии использования Kafka Компоненты Kafka и Kafka экосистемы Архитектура Kafka Кластер Zookeeper (Установка кластера Kafka без использования Zookeeper KIP-500) 2. Основные концепции Kafka Как...
  19. Kail

    Скачать  [Udemy] Курс для разработчиков больших данных [Deesa Technologies]

    The Big Data Developer Course Master the most in-demand big data skills: Hadoop, Sqoop, Hive, Spark, Scala, Cassandra, HBase, NIFI, Kafka and more Чему вы научитесь: Понимание архитектуры Hadoop Понимание форматов файлов и возможность выбрать правильный формат для данного варианта...
  20. Kail

    Скачать  Много цифр. Анализ больших данных при помощи Excel [Джон Форман]

    Казалось бы, термин «большие данные» понятен и доступен только специалистам. Но автор этой книги доказывает, что анализ данных можно организовать и в простом, понятном, очень эффективном и знакомом многим Excel. Причем не важно, сколько велик ваш массив данных. Техники, предложенные в этой...