Справка
x
Поиск
Закладки
Озвучить книгу
Изменить режим чтения
Изменить размер шрифта
Оглавление
Для озвучивания и цитирования книги перейдите в режим постраничного просмотра.
Анализ больших наборов данных
ГЛАВА 4. Анализ потоков данных
Поставить закладку
4.1. Потоковая модель данных
Если Вы наш подписчик,то для того чтобы скопировать текст этой страницы в свой конспект,
используйте
просмотр в виде pdf
. Вам доступно 6 стр. из этой главы.
Для продолжения работы требуется
Регистрация
Предыдущая страница
Следующая страница
Оглавление
Предисловие
+
ГЛАВА 1. Добыча данных
+
ГЛАВА 2. MapReduce и новый программный стек
+
ГЛАВА 3. Поиск похожих объектов
+
ГЛАВА 4. Анализ потоков данных
-
4.1. Потоковая модель данных
4.1.1. Система управления потоками данных
4.1.2. Примеры источников потоков данных
4.1.3. Запросы к потокам
4.1.4. Проблемы обработки потоков
4.2. Выборка данных из потока
4.2.1. Пояснительный пример
4.2.2. Получение репрезентативной выборки
4.2.3. Общая постановка задачи о выборке
4.2.4. Динамическое изменение размера выборки
4.2.5. Упражнения к разделу 4.2
4.3. Фильтрация потоков
4.3.1. Пояснительный пример
4.3.2. Фильтр Блума
4.3.3. Анализ фильтра Блума
4.3.4. Упражнения к разделу 4.3
4.4. Подсчет различных элементов в потоке
4.4.1. Проблема Count-Distinct
4.4.2. Алгоритм Флажоле-Мартена
4.4.3. Комбинирование оценок
4.4.4. Требования к памяти
4.4.5. Упражнения к разделу 4.4
4.5. Оценивание моментов
4.5.1. Определение моментов
4.5.2. Алгоритм Алона-Матиаса-Сегеди для вторых моментов
4.5.3. Почему работает алгоритм Алона-Матиаса-Сегеди
4.5.4. Моменты высших порядков
4.5.5. Обработка бесконечных потоков
4.5.6. Упражнения к разделу 4.5
4.6. Подсчет единиц в окне
4.6.1. Стоимость точного подсчета
4.6.2. Алгоритм Датара-Гиониса-Индыка-Мотвани
4.6.3. Требования к объему памяти для алгоритма DGIM
4.6.4. Ответы на вопросы в алгоритме DGIM
4.6.5. Поддержание условий DGIM
4.6.6. Уменьшение погрешности
4.6.7. Обобщения алгоритма подсчета единиц
4.6.8. Упражнения к разделу 4.6
4.7. Затухающие окна
4.7.1. Задача о самых частых элементах
4.7.2. Определение затухающего окна
4.7.3. Нахождение самых популярных элементов
4.8. Резюме
4.9. Список литературы
ГЛАВА 5. Анализ ссылок
+
ГЛАВА 6. Частые предметные наборы
+
ГЛАВА 7. Кластеризация
+
ГЛАВА 8. Реклама в Интернете
+
ГЛАВА 9. Рекомендательные системы
+
ГЛАВА 10. Анализ графов социальных сетей
+
ГЛАВА 11. Понижение размерности
+
ГЛАВА 12. Машинное обучение на больших данных
+
Предметный указатель
Данный блок поддерживает скрол*