Справка
x
Поиск
Закладки
Озвучить книгу
Изменить режим чтения
Изменить размер шрифта
Оглавление
Для озвучивания и цитирования книги перейдите в режим постраничного просмотра.
Анализ больших наборов данных
ГЛАВА 3. Поиск похожих объектов
Поставить закладку
3.1. Приложения поиска близкого соседям
Для продолжения работы требуется
Registration
Предыдущая страница
Следующая страница
Table of contents
Предисловие
+
ГЛАВА 1. Добыча данных
+
ГЛАВА 2. MapReduce и новый программный стек
+
ГЛАВА 3. Поиск похожих объектов
-
3.1. Приложения поиска близкого соседям
3.1.1. Сходство множеств по Жаккару
3.1.2. Сходство документов
3.1.3. Коллаборативная фильтрация как задача о сходстве множеств
3.1.4. Упражнения к разделу 3.1
3.2. Разбиение документов на шинглы
3.2.1. k-шинглы
3.2.2. Выбор размера шингла
3.2.3. Хэширование шинглов
3.2.4. Шинглы, построенные из слов
3.2.5. Упражнения к разделу 3.2
3.3. Сигнатуры множеств с сохранением сходства
3.3.1. Матричное представление множеств
3.3.2. Минхэш
3.3.3. Минхэш и коэффициент Жаккара
3.3.4. Минхэш-сигнатуры
3.3.5. Вычисление минхэш-сигнатур
3.3.6. Упражнения к разделу 3.3
3.4. Хэширование документов с учетом близости
3.4.1. LSH для минхэш-сигнатур
3.4.2. Анализ метода разбиения на полосы
3.4.3. Сочетание разных методов
3.4.4. Упражнения к разделу 3.4
3.5. Метрики
3.5.1. Определение метрики
3.5.2. Евклидовы метрики
3.5.3. Расстояние Жаккара
3.5.4. Косинусное расстояние
3.5.5. Редакционное расстояние
3.5.6. Расстояние Хэмминга
3.5.7. Упражнения к разделу 3.5
3.6. Теория функций, учитывающих близость
3.6.1. Функции, учитывающие близость
3.6.2. LSH-семейства для расстояния Жаккара
3.6.3. Расширение LSH-семейства
3.6.4. Упражнения к разделу 3.6
3.7. LSH-семейства для других метрик
3.7.1. LSH-семейства для расстояния Хэмминга
3.7.2. Случайные гиперплоскости и косинусное расстояние
3.7.3 Эскизы
3.7.4. LSH-семейства для евклидова расстояния
3.7.5. Другие примеры LSH-семейств в евклидовых пространствах
3.7.6. Упражнения к разделу 3.7
3.8. Применения хэширования с учетом близости
3.8.1. Отождествление объектов
3.8.2. Пример отождествления объектов
3.8.3. Проверка отождествления записей
3.8.4. Сравнение отпечатков пальцев
3.8.5. LSH-семейство для сравнения отпечатков пальцев
3.8.6. Похожие новости
3.8.7. Упражнения к разделу 3.8
3.9. Методы для высокой степени сходства
3.9.1. Поиск одинаковых объектов
3.9.2. Представление множеств в виде строк
3.9.3. Фильтрация на основе длины строки
3.9.4. Префиксное индексирование
3.9.5. Использование информации о позиции
3.9.6. Использование позиции и длины в индексах
3.9.7. Упражнения к разделу 3.9
3.10. Резюме
3.11. Список литературы
ГЛАВА 4. Анализ потоков данных
+
ГЛАВА 5. Анализ ссылок
+
ГЛАВА 6. Частые предметные наборы
+
ГЛАВА 7. Кластеризация
+
ГЛАВА 8. Реклама в Интернете
+
ГЛАВА 9. Рекомендательные системы
+
ГЛАВА 10. Анализ графов социальных сетей
+
ГЛАВА 11. Понижение размерности
+
ГЛАВА 12. Машинное обучение на больших данных
+
Предметный указатель
Данный блок поддерживает скрол*