Справка
x
Поиск
Закладки
Озвучить книгу
Изменить режим чтения
Изменить размер шрифта
Оглавление
Для озвучивания и цитирования книги перейдите в режим постраничного просмотра.
Анализ больших наборов данных
ГЛАВА 3. Поиск похожих объектов
Для продолжения работы требуется
Регистрация
Предыдущая страница
Следующая страница
Оглавление
Предисловие
+
ГЛАВА 1. Добыча данных
+
ГЛАВА 2. MapReduce и новый программный стек
+
ГЛАВА 3. Поиск похожих объектов
-
3.1. Приложения поиска близкого соседям
3.1.1. Сходство множеств по Жаккару
3.1.2. Сходство документов
3.1.3. Коллаборативная фильтрация как задача о сходстве множеств
3.1.4. Упражнения к разделу 3.1
3.2. Разбиение документов на шинглы
3.2.1. k-шинглы
3.2.2. Выбор размера шингла
3.2.3. Хэширование шинглов
3.2.4. Шинглы, построенные из слов
3.2.5. Упражнения к разделу 3.2
3.3. Сигнатуры множеств с сохранением сходства
3.3.1. Матричное представление множеств
3.3.2. Минхэш
3.3.3. Минхэш и коэффициент Жаккара
3.3.4. Минхэш-сигнатуры
3.3.5. Вычисление минхэш-сигнатур
3.3.6. Упражнения к разделу 3.3
3.4. Хэширование документов с учетом близости
3.4.1. LSH для минхэш-сигнатур
3.4.2. Анализ метода разбиения на полосы
3.4.3. Сочетание разных методов
3.4.4. Упражнения к разделу 3.4
3.5. Метрики
3.5.1. Определение метрики
3.5.2. Евклидовы метрики
3.5.3. Расстояние Жаккара
3.5.4. Косинусное расстояние
3.5.5. Редакционное расстояние
3.5.6. Расстояние Хэмминга
3.5.7. Упражнения к разделу 3.5
3.6. Теория функций, учитывающих близость
3.6.1. Функции, учитывающие близость
3.6.2. LSH-семейства для расстояния Жаккара
3.6.3. Расширение LSH-семейства
3.6.4. Упражнения к разделу 3.6
3.7. LSH-семейства для других метрик
3.7.1. LSH-семейства для расстояния Хэмминга
3.7.2. Случайные гиперплоскости и косинусное расстояние
3.7.3 Эскизы
3.7.4. LSH-семейства для евклидова расстояния
3.7.5. Другие примеры LSH-семейств в евклидовых пространствах
3.7.6. Упражнения к разделу 3.7
3.8. Применения хэширования с учетом близости
3.8.1. Отождествление объектов
3.8.2. Пример отождествления объектов
3.8.3. Проверка отождествления записей
3.8.4. Сравнение отпечатков пальцев
3.8.5. LSH-семейство для сравнения отпечатков пальцев
3.8.6. Похожие новости
3.8.7. Упражнения к разделу 3.8
3.9. Методы для высокой степени сходства
3.9.1. Поиск одинаковых объектов
3.9.2. Представление множеств в виде строк
3.9.3. Фильтрация на основе длины строки
3.9.4. Префиксное индексирование
3.9.5. Использование информации о позиции
3.9.6. Использование позиции и длины в индексах
3.9.7. Упражнения к разделу 3.9
3.10. Резюме
3.11. Список литературы
ГЛАВА 4. Анализ потоков данных
+
ГЛАВА 5. Анализ ссылок
+
ГЛАВА 6. Частые предметные наборы
+
ГЛАВА 7. Кластеризация
+
ГЛАВА 8. Реклама в Интернете
+
ГЛАВА 9. Рекомендательные системы
+
ГЛАВА 10. Анализ графов социальных сетей
+
ГЛАВА 11. Понижение размерности
+
ГЛАВА 12. Машинное обучение на больших данных
+
Предметный указатель
Данный блок поддерживает скрол*