Система для осуществления полнотекстового поиска на английском и русском языках в субд postgress
Введение 8
1 ТЕСТОВЫЕ НАБОРы ДАННЫХ. БАЗА ДАННЫХ ФИЛЬМОВ IMDB 10
1.1 Назначение тестовых наборов данных. 10
1.2 Базы данных полнотекстового поиск 11
2 НЕОПРЕДЕЛЕННОСТИ И НЕЧЕТКОСТИ В ПОЛНОТЕКСТОВОМ ПОИСКЕ ДАННЫХ 16
2.1 Определение полнотекстового поиска 16
2.2 Основные этапы хранения и поиска данных 17
2.3 Разновидности неопределенности и нечеткости в тестовой базе IMDb. 20
3 СОВРЕМЕННЫЕ ПОИСКОВЫЕ СИСТЕМЫ И СУБД, В КОТОРЫХ ВОЗМОЖЕН ПОЛНОТЕКСТОВЫЙ ПОИСКА ДАННЫХ 21
3.1 Системы полнотекстового поиска данных 21
3.2 Методы и алгоритмы, которые используются для полнотекстового поиска данных в поисковых системах 24
3.3 Совокупность задач, в которых применяют тип данных cube СУБД PostgreSQL 29
4 ПОЛНОТЕКСТОВЫЙ ПОИСК ДАННЫХ В СУБД POSTGRESQL 36
4.1 SQL – операторы полнотекстового поиска данных в СУБД PostgreSQL 36
4.2 Примеры полнотекстового поиска в базе данных IMDb 38
4.3 Клиентское приложение для запросов к тестовой базы IMDb 46
5 ОЦЕНКА ЭКОНОМИЧЕСКОЙ ЭФФЕКТИВНОСТИ 51
ВЫВОДЫ 71
ПЕРЕЧЕНЬ ИСТОЧНИКОВ 72
Цель исследования – определить разновидности неопределенности и нечеткости при полнотекстовом поиске данных. Исследовать методы и алгоритмы, которые используются для полнотекстового поиска данных в поисковых системах. Определить совокупность задач, в которых применяется тип данных cube СУБД PostgreSQL.
Объект исследования – современные методы и информационные технологии сохранения и анализа информации, размещенной в Интернет. Структура и объем наборов данных базы IMDb (Internet Movie Database) в различных хранилищах. Возможности полнотекстового поиска в СУБД PostgreSQL Совокупность SQL – операторов полнотекстовом поиске данных в СУБД PostgreSQL.
Предмет исследования – возможность полнотекстового поиска в СУБД PostgreSQL на русском и украинском языках. Возможность использования типа данных cube в СУБД PostgreSQL для представления нечетких данных категориальных переменных.
1. Набор данных IMDb на data.world [Электронный ресурс]. – Режим доступа: https://data.world/datasets/open-data, – Дата доступа: 12.10.2019.
2. Набор данных IMDb на kaggle.com [Электронный ресурс]. – Режим доступа: https://www.kaggle.com/datasets – Дата доступа: 12.10.2019.
3. Страница наборов на сайте IMDb [Электронный ресурс]. – Режим доступа: https://www.imdb.com/interfaces – Дата доступа: 12.10.2019.
4. Страница наборов IMDb на ILP [Электронный ресурс]. – Режим доступа: https://relational.fit.cvut.cz/dataset/IMDb – Дата доступа: 12.10.2019.
5. Редмонд Э. «Семь баз данных по семь недель» / Э. Редмонд, Дж. Р. Уилсон. – М .: ДМК Прессб, 2013. – 384с.
6. Документация компании Postgres Professional, раздел поиск текстов. [Электронный ресурс]. – Режим доступа: https://postgrespro.ru/docs/postgrespro/9.5/textsearch. – Дата доступа: 12.10.2019.
7. Цикл статей «Готовим Полнотекстовые поиск в Postgres» [Электронный ресурс]. – Режим доступа: https://habr.com/ru/post/442170/. – Дата доступа: 12.10.2019.
и еще 12 источников
Хочешь уникальную работу?
Больше 3 000 экспертов уже готовы начать работу над твоим проектом!