Methodology for image retrieval based on binary space partitioning and perceptual image hashing

Hodovychenko, Mykola; Годовиченко, Микола Анатолійович; Годовиченко, Николай Анатольевич; Antoshchuk, Svitlana; Антощук, Світлана Григорівна; Антощук, Светлана Григорьевна; Kuvaieva, Varvara; Куваєва, Варвара Ігорівна; Куваева, Варвара Игоревна

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://dspace.opu.ua/jspui/handle/123456789/12918

Название:	Methodology for image retrieval based on binary space partitioning and perceptual image hashing
Другие названия:	Методологія пошуку зображень на базі бінарного розбиття простору та перцептивного хешування
Авторы:	Hodovychenko, Mykola Годовиченко, Микола Анатолійович Годовиченко, Николай Анатольевич Antoshchuk, Svitlana Антощук, Світлана Григорівна Антощук, Светлана Григорьевна Kuvaieva, Varvara Куваєва, Варвара Ігорівна Куваева, Варвара Игоревна
Ключевые слова:	Content-based image retrieval binary space partitioning perceptual hashing vantage-point tree discrete cosine transform discrete wavelet transform пошук зображень на основі вмісту бінарне розбиття простору перцептивне хешування дерево точки огляду дискретне косинусне перетворення дискретне вейвлет-перетворення
Дата публикации:	4-Июл-2022
Издательство:	Odessa National Polytechnic University
Библиографическое описание:	Hodovychenko, M., Antoshchuk, S., Kuvaieva, V. (2022). Methodology for image retrieval based on binary space partitioning and perceptual image hashing. Applied Aspects of Information Technology, Vol. 5, N 2, р. 136-146. Hodovychenko, M. Methodology for image retrieval based on binary space partitioning and perceptual image hashing / M. Hodovychenko, S. Antoshchuk, V. Kuvaieva // Аpplied Aspects of Information Technology = Прикладні аспекти інформ. технологій. – Оdesa, 2022. – Vol. 5, N 2. – P. 136–146.
Краткий осмотр (реферат):	The paper focuses on the content-based image retrieval systems building. The main challenges in the construction of such systems are considered, the components of such systems are reviewed, and a brief overview of the main methods and techniques that have been used in this area to implement the main components of image search systems is given. As one of the options for solving such a problem, an image retrieve methodology based on the binary space partitioning method and the perceptual hashing method is proposed. Space binary partition trees are a data structures obtained as follows: the space is partitioned by a hyperplane into two halfspaces, and then each half-space is recursively partitioned until each node contains only a trivial part of the input features. Perceptual hashing algorithms make it possible to represent an image as a 64-bit hash value, with similar images represented by similar hash values. As a metric for determining the distance between hash values, the Hamming distance is used, this counts the number of distinct bits. To organize the base of hash values, a vp-tree is used, which is an implementation of the binary space partitioning structure. For the experimental study of the methodology, the Caltech-256 data set was used, which contains 30607 images divided into 256 categories, the Difference Hash, P-Hash and Wavelet Hash algorithms were used as perceptual hashing algorithms, the study was carried out in the Google Colab environment. As part of an experimental study, the robustness of hashing algorithms to modification, compression, blurring, noise, and image rotation was examined. In addition, a study was made of the process of building a vp-tree and the process of searching for images in the tree. As a result of experiments, it was found that each of the hashing algorithms has its own advantages and disadvantages. So, the hashing algorithm based on the difference in adjacent pixel values in the image turned out to be the fastest, but it turned out to be not very robust to modification and image rotation. The P-Hash algorithm, based on the use of the discrete cosine transform, showed better resistance to image blurring, but turned out to be sensitive to image compression. The W-Hash algorithm based on the Haar wavelet transform made it possible to construct the most efficient tree structure and proved to be resistant to image modification and compression. The proposed technique is not recommended for use in general-purpose image retrieval systems; however, it can be useful in searching for images in specialized databases. As ways to improve the methodology, one can note the improvement of the vp-tree structure, as well as the search for a more efficient method of image representation, in addition to perceptual hashing. Стаття розглядає питання щодо побудови систем пошуку зображень на основі зображення-зразка. Розглянуто основні виклики, які стоїть на шляху вчених та інженерів при побудові подібних систем, розглянуто складові частини подібних систем і дано короткий огляд основних методів і технік, які використовувалися в цій галузі для реалізації основних складових частин систем пошуку зображень. У якості одного з варіантів розв'язання подібного завдання запропоновано методологію пошуку зображень на основі методу бінарного розбиття простору та методу перцептивного хешування. Дерева бінарного розбиття простору являють собою структуру даних, отриману наступним чином: простір розбивається гіперплощиною на два напівпростори, потім кожен напівпростір рекурсивно розбивається до тих пір, поки кожен вузол не буде містити тільки тривіальну частину вхідних об'єктів. Алгоритми перцептивного хешування дозволяють отримати уявлення зображення у вигляді хеш-значення довжиною 64 біта, при чому схожі зображення будуть представлені схожими хеш-значеннями. У якості метрики визначення відстані між хеш-значеннями використовується відстань Геммінга, яка підраховує кількість різних біт. Для організації бази хеш-значень використовується vp-дерево, що є реалізацією структури бінарного розбиття простору. Для експериментального дослідження методики був використаний набір даних Caltech-256, який містить 30607 зображень, розбитих на 256 категорій, у якості алгоритмів перцептивного хешування були використані алгоритми Difference Hash, PHash та Wavelet Hash, дослідження проводилося в середовищі Google Colab. В рамках експериментального дослідження було розглянуто стійкість алгоритмів хешування до модифікації, стиснення, розмиття, зашумлення та повороту зображення. Крім того, було проведено дослідження процесу побудови vp-дерева та процесу пошуку зображень у дереві. В результаті експериментів було встановлено, що кожен з алгоритмів хешування має свої переваги та недоліки. Так, алгоритм хешування, заснований на різниці значень пікселів на зображенні, виявився найшвидшим, але був не надто стійким до модифікації та повороту зображень. Алгоритм P-Hash, заснований на використанні дискретного косинусного перетворення, показав кращу стійкість до розмиття зображень, але виявився чутливим до стиснення. Алгоритм W-Hash, заснований на вейвлетперетворенні Гаара, дозволив побудувати найбільш ефективну структуру дерева і виявився стійким до модифікації та стиснення зображення. Запропонована методика не рекомендується для використання в системах пошуку зображень загального призначення, однак, може бути корисна для пошуку зображень у спеціалізованих базах. В якості подальших шляхів покращення методики можна відзначити удосконалення структури vp-дерева, а також пошук більш ефективного методу представлення зображення, ніж перцептивне хешування
URI (Унифицированный идентификатор ресурса):	http://dspace.opu.ua/jspui/handle/123456789/12918
ISSN:	2617-4316 2663-7723
Располагается в коллекциях:	2022, Vol. 5, № 2

Файлы этого ресурса:

Файл	Описание	Размер	Формат
4__Hodovychenko.pdf		816.21 kB	Adobe PDF	Просмотреть/Открыть

Показать полное описание ресурса Просмотр статистики

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.