Preview

Proceedings in Cybernetics

Advanced search

Comparative analysis of vector distance metrics for raster images

https://doi.org//10.35266/1999-7604-2024-3-3

Abstract

The article describes metrics and algorithms that allow evaluating the difference or similarity of the objects under study: Hamming distance, Levenshtein distance, Jaro-Winkler similarity, Dice-Sørensen coeffi cient, SIFT, Perceptual Hash algorithm. To identify an algorithm that is optimally suitable for evaluating the uniqueness of logos by comparing them with each other, we implemented metrics and algorithms as programs in the Python programming language. Then, we tested their speed and quality of work. The fastest working algorithm for comparing logos is based on the calculation of a perceptual hash sum, followed by the calculation of the Hamming distance.
The most accurate results of comparing logos were obtained during the operation of the program based on the calculation of the Hamming distance. We chose a software-implemented algorithm based on Hamming distance
calculation as the optimal algorithm that combines high speed of operation and the quality of the obtained results.

About the Authors

A. A. Detkov
Ural Federal University named after the First President of Russia B. N. Yeltsin, Yekaterinburg
Russian Federation

Candidate of Sciences (Economics), Associate Professor



V. A. Voronina
Ural Federal University named after the First President of Russia B. N. Yeltsin, Yekaterinburg
Russian Federation

Student



Yu. V. Garifullina
Ural Federal University named after the First President of Russia B. N. Yeltsin, Yekaterinburg
Russian Federation

Student



A. M. Korepanov
Ural Federal University named after the First President of Russia B. N. Yeltsin, Yekaterinburg
Russian Federation

Student



A. Yu. Vishnyakova
Ural Federal University named after the First President of Russia B. N. Yeltsin, Yekaterinburg
Russian Federation

Senior Lecturer



References

1. Большой энциклопедический словарь. 2-е изд., перераб. и доп. М. ; СПб. : Большая российская энциклопедия, Норинт, 2000. 1434 с.

2. Определение метрики и ее свойства. Шкалы: номинальная, порядковая, интервальная, относительная. URL: https://studfi le.net/preview/8985938/page:7/ (дата обращения: 04.05.2024).

3. Битюцков В. И., Войцеховский М. И., Иванов А. Б. и др. Математическая энциклопедия. М. : Советская Энциклопедия, 1984. 1246 с.

4. Метрика (математика). URL: https://ru.wikibrief.org/wiki/Metric_(mathematics) (дата обращения: 04.05.2024).

5. Гражданский кодекс Российской Федерации (часть четвертая) от 18.12.2006 № 230-ФЗ. Доступ из СПС «КонсультантПлюс».

6. Об утверждении Руководства по осуществлению административных процедур и действий в рамках предоставления государственной услуги по государственной регистрации товарного знака, знака обслуживания, коллективного знака и выдаче свидетельств на товарный знак, знак обслуживания,коллективный знак, их дубликатов : приказ ФГБУ ФИПС 20.01.2020 № 12 (ред. от 25.03.2022). URL: https://legalacts.ru/doc/prikaz-fgbu-fi ps-ot-20012020-n-12-ob-utverzhdenii/ (дата обращения: 04.05.2024).

7. GitHub. URL: https://github.com/?ysclid=lhjgylis6v237864613 (дата обращения: 04.05.2024).

8. Либерман А. И., Шульга Т. Э. Актуальные задачи анализа изображений // Проблемы управления в социально-экономических и технических системах : сб. науч. ст. XVIII Междунар. науч.-практич. конф., 14–15 апреля 2022 г., г. Саратов. Саратов : Наука, 2022. С. 41–46.

9. Коломийцева Е. Ю. Анализ изображений в Интернете: возможности современных сервисов // Медиа в современном мире. 61-е Петербургские чтения : ст. участников ежегодного апрельского научного форума, 21–22 апреля 2022 г., Санкт-Петербург. Т. 2. СПб. : Медиапир, 2022. С. 66–67.

10. Шестоперов Д. В. Анализ изображений. Определение дубликатов и степени размытости изображений // Вопросы устойчивого развития общества. 2022. № 5. С. 1089–1096.

11. Ситникова Л. К., Еланцев М. О., Султанов Р. О. Двухэтапный метод поиска изображений в большой базе изображений // Выставка Инноваций – 2022 (весенняя сессия) : сб. материалов XXXIII Республиканской выставки-сессии студенческих инновационных проектов, 29 апреля 2022 г., г. Ижевск. Ижевск : Ижевский государственный технический университет имени М. Т. Калашникова, 2022. С. 304–309.

12. Питерсон У. У., Уэлдон Э. Коды, исправляющие ошибки / пер. с англ., под ред. Р. Л. Добрушина, С. И. Самойленко. М. : Мир, 1976. 594 с.

13. Метод Левенштейна. URL: https://spravochnick.ru/informatika/metod_levenshteyna/?ysclid=li96moyh99224030240 (дата обращения: 10.05.2024).

14. Brinardi L., Seng H. Text documents plagiarism detection using Rabin Karpand Jaro-Winkler Distance algorithms // Indonesian Journal of Electrical Engineering and Computer Science. 2017. Vol. 5, no. 2. P. 462–471.

15. Трасс Х. Х. Геоботаника: история и современные тенденции развития. Л. : Наука, 1976. 252 с.

16. Построение SIFT дескрипторов и задача сопоставления изображений. URL: https://habr.com/ru/ articles/106302/ (дата обращения: 10.05.2024).

17. Как бороться с репостами или пара слов о перцептивных хешах. Перцептивные хэш-алгоритмы. URL: https://habr.com/ru/articles/237307/ (дата обращения: 10.05.2024).


Review

For citations:


Detkov A.A., Voronina V.A., Garifullina Yu.V., Korepanov A.M., Vishnyakova A.Yu. Comparative analysis of vector distance metrics for raster images. Proceedings in Cybernetics. 2024;23(3):22-30. (In Russ.) https://doi.org//10.35266/1999-7604-2024-3-3

Views: 86


Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 License.


ISSN 1999-7604 (Online)