Перейти к:
СПОСОБ ФОРМИРОВАНИЯ ОРТОГОНАЛЬНЫХ ПРИЗНАКОВ РАСПОЗНАВАНИЯ ОБЪЕКТОВ НА ПЛОСКИХ ИЗОБРАЖЕНИЯХ
https://doi.org/10.35266/1999-7604-2024-2-10
Аннотация
В работе рассмотрен такой важный аспект компьютерного зрения, как формирование признаков распознавания объектов, в системах технического зрения. Подобные системы, нашедшие широкое применение в различных отраслях промышленности, дают возможность получить большой объем быстро собираемой информации. При этом cобирается информация о свойствах наблюдаемых объектов, в число которых зачастую относят перемещение, а также геометрические параметры их формы. Авторами предлагается использование признаков распознавания объектов, в основе которых лежат ортоэкспоненциальные функции и которые сохраняют в себе информацию о форме исследуемого объекта. Для контуров некоторых правильных геометрических фигур приведены примеры вычисленных комплексных значений элементов матрицы формы, получаемой на основе коэффициентов разложения рассматриваемых в работе ортоэкспоненциальных функций.
Для цитирования:
Храмов В.В., Митясова О.Ю. СПОСОБ ФОРМИРОВАНИЯ ОРТОГОНАЛЬНЫХ ПРИЗНАКОВ РАСПОЗНАВАНИЯ ОБЪЕКТОВ НА ПЛОСКИХ ИЗОБРАЖЕНИЯХ. Вестник кибернетики. 2024;23(2):76-80. https://doi.org/10.35266/1999-7604-2024-2-10
For citation:
Khramov V.V., Mityasova O.Yu. METHOD FOR FORMING ORTHOGONAL FEATURES FOR OBJECT RECOGNITION IN FLAT IMAGES. Proceedings in Cybernetics. 2024;23(2):76-80. (In Russ.) https://doi.org/10.35266/1999-7604-2024-2-10
ВВЕДЕНИЕ
Современные системы очувствления роботов предполагают наличие элементов технического зрения, способных обеспечить прием и обработку информации о свойствах объектов распознавания, в первую очередь об их форме, размерах и ориентации. Зная эти свойства, можно идентифицировать объекты текущего изображения с некоторым эталоном, находящимся в памяти ЭВМ.
Для более сложных систем технического зрения помимо текстурных признаков, описывающих структуру видимой поверхности объекта, применяются признаки для различения объектов по цвету, а также геометрические признаки, учитывающие не только форму объекта, но и его пространственное положение.
Одним из ключевых элементов систем технического зрения (СТЗ) является алгоритм сегментации изображения, который позволяет выделить объекты на фоне изображения и определить их границы [1]. Для этого используются различные методы обработки изображений, в том числе фильтрация, морфологические операции, выделение краев и др.
Для увеличения эффективности распознавания объектов в СТЗ в последнее время все чаще применяются методы машинного обучения, нейронные сети, метод опорных векторов, алгоритмы кластеризации и др. Эти методы позволяют повысить точность и скорость работы системы при обучении на большом объеме данных.
Таким образом, современные системы технического зрения роботов используют разнообразные признаки и методы обработки изображений для распознавания объектов и выполнения различных задач в автоматизированных процессах. Рассмотрим разработанную авторами методику, обладающую, на наш взгляд, несколько большими возможностями и универсальностью.
МАТЕРИАЛЫ И МЕТОДЫ
Система технического зрения (СТЗ) простейших роботов-манипуляторов использует метрические признаки, известные из интегральной геометрии [1]: удлиненность объекта , сложность контура
, компактность фигуры
, моменты инерции относительно осей и т. д. (P – площадь; S – периметр; a – наибольшее сечение объекта; b – наибольшее сечение из перпендикулярных сечению a). Роботы же, ориентированные на решение широкого круга задач и обладающие высоким уровнем искусственного интеллекта, нуждаются в более развитой, более универсальной системе признаков распознавания.
Одной из эвристик, которая применяется для контурной идентификации объектов, является использование оператора Собеля для выделения границ объектов на изображении. Этот оператор позволяет выделить различные уровни контрастности и изменений яркости, что, в свою очередь, помогает выявить контуры объектов.
Другой эвристикой является использование алгоритмов машинного обучения для классификации контуров объектов. На основе набора обучающих данных, таких как изображения с контурами различных объектов, модель может быть обучена распознавать и идентифицировать контуры объектов на новых изображениях.
Авторами используется собственная эвристика, основанная на использовании кодов Фримена, применительно к клеточным автоматам на плоскости [2][3].
Интеграция этих и других эвристик в процесс анализа изображений позволяет повысить эффективность и точность идентификации объектов, явлений и ситуаций. Тем самым, развитие технологий интеллектуального анализа данных значительно улучшает возможности применения систем технического зрения в различных областях, от медицины и автопрома до робототехники и безопасности [4].
Методология
Остановимся на таком подходе к формированию признаков, который бы обеспечил сохранение в них информации о форме распознаваемых контуров как едином целом, в первую очередь с учетом взаимосвязи координат соседних точек контура. Такой подход получил не только официальное признание [5], но и показал свою эффективность на практике [6].
Пусть средствами предварительной обработки выделен замкнутый контур объекта на двумерном изображении, то есть задана упорядоченная совокупность координат {xi; yi} точек ai, i = 1,n, контура, где N – количество точек контура. Выбирается начальная точка контура по какому-либо правилу, например:
.
Направление движения по контуру справа от объекта примем за положительное и представим контурную линию параметрически:
где s – расстояние по контуру от начальной точки до i-й.
Для изображения, задаваемого на прямоугольном растре, любая контурная линия является решением линейного дифференциального уравнения порядка не выше n < ∞. В работе [7] для этого случая было доказано, что для сохранения полной информации о форме контура достаточно не более чем по (n + 1)-му коэффициенту разложения в ряд ортогональных экспоненциальных функций для x = x (s) и y = y (s).
Базисные ортоэкспоненциальные функции задаются выражением:
,
где m ∈ (0,1) – масштабный коэффициент.
Если обозначить
, то коэффициенты разложения будут вычисляться по формулам [1]:
РЕЗУЛЬТАТЫ И ИХ ОБСУЖДЕНИЕ
Учитывая, что аппаратное вычисление коэффициентов ортогонального разложения {Ei} проблем в настоящее время не представляет [3], переход {Jk} ←{Ei} также вполне разрешимая задача.
Обратив внимание на то, что:
,
и обозначив f1 (s) = x (s); f2 (s) = y (s); f3 (s) = x (S-s); f4 (s) = y (S-s), где x (S-s); y (S-s) – «зеркальные» функции; S – длина контура, можно образовать матрицу формы контура:
.
При этом Фij характеризует связность точек контура. Вещественные сечения некоторых элементов матрицы формы (Ф13; Ф24) были исследованы ранее в работе [3] и получили название экспоненциальных коэффициентов формы.
Отметим два полезных свойства элементов матрицы формы:
1) в силу того, что все fi (s) периодические, с одним периодом S:
2) Ф12 и Ф34 инвариантны к выбор начальной точки контура, а следовательно, и к повороту объекта на текущем изображении.
Приведем примеры вычисленных инвариантных комплексных значений элементов матрицы формы для контуров правильных геометрических фигур:
– квадрат со стороной a: Ф12 = е–ap;
– окружность:
– эллипс с осями a и b:
.
Элементы матрицы для фигур произвольной формы, равно как и их проекции на действительную ось, сохраняют свойства 1 и 2.
Анализируя вид выражений для Ф12 контуров различных фигур, следует отметить, что некоторые признаки, полученные другими, например эвристическими, опытными методами [1][7] (признаки П1, П2), входят в качестве компонентов для выражения элементов матрицы формы. Тем самым теоретически доказывается правомерность их практического использования, по меньшей мере в качестве признаков первого уровня иерархической системы распознавания.
ЗАКЛЮЧЕНИЕ
Способ описывает порядок формирования ортогональных признаков для распознавания объектов на плоских изображениях. Основные шаги способа включают [7]:
- Описание контура объекта: имеется замкнутый контур объекта, который параметрически описывается по его координатам на плоскости.
- Параметризацию контура: координаты контура представляются в виде функций расстояния от фиксированной точки (например, начала координат) вдоль контура объекта, это позволяет учесть форму и структуру объекта.
- Разложение функций расстояния в ряд: полученные функции расстояния разлагаются в ряды по ортогональным полиномам. Ортогональные полиномы – это функции, которые ортогональны друг другу на определенном интервале с некоторым весом. С учетом того, что исследуемые объекты описываются замкнутыми контурами, параметрические описания – периодические функции, следовательно, пределы интегрирования могут быть заданы от нуля до значения, равного длине контура. Это существенно упрощает вычислительные процедуры.
- Формирование признаков идентификации: коэффициенты разложения функций расстояния в ряды по ортогональным полиномам могут сами использоваться как признаки для идентификации объектов. Комбинации отношений этих коэффициентов также могут образовывать признаки второго уровня, в том числе формируемые в матрицы, которые в ряде практических случаев весьма эффективны [4][8].
Такой подход позволяет учитывать как геометрические, так и структурные особенности объектов при их распознавании на изображениях.
Список литературы
1. Долгин Ю. Н., Васильев Г. И., Храмов В. В. Выбор информационных признаков для распознавания некоторых многомерных сигналов // Проектирование и применение микроэлектронных специализированных вычислителей : сб. науч. тр. М. : МИЭТ, 1985. С. 82–86.
2. Kramarov S., Khramov V. Methodology of formation of unite geo-informational space in the region // Modern Information Technology and IT Education. SITITO 2018 : Proceedings of the International Conference / Sukhomlin V., Zubareva E., eds. 2020. P. 309‒316. DOI 10.1007/978-3-030-46895-8_24.
3. Абдуллаева А. М., Аверченко Е. В., Александрова Т. С. и др. Возможности сочетания естественного и искусственного интеллектов в образовательных системах. М. : Изд. центр РИОР, 2023. 232 с.
4. Akperov I. G., Khramov V. V. Development of instruments of fuzzy identifi cation of extended objects based on the results of satellite monitoring // Advances in Intelligent Systems and Computing. 2019. Vol. 896. P. 325‒332. DOI 10.1007/978-3-030-04164-9_44.
5. Акперов И. Г., Акперов Т. И., Александрова Т. С. и др. Программа для формирования признаков контурного распознавания и идентификации информационных объектов : программа для ЭВМ № 2023680950 Российская Федерация, № 2023668703 ; заявл. 11.09.2023 ; опубл. 11.10.2023 ; заявитель ЧОУ ВО «Южный университет (ИУБиП)». URL: https://onlinepatent.ru/oftware/2023680950/ (дата обращения: 14.05.2024).
6. Lindenbaum T., Belyaev A., Grebenyuk E. et al. The method of identifying a person in formation of an educational trajectory // INTERAGROMASH 2022 : Proceedings of the XV International Scientific Conference, March 2‒4, 2022, Rostov-on-Don. Rostov-on-Don, 2023. P. 1323‒1332. DOI 10.1007/978-3-031-21219-2_148.
7. Дедус Е. Ф., Храмов В. В. Система признаков распознавания контуров произвольной формы // Тематический научно-технический сборник. Т. 2. М. : Изд-во Министерства обороны СССР, 1988. С. 21–23.
8. Akperov G. I., Grigoriev S. G., Işiklar A. et al. Cognitive modeling of university management support as a human-machine system // Informatics and Education. 2024. Vol. 39, no. 1. P. 65‒73. DOI 10.32517/0234-0453-2024-39-1-65-73.
Об авторах
Владимир Викторович ХрамовРоссия
кандидат технических наук, доцент, ведущий научный сотрудник
Ольга Юрьевна Митясова
Россия
кандидат технических наук
Рецензия
Для цитирования:
Храмов В.В., Митясова О.Ю. СПОСОБ ФОРМИРОВАНИЯ ОРТОГОНАЛЬНЫХ ПРИЗНАКОВ РАСПОЗНАВАНИЯ ОБЪЕКТОВ НА ПЛОСКИХ ИЗОБРАЖЕНИЯХ. Вестник кибернетики. 2024;23(2):76-80. https://doi.org/10.35266/1999-7604-2024-2-10
For citation:
Khramov V.V., Mityasova O.Yu. METHOD FOR FORMING ORTHOGONAL FEATURES FOR OBJECT RECOGNITION IN FLAT IMAGES. Proceedings in Cybernetics. 2024;23(2):76-80. (In Russ.) https://doi.org/10.35266/1999-7604-2024-2-10