В современном мире, стоит проблема машинного или нейронного обнаружения объектов с целью, например, подсчета людей в толпе или организации технических систем охраны. Разработанные на данный момент датчики и тепловизоры не только не отличаются высокой точностью и быстротой обработки, но и тяжелы в настройке, что делает их непрактичными. В этой статье рассматривается направление информационных систем – поиск человека на медиа-данных, и предлагается высокоточный способ реализации поиска. Поэтому на данный момент, большую распространенность получают системы технического зрения (СТЗ).
Суть данных систем состоит в том, что движущийся объект поступает на территорию входа системы обнаружения или датчика. Причем эта система состоит из камеры с двумерным изображением, датчика движения на территории, блок преобразования и фрагментации изображения, блок распознавания объекта и вывод результата.
Рассмотрим принцип работы системы технического зрения подробнее. Данные об объекте поступают на вход датчика, в результате сигнала о движении. Блок датчика движения отбирает последовательные снимки с определенным интервалом. Происходит нумерация изображений в соответствии с очередностью. Допустим, было взято 4 медиа-файла из видео. Из координат изображения под номером 3 вычтем координаты снимка 1 и только если, их разность не равна нулю, то из изображения под номером 4 вычитаются координаты снимка 2. И если результат разности не равна нулю, то выводится результат о нахождении движущего объекта в поле зрения камеры и позже, для дальнейшей обработки производится вычитание второго снимка из третьего, и третьего из четвертого.
Блок преобразования и фрагментации изображения обеспечивает четкое разделение объектов в случае, если объектов больше, чем один. Для этого фрагментируются множества пикселей во множество объектов, разделенных на области с границами определенной толщины.
Алгоритм вычитания выглядит следующим образом:
- Из изображения формируются области O и границами определенной толщины t, причем если пиксель попадает внутрь или на границу уже существующей области, то область должна быть расширена до координат этого пикселя;
- Если область с данным пикселем не найден, то создается новая область с размером 1х1 с центром в этом пикселе;
- После обработки изображения области, размер, которых меньше установленного необходимо удалить.
В блоке распознавания используется метод опорных векторов сортировки на объекты.Для высокой точности можно использовать большое количество векторов, что сократит возможность ошибки, а использование параллельных плоскостей приводит к результативности.
Вывод результата состоит из анализа полученных данных в процентах. Соответствие определяется путем классификацией порога сходства, который зависит от расположения камеры и от освещенности.
В результате выполненной работы были описаны возможности метода, позволяющего с высокой точностью определить количество объектов или человек, находящихся на определенной территории на изображении или видео-файле.
Библиографический список
- R.L. Rivest, A. Shamir, L. Adleman. A method for obtaining digital signatures and public key cryptosystems (англ.) Comm. ACM, — 1978. — P. 120–126.
- Thorsten Kleinjung, Kazumaro Aoki, Jens Franke, Arjen K. Lenstra, Emmanuel Thomé: Factorization of a 768-bit RSA modulus. IACR Cryptology ePrint Archive 2010: 6 (2010).