Development of a method for detecting traffic flow objects from satellite photographs with high image quality

Cover Page

Cite item

Full Text

Abstract

A set of algorithms used to recognize objects in high-quality satellite photographs is described. This method has a unique ability to detect objects whose dimensions in images do not exceed several tens of pixels. In a photograph, each distinctive area of the image is examined to determine the presence of an object of a certain class, and the probability of this presence in the area in question is calculated. Based on the results of image analysis, a conclusion is drawn about the presence and probable location of the object. A detailed explanation is also given of how the algorithms used in the detection process are learned and parameterized. Taking into account the research results, a wide range of processes can be automated, for example, simplifying the collection and analysis of data in numerous analytical systems. The method has enormous potential and can be effectively used in various fields related to image processing and data analysis, in particular, used for effective traffic management, ensuring uniform loading of the transport network at the limit of its capacity, avoiding overloading of vulnerable areas, as well as forecasting the development of the transport situation. It helps speed up the algorithm for detecting vehicles on satellite images, allows you to assess the state of road traffic and the effectiveness of its organization, identify and predict the development of processes affecting the state of road traffic, as well as monitor the field of safety and traffic management.

Full Text

Введение

Транспортные системы городов сегодня перегружены, а системы мониторинга громоздки, дорогостоящи и не отражают единовременной целостной картины. Tребуется новая технологическая платформа, обеспечивающая доступный, достоверный, комплексный мониторинг систем. В связи с этим тема исследований, направленных на разработку методологии применения материалов космического зондирования земли для решения задач мониторинга и оптимизации транспортной инфраструктуры, весьма актуальна.

Космические снимки сверхвысокого (от 0,3 до 1 м) пространственного разрешения могут отображать большие территории, в частности территории различных населенных пунктов – от мелких до крупных городов [1].

Нашей целью являлась разработка метода детектирования и классификации объектов для оценки интенсивности и состава транспортного потока по спутниковым снимкам сверхвысокого разрешения и географической информации о расположении и ширине дорог. Основными задачами исследования стали: анализ алгоритмов и методов оценки показателей транспортного потока (ТП) с использованием спутниковых снимков сверхвысокого разрешения, а также алгоритмов детектирования и классификации транспортных средств (ТС) на таких снимках; разработка алгоритма извлечения со снимков изображений отдельных перегонов дорожной сети.

Из перечня основных параметров дорожного движения следует выделить два: состав ТП и количество ТС, приходящихся на один километр полосы движения (плотность движения). Данные параметры возможно определять фактически, а не расчетом единовременно на всей улично-дорожной сети (УДС) города, в различные периоды времени, с применением космических снимков сверхвысокого пространственного разрешения.

Материалы и методы исследований

Одним из факторов, осложняющих детектирование и классификацию ТС, является то, что снимки с очень высоким разрешением, от 0,3 до 1 м, могут содержать только несколько пикселей для установления размеров и характеристик ТС. Например, автомобиль размером 3200 на 1420 мм будет представлен всего лишь 3 пикселями в длину и 1 пикселем в ширину. Это сильно осложняет их распознавание и классификацию.

Для исследования была создана экспериментальная система «TDC extractor» с использованием методов цифровой обработки изображений, распознавания образов и машинного обучения для обнаружения и классификации транспортных средств на конкретном участке УДС [2, 3]. В качестве базы для построения программной системы была выбрана библиотека глубокого обучения Caffe, написанная на языке программирования C++. Программная система включает в себя несколько основных компонентов:

  1. Модуль сужения области детектирования, использующий географические данные о расположении дорожных участков в городе для сужения области поиска ТС.
  2. Модуль генерации гипотез, который включает алгоритмы селективного поиска и их фильтрации, основан на низкочастотной информации и размерах объектов.
  3. Модуль распознавания визуальных объектов, основанный на сверточной нейронной сети второго порядка. Модуль распознавания визуальных объектов решает задачи определения принадлежности гипотезы одному из классов ТС: легковое авто, грузовое авто, автобус, мототранспорт.

Модули, которые решают проблемы обнаружения и классификации транспортных средств, включают все вышеперечисленные составные компоненты. В данной статье не рассматриваются модули, выполняющие расчеты числовой оценки показателей транспортного потока.

На рис. 1 изображен процесс обнаружения и классификации транспортных средств методом обработки спутниковых изображений. Конечным результатом работы системы является численное значение транспортных средств, обнаруженных на каждом этапе процедуры детектирования, по категориям и направлениям движения [4].

 

Рис. 1. Базовые стадии работы метода детектирования и классификации ТС: а – участок спутникового снимка, включающий в себя изображение перегона; б – изображение перегона в рамках рассматриваемого участка, полученное программной реализацией алгоритма сокращения области поиска; в – множество гипотез, полученных модифицированным алгоритмом селективного поиска; г – набор гипотез, оставшихся в результате выполнения фильтрации по низкочастотной информации и по размерам; д – множество детектированных ТС, для которых была выполнена классификация; е – ТС с определенным направлением движения, полученным исходя из относительной позиции на дорожном полотне

 

В ходе проведенных исследований на программной системе «TDC extractor» были качественно оценены разработанные алгоритмы, составляющие систему детектирования и классификации: алгоритмов сокращения области поиска, алгоритмов выборочного поиска с фильтрацией гипотез.

Для обучения нейронной сети создаются две базы из обучающей и тестирующей выборки, которые записываются в базу данных формата lmdb (Lightning Memory-Mapped Database). Данная база представляет собой высокопроизводительную встроенную транзакционную базу данных и созданных к ним масок.

После детектирования необходимо классифицировать транспортные средства по типам. Классификация будет осуществляться с помощью семантической классификации с использованием сверточных нейронных сетей (Convolutional Neural Network ConvNet/CNN). Для глубокого обучения нейронной сети существует большое разнообразие различных программных библиотек.

Искусственные нейронные сети могут менять свое поведение в зависимости от внешней среды. Данный фактор в большей степени, чем любой другой, ответствен за тот интерес, который они вызывают. После предъявления входных сигналов (возможно, вместе с требуемыми выходами) они самостоятельно настраиваются, чтобы обеспечивать требуемую реакцию. Было разработано множество обучающих алгоритмов, каждый со своими сильными и слабыми сторонами. Все еще существуют проблемы относительно того, чему нейронная сеть может обучиться и как обучение должно проводиться.

Это показывает, что работы предлагаемого направления являются актуальными на сегодняшний момент.

Для проведения исследований была выбрана среда обучения Caffe, разработанная Яньцинем Цзя в университете Беркли. Данная библиотека, поддерживающая множество типов машинного обучения, нацелена в первую очередь на решение задач классификации и сегментации. Для того чтобы построить и обучить модель распознавания в библиотеке, объявлена функция Сaffe с параметром обучения (train) и входным файлом, определяющим структуру и базовые параметры модели. На выходе получится файл формата caffemodel, используемый для сохранения и перенесения модели.

На рис. 2 показана общая схема сверточной нейронной сети, использованной в данной работе. Приведены количество и размер карт признаков для каждого слоя, а также формулы для вычисления значений, проходящих через сигнальные слои.

 

Рис. 2. Структурная схема используемой CNN

 

Кроме того, было исследовано качество разработанного алгоритма, в том числе модулей сужения области поиска и выборочного поиска с допущениями фильтрации. Сверточная нейронная сеть была обучена на 100 раундов.

Результаты исследований и их обсуждение

Проанализированы результаты проведенных экспериментов. Анализ показал, что увеличение размера обучающей выборки приводит к улучшению качества сети [4]. На рис. 3 показан график зависимости ошибки обучения CNN от количества эпох для различных размеров обучающей выборки. Минимальная ошибка обучения на предъявляемом алгоритму наборе была равна 1%. Минимальная ошибка тестирования составила 7,3%.

 

Рис. 3. Полученные в результате исследования графики зависимости ошибки обучения CNN от количества эпох обучения (1750, 3500, 5250, 7000 примеров в обучающей выборке)

 

В таблице показаны данные каждого слоя (количество и размер ядер свертки) и формула расчета для каждого слоя свертки, слоя подвыборки и полносвязного слоя.

 

Структура используемой CNN

№ п/п

Слой

Размеры ядра

Количество каналов

Формулы формирования сигнала

Вход

Входное изображение 68 × 68

1

Сверточный слой С1 (с нейронами 2-го порядка) на выходе 16 каналов 63 × 4

5 × 5

8

yj=f(i=1mwjikyik+ujikyi2k

2

Субдискретизирующий слой S1 на выходе 16 каналов

4 × 4

8

yj=fajmaxyj

3

Сверточный слой С2 (с нейронами 2-го порядка)

5 × 5

24

yj=f(i=1mwjikyik+ujikyi2k

4

Субдискретизирующий слой S2

4 × 4

24

yj=fajmaxyj

5

Сверточный слой C3

3 × 3

112

yj=fi=1mwjik yik 

6

Полносвязный слой F

  yj=fi=1mwjik yik 

Выход

4 классификационных сигнала от полносвязного слоя

 

В вышеприведенной таблице f(…) – сигмоидальная функция активации нейронов сети:

fx=11+ex.

Нейроны более высокого порядка могут быть введены в любой слой CNN: сверточный и полносвязный слои, даже слои субдискретизации. Однако добавление различных типов слоев может по-разному влиять на характеристики нейронной сети, такие как точность распознавания объектов и способность к обобщению, вследствие чего и влияние на результат работы сети будет различным. В ходе исследования было установлено, что первый и второй сверточные слои оказались лучшим выбором для внедрения нейронов второго порядка. Нецелесообразно использовать нейроны на третьем сверточном слое, поскольку это приводит к увеличению вычислительной сложности без улучшения качества нейронной сети.

Оригинальность исследований состоит в использовании исходных данных, полученных с применением космических снимков для построения транспортных моделей территории, с решением задач подбора космических материалов, условий съемки, оптимизации. Предлагаемая методика построения транспортной модели территории на основе данных космического зондирования включает в себя необходимые процедуры: процедура определения оптимальных параметров космической съемки, изучение вероятных вариантов схемы классификации объектов, вариантов анализа и оптимизации сети.

Нейронная сеть обрабатывает изображение каждой из детектированных гипотез, связывая его с одной из категорий ТС. Проводится полное обнаружение и классификация транспортных средств. Однако для оценки метрик транспортного потока помимо выявления соответствия между транспортными средствами и участками дороги необходимо также определить направление, в котором транспортные средства движутся по дороге при двустороннем движении. С этой целью был разработан алгоритм, основанный на положении обнаруженного транспортного средства относительно осевой линии интерполированной модели дороги.

Производится определение, на какой половине дороги находится центральная точка минимального ограничивающего прямоугольника (BoundingBox) обнаруженного автомобиля. То есть при рассмотрении интерполированной цифровой модели перегона устанавливают, с какой стороны относительно ломаной цепочки отрезков перегона находится центральная точка ТС.

Для определения направления движения на участке дороги используются следующие обозначения. Направления движения нумеруются с нулевым индексом, если для каждой точки, лежащей на полосе перегона, выполняется соотношение:

x>xo,

где x – абсцисса рассматриваемой точки; xo – абсцисса точки основания перпендикуляра, проведенного от рассматриваемой точки к осевой линии интерполированной модели перегона (рис. 4).

 

Рис. 4. Направление трафика, определяемое путем нахождения центральной точки гипотезы и ее положения по отношению к центральной линии интерполированной модели пролетов

 

Если соотношение не выполняется, индекс направления движения транспортного средства, находящегося на соответствующей полосе, равен 1.

Таким образом, алгоритм определения направления дорожного движения по BoundingBox ТС, включает в себя следующие этапы:

Шаг 1. Расчет координат центральной точки ТС:

xbb+wbb2;ybb+hbb2,

где (xbb; ybb) – координаты BoundingBox ТС; wbb, hbb – ширина и высота BoundingBox ТС.

Шаг 2. Нахождение перпендикуляра с минимальной длиной к одной из прямых, построенных на основе отрезков ломаной рассматриваемого перегона.

Шаг 3. Если неравенство верно, то это означает, что центральная точка находится по одну сторону от ломаной, и транспортное средство движется прямо. При нахождении центральной точки по другую сторону предполагается, что движение обратное. Для этого нужно найти отношение координат точки основания перпендикуляра и центральной точки ТС.

Выводы

Информация, собранная с орбитальных носителей в виде данных дистанционного зондирования (ДЗЗ), представляет собой всеобъемлющий и разнообразный источник знаний о наземных объектах [5–11]. Обнаружение и категоризация объектов в транспортном потоке, представленных на спутниковых снимках, является важнейшим аспектом решения проблемы интерпретации данных, полученных от систем ДЗЗ. Данная система исследований и разработок позволяет детектировать и классифицировать ТС на снимках с высоким пространственным разрешением, учитывая все описанные проблемы, возникающие при этом процессе.

Разрабатываемая алгоритмическая схема позволит производить численную оценку интенсивности и состава ТП по каждому перегону дорожной сети и может улучшить фактографическое обеспечение процессов транспортного планирования и повысить качество систем управления дорожным движением.

Мониторинг безопасности и организации дорожного движения будет проводиться чаще, чем предполагает «Порядок мониторинга дорожного движения» (утвержден приказом Минтранса России от 18 апреля 2019 г. № 114), поскольку предлагаемый метод оценивает состояние дорожного движения и его эффективность. Кроме того, он определяет и прогнозирует развитие процессов, влияющих на условия дорожного движения.

Решение задач формирования и развития транспортной инфраструктуры требует учета большого количества факторов, связанных с показателями технического развития города, ростом потребностей предприятий и населения, ресурсными возможностями. Требование учета временной динамики ресурсных ограничений совместно с динамикой специфики решаемых задач и потребностей в транспортных (дорожных) ресурсах приводит к объективной необходимости сформулировать научно обоснованный подход, позволяющий оптимизировать процессы совершенствования базовых магистральных транспортных связей на муниципальном уровне.

×

About the authors

Igor N. Pugachev

Khabarovsk Federal Research Center, FEB RAS

Author for correspondence.
Email: ipugachev64@mail.ru
ORCID iD: 0000-0003-0345-4350

Doctor of Technical Sciences, Associate Professor

Russian Federation, Khabarovsk

Vladimir S. Tormozov

Pacific State University

Email: 007465@pnu.edu.ru
ORCID iD: 0000-0002-5628-858X

Candidate of Technical Sciences, Associate Professor

Russian Federation, Khabarovsk

References

  1. Pugachev I. N., Markelov G. Ya., Tormozov V. S. Technique for counting vehicles using space images of ultra-high spatial resolution. Bulletin of Pacific National University. 2017;45(2):13–20. (In Russ.).
  2. Pugachev I. N., Markelov G. Ya., Tormozov V. S. Acceleration of the vehicle detection algorithm on satellite images using the hypothesis filtering procedure. Bulletin of the Russian New University. Series: Complex Systems: Models, Analysis, Control. 2019;(1):130–139. (In Russ.).
  3. Chen Ch., Minald A. A., Bogush R. P., Ma G., Weichen Y., Ablameiko S. V. Detection and classification of vehicles in ultra-high resolution images using neural networks. Journal of Applied Spectroscopy. 2022;89(2):275–282. (In Russ.).
  4. Pugachev I. N., Markelov G. Ya., Tormozov V. S. Training and use of a convolutional neural network for the detection and classification of vehicles on ultra-high resolution satellite images. Industrial ACS and Controllers. 2019;(10):20–25. (In Russ.).
  5. Golovnin O. K. System analysis and modeling of objects, processes and phenomena of transport infrastructure in technical control systems. Proceedings of the Samara Scientific Center of the Russian Academy of Sciences. 2018;20(6–2):301–310. (In Russ.).
  6. Bobyr M. V., Arkhipov A. E., Yakushev A. S., Bhattacharya S. Building a depth map using the upgraded Canny filter. Part 2. Industrial ACS and Controllers. 2021;(5):3–15. (In Russ.).
  7. Pashaev M. Ya. Management of transport logistics systems based on GLONASS. Bulletin of the Astrakhan State Technical University. Series: Management, Computer Technology and Informatics. 2017;(3):143–148. (In Russ.).
  8. Filippova N. A., Mushta B. M., Sidorenko A. V. Analysis of the development of the navigation system of dispatch control of freight transport. Synergy of Sciences. 2019;(36):734–751. (In Russ.).
  9. Isaeva E. I., Sorokin E. A. Evaluation of the effectiveness of the implementation of navigation satellite technologies for transportation in international traffic. In: Topical Issues of the Organization of Road transport, Traffic Safety and Operation of Vehicles: Collection of scientific papers based on the materials of the XIV International Scientific and Technical Conference. Saratov; 2019. P. 97–104. (In Russ.).
  10. Petrova E. A. Reducing the costs of a transport enterprise with the help of digital technologies. In: Problems of improving the organization of production and management of industrial enterprises: Interuniversity collection of scientific papers. Samara; 2021. N1. P. 228–231. (In Russ.).
  11. Mikheeva T. I., Golovnin O. K., Fedoseev A. A. Intelligent geoinformation platform for the study of transport processes. In: Information technologies and nanotechnologies (ITNT-2017). Proceedings of the III International Conference and Youth School. Samara; 2017. P. 753–761. (In Russ.).

Supplementary files

Supplementary Files
Action
1. JATS XML
2. Fig. 1. Basic stages of the TC detection and classification method: a - satellite image section, including the image of the crossing; b - image of the crossing within the considered section, obtained by software implementation of the search area reduction algorithm; c - set of hypotheses obtained by the modified selective search algorithm; d - set of hypotheses remaining as a result of low-frequency and size filtering; e - set of detected TCs, for which classification was performed; f - TCs with a certain size; g - set of hypotheses with a certain number of the detected TCs; h - set of hypotheses obtained by the modified selective search algorithm; h - set of hypotheses obtained by the modified selective search algorithm; i - set of hypotheses obtained by the modified selective search algorithm; j - set of hypotheses obtained by the modified selective search algorithm

Download (184KB)
3. Fig. 2. Structure diagram of the used CNN

Download (94KB)
4. Fig. 3. Plots of dependence of CNN learning error on the number of training epochs (1750, 3500, 5250, 7000 examples in the training sample) obtained as a result of the study

Download (152KB)
5. Fig. 4. Traffic direction determined by finding the centre point of the hypothesis and its position with respect to the centre line of the interpolated spanning model

Download (186KB)

Copyright (c) 2024 Russian Academy of Sciences