Автоматическое определение объектов энергетической инфраструктуры

  • baycgis
  • 10 августа, 2021
  • Комментариев нет

Введение

Одной из основных целей любого государства является обеспечение доступной, надежной и устойчивой электрической энергией. Главное препятствие к этому связано с тем фактом, что энергоснабжающие организации не всегда обладают всеобъемлющей картой воздушных линий электропередач, а схемы, которые существуют, как правило, устарели и неполны. Без централизованной карты, правительства или другие организации не обладают знаниями для принятия обоснованных решений об инвестировании средств в техническое обслуживание или расширение электрической сети. Этот недостаток информации также усложняет принятие решений об установке альтернативных источников энергии — не зная, где обычная сеть, трудно разумно использовать альтернативы, такие как солнечная или ветровая энергия. Помимо самой карты, правительства и организации нуждаются в быстром и экономически эффективном инструменте. Высоковольтная сеть постоянно расширяется, поэтому важным моментом является возможность создания точных снимков через равные промежутки времени. Функционал платформы cGIS включает алгоритм, способный эффективно картировать инфраструктуру воздушных линий электропередач.

Мы предлагаем автоматическое решение задачи обнаружения линий электропередач, основанное на использовании машинного обучения. Решение представляет собой алгоритм, который получает на входе данные дистанционного зондирования Земли. Полученные снимки выполнены в видимом спектре обрабатывает нейронная сеть и возвращает геопространственные местоположения, которые с высокой степенью вероятности содержат элементы высоковольтной инфраструктуры — вышки линий электропередач. Эти данные в дальнейшем требуют верификации оператором. Однако, даже в исходном виде, они представляют собой классифицированные географические положения, с высокой степенью вероятности соответствующие местоположениям реальных объектов на территориях.

Линии электропередач на снимках.


Классификация или детектирование?

Первым вопросом для создания такого решения стала постановка самой задачи машинного обучения. Изначально мы были вдохновлены тем, как подобная проблема решалась у компании DevSeed. Их решение предполагает классификацию векторных тайлов, на карте с масштабом 1:2000, которая указывает, есть ли на данном тайле опоры линий электропередач. В дальнейшем оператору необходимо по классифицированным тайлам вручную провести трассировку линий электропередач, используя web-интерфейс c интерактивной картой.

Пример классификации векторных тайлов компании DevSeed. Выделяются те тайлы, на которых содержатся опоры линий электропередач для дальнейшей ручной трассировки.

Данный способ картирования воздушных линий электропередач оказался недостаточно эффективен. Мы приняли решение найти более оптимальное решение данной задачи, а именно, непосредственное детектирование самих опор линий электропередач на карте.
 
Мы решили использовать детектирование вместо классификации поскольку алгоритму детектирования при более значимых преимуществах свойственны те же самые недостатки, что и алгоритму классификации.

Преимущества:

  1. Для обнаружения линий электропередач не требуется сильное приближение (1:2000). Для публично доступных карт в масштабах крупнее 1:4000 требуется особый тарифный план, в то время как для обнаружения размер тайла не существенен, важно только, чтобы непосредственно сама опора была различима на карте.
  2. Процесс ручной трассировки не требуется.
  3. На выходе детектирования сразу выдается местоположение опоры в географических координатах, что позволяет строить трассировку линий электропередач автоматически.

Недостатки:

  1. Ложные срабатывания, когда в качестве опор могут выделяться деревья.
  2. Пропуски, когда некоторые объекты на карте могут быть пропущены, ввиду ошибки алгоритма детектирования.


Исходные данные для машинного обучения

Исходные данные для задачи обучения представляют собой географические координаты опор линий электропередач, категоризированных по следующим значимым признакам: тип опоры, материал изделия, вольтаж и прочие. Всего в полном наборе данных было представлено 211725 объектов. В дальнейшем работа велась с данными, сгруппированными по типам опор, как наиболее представительному признаку. Ниже приведены сводные данные по этому признаку.

ТипКоличество объектов
Ж/б опоры ЛЭП до20кВ119383
Деревянные опоры ЛЭП до20кВ83453
Промежуточные опоры ЛЭП 110кВ4938
Анкерные опоры ЛЭП 110кВ1176
Промежуточные опоры ЛЭП 330кВ808
Металлические опоры ЛЭП до20кВ604
Анкерные опоры ЛЭП 330кВ265
Промежуточные опоры ЛЭП 35кВ175
Промежуточные опоры ЛЭП 220кВ96
Порталы ПС и ВЛ 110-330 кВ39
Анкерные опоры ЛЭП 35кВ31
Опоры высокомачтовые, дорожные12
Порталы ПС и ВЛ 110 кВ9
Анкерные опоры ЛЭП 220кВ8
Пролеты2
Порталы ПС и ВЛ 35 кВ2
СИП без нулевой несущей жилы1
ВСЕГО211725
Таблица № 1. Все типы энергетической инфраструктуры


В связи с недостаточной различимостью на снимках объектов всех обозначенных типов, для дальнейшей работы в рамках алгоритма машинного обучения были выбраны следующие объекты:

ТипКоличество объектов
Промежуточные опоры ЛЭП 330кВ808
Промежуточные опоры ЛЭП 220кВ96
Промежуточные опоры ЛЭП 110кВ4938
Анкерные опоры ЛЭП 330кВ265
Анкерные опоры ЛЭП 220кВ8
Анкерные опоры ЛЭП 110кВ1176
ВСЕГО7291
Таблица № 2. Выбранные типы объектов для распознавания


Данные для машинного обучения представляли собой растровые изображения размером 512х512 пикселей с размеченными на них районами нахождения высоковольтных опор линий электропередач. Разметка представляла собой прямоугольную область на изображении, соответствующую в среднем области 70х70 метров на земле.

Для машинного обучения исходные растровые изображения были разбиты в отношении 80% данных для обучения и 20% данных для тестирования.


Выбор архитектуры решения

Для задачи детектирования объектов на изображении, где объекты целевого класса являются лишь малой частью изображения, является проблемой то, что в процессе обучения слишком большой вклад вносят те части изображения, на которых отсутствует целевой объект, что в итоге приводит к множеству пропусков на тестовом множестве. Для решения данной проблемы мы использовали функцию потерь нейронной сети Focal Loss, которая снижает влияние часто встречающегося фона и повышает значимость редко встречающихся объектов при обучении.

Таким образом была выбрана следующая архитектура нейронной сети для детектирования — RetinaNet, которая как раз и использует Focal Loss в качестве функции потерь.

В процессе обучения RetinaNet функция потерь вычисляется для всех рассматриваемых ориентаций областей-кандидатов (анкоров), со всех уровней масштабирования изображения. Всего — около 100 тысяч областей для одного изображения. Значение Focal Loss вычисляется как сумма значений функции для всех анкоров, нормализованная по количеству анкоров, содержащих искомые объекты. Нормализация производится только по ним, а не общему числу, поскольку подавляющее большинство анкоров — это легко определяемый фон, с незначительным вкладом в общую функцию потерь.

Структурно RetinaNet состоит из Backbone и двух дополнительных сетей классификации (Classification Subnet) и определения границ объекта (Box Regression Subnet).

Архитектура нейронной сети RetinaNet

В качестве базисной нейронной сети используется так называемая Feature Pyramid Network (FPN), работающая поверх одной из общеиспользуемых свёрточных нейронных сетей (например ResNet-50). FPN имеет дополнительные боковые выходы со скрытых слоев свёрточной сети, формирующие уровни пирамиды с разным масштабом. Каждый уровень дополняется «знаниями сверху», т.е. информацией с более высоких уровней, имеющих меньший размер, но содержащих сведения об областях большей площади. Выглядит это как искусственное увеличение (например, простым повтором элементов) более «свёрнутой» карты признаков до размера текущей карты, их поэлементное суммирование и передача как на более низкие уровни пирамиды, так и на вход остальных подсетей (т.е. в Classification Subnet и Box Regression Subnet). Это позволяет выделить из исходного изображения пирамиду признаков в разных масштабах, на которых могут быть обнаружены как большие, так и мелкие объекты. FPN используется во многих архитектурах, улучшая детектирование объектов разного масштаба — RPN, DeepMask, Fast R-CNN, Mask R-CNN и других.

В нашей сети, как и в оригинальной, использована FPN с 5-ю уровнями, нумеруемыми с P3 по P7. Уровень Pl имеет разрешение в 2l раз меньшее, чем входное изображение. Все уровни пирамиды имеют одинаковое количество каналов С = 256 и количество анкоров.

Площади анкоров были подобраны следующим образом: [16 х 16] до [256 x 256] для каждого уровня пирамиды от P3 до P7 соответственно, с шагом смещения (strides) [8 — 128] пикселей. Такой размер позволяет анализировать мелкие объекты и некоторую окрестность вокруг. В нашем случае — это опоры линий электропередач с прилегающей к ним тенью.

Обучение и результаты

Оценка результатов машинного обучения производилась следующими способами:

  1. Проверка на отложенной выборке в 20% от исходного на соответствие предсказанных прямоугольных рамок и истинных, размеченных экспертом вручную. 70% площади прямоугольников были опознаны верно, учитывая тот факт, что количество данных не многочисленно.
  2. Вычисление расстояния отклонения актуальных координат от предсказанных во всем наборе данных. В ходе автоматического определения местоположения опор алгоритмом машинного обучения было выявлено до 60% местоположений, соответствующих актуальным объектам электрических сетей (опорам) и находящихся, в среднем, на расстоянии не более чем 70 метров от предсказанных. Также были найдены случаи, когда в данных не было опор, а алгоритм их нашел на снимке, что в итоге привело к искажению метрики качества, так как фактически объект на снимке есть, но в справочной базе данных его нет, что говорит о том, что алгоритм может быть с успехом использован для актуализации баз данных с информацией о линиях электропередач.
ru_RU