Introduktion
Одной из основных целей любого государства является обеспечение доступной, надежной и устойчивой электрической энергией. Главное препятствие к этому связано с тем фактом, что энергоснабжающие организации не всегда обладают всеобъемлющей картой воздушных линий электропередач, а схемы, которые существуют, как правило, устарели и неполны. Без централизованной карты, правительства или другие организации не обладают знаниями для принятия обоснованных решений об инвестировании средств в техническое обслуживание или расширение электрической сети. Этот недостаток информации также усложняет принятие решений об установке альтернативных источников энергии – не зная, где обычная сеть, трудно разумно использовать альтернативы, такие как солнечная или ветровая энергия. Помимо самой карты, правительства и организации нуждаются в быстром и экономически эффективном инструменте. Высоковольтная сеть постоянно расширяется, поэтому важным моментом является возможность создания точных снимков через равные промежутки времени. Функционал платформы cGIS включает алгоритм, способный эффективно картировать инфраструктуру воздушных линий электропередач.
Denna funktion ger en automatisk lösning på problemet med att upptäcka kraftledningar med hjälp av maskininlärning. Lösningen är en algoritm som tar emot fjärranalysdata som indata. De resulterande bilderna bearbetas i det synliga spektrumet av ett neuralt nätverk och returnerar geografiska platser som med stor sannolikhet innehåller delar av högspänningsinfrastruktur - kraftledningsstolpar. Dessa uppgifter måste dessutom verifieras av operatören. Även i sin ursprungliga form klassificeras de dock som geografiska positioner som med stor sannolikhet motsvarar platser för verkliga objekt i områdena.
Klassificering eller upptäckt?
Den första frågan för att skapa en sådan lösning var att fastställa själva uppgiften för maskininlärning. Vi inspirerades inledningsvis av hur DevSeed löste ett liknande problem. Deras lösning omfattar klassificering av vektorplattor, på en karta i skala 1:2000, som anger om det finns kraftledningsstolpar på en viss platta. Operatören måste sedan manuellt spåra kraftledningar på de klassificerade rutorna med hjälp av ett webbgränssnitt med en interaktiv karta.
Denna metod för identifiering av luftledningar har visat sig vara otillräckligt effektiv. Vi bestämde oss för att hitta en bättre lösning på detta problem, nämligen att direkt upptäcka själva kraftledningsstolparna på kartan.
Vi bestämde oss för att använda upptäckt i stället för klassificering eftersom upptäcktsalgoritmen har samma nackdelar som klassificeringsalgoritmen.
Fördelar:
- En stark approximation (1:2000) krävs inte för att upptäcka kraftledningar. Offentligt tillgängliga kartor i skalor större än 1:4000 kräver en särskild taxa, medan det för detektering inte är avgörande hur stor plattan är, utan det är bara viktigt att själva kraftledningsstolpen är direkt urskiljbar på kartan.
- Manuell spårning behövs inte.
- Detektionsutgången visar omedelbart var kraftledningsstolpen befinner sig i geografiska koordinater, vilket gör att kraftledningarna kan spåras automatiskt.
Nackdelar:
- Falskt positiva resultat när träd kan framstå som kraftledningsstolpar.
- Missar, när vissa objekt på kartan kan missas på grund av ett fel i detektionsalgoritmen.
Rådata för maskininlärning
Indata för utbildningsuppgiften är de geografiska koordinaterna för kraftledningsstolpar som kategoriseras enligt följande meningsfulla attribut: stolptyp, produktmaterial, spänningar och andra. Sammanlagt 211725 objekt fanns representerade i den fullständiga datamängden. Det fortsatta arbetet utfördes med data grupperade efter stödtyp som den mest representativa egenskapen. Nedan följer en sammanfattning av uppgifterna enligt detta kriterium.
Typ | Antal objekt |
Stolpar i armerad betong för överföringsledningar upp till 20 kV | 119383 |
Stöd för överföringsledningar i trä upp till 20 kV | 83453 |
Mellanliggande stolpar för 110 kV-överföringsledningar | 4938 |
110 kV förankrade stolpar | 1176 |
Mellanliggande stolpar upp till 330 kV | 808 |
Metallstolpar upp till 20 kV | 604 |
Tieboltar upp till 330 kV | 265 |
Mellanliggande stolpar för kraftöverföringsledningar 35 kV | 175 |
220 kV 220 kV mellanliggande torn | 96 |
Understationer och portaler för luftledningar på 110-330 kV | 39 |
Förankrade stolpar för 35 kV-överföringsledningar | 31 |
Maststolpar, vägstolpar | 12 |
110 kV OL och portaler för understationer | 9 |
Ankarstolpar för 220 kV-överföringsledningar | 8 |
Spännvidder | 2 |
35 kV OL- och PL-portaler | 2 |
Luftburna buntkablar | 1 |
TOTALT | 211725 |
På grund av bristen på särskiljbarhet av alla typer av objekt på bilderna valdes följande objekt ut för vidare arbete med algoritmen för maskininlärning:
Typ | Antal objekt |
Mellanliggande stolpar upp till 330 kV | 808 |
220 kV 220 kV mellanliggande torn | 96 |
Mellanliggande stolpar för 110 kV-överföringsledningar | 4938 |
Tieboltar upp till 330 kV | 265 |
Ankarstolpar för 220 kV-överföringsledningar | 8 |
110 kV förankrade stolpar | 1176 |
TOTALT | 7291 |
Data för maskininlärning var en rasterbild med 512x512 pixlar där högspänningsledningstornens områden var markerade. Markeringen var ett rektangulärt område i bilden som motsvarar ett genomsnittligt område på 70x70 meter på marken.
För maskininlärning delades de ursprungliga rasterbilderna upp med 80 % data för träning och 20 % data för testning.
Val av lösningsarkitektur
För uppgiften att upptäcka objekt i en bild där objekt av målklassen endast utgör en liten del av bilden är det ett problem att de delar av bilden där målobjektet saknas bidrar för mycket till träningsprocessen, vilket i slutändan leder till många luckor i testuppsättningen. För att lösa detta problem använde vi den neurala nätverksfunktionen Focal Loss, som minskar inflytandet av frekventa bakgrunder och ökar betydelsen av sällsynta objekt i träningen.
Таким образом была выбрана следующая архитектура нейронной сети для детектирования – RetinaNet, которая как раз и использует Focal Loss в качестве функции потерь.
Under RetinaNet-utbildningen beräknas förlustfunktionen för alla tänkbara orienteringar av kandidatområden (ankare), från alla nivåer av bildskalning. Totalt finns det cirka 100 000 områden för en bild. Det fokala förlustvärdet beräknas som summan av funktionsvärdena för alla ankare, normaliserat med antalet ankare som innehåller de sökta objekten. Normaliseringen görs endast av dem och inte av det totala antalet, eftersom de allra flesta ankare är lättdefinierade bakgrunder med litet bidrag till den totala förlustfunktionen.
RetinaNet består strukturellt sett av Backbone och två ytterligare nätverk (Classification Subnet) och Object Boundary Definition (Box Regression Subnet).
В качестве базисной нейронной сети используется так называемая Feature Pyramid Network (FPN), работающая поверх одной из общеиспользуемых свёрточных нейронных сетей (например ResNet-50). FPN имеет дополнительные боковые выходы со скрытых слоев свёрточной сети, формирующие уровни пирамиды с разным масштабом. Каждый уровень дополняется «знаниями сверху», т.е. информацией с более высоких уровней, имеющих меньший размер, но содержащих сведения об областях большей площади. Выглядит это как искусственное увеличение (например, простым повтором элементов) более «свёрнутой» карты признаков до размера текущей карты, их поэлементное суммирование и передача как на более низкие уровни пирамиды, так и на вход остальных подсетей (т.е. в Classification Subnet и Box Regression Subnet). Это позволяет выделить из исходного изображения пирамиду признаков в разных масштабах, на которых могут быть обнаружены как большие, так и мелкие объекты. FPN используется во многих архитектурах, улучшая детектирование объектов разного масштаба – RPN, DeepMask, Fast R-CNN, Mask R-CNN и других.
I vårt nät, liksom i det ursprungliga, används FPN med fem nivåer från P3 till P7. Nivån Pl har en upplösning som är 2l gånger mindre än den ingående bilden. Alla nivåer i pyramiden har samma antal kanaler C = 256 och samma antal ankare.
Площади анкоров были подобраны следующим образом: [16 х 16] до [256 x 256] для каждого уровня пирамиды от P3 до P7 соответственно, с шагом смещения (strides) [8 — 128] пикселей. Такой размер позволяет анализировать мелкие объекты и некоторую окрестность вокруг. В нашем случае – это опоры линий электропередач с прилегающей к ним тенью.
Utbildning och resultat
Resultaten av maskininlärning utvärderades på följande sätt:
- Testning av ett fördröjt urval på 20 % av det ursprungliga urvalet för att matcha de förutspådda rektangulära ramarna med de riktiga manuellt markerade ramarna av experten. 70 % av rektangelområdena identifierades korrekt, med tanke på att datamängden inte är så stor.
- Beräkning av avvikelseavståndet mellan de faktiska koordinaterna och de förutspådda koordinaterna i hela datasetet. Vid den automatiska lokaliseringen av stödpunkterna med hjälp av algoritmen för maskininlärning visade sig upp till 60 % av platserna motsvara de faktiska objekten i elnäten (stödpunkterna) och ligger i genomsnitt på ett avstånd på högst 70 meter från de förutsagda. Det hittades också fall där det inte fanns några stolpar i uppgifterna, men algoritmen hittade dem i bilden, vilket i slutändan ledde till en snedvridning av kvalitetsmåttet, eftersom det finns ett objekt i bilden, men det finns inte i referensdatabasen, vilket tyder på att algoritmen framgångsrikt kan användas för att uppdatera databaserna med information om kraftledningar.