Kartläggning av elinfrastruktur med djup inlärning

  • baycgis
  • augusti 10, 2021
  • Inga kommentarer

Introduktion

Ett av de främsta målen för varje stat är att tillhandahålla en prisvärd, tillförlitlig och hållbar elförsörjning. Ett stort hinder för detta är att elbolagen inte alltid har en heltäckande karta över luftledningar, och de system som finns är oftast föråldrade och ofullständiga. Avsaknaden av en aktuell karta gör det svårt att ordna underhållet eller utvecklingen av energinätet, inklusive användningen av alternativa energikällor. Regeringar och organisationer behöver därför ett snabbt och kostnadseffektivt verktyg för att skapa kartor. Högspänningsnätet byggs ständigt ut, så det är viktigt att kunna nå exakta fjärranalysdata med jämna mellanrum. Därför har cGIS-plattformen "ombord" en algoritm som effektivt kan kartlägga infrastrukturen för luftledningar.

Denna funktion ger en automatisk lösning på problemet med att upptäcka kraftledningar med hjälp av maskininlärning. Lösningen är en algoritm som tar emot fjärranalysdata som indata. De resulterande bilderna bearbetas i det synliga spektrumet av ett neuralt nätverk och returnerar geografiska platser som med stor sannolikhet innehåller delar av högspänningsinfrastruktur - kraftledningsstolpar. Dessa uppgifter måste dessutom verifieras av operatören. Även i sin ursprungliga form klassificeras de dock som geografiska positioner som med stor sannolikhet motsvarar platser för verkliga objekt i områdena.

Kraftledningar i satellitbilderna


Klassificering eller upptäckt?

Den första frågan för att skapa en sådan lösning var att fastställa själva uppgiften för maskininlärning. Vi inspirerades inledningsvis av hur DevSeed löste ett liknande problem. Deras lösning omfattar klassificering av vektorplattor, på en karta i skala 1:2000, som anger om det finns kraftledningsstolpar på en viss platta. Operatören måste sedan manuellt spåra kraftledningar på de klassificerade rutorna med hjälp av ett webbgränssnitt med en interaktiv karta.

Ett exempel på DevSeeds klassificering av vektorplattor. De plattor som innehåller stöd för kraftledningar väljs ut för ytterligare manuell spårning.

Denna metod för identifiering av luftledningar har visat sig vara otillräckligt effektiv. Vi bestämde oss för att hitta en bättre lösning på detta problem, nämligen att direkt upptäcka själva kraftledningsstolparna på kartan.
 
Vi bestämde oss för att använda upptäckt i stället för klassificering eftersom upptäcktsalgoritmen har samma nackdelar som klassificeringsalgoritmen.

Fördelar:

  1. En stark approximation (1:2000) krävs inte för att upptäcka kraftledningar. Offentligt tillgängliga kartor i skalor större än 1:4000 kräver en särskild taxa, medan det för detektering inte är avgörande hur stor plattan är, utan det är bara viktigt att själva kraftledningsstolpen är direkt urskiljbar på kartan.
  2. Manuell spårning behövs inte.
  3. Detektionsutgången visar omedelbart var kraftledningsstolpen befinner sig i geografiska koordinater, vilket gör att kraftledningarna kan spåras automatiskt.

Nackdelar:

  1. Falskt positiva resultat när träd kan framstå som kraftledningsstolpar.
  2. Missar, när vissa objekt på kartan kan missas på grund av ett fel i detektionsalgoritmen.


Rådata för maskininlärning

Indata för utbildningsuppgiften är de geografiska koordinaterna för kraftledningsstolpar som kategoriseras enligt följande meningsfulla attribut: stolptyp, produktmaterial, spänningar och andra. Sammanlagt 211725 objekt fanns representerade i den fullständiga datamängden. Det fortsatta arbetet utfördes med data grupperade efter stödtyp som den mest representativa egenskapen. Nedan följer en sammanfattning av uppgifterna enligt detta kriterium.

TypAntal objekt
Stolpar i armerad betong för överföringsledningar upp till 20 kV119383
Stöd för överföringsledningar i trä upp till 20 kV83453
Mellanliggande stolpar för 110 kV-överföringsledningar4938
110 kV förankrade stolpar1176
Mellanliggande stolpar upp till 330 kV808
Metallstolpar upp till 20 kV604
Tieboltar upp till 330 kV265
Mellanliggande stolpar för kraftöverföringsledningar 35 kV175
220 kV 220 kV mellanliggande torn96
Understationer och portaler för luftledningar på 110-330 kV39
Förankrade stolpar för 35 kV-överföringsledningar31
Maststolpar, vägstolpar12
110 kV OL och portaler för understationer9
Ankarstolpar för 220 kV-överföringsledningar8
Spännvidder2
35 kV OL- och PL-portaler2
Luftburna buntkablar1
TOTALT211725
Tabell 1. Alla typer av energiinfrastruktur


På grund av bristen på särskiljbarhet av alla typer av objekt på bilderna valdes följande objekt ut för vidare arbete med algoritmen för maskininlärning:

TypAntal objekt
Mellanliggande stolpar upp till 330 kV808
220 kV 220 kV mellanliggande torn96
Mellanliggande stolpar för 110 kV-överföringsledningar4938
Tieboltar upp till 330 kV265
Ankarstolpar för 220 kV-överföringsledningar8
110 kV förankrade stolpar1176
TOTALT7291
Tabell 2. Utvalda typer av objekt för igenkänning


Data för maskininlärning var en rasterbild med 512x512 pixlar där högspänningsledningstornens områden var markerade. Markeringen var ett rektangulärt område i bilden som motsvarar ett genomsnittligt område på 70x70 meter på marken.

För maskininlärning delades de ursprungliga rasterbilderna upp med 80 % data för träning och 20 % data för testning.


Val av lösningsarkitektur

För uppgiften att upptäcka objekt i en bild där objekt av målklassen endast utgör en liten del av bilden är det ett problem att de delar av bilden där målobjektet saknas bidrar för mycket till träningsprocessen, vilket i slutändan leder till många luckor i testuppsättningen. För att lösa detta problem använde vi den neurala nätverksfunktionen Focal Loss, som minskar inflytandet av frekventa bakgrunder och ökar betydelsen av sällsynta objekt i träningen.

Därför valdes följande neurala nätverksarkitektur för detektion - RetinaNet, som endast använder Focal Loss som förlustfunktion.

Under RetinaNet-utbildningen beräknas förlustfunktionen för alla tänkbara orienteringar av kandidatområden (ankare), från alla nivåer av bildskalning. Totalt finns det cirka 100 000 områden för en bild. Det fokala förlustvärdet beräknas som summan av funktionsvärdena för alla ankare, normaliserat med antalet ankare som innehåller de sökta objekten. Normaliseringen görs endast av dem och inte av det totala antalet, eftersom de allra flesta ankare är lättdefinierade bakgrunder med litet bidrag till den totala förlustfunktionen.

RetinaNet består strukturellt sett av Backbone och två ytterligare nätverk (Classification Subnet) och Object Boundary Definition (Box Regression Subnet).

RetinaNet neurala nätverksarkitektur

Det så kallade Feature Pyramid Network (FPN), som fungerar ovanpå ett av de vanligaste konvolutionella neurala nätverken (t.ex. ResNet-50), används som basneuralt nätverk. FPN har ytterligare laterala utgångar från de dolda lagren i det konvolutionella nätverket som bildar pyramidnivåer med olika skalor. Varje nivå kompletteras med "kunskap ovanifrån", dvs. information från de högre nivåerna, som är mindre i storlek men innehåller information om områden i det större området. Det ser ut som en artificiell utvidgning (t.ex. genom enkel upprepning av element) av mer "kollapsade" funktionskartor till storleken på den aktuella kartan, deras summering element för element och överföring både till lägre nivåer i pyramiden och ingång till andra delnät (dvs. till delnätet för klassificering och delnätet för boxregression). Detta gör det möjligt att från den ursprungliga bilden extrahera en pyramid av egenskaper i olika skalor, på vilken både stora och små objekt kan upptäckas. FPN används i många arkitekturer som förbättrar upptäckten av objekt i olika skalor - RPN, DeepMask, Fast R-CNN, Mask R-CNN och andra.

I vårt nät, liksom i det ursprungliga, används FPN med fem nivåer från P3 till P7. Nivån Pl har en upplösning som är 2l gånger mindre än den ingående bilden. Alla nivåer i pyramiden har samma antal kanaler C = 256 och samma antal ankare.

Förankringarnas områden valdes enligt följande: [16 x 16] till [256 x 256] för varje pyramidnivå från P3 till P7, med ett förskjutningssteg (steg) på [8 - 128] pixlar. Denna storlek gör det möjligt att analysera små objekt och vissa omgivande områden. I vårt fall är det kraftledningsstolpar med omgivande skuggor.

Utbildning och resultat

Resultaten av maskininlärning utvärderades på följande sätt:

  1. Testning av ett fördröjt urval på 20 % av det ursprungliga urvalet för att matcha de förutspådda rektangulära ramarna med de riktiga manuellt markerade ramarna av experten. 70 % av rektangelområdena identifierades korrekt, med tanke på att datamängden inte är så stor.
  2. Beräkning av avvikelseavståndet mellan de faktiska koordinaterna och de förutspådda koordinaterna i hela datasetet. Vid den automatiska lokaliseringen av stödpunkterna med hjälp av algoritmen för maskininlärning visade sig upp till 60 % av platserna motsvara de faktiska objekten i elnäten (stödpunkterna) och ligger i genomsnitt på ett avstånd på högst 70 meter från de förutsagda. Det hittades också fall där det inte fanns några stolpar i uppgifterna, men algoritmen hittade dem i bilden, vilket i slutändan ledde till en snedvridning av kvalitetsmåttet, eftersom det finns ett objekt i bilden, men det finns inte i referensdatabasen, vilket tyder på att algoritmen framgångsrikt kan användas för att uppdatera databaserna med information om kraftledningar.
sv_SE