Die Daten der EnergyMap zum Download
Jeder darf und soll selber sehen und nachprüfen können, welchen Erfolg die Erneuerbaren Energien in seiner Region haben. Wir stellen die öffentlich verfügbaren Daten hier zum Download bereit.
Die Motivation zu unserem "EEG-Anlagenregister"
Wie wir bereits im Abschnitt über die gesetzliche Grundlage der EEG-Meldepflicht dargelegt haben, besteht (lediglich in der Theorie?) der Wunsch des Gesetzgebers nach einem Anlagenregister schon seit vielen Jahren. Bis heute (Stand Februar 2013) wurde es jedoch nicht umgesetzt. Denn auch die EEG-KWK Internetplattform der Energiewirtschaft stellt bisher noch keine Bewegungsdaten bereit. Also warten wir mal ab, was der Verlauf des Jahres 2013 bringen wird.
Die zur Publikation der Anlagendaten verpflichteten Netzbetreiber kommen bisher ihren gesetzlichen Meldepflichten nur schleppend nach und verwenden dafür (erwartungsgemäß?) unterschiedliche Datenformate. Die eigentlichen Daten sind ihrerseits manchmal fehlerhaft oder unvollständig. Erschwerend kommt noch hinzu, dass die Daten zwar öffentlich im Internet publiziert werden, aber an Orten tief in der Hierarchie der Firmen-Webseiten, wo sie für Ungeübte meist erst nach längerer Suche aufzufinden sind.
Weiterhin sind die Netzgebiete oft zerstückelt und aus technischen Gründen meist nicht direkt mit den Verwaltungsgrenzen von Gemeinden oder Landkreisen deckungsgleich. Eine einfache Überprüfung des regionalen Ausbaus der Erneuerbaren Energien wird damit sehr schwierig — bzw. für Laien nahezu unmöglich.
Aus diesen Gründen haben wir uns entschlossen einmal alle Daten zusammenzuführen, sie auf offensichtliche Fehler zu prüfen und dann alle bereinigten Daten in einem Datensatz zu veröffentlichen.
Der Datensatz
Das von uns bereitgestellte Datenformat ist ähnlich wie das der großen Energieversorger … nur sind wir etwas "professioneller":
- Die Buchstaben der Datei sind im UTF-8 Zeichenformat kodiert.
- Es ist eine CSV-Datei, also "Comma seperated values", in der die einzelnen Spalten durch einen Semicolon ";" getrennt werden.
- Kommentarzeilen werden mit einem "#" am Zeilenanfang markiert.
- Die Bedeutung der einzelnen Spalten wird in einer Kommentarzeile an Anfang der Datei erläutert.
- Der Inhalt ist geografisch sortiert ("Depth First Recursion"). Alle Anlagen einer Verwaltungsregion sollten untereinander stehen.
Das CSV-Format hat zwar viele Unzulänglichkeiten, jedoch scheinen viele Nutzer der EnergyMap die Daten mit normalen Tabellenkalkulationsprogrammen auszuwerten, weshalb wir bis auf weiteres von einer Umstellung auf XML oder JSON Datenstrukturen Abstand nehmen werden.
Hinweis:
Das Datenformat entspricht dem Download vom 07.10.2012. Zu den damaligen Neuerungen zählte:
- Anstelle der 2010er-Ertragswerte wird nun die Spalte "kWh (2011)" ausgegeben.
- Wir binden zusätzlich zu den OpenGeoDB-Kennzahlen nun auch die offiziellen Gemeindeschlüssel-Kennzahlen der Orte ein, sofern uns diese bekannt sind.
- Wir haben begonnen die GPS-Koordinaten aufzulisten. Die "Genauigkeit" liegt aber bisher überall bei 3 km, womit wir markieren, dass die GPS Daten aus der Position der dazugehörigen Ortsmittelpunkte abgeleitet wurden. Es ist also nur ein grober Schätzwert!
- Die Validierung bleibt die letzte Spalte, hat aber nun eine andere Spaltennummer.
Suspekte Datensätze
Da die Energieversorger offenbar selbst die grundlegendsten Validierungen nicht durchführen, leiten wir einige Basiskennzahlen aus den Daten ab und lassen diese von unserem Validierungssystem überprüfen.
Im nebenstehenden CSV-Download befinden sich alle "suspekten" Anlagen. Einen Hinweis auf die vorliegenden Unstimmigkeiten findet man dort in der letzten Spalte. Wir prüfen unter anderem folgende Aspekte:
- Unglaubwürdige Leistungswert: in der Regel ist dies ein Zeichen dafür, dass die betroffene Anlage mit "0 kW"-Leistung gemeldet wurde.
- Unglaubwürdige Ertragskennzahl: weicht der "kWh/kW"-Kennwert um mehr als 50% vom landesweiten Durchschnitt ab, so ist der Datensatz suspekt. Meist liegen hier Tippfehler in den Stammdaten vor.
- Unglaubwürdige Spannungsebene: es ist suspekt, wenn eine 3 kW-Solarstromanlage am 380 kV-Netz hängt. Diese Art der Überprüfung ist aber leider etwas überempfindlich, weil der Zusammenschluss vieler kleiner Anlagen durchaus üblich ist (z.B. große Windparks, vor allem Offshore) und damit auf den ersten Blick suspekte Netzanschlusspunkte oft dann doch korrekt sein können.
Es fällt bei den suspekten Datensätzen auf, dass es auch hier Häufungen bei bestimmten Netzbetreibern gibt.
Erstaunlich ist auch, dass 453 Anlagen (271 davon sind Biomasse) mehr als 8760 Stunden im Jahr gelaufen sind ... was leider unmöglich ist, da ein Jahr nicht mehr Stunden hat! Hier liegen entweder gravierende Datenprobleme vor, oder - was vor allem bei Biogasanlagen der Fall zu sein scheint - es werden größere Anlagen betrieben, als man im Rahmen der Genehmigung beantragt hat.
Es wäre wünschenswert, wenn diese "suspekten" Anlagen von den zuständigen Netzbetreibern und Genehmigungsbehörden überprüft würden.
Die Rohdaten der Netzbetreiber
Um noch mehr Transparenz in unsere Auswertungen zu bringen stellen wir auch die gesammelten Rohdaten zur Verfügung. Sollten einige Angaben in unserem Datenbestand fehlerhaft erscheinen, so kann man hier überprüfen, ob unser Auswertungssystem dafür verantwortlich ist (was durchaus auch mal passieren kann), oder ob die Fehler tatsächlich bereits in den offiziellen Anlagenregistern enthalten waren.
Ein ZIP-Archiv mit allen Dateien ist weiter unten neben der Analyse der jeweiligen Datenimporte verlinkt.
Das Urheberrecht
Das EEG verpflichtet die Netzbetreiber zur Veröffentlichung der Daten. Nach unserem Verständnis der gesetzlichen Grundlage handelt es sich somit um "freie, öffentliche Daten". Da wir diese Daten nur zusammenführen und auf Plausibilität testen erheben wir von unserer Seite ebenfalls keinen Anspruch auf ein "Urheberrecht", auch wenn dies für einige Aspekte der Datenbasis berechtigt sein könnte.
Da der Prozess dennoch mit viel Arbeit verbunden ist, würden wir uns jedoch freuen, wenn alle, die unsere aufbereiteten Daten verwenden, unser Projekt im Sinn der "Fairness" auch auf die eine oder andere Art unterstützen würde. Dies könnte z.B. der Beitritt zu einem der Trägervereine sein, eine Spende oder die Nennung und der Verweis auf die "EnergyMap" als Quelle des Datenbestandes.
Die Zukunft
Es ist geplant hier noch weiterführende Daten einfliessen zu lassen um so z.B. Aspekte der Anlagenqualität oder auch Standortpotentiale an zentraler Stelle zugänglich zu machen.
Weiterhin soll die Erfassung der Erneuerbaren Energie auch nicht auf die Bundesrepublik Deutschland beschränkt bleiben. Sobald sich uns neue Datenquellen öffnen, werden auch diese in die EnergyMap einbezogen werden. Ein erster Schritt in diese Richtung ist das Energy4Life-Projekt.
Die Vergangenheit
Um zu dokumentieren, wie sich der hier zum Download angeboten Datenbestand entwickelt hat, versuchen wir nachfolgend in groben Zügen die Entwicklungsstufen und unterschiedlichen Importvorgänge zu beschreiben. Dies ist eine kleine Historie der EnergyMap.
Sollten diese Ausführungen Ihre Fragen nicht beantworten, so lesen Sie doch bitte auch unser FAQ-Seite mit den häufig gestellten Fragen.
16.02.2013 - "Das Orakel von EEX"
Eigentlich haben wir uns ja schon daran gewöhnt: Anlagen mit mehr Betriebsstunden pro Jahr als ein Jahr haben kann, fiktive Anlagen, verspätete Meldungen, willkürliche Änderungen an Datenformaten, etc. pp. Alles wie immer.
Wir wollen deshalb eine Beobachtung hervorheben, die uns schon lange "beeindruckt". An der Leipziger Strombörse (EEX) werden schon seit Jahren die Erneuerbaren "kWh" im Tagesrythmus verkauft und zwar exakt auf ein 15 Minuten-Raster verteilt . Doch "kWh" sind das Produkt aus "Wetter * installierter Leistung (kW_peak)".
Ein Beispiel: Im Oktober 2012 haben die Netzbetreiber für den März 2012 einen Solarstrom-Zubau von 750 MW dokumentiert. Heute (Feb. 2013) werden für den gleichen März 2012 aber 1068 MW ausgewiesen.
Quizfrage: Mit welcher kW_peak Zubauzahl wurde am 1. April 2012 die PV-Produktion der von 11:00 bis 11:15 vermarkteten kWh berechnet?. Welches Orakel war da wohl am Werk?
- Unser aktueller Datenbestand stammt vom 16.02.2013.
- 1.310.669 Anlagen sind nun im Datenbestand.
- 63.659 Anlagen wurden, per Saldo, neu hinzugefügt.
Folgende grundlegende Datenprobleme sind aufgefallen:
- 59.889 Einträge sind aufgrund unserer Validierung potentiell "suspekt".
- 453 (!) Anlagen weisen jährlich mehr als 8.760 Betriebsstunden aus!? 271 dieser Anlagen gehören zur Kategorie "Biomasse".
- Amprion hat sich, wie zu erwarten war, wieder ein neues Datenformat ausgedacht (OK, man hat nur ein paar Spalten vertauscht, damit es niemandem langweilig wird). Zudem liefert Amprion in der Spalte "Anschrift" nur noch leere Einträge.
- … und die meisten der früher beschriebenen Probleme bleiben auch weiterhin bestehen.
Es ist zwar schon Mitte Februar 2013, doch es wundert uns nicht, dass es faktisch keinen einzigen Datensatz mit Bewegungsdaten für 2012 gibt. Null, nix, nirgendwo. Wen interessieren schon genaue kWh-Mengen. Hauptsache die Kasse ist voll.
Herr Ober … einen Sekt bitte!
07.10.2012 - "AGGREGATION-FIKTIV?"
Die Bundesminister, die Industrie, ja selbst unsere "saubere" Bahn verteufeln die EEG-Umlage aber niemand scheint sich an der Intransparenz der Zahlenbasis zu stören. Im Solarstrom-Bereich sind in den ersten neun Monaten des Jahres 2012 weniger als 1,8 GW durch Standorte nachgewiesen. Mindestens 15% der gemeldeten Leistung ist "FIKTIV".
Im Januar 2012 hatte die Bundesnetzagentur 7,5 GW Solarstrom für 2011 gemeldet, aber in der Endabrechnung tauchen nach unserer Zählung bisher erst 7,2 GW auf. Wo bleiben die restlichen 300 Megawatt?
- Unser aktueller Datenbestand stammt vom 07.10.2012.
- 1.247.010 Anlagen sind nun im Datenbestand.
- 84.866 Anlagen wurden, per Saldo, neu hinzugefügt.
Folgende grundlegende Datenprobleme sind aufgefallen:
- 56.824 Einträge sind aufgrund unserer Validierung potentiell "suspekt".
- 437 (!) Anlagen weisen jährlich mehr als 8.760 Betriebsstunden aus!? 256 dieser Anlagen gehören zur Kategorie "Biomasse".
- TransnetBW liefert, trotz Grüner "Energiewende" Landesregierung, weiterhin unvollständige Daten. Es fehlen neben den genauen Standortangaben auch die zum nachvollziehen der EEG-Umlage erforderlichen Bewegungsdaten und Vergütungsschlüssel.
- 50 Hertz liefert ebenfalls keine nachvollziehbaren Bewegungsdaten und keine Vergütungsschlüssel.
- Amprion hat sich, wie jedes mal, wieder ein neues Datenformat ausgedacht. Die dortigen Mitarbeiter müssen vermutlich viel kostbare Freizeit in solche Späße investieren.
- Insgesamt mussten wir dieses mal 18.339 Anlagen aus unserem Bestand entfernen, da offenbar deren Anlagenschlüssel geändert und die Anlagen somit in den vorherigen Auswertungen doppelt verbucht wurden. Dies trifft ganz besonders das Bundesland Schleswig-Holstein. Dort werden so ca. 260 MW PV und ca. 300 MW Wind "gestrichen". Der EE-Anteil sinkt dort von 49 auf 45 Prozent!
- … und wie immer ist das nur ein kleiner Ausschnitt der Datenprobleme.
Dummy-Daten (Codename "AGGREGATION-FIKTIV") sind zwar weniger geworden, aber immer noch "gut im Geschäft".
- 14 Anlagen laufen unter einem "DUMMY" Anlagenschlüssel. Datenleichen?
- Die Disziplin "ZubauDummy" im Datenbestand von 50 Hertz pflegen unter anderem die "Stadtwerke Riesa GmbH", "Stadtwerke Barth GmbH" und natürlich die "E.ON edis AG" (alleine hier 334 MW Solarstrom in 2012, FIKTIV?).
- 120 Einträge werden im Anlagenschlüssel unter der Kategorie "AGGREGATION-FIKTIV" geführt.
- Bei der "Celle-Uelzen Netz GmbH" befinden sich davon aber alleine 105 dieser Einträge. Wir unterstellen einmal, dass da lediglich jemand die Bedeutung des Wortes "AGGREGATION-FIKTIV" lustig findet und dass Adressen wie "Hauptstraße 0" real sind.
- Die "NRM Netzdienste Rhein-Main" haben auch weiterhin ca. 2 MW PV-Leistung jeweils für die Jahre 2010 und 2011 im Programm.
- Interessant ist, dass fast alle "FIKTIV"-Einträge in der Datei "Regelzonegesamt_Anlagenregister_aktuell.csv" der TenneT auftauchen (markiert für 2010, 2011 und 2012 etc.), aber nicht im jeweiligen Jahresdatensatz. Wird hier falsch gefiltert?
- 50 Hertz hat nun endlich begonnen die genauen Inbetriebnahmetermine zu veröffentlichen. Das ist eigentlich positiv. Es wird jedoch peinlich, wenn man im Oktober 2012 bereits Anlagen meldet, die erst im Dezember 2012 ans Netz gehen werden. Auch Amprion meldet derartige "Wunder der Vorausahnung". Insgesamt 2,7 MW Solarstrom dokumentieren, dass die Daten vor der Veröffentlichung noch nicht einmal der banalsten Prüfung unterzogen werden. (FIKTIV?)
Positiv ist zu vermelden, dass nur noch 86 Anlagen keine Postleitzahl mehr besitzen, wovon 40 Offshore-Windräder sind. Der bisherige "negativ-Weltmeister" in dieser Disziplin der Falschmeldungen, die enviaM Tochter "Mitteldeutsche Netzgesellschaft Strom mbH", konnte die Zahl der Anlagen ohne Postleitzahl immerhin von 1.112 auf nur noch 28 reduzieren. Vermutlich wird man in den nächsten drei Jahren auch hier noch die Postleitzahlen herausfinden. Bravo!
23.05.2012 - "5,2 Gigawatt sind keine 7,5 Gigawatt"
Die EEG Novelle wurde im Bundesrat aufgehalten. Es wäre gut wenn man die Zeit nutzen würde um mal nach den fehlenden 2 Gigawatt Solarleistung zu suchen. Denn auch im Mai 2012 sind erst 5,2 GW nachgewiesen. Gut 490 MW laufen derzeit noch unter der Überschrift "AGGREGATION-FIKTIV", "Dummy" oder "DUMMY". Angeblich wurden in 2011 ja 7,5 Gigawatt neu zugebaut. Doch wo?
Es ist schon lustig, wie an der Energiebörse "exakte" 15 Minuten Solarstrom-Einspeiseprofile gehandelt werden, aber niemand sagen kann, wie viele PV-Anlagen es überhaupt gibt. Das riecht nach Kristallkugel oder Hühnerknochen. Über die "Genauigkeit" des dokumentierten EE-Zubaus in den ersten 4 Monaten des Jahres 2012 wollen wir erst gar nicht reden.
- Unser aktueller Datenbestand stammt (im Prinzip) vom 23.05.2012.
- 1.162.144 Anlagen sind nun im Datenbestand.
- 66.214 Anlagen wurden, per Saldo, neu hinzugefügt.
- Alle EnBW-Anlagen laufen nun unter dem Namen der TransnetBW GmbH.
Folgende grundlegende Datenprobleme sind aufgefallen:
- 51.594 Einträge sind aufgrund unserer Validierung potentiell "suspekt".
- 537 (!) Anlagen weisen jährlich mehr als 8.760 Betriebsstunden aus!? 314 dieser Anlagen gehören zur Kategorie "Biomasse".
- 1.112 Anlagen habe keine Postleitzahl, wobei nur 28 davon Offshore-Windräder sind. 1.058 gehen jedoch auf das Konto der "Mitteldeutsche Netzgesellschaft Strom mbH", die als 100%ige Tochter der enviaM deren bisherige, peinliche "Spitzenreiterstellung" konsequent fortführt.
- 50 Hertz, Amprion und TransnetBW haben bisher praktisch keine Bewegungsdaten für 2011.
- … und wie immer ist das nur ein kleiner Ausschnitt der Datenprobleme.
Im Archiv ist zusätzlich die Aufstellung aller aktuellen Vergütungsschlüssel enthalten. Da bisher jedoch nur TenneT die gesetzlich geforderte, exakten Bewegungsdaten veröffentlicht haben diese Schlüssel nur einen bedingten praktischen Nutzen.
22.02.2012 - "Von 7,5 Gigawatt … keine Spur"
Und wieder fällt unsere Auswertung in eine turbulente Zeit. Die EEG-Umlage soll nach dem Willen der Bundesregierung (zum Wohle der Energiewende?) noch schneller gekürzt werden. Angeblich wurden 7,5 Gigawatt Solarstrom in 2011 neu zugebaut. Doch wie bereits im Oktober letzten Jahres vermag es die Energiewirtschaft nicht auch nur annähernd ihre Behauptungen zu belegen. Gerade einmal 4,2 Gigawatt können wir in den Meldungen entdecken, doch davon laufen über 250 MW unter der Überschrift "AGGREGATION-FIKTIV". Von den vielen "ZubauDummy"-Einträge ganz zu schweigen. Wir schreiben Februar 2012 und die Netzbetreiber können für gut 3,5 Gigawatt PV Leistung keinen Nachweis erbringen und sammeln dennoch munter Geld dafür ein. Bravo.
- Unser aktueller Datenbestand stammt (im Prinzip) vom 22.02.2012.
- 1.095.930 Anlagen sind nun im Datenbestand.
- 76.264 Anlagen wurden, per Saldo, neu hinzugefügt.
Folgende grundlegende Datenprobleme sind aufgefallen:
- 44.694 Einträge sind aufgrund unserer Validierung potentiell "suspekt".
- 499 (!) Anlagen weisen jährlich mehr als 8.760 Betriebsstunden aus!? 290 dieser Anlagen gehören zur Kategorie "Biomasse".
- 1.391 Anlagen habe keine Postleitzahl, wobei nur 29 davon Offshore-Windräder sind. 1.340 gehen jedoch auf das Konto der "Mitteldeutsche Netzgesellschaft Strom mbH", die als 100%ige Tocher der enviaM deren bisherige, peinliche "Spitzenreiterstellung" fortführt.
- EnBW veröffentlicht weiterhin keine Angaben mehr zur "Straße" des Anlagenstandortes und auch kein vollständiges Inbetriebnahmedatum.
- 50 Hertz als auch die EnBW veröffentlichen weiterhin keine "Vergütungsschlüssel" und auch keine nachvollziehbaren Bewegungsdaten.
- Bewegungsdaten für das Jahr 2011 sind faktisch nicht verfügbar, obwohl viele Anlagen mit fernauslesbaren Lastgangzählern ausgestattet sind. Diese neue Information können wir zumindest nun aus den Meldedaten ablesen.
- … und selbstverständlich gibt auch weiterhin die vielen anderen Unzulänglichkeiten der vorherigen Überprüfungen der EEG-Melderegister.
Wir haben dieses mal auch die Daten der BNetzA in das Archiv gepackt, doch da diese keine Zuordnung zu den Meldedaten der Netzbetreibern erlauben, sind sie faktisch wertlos. Man fragt sich, warum der Steuerzahler überhaupt für die Erhebung dieser Daten bezahlt. Es wäre viel sinnvoller, wenn die BNetzA den Netzbetreibern unmissverständlich erklären würde, was unter einer "unverzüglichen Meldung von Neuanlagen" zu verstehen ist.
24.10.2011 - "Ein paar Gigawatt mehr oder weniger"
Die neue EEG-Umlage für 2012 wurde wenige Tage vor unserer Auswertung verkündet. Eine gehörige Portion "Kaffeesatzleserei" scheint in dem Prozess wieder mal enthalten zu sein. Die geplante Wasserkraftleistung für Ende 2012 (1.480 MW) haben wir fast schon jetzt erreicht (1.444 MW). Die Einspeisung von (Gruben-, Klär-, Deponie)Gasen soll von heute 2,4 TWh auf ca. 1,6 TWh sinken!? Bei der PV sieht es ähnlich "interessant" aus. Ende 2011 sollen wir 23,8 GW haben, aber nachweisen können die Netzbetreiber im Oktober 2011 erst 20,4 GW. Offenbar werden nun in den letzten zwei Wintermonaten noch fast 4 GW zugebaut? Da sind entweder mal wieder die "Fachleute" am Werk oder der Datenbestand im Anlagenregister ist grauenvoll falsch. Beide Erklärungen erscheinen uns gleichermaßen plausibel.
- Unser aktueller Datenbestand stammt (im Prinzip) vom 24.10.2011.
- 1.019.666 Anlagen sind nun im Datenbestand.
- 77.519 Anlagen wurden, per Saldo, neu hinzugefügt.
Folgende grundlegende Datenprobleme sind aufgefallen:
- 44.766 Einträge sind aufgrund unserer Validierung potentiell "suspekt".
- 505 (!) Anlagen weisen jährlich mehr als 8.760 Betriebsstunden aus!? 287 dieser Anlagen gehören zur Kategorie "Biomasse".
- 7.794 Anlagen können derzeit keinem genauen Standort zugewiesen werden und wurden deshalb direkt der Bundesrepublik Deutschland zugeordnet. Dieser Umstand liegt meist in den (verstümmelten) Schreibweisen der Ortsnamen, die von der OpenGeoDB abweichen.
- 2.401 Anlagen habe keine Postleitzahl ... und alle liegen im Netzgebiet der envia Verteilnetz GmbH.
- EnBW veröffentlicht weiterhin keine Angaben mehr zur "Straße" des Anlagenstandortes.
- Dafür scheint die ELE Verteilnetz GmbH den Unterschied zwischen "Ort" und "Strasse" nicht zu kennen.
- Obwohl es bereits Oktober 2011 ist, gibt es für sehr viele Anlagen immer noch keine Ertragszahlen für 2010! Beispielsweise kennt 50 Hertz bei 80.720 Anlagen nur für 71.988 die 2010er Bewegungsdaten.
- 50 Hertz als auch die EnBW veröffentlichen weiterhin keine "Vergütungsschlüssel" und auch keine nachvollziehbaren Bewegungsdaten.
- Es gibt aber nicht nur Anlagen ohne Bewegungsdaten, es gibt auch viele viele Bewegungsdaten, die man keiner Anlage zuordnen kann.
- Amprion pfuscht beim "Anlagenregister" immer noch von Hand in den Dateien herum. So liefert das "Weltunternehmen" in einige Bewegungsdaten willkürlich mehr Spalten als der Datensatz erlaubt und eine der Dateien hat völlig grundlos ein eigenes Datumsformat.
- TenneT hat unverändert ein "beeindruckend" langsames Onlinesystem. Ein Daten-Download dauert mehrere Stunden.
- Auch heute noch gibt es für 2010 reichlich "FIKTIV" und "DUMMY" Anlagen (z.B. E2129401-AGGREGATION-FIKTIV-SOL10, E4-0750--ZubauDummy--x--Solar----, etc.). In Summe werden bis heute über 320 MW "Geisteranlagen" im Datenbestand geführt. Hallo?
Wie jedes mal, wurden weiterführende, detaillierte Fehleranalysen vorgenommen, deren Ergebnisse jedoch strukturell denen der vorherigen Importe gleichen (kaputte Anlagenschlüssel, wechselnde Anlagentypen, etc. pp.). Eine exakte Aufschlüsselung der Datenfehler werden wir hier in Zukunft nur noch maximal einmal im Jahr vornehmen.
05.06.2011 - "Keine Erträge in 2010?"
Es in Juni und da bereits fünf volle Monate ins Land gegangen sind hatten wir die Hoffnung, dass wir von den Netzbetreibern endlich die Standorte aller im Jahr 2010 zugebauten Anlagen und vor allem auch deren "kWh"-Produktion erfahren können. Fehlanzeige!
Es fehlen immer noch 2010er PV-Anlagen mit ca. 500 MW und die "kWh"-Meldungen sind weiterhin nahezu überall "Mangelware"! Wenn die Netzbetreiber noch nicht einmal einen Messwert pro Jahr "zeitnah" bereitstellen können, wieso traut man denen dann den Betrieb eines "Smart Grid" mit Unmengen an Echtzeitwerten zu?
- Der Datenbestand stammt (im Prinzip) vom 05.06.2011.
- 942.147 Anlagen sind nun im Datenbestand.
- 65.592 Anlagen wurden, per Saldo, neu hinzugefügt.
Folgende grundlegende Datenprobleme sind aufgefallen:
- 7.984 Anlagen können derzeit keinem genauen Standort zugewiesen werden und wurden deshalb direkt der Bundesrepublik Deutschland zugeordnet. Dieser Umstand liegt meist in den Schreibweisen der Ortsnamen, die von der OpenGeoDB abweichen.
- rund 5.000 Anlagen habe keine Postleitzahl eine oder ungültige. So wird bei 890 dieser Datensätze z.B. die 99999 angegeben.
- 38.039 Einträge sind aufgrund unserer Validierung potentiell "suspekt".
- 487 (!) Anlagen weisen jährlich mehr als 8.760 Betriebsstunden aus!?
- EnBW veröffentlicht keine Angaben mehr zur "Straße" des Anlagenstandortes.
- EnBW hat weiterhin nur die Bewegungsdaten von 2009.
- Amprion liefert offenbar gar keine Bewegungsdaten mehr.
- 50 Hertz kennt immerhin für ca. 10% seiner Anlagen die 2010er Erträge.
- TenneT liefert nur für ca. 5% seiner Anlagen die 2010er Erträge.
- TenneT hat weiterhin ein "beeindruckend" langsames Onlinesystem. Ein Daten-Download dauert mehrere Stunden.
- Die E.ON Töchter pflegen "fiktive" Anlagen (z.B. E2056801-AGGREGATION-FIKTIV-BIOMA, E2079301-AGGREGATION-FIKTIV-SOLAR, etc.). Für das Jahr 2010 verbucht E.ON Bayern "77.018" kW Solarleistung "fiktiv" im Netz. Was soll das bitte?
22.02.2011 - "Was war 2010?"
Das vergangene Jahr war unter anderem geprägt von der Debatte um die Höhe der EEG-Umlage. Von den Netzbetreibern wurde im Oktober 2010 der PV-Zubau auf 10 GW geschätzt und die Höhe der EEG-Umlage entsprechend hoch festgelegt. In den EEG Meldungen waren aber im November 2010 nur 2 GW gelistet und selbst heute hat die Energiewirtschaft für das Jahr 2010 erst einen Zubau von 5 GW nachgewiesen!
Genauso katastrophal ist die Meldung der kWh-Erträge. Ende Februar 2011 liegen nur für weit weniger als 1% der Anlagen Ertragswerte für das Jahr 2010 vor. So sind zum Beispiel im gesamten "50 Hertz"-Gebiet 68.721 Anlagen gelistet, jedoch nur für 6 (sechs !) Anlagen gibt es derzeit Ertragswerte.
- Der Datenbestand stammt (im Prinzip) vom 22.02.2011.
- 876.547 Anlagen sind nun im Datenbestand.
- 141.995 Anlagen wurden, per Saldo, neu hinzugefügt.
Folgende grundlegende Datenprobleme sind aufgefallen:
- 7.653 Anlagen können keinem genauen Standort zugewiesen werden und wurden deshalb direkt der Bundesrepublik Deutschland zugeordnet. Dieser Umstand liegt oft Schreibweisen der Ortsnamen, die von der OpenGeoDB abweichen.
- 3.988 der Anlagen ohne Standort liegen im Netz der "envia Verteilnetz GmbH". 888 dieser Datensätze haben als Postleitzahl die 99999 angegeben.
- 35.590 Einträge sind aufgrund unserer Validierung potentiell "suspekt".
- mehr als 1.000 (!) Anlagen weisen jährlich mehr als 8.760 Betriebsstunden aus!?
- EnBW veröffentlich seit kurzem keine Angaben mehr zur "Straße" des Anlagenstandortes.
- Amprion liefert nun offenbar gar keine Bewegungsdaten mehr.
- 50 Hertz hat auch jetzt noch Änderungen in den 2009-er Datenbeständen.
- TenneT hat nicht nur weiterhin ein "beeindruckend" langsames sondern auch ein erschreckend fehlerhaftes Onlinesystem. Obwohl TenneT den 2006-er Datenbestand offiziell gar nicht anbietet, wurde er uns zweimal ausgeliefert (anstelle der gewünschten 2009 und 2010 Daten)! Zum Glück betreiben die keine Atomkraftwerke.
02.11.2010 - "Summierte kWh"
Wir haben mit diesem Update in erster Linie einen fundamentalen Fehler in unserer Auswertung bereinigt. Bisher wurde für jede Anlage immer nur eine "kWh"-Meldung berücksichtigt. Doch gerade für große Anlagen gibt es, z.B. im Tennet-Datenbestand, durchaus mehrere "kWh"-Meldungen, da dort in vorbildlicher Weise die unterschiedlichen Vergütungskategorien getrennt aufgeschlüsselt werden.
Unsere Auswertung summiert nun alle zusammengehörenden "kWh"-Einzelmeldungen, was vor allem in Regionen mit großen Biomasseanlagen zu deutlich höheren Produktionsmengen geführt hat. Wir haben in diesem Zug in unserem System auch die anlagentypischen Ertragskennzahlen (kWh/kW) angepaßt.
Ferner sei angemerkt, dass der Übertragungsnetzbetreiber Transpower in die "TenneT TSO GmbH" übergeführt wurde, was bei allen betroffenen Anlagen zu entsprechenden Änderungen geführt hat. Erschreckend daran war aber vor allem, dass der Download einer einzigen Anlagenregister-Datei von der TenneT-Webseite zwischen 3 bis 12 (!) Stunden gedauert hat und somit noch nicht einmal die Archivierung der Rohdaten an einem Tag durchgeführt werden konnte.
- Der Datenbestand stammt (im Prinzip) vom 02.11.2010.
- 734.552 Anlagen sind nun im Datenbestand.
- 83.235 Anlagen wurden, per Saldo, neu hinzugefügt.
Folgende grundlegende Datenprobleme sind aufgefallen:
- 7.230 Anlagen können keinem genauen Standort zugewiesen werden und wurden deshalb direkt der Bundesrepublik Deutschland zugeordnet. Dieser Umstand liegt oft Schreibweisen der Ortsnamen, die von der OpenGeoDB abweichen.
- 3.990 der Anlagen ohne Standort liegen im Netz der "envia Verteilnetz GmbH". 889 dieser Datensätze haben als Postleitzahl die 99999 angegeben, 65 haben gar keine Postleitzahl.
- 57.090 Einträge bei Amprion hatten vertauschte Angaben von "Ort" und "Strasse" (wurde von uns korrigiert).
- eine (!?) von 14 Dateien der Amprion lag in einer kaputten Zeichensatzkodierung vor (wurde von uns korrigiert).
12.07.2010 - "Erste Bereinigung"
Erstmalig ist eine grundlegende eine Bereinigung der Daten erfolgt. Dies ist derzeit nur einmal im Jahr (im Juli bzw. August) möglich, da nur zu diesem Zeitpunkt davon ausgegangen werden kann, dass die Meldedaten der Netzbetreiber (halbwegs) vollständig sind. Eine genaue Analyse der Gründe für das Verschwinden der Anlagen haben wir bisher nicht durchgeführt.
Interessant ist, dass trotz der generell stark gestiegenen Zahl der Anlagen sich auf der Ebene der (nördlichen) Bundesländer meist eine Reduktion des EE-Anteils ergeben hat. Dies liegt an den deutlich niedrigeren Erträgen in der Windkraft, was vermutlich auf das schlechte Windjahr 2009 zurückzuführen ist und den Umstand, dass wir die direkt vermarkteten kWh-Strom noch nicht erfassen.
Erstmalig stehen nun auch im gesamten Gebiet von transpower die Orts- und Straßenangaben und das genaue Inbetriebnahmedatum zur Verfügung. Dies ist sehr erfreulich und lobenswert, hat aber in einigen Regionen, wie zu erwarten war, zu drastischen Verschiebungen der EE-Statistiken geführt.
Ebenfalls neu ist, dass wir versuchen die Vergütungsschlüssel für Anlagen auszuwerten, um so auf Typ der Anlage zu schliessen. Die Erkennung ist sicherlich nicht perfekt, hat es uns aber z.B. erlaubt 3.635 Biogasanlagen zu identifizieren.
- Der Datenbestand stammt vom 12.07.2010.
- 651.317 Anlagen sind nun im Datenbestand.
- 94.876 Anlagen wurden, per Saldo, neu hinzugefügt.
- 14.147 Anlagen wurden im Zuge der Bereinigung entfernt.
Folgende grundlegende Datenprobleme sind aufgefallen:
- 11.918 Anlagen können keinem Standort zugewiesen werden.
- 8.668 der Anlagen ohne Standort liegen im Netz der "envia Verteilnetz GmbH" (siehe weiter unten), 627 im Gebiet der "E.ON Hanse AG", 347 bei der "E.ON edis AG" usw. usw.
- Weiterhin ändern sich die Netzbetreiber (DSO) von Anlagen, aber der Anlagenschlüssel bleibt geblieben. Für uns ist dies eigentlich praktisch, aber dennoch "verwunderlich", da im Anlagenschlüssel der Netzbetreiber kodiert ist (siehe Import 29.03.2010).
- Für manche Anlagen liegen mehrere "kWh" Angaben für das gleich Jahr vor. Wir wissen derzeit noch nicht, wie dies auszuwerten ist. Entsprechende Fehler bei den von uns angegebenen Erträgen sind in solchen Fällen sehr wahrscheinlich. Dies betrifft aber im Moment nur das "transpower"-Gebiet.
Besonderheiten im 50Hertz-Datenbestand:
- Semantisch Kaputte Einträge waren wieder nicht enthalten. Dies ist lobenswert.
- Von den 11.049 Einträgen (der identische Stand wie im März 2010!) der "envia Verteilnetz GmbH" können weiterhin 8.668 Anlagen keinem Standort zugeordnet werden, da sie keine, oder eine ungültige Postleitzahl haben ("99999").
- 2 Anlagen haben ihren Typ geändert (von "Biomasse" auf "Gas" und von "Wasserkraft" auf "Solarstrom")
- Die Änderungen bei den Netzbetreiberangaben waren primär von "Vattenfall" auf "50 Hertz".
Besonderheiten im Amprion-Datenbestand:
- Die Stammdaten lag in zwei unterschiedlichen Datenformaten vor!?
- Die Bewegungsdaten für das Jahr 2009 lagen selbst im Juli 2010 noch nicht vor!
- 1.817 Einträge sind semantisch fehlerhaft. Alle entfallen auf die "RWE Rhein-Ruhr Verteilnetz GmbH".
- 20 Einträge haben einen kaputten Anlagenschlüssel (z.B. "E318370100172", "E3061301902000000000000021550001")
- 28 Einträge haben keine Postleitzahl.
- … davon 13 Anlagen der "Pfalzwerke Netzgesellschaft mbH"
- 8 Anlagen haben ihren Typ geändert (von "Gas" auf "Biomasse" oder "Solar")
- Bei 3.317 Anlagen hat sich der Verteilnetzbetreiber (DSO) und bei bei 244 der Übertragungsnetzbetreiber (TSO) geändert.
Besonderheiten im EnBW-Datenbestand:
- Nur eine einzige (!) neue Anlagenmeldung seit dem 29.03.2010.
- Für 2009 liegen keine kWh-Produktionsmengen vor (und das im Juli 2010!)
- Die Datenqualität der EnBW ist aus unserer Sicht absolut nicht akzeptable!
Besonderheiten im Transpower-Datenbestand:
- Die Datenqualität ist nun um "Lichtjahre" besser als vorher, auch wenn die transpower-Webseite deutlich langsammer geworden ist als früher. Endlich gibt es nun überall Orts- und Straßennamen. Transpower liefert nun die mit Abstand beste Datenqualität.
- Die "E.ON Hanse AG" liefert viele der Datensätze die aufgrund schlechter Datenqualität regional nicht zugeordnet werden können. So finden sich doch für ein und denselben Ort z.B. folgende Schreibweisen: "F-W-L-KOOG", "FWL- KOOG", "FR.-W.-LÜBKE-KOOG", "FR.-WILH.-LÜBKE-KOOG" und "FRIEDRICH-WILHELM-LÜ"
- Bei 6.907 Anlagen hat sich der Verteilnetzbetreiber (DSO) geändert, jedoch sind dies überwiegend nur Namensänderungen der jeweiligen Gesellschaft.
- Bei 184 der Übertragungsnetzbetreiber (TSO) von "E.ON" auf "transpower" geändert.
02.05.2010 - "kWh Anpassung"
Dieses Update hatte nur Auswirkungen auf die Webseite und die regionalen Statistiken. Der Datenbestand und die Download-Datei sind identisch zum 29.03.2010.
Im bisherigen Verfahren hatten wir für alle Anlagen die jeweils gemeldete Produktionsmenge veranschlagt. Für Anlagen ohne echte kWh-Meldung wurde der Wert geschätzt. Dies führte jedoch in der Regel immer zu dem verwirrenden Zustand, dass Anlagen aus dem Jahr 2008 (=Anlagen, die im ersten Betriebsjahr immer nur einen Teil des Jahres laufen, mit realer kWh-Meldung) einen extrem niedrigen Ertrag ausgewiesen haben und dass Anlagen aus dem Jahr 2009 (=Anlagen mit geschätzten Erträgen) deutlich höhere "ca." kWh vorweisen konnten.
Diese Darstellung hat nicht nur die Anlagenbesitzer verwirrt, sondern auch die Ausbaustatistiken stark verzerrt. Aus diesem Grund werden kWh-Erträge in der Statistik von nun an immer für volle Betriebsjahre veranschlagt. In der Download-Datei sind jedoch weiterhin nur die exakten kWh für ein festgelegtes Betriebsjahr enthalten.
29.03.2010 - "E.ON Bayern-Hanse-Fix"
Neben der Einspielung der neuen Meldedaten galt dieses Update vor allem der Bereinigung von Datendubletten im E.ON Hanse Gebiet. Durch einen (glücklichen) Fehler wurden ursprünglich die Daten der E.ON Hanse mit dem Netzbetreibernamen "E.ON Bayern" importiert. Nur dadurch ist aufgefallen, dass E.ON Hanse offenbar im Laufe des Jahres 2009 sämtliche Anlagenschlüssel geändert hat. Die betreffenden Anlagen waren folglich unter zwei Anlagenschlüsseln — also doppelt — vorhanden. Obwohl wir (Stand 29.3.2010) noch auf eine offizielle Erklärung dieser Handhabung von Anlagenschlüsseln warten, haben wir eine uns plausibel erscheinende Bereinigung vorgenommen.
Durch die Bereinigung der "E.ON Bayern-Hanse"-Dubletten ist nicht nur Schleswig-Holstein in den TOP 10 deutlich abgesunken, auch die Zahl der Windkraftanlagen ist deutlich zurückgegangen. Damit hat sich nun auch die gesamte EE-Strommenge im Vergleich zum letzten Import verringert.
- Der Datenbestand stammt vom 28.03.2010.
- Änderungen bei den Übertragungsnetzbetreibern: "Vattenfall" ist nun "50Hertz".
- 26.601 Anlagen wurden neu hinzugefügt.
- 556.441 Anlagen sind nun im Datenbestand.
Folgende grundlegende Datenprobleme sind aufgefallen:
- Der BWE beziffert zum 31.12.2009 die Zahl der Anlagen auf 21.164. Wir kennen derzeit nur 19.273. Da jedoch die Netzanschlussleistung recht ähnlich ist (25.777 zu 25.881 MW) gehen wir davon aus, dass dieser Effekt vermutlich darauf zurückzuführen ist, dass einige Standorte nicht als Einzelanlage sondern als "Pool" in den EEG-Meldungen auftauchen, oder dass vor allem viele sehr kleine Anlagen aus der Zeit vor dem EEG nicht enthalten sind.
- 13.222 Anlagen können keinem Standort zugewiesen werden.
- Die Anlagen der "envia Verteilnetz GmbH" haben weiterhin keinen Standort (siehe weiter unten).
- Anlagen ohne Standort werden zwar der Bundesrepublik zugerechnet, tauchen aber in keinem Bundesland auf. Sie sind aber dennoch im CSV-Datenbestand enthalten.
Probleme im 50Hertz-Datenbestand:
- Kaputte Einträge waren nicht enthalten. Dies ist lobenswert.
- Alle 11.049 Einträge der "envia Verteilnetz GmbH" haben als Postleitzahl nur die "00000".
- Eine Anlage hat ihren Typ geändert (von "Solar" auf "Windkraft"!)
Probleme im Amprion-Datenbestand:
- 64 Einträge haben einen kaputten Anlagenschlüssel
- … davon 13 Anlagen der "regionetz GmbH" (z.B. "E318370100183")
- … davon 2 Anlagen der "NEW Netz GmbH" (z.B. "E3178801wirdnachgereicht00142")
- 92 Einträge haben keine Postleitzahl.
- … davon 70 Anlagen der "SWL Verteilungsnetzgesellschaft"
- … davon 12 Anlagen der "Pfalzwerke Netzgesellschaft mbH"
- 9 Anlagen haben ihren Typ geändert (z.B. von "Solar" auf "Biomasse"!)
Probleme im EnBW-Datenbestand:
- Kaputte Einträge waren nicht enthalten. Dies ist lobenswert.
- 5 Anlagen haben ihren Typ geändert (z.B. von "Wasserkraft" auf "Gase"!)
Probleme im Transpower-Datenbestand:
- Es werden auch weiterhin nur Postleitzahlen veröffentlicht.
- 103 Verteilnetzbetreiber haben keine Daten gemeldet.
- 64 Einträge haben einen kaputten Anlagenschlüssel
- 246 Einträge haben keine Postleitzahl.
- … davon 210 Anlagen der "SWM Infrastruktur GmbH"
- … davon 15 Anlagen der "Kreiswerke Main-Kinzig GmbH (Gelnhausen)"
- Aufgrund fehlerhafter Anlagenschlüssel (z.B. "E00000000000000000000000000000003") sind einige Anlagen "doppelt" vorhanden. Die Fehler werden offenbar von "Stadtwerke Schlitz", "Blomberger Versorgungsbetriebe GmbH" und "Stadtwerke Uelzen GmbH" verursacht.
- 21 Anlagen haben ihren Typ geändert (z.B. von "Windkraft" auf "Solarstrom"!). 17 dieser Fälle gehen jedoch auf die uneindeutigen Anlagenschlüssel zurück.
06.02.2010 - "Reale Produktionsdaten"
Bei diesem Update wurden erstmalig die tatsächlichen Produktionsmengen (kWh) mit ausgewertet. Dies hat gezeigt, dass die ursprünglich angenommen Durchschnittserträge für die Biomasse und die Wasserkraft viel zu hoch lagen. Daraus resultiert nun, dass trotz gestiegener Anlagenanzahl die produzierten Energiemengen und damit auch die "% EE"-Werte in den meisten Regionen gesunken sind.
- Der Datenbestand stammt vom 31.12.2009.
- Änderungen bei den Übertragungsnetzbetreibern: "E.ON" ist nun "Transpower" und "RWE" ist "Amprion".
- 40.698 Anlagen wurden neu hinzugefügt.
- 529.840 Anlagen sind nun im Datenbestand.
Folgende grundlegende Datenprobleme sind aufgefallen:
- 13.077 Anlagen können keinem Standort zugewiesen werden.
- 11.112 der Anlagen ohne Standort liegen im Netz der "envia Verteilnetz GmbH" (siehe weiter unten).
- 61.539 Anlagen haben keine realen Produktionsdaten. Dies sind zum großen Teil Anlagen, die im Jahr 2009 an das Netz gegangen sind.
Probleme im Amprion-Datenbestand:
- 37 Anlagen haben einen kaputten Anlagenschlüssel.
- 129 Einträge der "LEW Verteilnetz GmbH" beginnen (immer noch) mit einem "#", was überlicherweise eine Kommentarzeile markieren sollte. Wir werten diese Zeilen dennoch aus.
- 14 Einträge haben keine Postleitzahl.
Probleme im EnBW-Datenbestand:
- Es sind nur 3.520 Anlagen für das Jahr 2009 enthalten, obwohl sicherlich mehr als das 10-fache gebauten wurde.
- Kaputte Einträge waren, im Vergleich zu allen anderen ÜNBs, nicht enthalten. Dies ist fast schon erstaunlich und lobenswert.
Probleme im Transpower-Datenbestand:
- Es werden auch weiterhin nur Postleitzahlen veröffentlicht.
- 109 Verteilnetzbetreiber haben keine Daten gemeldet.
- 211 Einträge der "SWM Infrastruktur GmbH" haben keine Postleitzahl.
- 15 Anlagen werden sowohl von der "Harz Energie Netz GmbH" als auch der "Versorgungsbetriebe Seesen/Harz GmbH" gemeldet.
- 42 neue Einträge für Anlagen aus dem Jahr 2008 waren enthalten. Diese wurde also erst nach dem 30.07.2009 gemeldet.
Probleme im Vattenfall-Datenbestand:
- 231 Datensätze sind "kaputt".
- Alle 11.112 Einträge der "envia Verteilnetz GmbH" haben als Postleitzahl nur die "00000".
- "ewag.kamenz" liefert komplett leere Datensätze.
- Es gibt "Bewegungsdaten" für Anlagen die in den "Stammdaten" nicht enthalten sind.
01.08.2009 - "Erster Datenimport"
Die EEG-Daten der vier Übertragungsnetzbetreiber (E.ON, RWE, EnBW und Vattenfall) wurden erstmalig importiert. Diese wurden zusätzlich mit Daten von E.ON Hanse, E.ON Bayern und der EWE abgeglichen.
- Der Datenbestand stammt vom 30.07.2009.
- 489.142 Anlagen sind nun im Datenbestand
