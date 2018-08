Unsere Analyse deckt alle Ortsnamen ab, auf die mindestens drei Menschen in Berlin registriert sind. Aus Datenschutzgründen ist für alle Ortsnamen, aus denen nur ein oder zwei Menschen kommen, "0" als Summe eingetragen, sodass sie nicht in unsere Analyse einfließen konnten. Das Verzeichnis enthält 114.386 Ort-Land-Einträge mit mindestens drei Menschen.

Ausgangsbasis unserer Geburtsorte-Auswertung ist eine Statistik vom Amt für Statistik Berlin-Brandenburg, in der die Geburtsorte der Berliner verzeichnet sind (Stand 31.12.2017). Sie enthält Einträge für Geburtsort, Geburtsland und die Anzahl Menschen, die an diesem Ort geboren wurden.

Der Geburtsort wird von Behördenmitarbeitern händisch in die Einwohnerregisterdatenbank eingetragen. Deshalb gibt es viele Unregelmäßigkeiten in unserem Ausgangsdatensatz. Gründe dafür sind zum Beispiel:

Wir haben die Ergebnisse händisch geprüft, so gut es uns möglich war. Da der Datensatz so groß ist, konnten wir aber nicht alles prüfen. Deshalb kann es sein, dass die API ein falsches Ergebnis geliefert hat. Sie könnte auch zum Beispiel einen Stadtteil ausgegeben haben, obwohl wir gerne den ganzen Ort als Ergebnis haben wollten, oder umgekehrt nur eine grobe Region ausgegeben haben. Eine gewisse Unschärfe ist daher nicht zu vermeiden.

Etwa 16.500 Einträge konnten mit diesem Prozess nicht zugeordnet werden. Das sind zum Großteil Orte, aus denen sehr wenige Menschen kommen: Insgesamt konnten nur knapp 53.000 von den 3.712.000 verzeichneten Menschen (etwa 1,5%) nicht zugeordnet werden.

So gibt es in der Statistik 1.364 Menschen, die in Burg geboren wurden. Burg gibt es zum Beispiel im Spreewald oder bei Magdeburg. Da sich diejenigen, die in Burg ohne Zusatz geboren wurden, nicht einem Ort zuordnen lassen, haben wir sie unserer Statistik keinem Bundesland zugeordnet.

444 Einträge waren schon in der Originaldatei als unbekannte Orte markiert (0,5%). Für 1436 Einträge konnte nur das Land gefunden werden (1%).

Als letzten Schritt haben wir die Einträge, jetzt in einheitlicher Schreibweise und mit Längen- und Breitengraden versehen, nach Ort, Land, Bundesland (in Deutschland), Längen- und Breitengrad zusammengefasst, sodass für jeden Eintrag nur noch ein Ort vorhanden war.