Reinigung der Adresse

Definition

Die Adressbereinigung ist ein technisches Verfahren zur Normalisierung und Standardisierung von Adressdaten mit dem Ziel, Fehler zu reduzieren und die Genauigkeit zu verbessern. Dabei werden Datenqualitätsverfahren wie Validierung, Parsing, Standardisierung, Geokodierung und Unterdrückung eingesetzt, um die Genauigkeit, Vollständigkeit und Gültigkeit einer Adressdatenbank zu verbessern und gleichzeitig den Zeitaufwand für die Verwaltung der Daten zu verringern.

Die Validierung ist häufig der erste Schritt. In diesem Schritt wird geprüft, ob die eingegebenen Daten den richtigen Formatierungsregeln entsprechen und bestimmte Komponenten enthalten. Sobald dieser Schritt abgeschlossen ist, erfolgt das Parsing. Bei diesem Prozess wird die Adresse in ihre Bestandteile wie Straße, Ort, Bundesland und Postleitzahl zerlegt, um sie zu standardisieren.

Bei der Standardisierung wird die Adresse anhand von Formatierungsregeln und Konvertierungen normalisiert, um die Konsistenz zu gewährleisten. Die Geokodierung verwendet Koordinaten von Straßen, Postleitzahlen und Städten, um Adressen und Koordinaten physischer Standorte zu ermitteln. In diesem Schritt werden fehlerhafte Informationen markiert und korrigiert. Der letzte Schritt im Adressbereinigungsprozess ist die Unterdrückung. Dabei werden alle doppelten oder unerwünschten Datensätze entfernt, um die Datenqualität und -genauigkeit zu erhalten.

For purposes of forward geocoding, the best way to ensure a good API response is to have address in the format: <house number>, <street>, <neighbourhood>, <city>, <state>, <country>, <postcode>