KI zur Auswertung von Beteiligung? Das Potenzial von Sprachmodellen zur Erkennnung von Verkehrsmitteln in Beteiligungsbeiträgen – CIMT – Citizen Involvement in Mobility Transitions

In diesem Artikel in der Zeitschrift Internationales Verkehrswesen stellen Laura Mark, Julia Romberg und Tobias Escher ein Sprachmodell vor, mit dessen Hilfe Verkehrsmittel in Beteiligungsbeiträgen zuverlässig erkannt werden. Sie zeigen damit, dass überwachtes maschinelles Lernen die Auswertung von Beteiligungsbeiträgen mobilitätsbezogener Online-Beteiligungsverfahren sinnvoll unterstützen kann.

Zusammenfassung

Konsultationen sind ein wichtiger Bestandteil der Verkehrsplanung und können dazu beitragen, Wissen aus der Bevölkerung in den Planungsprozess zu integrieren. Insbesondere durch Onlineformate kommen allerdings oft große Mengen an Beiträgen zustande, deren gründliche Auswertung ressourcenintensiv ist. Mit dem Einsatz von KI wird die Hoffnung verbunden, diese zu unterstützen.

Das in diesem Artikel vorgestellte Sprachmodell beruht auf dem Konzept des überwachten maschinellen Lernens zur Textklassifikation. Dabei werden vortrainierte Modelle mithilfe kleinerer Datensätze nachtrainiert. So kann ein Modell an einen speziellen Anwendungsbereich, wie beispielsweise verkehrsplanerische Konsultationsprozesse, angepasst werden.

Hier wurde eine vortrainierte deutschsprachige Version des leistungsfähigen RoBERTa Sprachmodells als Ausgangspunkt genommen. Anhand eines Kategorisierungsschemas, das hauptsächlich nach erwähnten Verkehrsmitteln unterscheidet, wurden 1.700 Beiträge aus sieben verkehrsplanerischen Konsultationsprozessen manuell kodiert. Die so entstandenen Daten wurden zum Teil als Trainingsdaten zum Fine-Tuning des Sprachmodells und zum Teil zur Evaluation genutzt.

Ergebnisse

Insgesamt konnte gezeigt werden, dass sich bereits heute verfügbare Sprachmodelle eignen, um die Auswertung von Konsultationsprozessen in der Praxis zu unterstützen. Das hier entwickelte Sprachmodell zur Erkennung der Verkehrsmittel kann dabei als Basis für eine konkrete Anwendung dienen.
Das nachtrainierte RoBERTa-Sprachmodell ist sehr gut in der Lage, die passenden Verkehrsmittel zuzuordnen. Das von uns vorgestellte Modell kann zuverlässig immer deutlich über 90% der Beiträge korrekt den darin genannten Verkehrsmitteln zuordnen.
Für die Verfahren, auf deren Beiträgen das Modell trainiert worden war, konnten im Durchschnitt 97% der Kategorien korrekt zugeordnet werden (auf einem separaten Testset). Für Beiträge aus anderen verkehrsbezogenen Beteiligungsverfahren konnten mit einer Genauigkeit von 91 bis 94% weiterhin sehr zuverlässig die passenden Verkehrsmittel zugeordnet werden.
Die Leistung des Modells verschlechtert sich also kaum, wenn es auf bislang unbekannte Daten aus mobilitätsbezogenen Beteiligungsverfahren angewandt wird. Das bedeutet, dass eine manuelle Kodierung im Vorfeld zumindest bei ähnlich aufgestellten Beteiligungsverfahren entfallen kann, was den Aufwand deutlich reduziert.

Publikation

Mark, Laura; Romberg, Julia; Escher, Tobias (2024). KI zur Auswertung von Beteiligung? Das Potenzial von Sprachmodellen zur Erkennung von Verkehrsmitteln in Beteiligungsbeiträgen. In: Internationales Verkehrswesen 76 (1): 12-16. DOI: 10.24053/iv-2024-0003