Evaluation von Vorhersagemodellen auf Basis von UN Millenniumszielen

Ulm University

MA Abschlussvortrag, Kai-Uwe Berroth, Ort: O27/545, Datum: 19.06.2019, Zeit: 11:00 Uhr

Werte und Klassifizierungen fünf Jahre in die Zukunft vorherzusagen, ist eine Herausforderung. Die UN stellt einen Trainingsdatensatz mit über 3,7 Mio. Werte in einem Wettbewerb zur Verfügung, in dem 737 Werte sowohl ein Jahr, wie fünf Jahre in die Zukunft des Datensatz vorhergesagt werden müssen. In dieser Masterthesis werden aus sieben Regressionsalgorithmen die zu der jeweiligen Fragestellung geeignetsten Algorithmen ausgesucht. Zum anderen wird versucht mittels Klassifizierung und Vorhersage von Bürgerkriegen und Wirtschaftskrisen das Regressionsergebnis zu verbessern. Für eine kleine Stichprobe von vier exemplarischen Ländern kann statistisch nachgewiesen werden, dass die Klassifizierung von Bankenkrisen die Regression verbessert. Am Ende wird der 14. Platz von 2108 Teilnehmer im Wettbewerb erreicht. Eine der wichtigsten Grundlagen hierzu ist die Verwendung des Cubist-Algorithmus, obwohl die Daten am Ende über 60% Missing Values haben.