Immobilien Analyse

Beginn: 06/2018

Technisches Umfeld

Sprachen: Python

Framework: Numpy, Pandas, Scikit-learn, Matplotlib

Methoden: Webscraping, Machine Learning

Infrastrukturelles Umfeld

Projektbeschreibung

Künstliche Intelligenz wird die Art wie wir arbeiten und leben grundlegend verändern. Und zweitens sind Immobilien eine attraktive Geldanlage.

Daher entschloss ich mich doch beides zu vereinen und mein erstes Machine Learning Projekt zu starten.

Dabei geht es darum, den bestehenden Immobilien Markt zu analysieren und zu bestimmen, welchen Wert diese laut dem Algorithmus hat. Dann kann der Vergleich gezogen werden, ob der Preis über oder unter dem Marktniveau liegt.

Woher kommen die Daten?

Die Daten werden aus ImmobilienScout24 gelesen. Da ich leider keinen direkten Zugang über eine API habe, habe ich mich des Webscraping nützlich gemacht. Regelmäßig kann ich meine Anwendung starten, um zu überprüfen, ob es neue Wohnungen oder Häuser gibt, die noch nicht in meinen Daten gespeichert sind. So verbessert sich die Genauigkeit auch über die Zeit und man könnte die Entwicklung des Immobilienmarktes einer Stadt beobachten. Leider reichen die Daten des Archivs von ImmoScout nicht so weit zurück.

Was ist das Ziel?

Ich möchte einerseits vertrauter mit Machine Learning werden, um mich für die Zukunft professioneller aufzustellen. Andererseits habe ich vielleicht durch das Projekt die Möglichkeit eine günstige Immobilie zu erwischen, in die ich investieren kann.

Learnings

Ich musste mich im Vorfeld erst einmal mit den Grundlagen von Data Science und Machine Learning auseinandersetzen. Der Udemy Kurs “Intro to Machine Learning” war ein guter Start.

Danach wusste ich welche Algorithmen, wie funktionieren und was in meinen Fall gut passen könnte.

Ich habe dabei gelernt:

  • Datensätze zu erstellen und zu bearbeiten
  • Grundlagen des Machine Learnings
  • Wie man passende Features auswählt
  • Eine Principal Component Analysis (PCA) durchführt
  • Outliers erkennt und ausselektiert