Machine Learning - Update
30.04.2014Vor einiger Zeit habe ich über das Projekt “Mobile Campusanwendung (MoCa)” gebloggt. Ziel des Forschungsprojekt MoCa ist die Entwicklung einer integrierten mobilen Anwendung nebst Backend-Services, die die gängigen Mobilen Plattformen (Android, iOS, Windows) unterstützt und es den Nutzern ermöglicht, personalisierte, hochschulspezifische Dienste wie z.B. Stundenplan, Prüfungsergebnisse etc. mobil zu nutzen. Dienste des Digitalen Campus - bei der die FH-Frankfurt eine Vorreiterrolle einnimmt - sollen ebenfalls integriert werden. Zusätzlich soll die Anwendung geeignet sein, mit Hilfe der im Gerät verbauten Sensoren u.a. Ortsinformationen zur Lokalisierung zu verwenden, um so einen Mehrwert für den Nutzer (und den Campus) zu erzielen. Dabei kann und soll geprüft werden, inwieweit die Geräte auch als Datenquelle genutzt werden können (Anwesenheit, Detektion von Freunden und Bekannten o.ä.), wobei Aspekten des Datenschutz und Schutzes der Privatsphäre eine besondere Bedeutung zukommt. Begleitende Themen wie u.a. Mobile Tagging, Mobile Augmented Reality, Push Notification und die Integration in Verkaufs- und Marketingplattformen (App-Stores) werden ebenso evaluiert.
Die ersten wissenschaftlichen Auswertungen des Projekts liegen nun vor. Wie sich gezeigt hat, ist die Lokalisierung innerhalb des untersuchten Gebäudes 1 der FH Frankfurt hervorragend möglich. Gemessen wurden sogenannte “Fingerprints”, d.h. die Feldstärken der empfangenen Accesspoints (Received Signal Strength oder RSS). Wie die nachstehende Abbildung zeigt, sind die geometrischen Abstände nur schwach mit den “Abständen” im Euklidischen Raum der Signalstärken (dem sogenannten Feature Space) korreliert:
Dennoch kann man mithilfe von Algorithmen des Maschinellen Lernens (s.a. mein Seminar im HIS) die Daten benutzen, um den Ort mit hoher Genauigkeit zu bestimmen. Die nachstehende Abbildung, die eine Principal Components Analyse der ermittelten Daten darstellt, veranschaulicht dies sehr gut am Beispiel der Seminar- und Vorlesungsräume 129-333:
Man sieht sehr schön, wie die Datenwolken für die einzelnen Räume clustern. Eine typische sogenannte Confusion Matrix, die die Fehler bei der Erkennung angibt, sieht dann so aus:
Raum | 129 | 130 | 131 | 235 | 236 | 237 | 332 | 333 |
---|---|---|---|---|---|---|---|---|
129 | 48 | 1 | 0 | 0 | 0 | 0 | 0 | 0 |
130 | 0 | 70 | 0 | 0 | 0 | 0 | 0 | 0 |
131 | 0 | 0 | 63 | 0 | 0 | 0 | 0 | 0 |
235 | 0 | 0 | 0 | 40 | 0 | 0 | 0 | 0 |
236 | 0 | 0 | 0 | 0 | 47 | 1 | 0 | 0 |
237 | 0 | 0 | 0 | 0 | 0 | 52 | 0 | 0 |
332 | 0 | 0 | 0 | 0 | 0 | 0 | 53 | 0 |
333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 50 |
Ebenso wurden die Middleware-Tools wie die Sybase Unwired Platform (SUP) der Firma SAP und diverse Java Enterprise Software (Spring) zum Einsatz gebracht. Für die nächste Phase ist geplant, die Dienste auszubauen und für Studierende praktisch nutzbar zu machen. Dazu kann ich wissenschaftliche Mitarbeiterstellen für interessierte und qualifizierte Studierene anbieten. Außerdem besteht die Möglichkeit, interessante forschungsnahe Master- (und Bachelor-) Arbeiten in den Themengebieten Maschinelles Learning, Lokalisierungsdienste und Software Engineering anzufertigen. Dazu in Bälde mehr (auch auf englisch, da die Stellen auch für unsere Masterstudenten aus dem Ausland relevant sind).
Hier das Paper, das ich im Oktober auf der ICUMT 2014 in St. Petersburg vorstellen werde (to appear in Proceedings of ICUMT 2014 - the 6th International Congress on Ultra Modern Telecommunications and Control Systems).