Zum zweiten Mal in Folge hat jetzt Mark Blacher von der Universität Jena den internationalen SIGMOD-Programmierwettbewerb gewonnen. Aufgabe war es, ein sogenanntes Entity-Resolution-System, eine vollautomatisierte Lösung zur eindeutigen Bestimmung eines Objekts, zu entwickeln. Dabei setzte sich das Team des Jenaer Doktoranden unter 53 Gruppen von renommierten Universitäten durch.
Jena (30.04.2020) Seit zwölf Jahren versuchen Doktoranden-Teams auf der ganzen Welt, den internationalen „SIGMOD Programming Contest“ zu gewinnen. Er wird im Rahmen der gleichnamigen Konferenz durchgeführt – die weltweit wichtigste Zusammenkunft von Datenbankspezialisten. Mit Mark Blacher siegte nun erstmals in der Geschichte des anspruchsvollen Wettbewerbs ein Doktorand gleich zweimal in Folge.
Bereits 2019 ging der 33-jährige Jenaer Informatiker mit der Verbesserung und Implementierung eines Sortieralgorithmus als Sieger hervor. Dieses Jahr entwickelte er mit Unterstützung seiner Kollegen Matthias Mitterreiter und Julien Klaus ein sogenanntes Entity-Resolution-System. „Die Lösung sollte identische, jedoch zahlreich unterschiedlich betitelte Produkte auf 30.000 Websites eindeutig bestimmen und zuordnen. Konkret ging es um Fotokameras“, erläutert Blacher. Die Macher des Wettbewerbs haben sich damit einem Problem gewidmet, welches Verbraucher beispielsweise von Preissuchmaschinen kennen. Wer dort ein Produkt und den günstigsten Preis dafür sucht, sieht sich häufig mit einer langen Artikelliste konfrontiert: Denn Suchalgorithmen ordnen einer Anfrage oftmals falsche Produkte zu.
Nur noch relevante Treffer in der Preissuchmaschine
Mittels „Machine Learning“ – also maschinellen Lernens – hat das Team vom Lehrstuhl für Theoretische Informatik II der Uni Jena dieses Problem gelöst. „Wir haben hocheffiziente Algorithmen zur Identifizierung und Klassifizierung entwickelt“, so Blacher. Am Beispiel der Preissuchmaschinen und Kameras erklärt er weiter: „Unsere Algorithmen identifizieren zum Beispiel eine spezifische Kamera, die auf verschiedenen Webseiten unterschiedlich betitelt ist, als ein und dasselbe Objekt. Falsche Produkte werden aussortiert.“ Für Verbraucher hieße das: Nur noch relevante Treffer in der Preissuchmaschine.
Den Wettbewerbsauftrag hat das Trio der Friedrich-Schiller-Universität vollumfänglich erfüllt: Ihre Lösung läuft zu 100 Prozent automatisiert und gewährleistet die geforderte Genauigkeit von 99 Prozent. „Darüber hinaus hat die Schnelligkeit große Bedeutung“, so Blacher zu den Herausforderungen. In nur zwei Monaten entwickelten er und seine Mitstreiter ein System, das Produkte von 30.000 vorgegebenen eCommerce-Webseiten in nur 0,2 Sekunden klassifiziert.
53 internationale Teams waren angetreten. Der Sieg aber ging erneut an das Team um Blacher, das sich jetzt über ein Preisgeld in Höhe von 7.000 US-Dollar freut. Zusätzlich erhält das Gewinnertrio ein Reisestipendium für die Teilnahme an der „SIGMOD 2020“ in Portland, Oregon, USA. Dort hätten sie ihr System einem breiten Fachpublikum vorstellen dürfen. Aufgrund der Corona-Krise aber werden Blacher, Klaus und Mitterreiter in Jena bleiben und ihre Lösung online präsentieren.
Training für Programmierwettbewerbe
Von Mark Blachers Wettbewerbserfahrungen und -erfolgen sollen nun auch andere Studierende in Jena profitieren: Ab diesem Sommersemester bietet er an der Friedrich-Schiller-Universität ein Training für Programmierwettbewerbe an, für das der Lehrstuhl eine hohe Nachfrage verzeichnet.
Weitere Informationen:
SIGMOD Programming Contest: http://www.inf.uniroma3.it/db/sigmod2020contest/index.html
Lehrstuhl für Theoretische Informatik II, Universität Jena: https://theinf2.informatik.uni-jena.de/
Info, FSU JENA // Axel Burchardt