

PublicAI
Im Projekt PublicAI arbeiten wir daran, Künstliche Intelligenz im öffentlichen Sektor, besonders bei der öffentlichen Beschaffung einzusetzen. Unser Ziel ist es, Systeme zu entwickeln, die große Mengen an Vergabedaten automatisch erfassen, verarbeiten und so aufbereiten, dass sie leicht ausgewertet und weiterverwendet werden können. Hintergrund ist ein wachsendes Problem: Immer mehr Aufträge werden ausgeschrieben, aber gleichzeitig sinkt die Zahl der eingehenden Angebote. Gründe dafür sind unter anderem unübersichtliche Ausschreibungsplattformen, schwer zugängliche Dokumente und aufwendige Anmeldeprozesse. Wir wollen mit PublicAI helfen, diesen Prozess besser und übersichtlicher zu machen. Das Gesamtprojekt PublicAI besteht dabei aus den Teilprojekten DataMind, DocuVision und RegX auf. Wir kombinieren moderne Technologien wie Web-Crawling, Optical Character Recognition (OCR) und maschinelles Lernen, um ein intelligentes System zur Datenverarbeitung zu schaffen. Ein Beispiel: Wir entwickeln in dem Teilprojekt DataMind einen Webcrawler, der europaweit Ausschreibungen automatisch von Plattformen wie TED oder BeschA in eine CKAN-Datenbank überträgt. Im Teilprojekt DocuVision liegt der Schwerpunkt auf der Verarbeitung gescannter Vergabedokumente. Diese werden per OCR in durchsuchbaren Text umgewandelt. Dafür testen wir verschiedene OCR-Technologien und entwickeln Vor- und Nachbearbeitungsverfahren, um die Qualität der erfassten Inhalte zu verbessern. Parallel entsteht mit RegX eine Plattform, auf der sich Unternehmen registrieren können. Ihre Daten werden automatisch durch einen Scraper ergänzt und aktuell gehalten. Mithilfe von Reinforcement Learning und Datenanalyse wollen wir langfristig eine hochwertige Datenbasis schaffen.