Unter "Data Mining" werden Methoden verstanden,die es erlauben, aus großen Datenmengen interessante und mit klassischen Verfahren nur schwer oder gar nicht aufzufindende Informationen, z.B. Trends, Subgruppen, "Ausreißer", wiederkehrende Strukturmerkmale usw. zu extrahieren. Wendet man diese Methoden auf natürlichsprachliche Texte an, so spricht man von "Text Mining". Insbesondere angesichts der enormen Mengen elektronisch verfügbarer Texte im Internet und in Intranets sind solche Methoden von wachsender wissenschaftlicher und wirtschaftlicher Bedeutung. In dem geplanten studentischen Projekt wird es darum gehen, Text-Mining-Methoden zu erproben, anzuwenden und weiterzuentwickeln.