Modultitel

  • Texttechnologie

Modultitel (Englisch)

  • Text-technology

Lehrveranstaltungen des Moduls

  • Texttechnologie (WS: 2V + 2Ü)

Lehrinhalte

Das Modul Texttechnologie behandelt die automatische Analyse und Repräsentation von Texten und Dokumenten im Bereich der geschriebenen Sprache. Am Beispiel des World Wide Web wird gezeigt, welche Struktureigenschaften Texte bzw. webbasierte Dokumente besitzen, wie diese mit Hilfe texttechnologischer Datenbanken zu repräsentieren sind und auf welche Weise schließlich diese Dokumente automatisch analysiert werden können. Die Dokumentanalyse betrifft eine Reihe grundlegender Aufgaben des Text und Web Mining. Dazu zählen unter anderen die Informationsextraktion und die Erkennung von Eigennamen sowie die automatische Klassifikation von Texten nach ihrem Inhalt, ihrer Struktur und ihrer Funktion. Einen zentralen Ausgangspunkt für die automatische Analyse von Texten bilden webbasierte Ressourcen wie zum Beispiel die Wikipedia. Die Vorlesung erläutert den Entwicklungsstand zur Erschließung dieser Ressource am Beispiel unterschiedlicher Kommunikationsbereiche (wie der Wissenskommunikation, der Pressekommunikation und der Wirtschaftskommunikation). Ferner führt die Vorlesung in den Bereich des Retrievals von Texten ein und somit in jene Grundlagen, auf denen Suchmaschinen basieren. Sämtliche theoretischen Konzepte der Vorlesung werden anhand des eHumanities Desktops exemplifiziert, der als rein webbasiertes Korpusmanagementsystem für die Texttechnologie entwickelt wurde. Auf diese Weise werden theoretische Konzepte stets auch praktisch anhand einschlägiger Aufgabenstellungen erprobt.

Kompetenzen

Die Vorlesung führt in grundlegende Begriffe, Methoden und Aufgabengebiete der Texttechnologie ein. Am Ende der Vorlesung sollen die Studierenden mit den grundlegenden Verfahrensweisen der automatischen Analyse von Texten und ihrer Repräsentation vertraut sein. Ferner sollen sie dazu in der Lage sein, einfache texttechnologische Anwendung zu entwickeln und anhand von Textkorpora zu erproben.

Literatur:

  • R. Feldman and J. Sanger. The Text Mining Handbook. Advanced Approaches in Analyzing Unstructured Data. Cambridge University Press, Cambridge, 2007.
  • G. Heyer, U. Quasthoff, and T. Wittig. Text Mining: Wissensrohstoff Text. W3L, Herdecke, 2006.
  • C. D. Manning and H. Schütze. Foundations of Statistical Natural Language Processing. MIT Press, Cambridge, Massachusetts, 1999.

Anzahl Einzelleistungen (benotet und unbenotet)

zwei Einzelleistungen: Bestehen der Übungsaufgaben (unbenotet) und Programmierprojekt (benotet oder unbenotet)

Prüfungsformen

  • Veranstaltungsbegleitendes Portfolio aus Übungsaufgaben (Bestehensgrenze 50% der erzielbaren Punkte), die in der Regel wöchentlich gestellt werden.
  • Erfolgreiche Umsetzung eines texttechnologischen Programmierprojekts im Anschluss an die Übung.

Voraussetzungen für die Vergabe von Leistungspunkten

Erfolgreiche Bearbeitung der vorlesungsbegleitenden Übungsaufgaben ergeben 4 LP, Absolvierung des texttechnologischen Programmierprojekts ergibt 1 LP.

Arbeitsaufwand und Leistungspunkte

Vorlesung
Nachbereitung der Vorlesung:
Übungen
Vorbereitung der Übungen:
Texttechn. Programmierprojekt
gesamt: 150h = 5 LP
2 SWS x 16 Wochen
2h/Woche x 16 Wochen
2 SWS x 16 Wochen
2h/Woche x 16 Wochen


= 30h
= 30h
= 30h
= 30h
= 30h

Teilnahmevoraussetzungen und Vorkenntnisse

Kenntnisse in folgenden Gebieten sind empfehlenswert, werden jedoch nicht vorausgesetzt: Algorithmen und Datenstrukturen, Grundkenntnisse Mathematik, Programmieren (in Java oder C++)

Modultyp und Verwendbarkeit

Wahlpflichtmodul für die Bachelorstudiengänge

  • Naturwissenschaftliche Informatik (WP Vertiefung Informatik)
  • Kognitive Informatik (WP Intelligente Systeme)
  • Medieninformatik und Gestaltung (WP Medieninformatik)
  • Nebenfach Informatik (WP Vertiefung Informatik)

Wahlpflichtmodul für die Masterstudiengänge

  • Naturwissenschaftliche Informatik (Grundlagen Ergänzung)
  • Intelligente Systeme (Grundlagen Ergänzung)

Dauer des Moduls / Angebotsturnus

Wintersemester: Vorlesung und Übungen