Modultitel

  • Information Retrieval

Modultitel (Englisch)

  • Information Retrieval

Lehrveranstaltungen des Moduls

  • Einführung in das Information Retrieval (WS: 2V+2Ü)
  • Praktikum Information Retrieval (SS: 4Pr)

Modulverantwortliche(r)

Lehrinhalte

Das Auffinden relevanter Informationen stellt eine zentrale Aktivität in unserer modernen Wissensgesellschaft dar. Relevante Informationen sind zum großen Teil in unstrukturierten Dokumenten (insbesondere Textdokumente) zu finden. Das Gebiet des Information Retrieval (IR) beschäftigt sich mit der Erforschung, Entwicklung und Anwendung von Methoden für den effizienten Zugriff und Suche auf großen Mengen von unstrukturierten Daten, insbesondere Texte, Bilder und Videos. In der Vorlesung werden folgende Themen behandelt:

  • Information Retrieval Modelle (insbesondere das Boolsche, das vektor-basierte und das probabilistische Modell)
  • Methoden zur Gewichtung von Termen
  • Techniken zur Indizierung
  • Sprachmodelle für das Information Retrieval
  • Relevance Feedback und Query Expansion für das Information Retrieval
  • Latent Semantic Indexing
  • Web Suche: Der Fall Google
  • Multimedia Retrieval

Ziel des Praktikums ist es, eine eigene Suchmaschine für einen größeren Datensatz (den Reuters Datensatz) zu entwickeln.

Kompetenzen

Nach Abschluss des Moduls sollten die Studierenden:

  • mit den wesentlichen Paradigmen sowie den gängigen Methoden und Modellen des Information Retrievals vertraut sein,
  • Techniken beherrschen, um große Mengen an unstrukturierten Daten  im Hinblick auf das effiziente Retrieval zu indizieren,
  • ein Verständnis für fortgeschrittene Techniken wie die Verwendung von Sprachmodellen für das IR, relevance feedback sowie latent semantic indexing entwickelt haben,
  • die Funktionsweise von Web-Suchmaschinen verstehen, sowie
  • in der Lage sein, ein IR System selbstständig zu implementieren.

Literatur:

  • "Introduction to Information Retrieval", Manning, Raghavan, Schütze, Cambridge University Press, 2008
  • "Search Engines: Information Retrieval in Practice", Bruce Croft, Donald Metzler, Trevor Strohman, Pearson/Addison-Wesley, 2009
  • "Modern Information Retrieval", Baeza-Yates and Ribeiro-Neto, Addison-Wesley, 1999

Anzahl Einzelleistungen (benotet und unbenotet)

eine benotete Einzelleistung (Klausur) und zwei unbenotete Einzelleistungen (Portfolio aus Übungsaufgaben und Praktikum)

Prüfungsformen

  • Klausur
  • Portfolio aus Übungsaufgaben, die veranstaltungsbegleitend gestellt werden (Bestehensgrenze 60% der erzielbaren Punkte, individuelles Erläutern der Lösungen). Die Übungsaufgaben im Rahmen des Portfolios werden in der Regel wöchentlich ausgegeben
  • erfolgreiches Absolvieren des Praktikums (Vorstellung der entwickelten Suchmaschine in Gruppen)

Voraussetzungen für die Vergabe von Leistungspunkten

Bestehen der Klausur (2 LP) und erfolgreiche Bearbeitung der Übungsaufgaben (3,5 LP) sowie erfolgreiches Absolvieren des Praktikums (4,5 LP) ergeben insgesamt 10 LP.

Arbeitsaufwand und Leistungspunkte

Vorlesung
Nachbereitung Vorlesung
Vorbereitung  der Übungen
Übungen
Vorbereitung der Klausur
Praktikum (Präsenz)
Vorbereitung Praktikum
gesamt: 300h = 10 LP
2 SWS x 16 Wochen
2h/Woche x 16 Wochen
2h/Woche x 16 Wochen
2 SWS x 16 Wochen

2 SWS x 16 Wochen


= 30h
= 30h
= 30h
= 30h
= 60h
= 30h
= 90h

Teilnahmevoraussetzungen und Vorkenntnisse

Kenntnisse in folgenden Gebieten werden empfohlen (stellen aber keine Voraussetzung dar): Algorithmen und Datenstrukturen, Grundkenntnisse Mathematik, Einführung in die Datenbanken und Modellierung

Modultyp und Verwendbarkeit

Wahlpflichtmodul für die Bachelorstudiengänge

  • Naturwissenschaftliche Informatik (WP Vertiefung Informatik)
  • Kognitive Informatik (WP Intelligente Systeme)
  • Bioinformatik und Genomforschung (WP Bioinformatik und Genomforschung)
  • Medieninformatik und Gestaltung (WP Medieninformatik)
  • Nebenfach Informatik (WP Vertiefung Informatik)

Wahlpflichtmodul für die Masterstudiengänge

  • Naturwissenschaftliche Informatik (Grundlagen Ergänzung)
  • Intelligente Systeme (Grundlagen Ergänzung)
  • Interdisziplinäre Medienwissenschaft

Dauer des Moduls / Angebotsturnus

Wintersemester: Vorlesungen und Übungen (einmalig auch im SS 2010)
Sommersemester: Praktikum
Dauer 2 Semester