Modultitel

  • Algorithmische Stochastik in der Bioinformatik

Modultitel (Englisch)

  • Algorithmic Stochastics in Bioinformatics

Lehrveranstaltungen des Moduls

  • Algorithmische Stochastik in der Bioinformatik (WS: 2V+2Ü)
  • Fallstudien zu Algorithmischer Stochastik in der Bioinformatik (SS: 2S) oder
    Biostatistik (SS: 2S)

Modulverantwortliche(r)

Lehrinhalte

Viele komplexe Probleme der Bio- und allgemeiner der naturwissenschaftlichen Informatik (z.B. Alignment, Gene finding, Inferenz fuer Populationssequenzdaten) lassen sich nicht gleichzeitig effizient und optimal mit deterministischen Verfahren lösen; in diesem Fall nimmt man oft stochastische Methoden zur Hilfe. Aufbauend auf stochastischen Grundlagen aus der Wahrscheinlichkeitstheorie und Statistik legt dieses Modul die nötigen Grundlagen (Darstellung von Verteilungen im Computer; Rechnen mit sehr kleinen Wahrscheinlichkeiten; Effiziente Generierung von Zufallszahlen aus vorgegebenen Verteilungen; Testen der Qualität von Zufallszahlengeneratoren). Als ein wichtiges Hilfsmittel werden Markov Chain Monte Carlo Methoden (Metropolis-Hastings; Gibbs sampler) anhand von Anwendungsbeispielen vorgestellt, sowie Methoden des
importance sampling und der Simulation seltener Ereignisse.Es werden alternativ zwei Seminare angeboten:

  1. Algorithmische Stochastik: Hier werden Simulationsanwendungen aus der aktuellen Forschungsliteratur erarbeitet.
  2. Biostatistik: Die Ausgaben stochastischer Simulationen, aber auch allgemein beliebige Datensätze, müssen statistisch untersucht werden um z.B. Parameterannahmen in den Modellen zu verifizieren oder weitergehende Aussagen über die Signifikanz der Ergebnisse machen zu können. Deswegen werden hier die notwendigen Grundlagen der Biostatistik gelegt (Konfidenzintervalle; statistische Test; multivariate Datenanalyse; lineare und nicht lineare Regression).

Kompetenzen

Der Schwerpunkt der Vorlesung liegt auf der Vermittlung von verschiedenen Methoden und Techniken als „Werkzeuge“ für ein breites Spektrum von Problemen aus der Bioinformatik. Die Studierenden lernen, in Wahrscheinlichkeiten zu denken und mit Wahrscheinlichkeitsverteilungen und ihren numerischen Eigenschaften umzugehen. Als Vorbereitung auf die Bachelor-Arbeit wird insbesondere in den Übungen verlangt, besprochene Methoden auf neue Probleme zu übertragen. Die Übungen beinhalten deswegen auch Programmier- und Projektaufgaben, in denen die Verfahren aus der Vorlesung implementiert und angewendet werden. Im Seminar lernen die Studierenden die Umsetzung in aktuelle Forschungssituationen, bzw. die statistische Analyse beliebiger Datensätze.


Literatur:
James E. Gentle. Random Number Generation and Monte Carlo Methods. Springer 1998. Christian P. Robert und George Casella. Monte Carlo Statistical Methods. Springer 2002. Donald E. Knuth. The Art of Computer Programming vol. 2. Addison-Wesley 1998.
Neil Madras, Lectures on Monte Carlo Methods, AMS 2002. James Bucklew, Introduction to Rare Event Simulation, Springer 2004.
Lutz Dümbgen. Biometrie. Vieweg+Teubner 2010.
Ludwig Fahrmeier. Regression. Springer 2009.

Anzahl Einzelleistungen (benotet und unbenotet)

eine benotete oder unbenotete Einzelleistung (Vorlesung), eine unbenotete Einzelleistung (Seminar)

Prüfungsformen

  • WS: Portfolio aus Übungsaufgaben, die veranstaltungsbezogen gestellt werden
    (Bestehensgrenze 50% der erzielbaren Punkte, individuelles Erläutern von Aufgaben) und Abschlussklausur (90-120 min) oder abschließende mündliche Prüfung (20-30 min). Die Übungsaufgaben im Rahmen des Portfolios werden in der Regel wöchentlich ausgegeben.
    Abschlussklausur oder abschließende mündliche Prüfung beziehen sich auf den Stoff der Vorlesung und der Übungen.
  • SS: Vortrag und schriftliche Ausarbeitung (Fallstudien-Seminar) oder lösen von Übungsaufgaben und schriftliche Ausarbeitung (Biostatistik-Seminar)

Voraussetzungen für die Vergabe von Leistungspunkten

WS: regelmäßige und aktive Teilnahme an den Übungen; Erbringen des o.g. Portfolios
SS: regelmäßige und aktive Teilnahme am Seminar; Seminarvortrag mit Ausarbeitung (Fallstudien- Seminar); schriftliche Ausarbeitung (Biostatistik-Seminar)

Arbeitsaufwand und Leistungspunkte

Algorithmische Stochastik in der Bioinformatik
gesamt: 210h = 7 LP
= 210h
Fallstudien zu Algorithmischer Stochastik in
der Bioinformatik oder Biostatistik
gesamt: 90h = 3 LP
= 90h

Leistungspunkte für das Modul: 10 LP

Teilnahmevoraussetzungen und Vorkenntnisse

Mathematik für Informatiker I und II,
Mathematische Methoden der Biowissenschaften I und II, Sequenzanalyse
Nützlich: Grundkenntnisse in numerischer Mathematik

Modultyp und Verwendbarkeit

Wahlpflichtmodul für den Bachelorstudiengang

  • Bioinformatik und Genomforschung (WP Bioinformatik und Genomforschung)

Wahlpflichtmodul für die Masterstudiengänge

  • Bioinformatik und Genomforschung (Vertiefung Mathematik/Physik/Chemie)
  • Naturwissenschaftliche Informatik (Vertiefung Naturwissenschaften)

Dauer des Moduls / Angebotsturnus

Beginn: Wintersemester, jährlich