Machine Learning and Statistical Genetics (2011)
Course overview (in German)
Titel
"Computational Approaches to Statistical Genetics"
Modul
BIOINF 4399 Advanced topics in bioinformatics
Dozenten
Prof. Dr. Karsten Borgwardt, Dr. Oliver Stegle und Christoph Lippert, MPI Entwicklungsbiologie und MPI Intelligente Systeme
Zeit
- Montag, 12.9.2011 - Freitag, 23.9.2011 (10 Kurstage),
- 3 Stunden Vorlesung pro Tag: 9:00 s.t. - 11:30
- 3 Stunden Übung pro Tag: 12:00 s.t. - 14:15
- (entspricht 2 SWS Vorlesung + 2 SWS Übung, 4 Leistungspunkte)
Raum
F122, Sand 6/7
Prüfung
Mündliche Scheinprüfung am Mittwoch 28.9.2011
Anrechenbarkeit
- 4 Leistungspunkte
- Wahlpflichtmodul Bioinformatik (Master)
- Praktische Informatik (Diplom)
Voraussetzungen
Grundlegende Mathematikkenntnisse, ansonsten erfordert der Kurs keine Vorkenntnisse
Inhalt
Ein klassisches Thema in der Genetik besteht darin, zu untersuchen, inwieweit phänotypische Unterschiede zwischen Individuen auf genetische Unterschiede zurückgeführt werden können. Dank moderner Sequenzierverfahren kann diese Fragestellung nun mit unheimlicher Detailtiefe auf kompletten Genotypen untersucht werden. Gleichzeitig wächst damit aber auch der Bedarf an schnellen Algorithmen, um diese enormen Datenbestände effizient analysieren zu können.
In dieser Vorlesung führen wir in die Thematik der rechnergestützten Verfahren in der statistischen Genetik ein. Im ersten Teil der Vorlesung erklären wir verschiedene Verfahren, um einzelne Genompositionen zu bestimmen, die einen Phänotypen beeinflussen. Wir beschreiben die statistischen Probleme, die sich aufgrund der hohen Anzahl von statistischen Tests ergeben, die man bei solch einer Assoziationsstudie durchführt, und wie man diesem Multiple-Hypothesen-Test-Problem begegnen kann. Im zweiten Teil führen wir sowohl in die statistischen als auch algorithmischen Probleme der Suche nach epistatischen Interaktionen ein, d.h. nach Paaren von Loci, die durch ihre Interaktion einen extremen Phänotypen hervorrufen. Im dritten Teil beschreiben wir, wie Phänotypen durch externe Faktoren wie die Populationsstruktur oder Interaktionen zwischen Genotyp und Umwelt beeinflusst werden und statistische Methoden, die diese Effekte berücksichtigen.