Die erste Fassung dieses Skripts wurde von Matthias Brandt (Student im WS 2011/2012) erstellt. Überarbeitet und erweitert wurde es von Dr. Rainer Schmidt und Prof. Dr. Georg Füllen. Im Winter 2011/2012 wurde das Script von Melina Schellhorn (zu Kürzesten Wegen, Maximum Likelihood und Single Nucleotide Polymorphismen) erweitert. Das Skript ist angelehnt an die Vorlesung zur Bioinformatik von Prof. Füllen, die ein Teil der gemeinsam mit Prof. Kundt gehaltenen Vorlesung „Epidemiologie, Medizinische Biometrie und Medizinische Informatik“ ist. Der erste Teil der Vorlesung basiert teilweise auf dem Buch „Algorithmen und Datenstrukturen - Eine Einführung mit Java“ von Saake/Sattler und auf Materialien von R. König aus Heidelberg (mit freundlicher Genehmigung). Der vierte Teil des Skripts „Biomarker-Finden mit R“ basiert teilweise auf dem Buch „Applied Statistics for Bioinformatics using R“ von Wim P.Krijnen. In diesem Teil erfolgt auch eine Einführung in die Programmiersprache „R“, mit der nicht nur viele Rechnungen im Bereich der Bioinformatik durchgeführt werden, sondern auch die typischen statistischen Untersuchungen für medizinische Promotionen im Bereich Biostatistik/Biometrie möglich sind. Auf den folgenden Seiten soll es um die Bioinformatik gehen. Angelehnt an die Vorlesung haben wir uns mit den Folien (siehe: http://www.ibima.med.uni-rostock.de/IBIMA/ unter „Teaching1“) auseinandergesetzt und versucht, jeweils zu erklären, worum es geht. Somit sollte es mit diesem Script möglich sein, den hier behandelten Teil der Vorlesung eigenständig nachzuvollziehen. Doch vorweg erst einmal die Antwort auf die zwei wichtigsten Fragen zu diesem Thema: Was ist Bioinformatik? Bioinformatik ist ein Teilbereich der Informatik, welcher mit Hilfe von Programmen Probleme und Fragestellungen der Biologie und Medizin zu lösen versucht. Was geht mich das an? Im Rahmen heutiger Fragestellungen, bei denen es nicht mehr nur darum geht, ob z. B. ein Medikament wirkt oder nicht, sondern auch danach gefragt wird, wo es wirkt (Rezeptoren, Carrier, …) und wie genau es dort angreift, kommt man an der Visualisierung und Berechnung derartiger Zusammenhänge einfach nicht mehr vorbei. In vielen Fällen sind die Datenmengen, die mit modernen Geräten gewonnen werden, so groß, dass sie ohne vorherige Sortierung und Organisierung gar nicht greifbar (und somit auswertbar) sind. Jede Information ist immer nur soviel wert wie der Zusammenhang, in den sie gesetzt wird. Genau hier greift die Bioinformatik an und versucht mit Hilfe von Berechnungen Ordnung ins Chaos zu bringen. Dass uns dies noch nicht täglich in der Klinik begegnen wird ist klar. Wenn es jedoch darum geht, Forschung zu betreiben oder zu verstehen, woher die Daten von Genanalysen stammen und was damit gemacht werden kann, ist es recht hilfreich, einen Einblick bekommen zu haben. In diesem Sinne hoffen wir, dass wir all jenen weiterhelfen können, die Probleme mit dem Themengebiet haben! Beschrieben werden hier die Inhalte der 1.Vorlesung sowie des 1. Seminars, und die Themen ‚Maximum Likelihood Phylogenie’, ‚Blast’ und ‚SNPs’. Am Ende der Kapitel befinden sich Übungsaufgaben. Hierbei handelt es sich um Multiple-Choice-Aufgaben, bei denen jeweils nur eine Antwort richtig ist. Die Lösungen zu den Übungsaufgaben befinden sich im Anhang. Der Inhalt wurde grundsätzlich auf Korrektheit geprüft. Es kann jedoch hier und da Fehler geben, genauso wie in den Folien zur Vorlesung. Wir bitten um Hinweise. Für die 3. Auflage wurde Kapitel 5 zur Informationsverarbeitung neu eingefügt. Prof. Georg Füllen: fuellen@uni-rostock.de Dr. Rainer Schmidt: rainer.schmidt@uni-rostock.de