Klassifikation von Tumoren mit GP-basierter DNA-Chip-Analyse

Inhaltsangabe:Zusammenfassung: Krebserkrankungen sind die zweithäufigste Todesursache in den Industrienationen. Daher ist es wichtig, neue Behandlungsmethoden und Medikamente zu entwickeln, die effizienter und schonender wirken als heutige Therapien. Eine wichtige Voraussetzung für jede Behandlung ist die richtige Diagnose. Bei Tumoren gibt es jedoch viele verschiedene Arten und Subtypen, die sich äußerlich kaum unterscheiden, deren Biologie aber sehr unterschiedlich sein kann. Daher ist die Erfassung der inneren Vorgänge in den betroffenen Geweben von großer Bedeutung. Ein wichtiges Hilfsmittel ist dabei die DNA-Chip-Technologie. Mit DNA-Chips lassen sich ?Schnappschüsse? der Abläufe in den Zellen machen, indem die Genexpression der verschiedenen Gene gemessen wird. Mit Hilfe dieser Expressionsdaten lassen sich dann Rückschlüsse auf die Situation ziehen. So kann man Typen von Tumoren klassifizieren und erkennen, welche Gene am bösartigen Zellwachstum beteiligt sind. In der Zukunft kann dies vielleicht einmal die Herstellung neuer, spezifischer Medikamente ermöglichen. Problematisch ist jedoch die Auswertung der Expressionsdaten, da es sich dabei nur um lange Folgen von scheinbar zusammenhangslosen Zahlen handelt. Bisher wurden dafür hauptsächlich statistische Klassifikationsverfahren, wie Nachbarschaftsanalyse, selbstorganisierte Karten oder Support Vector Machines benutzt. Kern dieser Diplomarbeit ist die Untersuchung, wie sich ?Genetische Programmierung? (GP) für die DNA-Chip-Analyse eignet. GP funktioniert im Allgemeinen gut bei der Erkennung von verborgenen Strukturen in großen Datenmengen. Untersucht werden bestimmte binäre und multiple Klassifikationsprobleme aus dem Bereich der Krebsdiagnose, etwa die Frage, ob bestimmtes Gewebe gesund ist oder aus bösartigen Zellen besteht, oder um welche Art von Krebs es sich handelt. Als Datenbasis dienen verschiedene im Internet verfügbare öffentliche Datenmengen, die auch schon mit anderen Klassifikationsverfahren benutzt worden sind. Die Ergebnisse der GP-Versuche sind kleine automatisch generierte Programme, sogenannte Klassifikatoren, die für die Datensätze die jeweils vorher definierte Fragestellung beantworten sollen. Die Arbeit ist folgendermaßen gegliedert: In Kapitel 2 wird der biologische Hintergrund erläutert. Das Kapitel ist in zwei Teile aufgeteilt. Im ersten Teil wird ein Einblick in die molekulare Genetik gegeben. Dabei werden Geschichte der Genetik, der Aufbau der DNA, der Vorgang [¿]