Studium, Ausbildung und Beruf

web uni-protokolle.de
 powered by
NachrichtenLexikonProtokolleBücherForenFreitag, 28. November 2014 

Sequenzalignment


Dieser Artikel von Wikipedia ist u.U. veraltet. Die neue Version gibt es hier.
Ein Alignment (englisch: Abgleich Anordnung Ausrichtung ) dient dem Vergleich mehrerer Strings (technischer für Zeichenfolge Sequenz) und wird besonders häufig der Bioinformatik verwendet um die funktionelle oder evolutionäre Verwandtschaft ( Homologie ) von DNA - oder Proteinsequenzen zu untersuchen.

Inhaltsverzeichnis

Das Prinzip

Beim Alignment ordnet man die Elemente untersuchten Strings denen des/der anderen Strings so dass die Reihenfolge erhalten bleibt und jedes einem anderen Element oder einem gap (Leerstelle Lücke) in jedem String zugeordnet Die einander zugeordneten (alignierten) Elemente sollten identisch möglichst ähnlich sein weil viele gleiche oder Elemente in gleicher Reihenfolge auf eine evolutionäre funktionelle Verwandtschaft hinweisen. Die Ähnlichkeit der Elemente meist vorgegeben und hängt von den Eigenschaften verwendeten Daten ab. Damit ein sinnvolles Alignment möglich und da die Sequenzen oft unterschiedlich lang dürfen Gaps in die Sequenzen eingefügt werden.

Kostenfunktion

Um ein Alignment bewerten zu können es eine Kostenfunktion ( alignment score ) die meist gleiche und ähnliche alignierte positiv und sich stärker unterscheidende Kombinationen weniger bis leicht negativ bewertet. Gaps werden ebenfalls bewertet allerdings gibt es sogenannte affine Gap-Scores die ein langes Gap weniger schlecht als mehrere kurze.

Ein Beispiel

 -AAACGG AAAACCG  
  
Das oben dargestellte Alignment von zwei DNA-Sequenzen zeigt an der ersten Position (-A) ein Gap eingefügt werden kann um Längenunterschiede Das Gap wurde am Anfang der oberen eingefügt und nicht in der Mitte weil aus der Sicht der Biologie wahrscheinlicher ist dass eine Sequenz an den mutiert als in der Mitte.

An der vorletzten Stelle wurden C G aligniert da in der DNA durchaus möglich sind in denen statt eines Cs ein G eingebaut wird oder umgekehrt. Es auch möglich gewesen G und C jeweils einem Gap in der anderen Sequenz zu Diese Entscheidung hängt von der verwendeten Kostenfunktion

Beim Proteinsequenzalignment entsprechen die Aminosäuresequenzen den Strings. Die Kostenfunktionen für die der einzelnen Aminosären untereinander sind etwas komplexer bei der DNA.

Das Alignment von zwei Sequenzen wird paarweises Alignment bezeichnet das von mehreren als multiples Alignment .

Literatur

Dan Gusfield: Algorithms on Strings Trees and Sequences 1997 Cambridge University Press ISBN 0521585198



Bücher zum Thema Sequenzalignment

Dieser Artikel von Wikipedia unterliegt der GNU FDL.

ImpressumLesezeichen setzenSeite versendenSeite drucken

HTML-Code zum Verweis auf diese Seite:
<a href="http://www.uni-protokolle.de/Lexikon/Sequenzalignment.html">Sequenzalignment </a>