Sequence Alignment (Part 1: Introduction)

What is Sequence Alignment?

Dalam Bioinformatika, Sequence Alignment merupakan salah satu aktivitas dalam pemrosesan data DNA dan protein.

Problem: Diberikan dua/lebih buah sequence DNA atau protein, seberapa mirip kedua sequence tersebut? Apa subsequence sebagai best alignment dari kedua sequence tersebut? Untuk kasus lebih dari dua sequence, disebut Multiple Sequence Alignment.

Salah satu pendekatan dalam Sequence Alignment ini adalah Pairwise Alignment, yaitu satu per satu karakter dari kedua sequence dibandingkan, apakah match/sama atau tidak. Pairwise Alignment ini berguna untuk mengidentifikasi sequence yang belum diketahui strukturnya (misalnya ditemukan tumbuhan yang dapat menyembuhkan suatu penyakit dan ingin diketahui struktur DNA atau proteinnya). Kegunaan lainnya adalah untuk studi mengenai molecular evolution.

Hal-hal yang dapat menyebabkan ketidakmiripan antara kedua sequence:

  • Mutation, e.g: ATA -> AGA
  • Insertion, e.g: AA -> AGA
  • Deletion, e.g: ACTG -> AC-G
  • Indel (an insertion or a deletion)

Ketidakmiripan antara dua sequence dapat ditandai dengan adanya mismatch ataupun gap. Adanya mismatch menandakan telah terjadi mutasi pada sequence tersebut, sedangkan gap menandakan telah terjadi insertion/deletion.

–000–

 

… to be continued… Part 2: Computation (coming soon!)

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s