Bài giảng Tin sinh học đại cương - Chương 3: Bắt cặp trình tự (Sequence Alignment) giới thiệu chung và tập trung làm rõ hiện tượng bắt cặp hai trình tự, bắt cặp nhiều trình tự. Bài giảng hữu ích với các bạn chuyên ngành Sinh học.
Nội dung trích xuất từ tài liệu:
Bài giảng Tin sinh học đại cương - Chương 3: Bắt cặp trình tự (Sequence Alignment)TIN SINH HỌC ĐẠI CƯƠNG(Introduction to Bioinformatics)Chương 3:PGS.TS. Trần Văn LăngEmail: langtv@vast.vnPGS.TS. Trần Văn Lăng,VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAMBẮT CẶP TRÌNH TỰ (SEQUENCEALIGNMENT)PGS.TS. Trần Văn Lăng, VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAMNỘI DUNG• Giới thiệu• Bắt cặp hai trình tự• Bắt cặp nhiều trình tựPGS.TS. Trần Văn Lăng, VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAMMỘT SỐ KHÁI NIỆM CHUNGPGS.TS. Trần Văn Lăng, VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM1Nhắc lại• Sinh vật được tạo thành từ tế bào.• Bên trong mỗi tế bào - ngoại trừ hồng huyết cầutrưởng thành - có nhân (nucleus) chứa tất cả cácchỉ thị di truyền (genetic instruction)• Những chỉ thị này là chức năng của tế bào• Các tế bào, với các ngăn khác nhau của nó gọilà bào quan, phải đối mặt với một vấn đề là:– Tế bào sản xuất các phân tử như kích thích tố, dẫntruyền thần kinh, các cytokine và enzyme– Chúng phải được gửi đến nơi khác bên trong tế bào,hoặc xuất ra khỏi tế bào.– Việc sản xuất và vận chuyển này phải được thực hiệnđúng nơi và đúng lúc.PGS.TS. Trần Văn Lăng, VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAMPGS.TS. Trần Văn Lăng, VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM• Chẳng hạn, mỗi tế bào người có 46 nhiễm sắcthể, được tổ chức thành 23 cặp.• Mỗi nhiễm sắc thể được cấu thành bởi một trìnhtự DNA• DNA chứa các gen mã hóa RNA mà nó sẽ sinhra các protein, để từ đó điều chỉnh tất cả các quátrình phát triển của một sinh vật• Một gene là một đoạn của DNA với trình tự baseđặc trưng – cụ thể, gọi là mã di truyền (geneticcode), hay chỉ thị di truyền để xác định chứcnăng của tế bàoPGS.TS. Trần Văn Lăng, VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAMPGS.TS. Trần Văn Lăng, VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM2Khái niệm bắt cặp• Bắt cặp trình tự, hay là sắp xếp thẳng hàng trìnhtự (Sequence Alignment)• Mục đích đạt đến sự giống nhau đến mức tối đacủa các trình tự• Việc bắt cặp được thực hiện bằng cách thêm các“gap” vào các vị trí có thể sao cho các cột giốngnhau hoặc tương tự nhau• Việc thêm các gap biểu thị sự đột biến mấtnucliotide đã xãy ra tại vị trì này trên trình tự.• Trong tin học, việc thêm ký tự gap là khoảngtrống (“-”) giúp cho việc tạo ra 2 chuỗi ký tự gầngiống nhau nhất.PGS.TS. Trần Văn Lăng, VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAMPGS.TS. Trần Văn Lăng, VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAMTiến hóa và đột biến• Trong sự tiến hóa, các gốc giống nhau đó chínhlà một phần của trình tự sinh học tổ tiên.• Còn các gốc bắt cặp không giống nhau chính làsự đột biến của một trong hai trình tự.– Tuy nhiên, không thể xác định trình tự nào bị đột biếnso với trình tự nào.PGS.TS. Trần Văn Lăng, VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM• Dưới góc độ sinh học, đột biến xãy ra trên cả mộttrình tự DNA của bộ gene.• Vì vậy có thể xãy ra tại:– các gene mã hóa protein– các gene mã hóa phân tử RNA chức năng– trình tự điều hòa tham gia bật tắc gene khác– vùng trình tự nối các genePGS.TS. Trần Văn Lăng, VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM3• Từ đó, đột biến có thể ảnh hưởng hay không ảnhhưởng đến kiểu hình của sinh vật.• Khi phân loại, có 2 loại đột biến– đột biến điểm: chỉ xãy ra ở một nucleotide, sẽ rấtquan trọng nếu tại vùng mã hóa protein, hay vùng tínhiệu– đột biến đoạn: do mất hay thêm một đoạn trình tự. Kếtquả của việc đột biến đoạn là sự nhân đôi gene haynhân đôi một vùng nhiễm sắc thểPGS.TS. Trần Văn Lăng, VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM• Qua thời gian, những đột biến có lợi hoặc khôngcó hại sẽ được giữ lại trong quần thể, kích thíchsự hình thành và phát triển loài mới.• Đó chính là sự tiến hóa (evaluation), trong đó độtbiến là nguyên liệu quan trọngPGS.TS. Trần Văn Lăng, VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAMVí dụ• Tương tự, với 2 trình tự dài hơn• Ví dụ bắt cặp 2 trình tự– GAATTCAGTTA– GGATCGA• Kết quả– GAATTCAGTTA– | || | | |– GGAT-C-G—-A• Hoặc 2 trình tự– ACGCTG– CATGT– tcctctgcctctgccatcat---caaccc– |||| ||| ||||| |||||||||||– tcctgtgcatctgcaatcatgggcaaccc• Kết quả– ACGCTG– | | |– -C-ATGTPGS.TS. Trần Văn Lăng, VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAMPGS.TS. Trần Văn Lăng, VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM4Ký tự “gap”• Ký tự “gap” là chỗ trống, khe hở, chỗ gián đoạn,chỗ thiếu sót.• Trong sinh học gap có ý nghĩa: sự đột biến, hoặcmất đi do quá trình tiến hóaNếu lấy v làm căn cứ,thì u có:• 4 match• 1 mismatch• 3 insertion• 2 deletionCho 2 trình tự:u = ATCTGATGv = TGCATACmatchdeletionAT-C-TGATG-TGCAT-A-CinsertionPGS.TS. Trần Văn Lăng, VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAMmismatchPGS.TS. Trần Văn Lăng, VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAMVề bắt cặp trình tự protein• Mụ ...