Bài giảng Tin sinh học đại cương - Chương 4: Phân tích trình tự DNA được biên soạn nhằm trang bị cho các bạn những kiến thức về chuyển đổi trình tự DNA, dự đoán gene, tìm motif. Mời các bạn tham khảo bài giảng để bổ sung thêm kiến thức về lĩnh vực này.
Nội dung trích xuất từ tài liệu:
Bài giảng Tin sinh học đại cương - Chương 4: Phân tích trình tự DNATIN SINH HỌC ĐẠI CƯƠNG(Introduction to Bioinformatics)Chương 4:PHÂN TÍCH TRÌNH TỰ DNAPGS.TS. Trần Văn LăngEmail: langtv@vast.vnAssoc. Prof. Tran Van Lang, PhD,VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGYAssoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY2• Chuyển đổi trình tự DNA• Dự đoán gene, tìm motifPHƯƠNG PHÁP SIXFRAMEAssoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY3Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY41• DNA động thực vật được cấu thành chủ yếutừ 4 base cơ bản là A, T, G, C• Chúng có khả năng tạo nên 64 codon (mỗicodon gồm 3 base),• Được gói gọn thành 20 amino acid.• Các amino acid này lại góp phần hình thànhnên các protein đặc trưng.Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY• Tuy nhiên, các sinh vật không giống nhaunên sự hình thành amino acid cũng khônggiống nhau.• Có những loài với codon này thì tạo nênamino acid này nhưng đối với loài khác thì lạilà một acid amin khác.5Chẳng hạn6Dịch mã sang Protein• Bộ ba (codon) “CTT” ở động vật có xươngsống hình thành nên Leucine thì ở nấm menlà Threonine.• Do đó, có nhiều bảng dịch mã khác nhaucho từng loài, từng trường hợp khác nhauAssoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGYAssoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY• Tiến trình chuyển đổi DNA sang protein cũngcó sự khác biệt.• Bởi không thể biết chính xác trình tự DNAđưa vào có base bắt đầu chính là base đầutiên trong một codon hay không7Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY82Six-Frame Translation• Hơn nữa, đầu 3’ củaDNA không rõ là phíanào.• Nên có 6 trường hợp chocả 2 trình tự xoắn vớinhau.• Dùng phương pháp Six-Frame với 3 dịchchuyển, ký hiệu +1, +2 và +3.• Ngoài ra, DNA tồn tại dạng chuỗi xoắn képtheo từng cặp A-T, C-G.Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY9Ví dụGGTCTATCCAGATA• Theo hướng: 3’5’3’GGTCTAT– frame +1, có 2 codon: GGT CTA:– frame +2 có 2 codon: GTC TAT:– frame +3 có 1 codon: TCT:• Khi đó có các trường hợp xãyra như sau:Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY10Translation in forward direction• Với chuỗi xoắn kép của DNA3’5’Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY115’GlyLeuValTyrSerAssoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY123Sử dụng phần mềm• Theo hướng 3’ ATAGACC 5’– frame -1, có 2 codon: ATA GAC:– frame -2, có 2 codon: TAG ACC:– frame -3, có 1 codon: AGA:IleAspAm*ThrArgAssoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY13Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY14Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY15Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY164• Motif là một đoạn trình tự nucleotide hayamino acid phổ biến và có (hoặc cho là có)một chức năng sinh học nào đó• Đối với protein, motif được phân thành 2 loại:– Motif trình tự– Motif cấu trúcTÌM MOTIFAssoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY17Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY18• Motif trình tự: sequence motif, motif, pattern,conserved pattern, consensus pattern,signature, fingerprint, block, feature.• Là một vùng trình tự bảo tồn hay là một đoạntrình tự đặc trưng được tìm thấy ở 2 haynhiều trình tự.• Bản thân nó đại diện cho chức năng, cấutrúc hoặc thành viên trong họ.• Các motif có thể được tìm thấy ở DNA, RNA,và Protein.Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGYAssoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY19205