Bài tổng hợp này cung cấp các khái niệm chung nhất về mã DNA, khoảng cách di truyền của chúng và việc xây dựng mối liên hệ tiến hoá giữa các trình tự, nhằm định hướng trong ứng dụng nghiên cứu đa dạng sinh học, khẳng định loài mới, hay truy xuất nguồn gốc động, thực vật.
Nội dung trích xuất từ tài liệu:
Tổng quan về mã DNA trong việc phân loại và xây dựng cây phát sinh phân tử TỔNG QUAN VỀ MÃ DNA TRONG VIỆC PHÂN LOẠI VÀ XÂY DỰNG CÂY PHÁT SINH PHÂN TỬ Bùi Thị Kim Lý1 1. Khoa Y Dược, Trường Đại học Thủ Dầu Một, liên hệ email: lybtk@tdmu.edu.vnTÓM TẮT Nhu cầu định danh sinh vật đã và đang dần trở nên quan trọng không chỉ trong các nghiêncứu về sinh thái, bảo tồn đa dạng sinh học mà còn ứng dụng trong đời sống con người như phânloại vi sinh vật hay truy xuất nguồn gốc nông, thuỷ sản. Sự phát triển nhanh chóng của khoa họccông nghệ đã cho phép ứng dụng nhiều kỹ thuật hiện đại trong phân tích trình tự DNA và mối liênhệ của chúng. Việc xác định khoảng cách di truyền giữa các trình tự có ý nghĩa trong việc xâydựng cây phát sinh phân tử, từ đó mô tả được mối quan hệ tiến hoá giữa các trình tự mang đi phântích. Bài tổng hợp này cung cấp các khái niệm chung nhất về mã DNA, khoảng cách di truyền củachúng và việc xây dựng mối liên hệ tiến hoá giữa các trình tự, nhằm định hướng trong ứng dụngnghiên cứu đa dạng sinh học, khẳng định loài mới, hay truy xuất nguồn gốc động, thực vật. Từ khóa: DNA barcoding, định danh, phylogeny, khoảng cách di truyền1. MÃ DNA TRONG PHÂN LOẠI, TRUY XUẤT NGUỒN GỐC THỰC VẬT Sự phát triển của khoa học công nghệ hiện đại ngày nay đã mở ra các hướng tiếp cận mớitrong việc ứng dụng các kỹ thuật sinh học phân tử vào việc phân loại và định danh sinh vật.DNA fingerprinting là một trong những kỹ thuật được ứng dụng đầu tiên và được xem là côngcụ độc lập trong việc điều tra pháp y, nghiên cứu và nhiều lĩnh vực khác (Sucher và nnk, 2012).Sau sự xuất hiện của kỹ thuật khuyếch đại PCR và giải trình tự (Sequencing) thì khái niệm vềDNA Barcoding đã ra đời và được ứng dụng như một phương tiện hỗ trợ đầy triển vọng trongviệc phân loại các loài và cá thể (Kress và nnk, 2012; Sucher và nnk, 2012). Hiện nay bên cạnhDNA Barcoding và DNA Fingerprinting, kỹ thuật giải trình tự gen thế hệ mới (NGS) cũng đượcứng dụng nhiều trong việc phân loại, và nghiên cứu sinh thái các loài (Sucher và nnk, 2012).Hình 1. Các định hướng tiếp cận đi đôi với kỹ thuật phân tích trong quá trình định danh sinh vật 36 DNA barcoding là khái niệm được mô tả lần đầu năm 2003 nhằm chỉ các vùng trình tựgen ngắn thuộc các vùng tiêu chuẩn trong bộ gen, được dùng như công cụ để xác định và phânbiệt các loài với nhau (Sucher và nnk, 2012). Kể từ lúc ra đời, DNA barcoding trở thành kỹthuật được xây dựng và phát triển mạnh mẽ nhằm thay thế DNA fingerprints. Năm 2004, hiệphội Barcode for life (CBOL) ra đời nhằm xây dựng các định hướng, tiêu chuẩn trong hệ thốngnghiên cứu và quản lý barcode của sinh vật. Năm 2007, dự án tiêu chuẩn DNA barcode củathực vật trên cạn được CBOL công bố (Sucher và nnk, 2012). Nghiên cứu DNA barcoding đượcxem là mang nhiều triển vọng trong nhiều ngành nghiên cứu như: nghiên cứu tiến hóa thôngqua tần số thay đổi trình tự của loài thông qua thời gian; nghiên cứu đa dạng sinh học thông quaviệc phân biệt, định danh các cá thể và dự đoán các loài mới phát hiện; chỉ dấu theo dõi, nghiêncứu các đối tượng đặc biệt; hoặc để truy xuất nguồn gốc, và nhiều ứng dụng khác (Kress, 2017).Để một DNA barcoding được tạo ra và áp dụng thì đòi hỏi phải có hai bước cơ bản: bước 1 làxây dựng thư viện mã vạch gồm tập hợp tất cả trình tự các loài liên quan trên một hay mộtnhóm gen đánh dấu (marker) mục tiêu xác định, các nhóm cá thể cung cấp trình tự này phảiđược xác định loài cụ thể và có các giấy tờ chứng nhận đi kèm, đây sẽ là các hồ sơ cần thiết đisuốt cùng barcode được cấp; bước 2 là nhận diện cá thể mới thông qua việc giải trình tự vùngmarker thuộc mã vạch ở bước 1 sau đó dùng các thuật toán để ghép nối, gióng cột trình tự củacá thể mới và thư viện mã vốn có để đưa ra nhận xét và kết luận về sự tương đồng của cá thể(Kress, 2017). Đây là phương pháp được tiếp cận gần đây, và hiện vẫn còn nhiều tranh cãi trongviệc sử dụng DNA barcoding trong phân loại (Kress, 2017). Sự phân loại và các tiêu chuẩn kèmtheo, phụ thuộc vào tần suất khác biệt của các loài trong cùng một họ, và vùng trình tự đượcmang đi làm mã (Bellafronte và nnk, 2013). Trên động vật, vùng gen cytochrome C oxidase (viết tắt là Cox1 hay CO1) được xem làvùng gen barcode lõi vì có khả năng phân biệt được rất nhiều loài động vật khác nhau. Tuynhiên đối với thực vật, các nghiên cứu cho thấy vùng gen trên các loài thực vật có rất ít biếnđổi và không phù hợp cho phân loại (Sucher và nnk, 2012). Các nghiên cứu sau này cũng chothấy khả năng sử dụng DNA barcode trên thực vật là kém hiệu quả hơn nhiều so với động vật.Chẳng hạn như hệ gen của ty thể ở thực vật vì một số lý do nào đó mà sự phát triển của hệ genty thể ở thực vật lại diễn ra đồng thời với sự di chuyển môi trường sống từ nước lên cạn củachúng, trong khi các vùng gen ty thể ở động vật lại có tính bảo tồn cao. Bên cạnh đó, hệ genomeở thực vật chịu nhiều ảnh hưởng của hình thức sinh sản đơn tính hay hữu tính, đồng thời có sựtương đồng cao giữa các loài hơn so với động vật. Chính vì vậy mà hệ gen lạp thể lại được chúý như nguồn trình tự có thể ứng dụng trong DNA barcode, tuy nhiên vẫn gặp nhiều khó khănvì tính tương đồng trong hệ gen plasmid và nhiều nhóm thực vật hầu như không có các đặctrưng, sai khác trong trình tự plasmid. Hiện nay CBOL chỉ công nhận hai vùng gene trên lạpthể là matK và rbcL như DNA barcode chính cho phân loại thực vật đồng thời đề xuất thêmmột số vùng gen khác là rbcL trên lạp thể, ITS trên genome và hai vùng non-coding atpF-atpHvà trnH-psbA (Sucher và nnk, 2012).2. KHOẢNG CÁCH DI TRUYỀN GIỮA HAI VÙNG TRÌNH TỰ Các trình tự marker gene chỉ có ý nghĩa phân biệt khi khoảng cách di truyền nằm trong giớihạn nhất định. Khoảng cách giữa các mã vạch DNA được xem như khoảng cách di truyền xéttrên một vùng gen marker dùng cho phân biệt l ...