Lắp ráp, chú giải và phân tích hệ phiên mã tôm sú Penaeus monodon
Số trang: 9
Loại file: pdf
Dung lượng: 463.73 KB
Lượt xem: 15
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Tôm sú (Penaeus monodon) là loài thủy sản đem lại nguồn lợi lớn cho quốc gia trong những năm gần đây. Tuy nhiên, các dữ liệu về hệ gene và hệ phiên mã của chúng còn hạn chế. Mặc dù công việc gia hóa sử dụng các biện pháp di truyền chọn giống đã nâng cao chất lượng tôm sú.
Nội dung trích xuất từ tài liệu:
Lắp ráp, chú giải và phân tích hệ phiên mã tôm sú Penaeus monodon VIEÄN NGHIEÂN CÖÙU NUOÂI TROÀNG THUÛY SAÛN 2 LẮP RÁP, CHÚ GIẢI VÀ PHÂN TÍCH HỆ PHIÊN MÃ TÔM SÚ Penaeus monodon Nguyễn Cường1*, Phạm Quang Huy1, Nguyễn Văn Lâm1, Hà Thị Thu1, Phạm Thị Hoa1, Nguyễn Hải Triều1, Đậu Huy Tùng1, Nguyễn Giang Thu2, Nguyễn Hữu Ninh3, Đồng Văn Quyền1, Chu Hoàng Hà1, Đinh Duy Kháng1 TÓM TẮT Tôm sú (Penaeus monodon) là loài thủy sản đem lại nguồn lợi lớn cho quốc gia trong những năm gần đây. Tuy nhiên, các dữ liệu về hệ gene và hệ phiên mã của chúng còn hạn chế. Mặc dù công việc gia hóa sử dụng các biện pháp di truyền chọn giống đã nâng cao chất lượng tôm sú. Tuy nhiên, nhu cầu giải mã và phân tích hệ gene, hệ phiên mã của của tôm sú để tìm ra các chỉ thị phân tử cũng như các dữ liệu quan trọng khác sẽ giúp tăng hiệu suất cho quá trình chọn giống. Trong bài báo này, chúng tôi công bố kết quả giải trình tự hệ phiên mã của tôm sú bằng công nghệ đọc trình tự thế hệ mới. Với 9 Gb dữ liệu thu được từ máy Illumina MiSeq, chúng tôi tiến hành lắp ráp de novo để tạo ra ngân hàng với 51.638 transcript, từ đó thực hiện chú giải chức năng transcript, phát hiện được 7.016 chỉ thị phân tử microsatellite và 17.783 SNP. Chúng tôi xây dựng hệ thống website quản lý các ngân hàng transcript cũng như các công cụ phân tích cần thiết. Kết quả của bài báo là tiền đề cho các nghiên cứu chuyên sâu hơn về loài tôm sú mang lại nguồn lợi lớn này. Từ khóa: hệ phiên mã, lắp ráp de novo, giải trình tự thế hệ mới, chú giải, biểu hiện gene, microsat- ellite, SNP. I. ĐẶT VẤN ĐỀ tử để nâng cao năng suất nuôi về tính trạng Động vật giáp xác chiếm 10% tổng sản tăng trưởng và kháng bệnh là rất cần thiết. lượng thủy sản của cả thế giới và là một trong Hiện nay, nguồn dữ liệu về tôm sú P. những lĩnh vực nuôi trồng thủy sản tăng trưởng monodon còn khá khiêm tốn (Andriantahina và nhanh nhất (trung bình 15% hằng năm từ năm ctv., 2013). Trên ngân hàng Genbank có tổng 1970 và đạt 5 triệu tấn vào năm 2008 (FAO, cộng 39.908 EST được ứng dụng vào tìm các 2010). Trong đó, tôm là sản phẩm thủy sản điểm đa hình (ví dụ như SNP) và có khoảng có giá trị nhất trong nhóm này và được nuôi 600 trình tự microsatellite (cập nhật tháng 10 trồng ở Việt Nam hiện nay là tôm sú Penaeus năm 2013). Trong khi đó, P. monodon có 44 monodon. Mặc dù là ngành sản xuất nuôi trồng nhiễm sắc thể với kích thước hệ gene lớn là thủy sản đem lại nguồn lợi lớn cho quốc gia ~2,17 Gb (You EM và ctv., 2010). nhưng ngành sản xuất này vẫn bị ảnh hưởng Với sự ra đời và phát triển không ngừng nặng nề bởi thiên nhiên nhất là dịch bệnh như của công nghệ đọc trình tự thế hệ mới Next là dịch đốm trắng (WSSV). Do đó, nhu cầu Generation Sequencing (NGS), công suất đọc nghiên cứu sâu hơn về hệ gene và các marker trình tự có thể lên tới từ 8 Gb cho đến 600 Gb, phân tử hỗ trợ chọn giống dựa vào chỉ thị phân cho phép đọc trình tự nguyên bộ gene với mức 1 Viện Công nghệ Sinh học, Viện Hàn lâm KH&CN Việt Nam *Email: cuongnguyen@ibt.ac.vn 2 Vụ Khoa học Công nghệ & Môi trường, Bộ NN&PTNT 3 Viện Nghiên cứu Nuôi trồng Thủy sản I, Bộ NN&PTNT TAÏP CHÍ NGHEÀ CAÙ SOÂNG CÖÛU LONG - 6 - THAÙNG 8/2015 9 VIEÄN NGHIEÂN CÖÙU NUOÂI TROÀNG THUÛY SAÛN 2 độ lặp rất lớn lên tới cả 100x. Hơn nữa, chi phí trinityrnaseq.sourceforge.net/) (Grabherr và đọc trình tự và thời gian đọc trình tự của cả hệ ctv., 2011) với các tham số mặc định. Để đánh gene cũng đã giảm đi đáng kể và có thể thực giá chất lượng lắp ráp chúng tôi đưa ra 3 tiêu hiện được ở các phòng thí nghiệm có quy mô chí: N50, phân bố độ dài của các transcript và trung bình. Do đó, NGS là một công cụ mạnh số lượng trình tự đọc được ánh xạ ngược trở để có thể giải trình tự toàn bộ hệ gene hoặc hệ lại hệ phiên mã tham chiếu. phiên mã của một loài nào đó từ đó có thể ứng 2.2.2. Chú giải và phân loại transcript trong dụng rất nhiều trong phân tích sinh học phân hệ phiên mã tử như đánh giá biểu hiện gene, phát hiện chỉ Chú giải chức năng cho các transcript thị phân tử, phân tích SNP/InDel,... hoặc ứng trong hệ phiên mã đòi hỏi phải sử dụng những dụng trong chuẩn đoán bệnh. thuật toán tìm kiếm tương đồng trên các cơ sở Trong nghiên cứu này, chúng tôi đọc trình dữ liệu protein quan trọng. Trong nghiên cứu tự hệ phiên mã của tôm sú Penaeus monodon, này, chúng tôi sử dụng công cụ BLAST+ với tiến hành lắp ráp de novo để thu được ngân chế độ BLASTX để so sánh toàn bộ transcript hàng các transcript. Từ đó, chúng tôi tiến hành lên các cơ sở dữ liệu NCBI non-redundant chú giải các transcript thu được, phân tích protein (Nr, http://www.ncbi.nlm.nih.gov/), biểu hiện gene, tìm kiếm các chỉ thị phân tử Swiss-Prot (http://www.expasy.ch/sprot) với microsatellite và phát hiện các chỉ thị SNP. tham số E-value là 1e-6. Trong trường hợp kết Chúng tôi cũng tiến hành xây dựng hệ thống quả chú giải trên các cơ sở dữ liệu là khác nhau phần mềm quản lý ngân hàng các transcript thì thứ tự ưu tiên kết quả chú giải các vùng cùng với các công cụ phân tích cần thiết. mã hóa protein là Nr, Swiss-Prot. Kết quả chú II. VẬT LIỆU VÀ PHƯƠNG PHÁP giải từ ngân hàng Nr sau đó được phần mềm NGHIÊN CỨU Blast2GO (Conesa và ctv., 2005) sử dụng để 2.1. Vật liệu lấy ra mã Gene Ontology (GO) riêng biệt cho Một cá thể tôm sú Penaeus monodon được mỗi transcript. Toàn bộ tr ...
Nội dung trích xuất từ tài liệu:
Lắp ráp, chú giải và phân tích hệ phiên mã tôm sú Penaeus monodon VIEÄN NGHIEÂN CÖÙU NUOÂI TROÀNG THUÛY SAÛN 2 LẮP RÁP, CHÚ GIẢI VÀ PHÂN TÍCH HỆ PHIÊN MÃ TÔM SÚ Penaeus monodon Nguyễn Cường1*, Phạm Quang Huy1, Nguyễn Văn Lâm1, Hà Thị Thu1, Phạm Thị Hoa1, Nguyễn Hải Triều1, Đậu Huy Tùng1, Nguyễn Giang Thu2, Nguyễn Hữu Ninh3, Đồng Văn Quyền1, Chu Hoàng Hà1, Đinh Duy Kháng1 TÓM TẮT Tôm sú (Penaeus monodon) là loài thủy sản đem lại nguồn lợi lớn cho quốc gia trong những năm gần đây. Tuy nhiên, các dữ liệu về hệ gene và hệ phiên mã của chúng còn hạn chế. Mặc dù công việc gia hóa sử dụng các biện pháp di truyền chọn giống đã nâng cao chất lượng tôm sú. Tuy nhiên, nhu cầu giải mã và phân tích hệ gene, hệ phiên mã của của tôm sú để tìm ra các chỉ thị phân tử cũng như các dữ liệu quan trọng khác sẽ giúp tăng hiệu suất cho quá trình chọn giống. Trong bài báo này, chúng tôi công bố kết quả giải trình tự hệ phiên mã của tôm sú bằng công nghệ đọc trình tự thế hệ mới. Với 9 Gb dữ liệu thu được từ máy Illumina MiSeq, chúng tôi tiến hành lắp ráp de novo để tạo ra ngân hàng với 51.638 transcript, từ đó thực hiện chú giải chức năng transcript, phát hiện được 7.016 chỉ thị phân tử microsatellite và 17.783 SNP. Chúng tôi xây dựng hệ thống website quản lý các ngân hàng transcript cũng như các công cụ phân tích cần thiết. Kết quả của bài báo là tiền đề cho các nghiên cứu chuyên sâu hơn về loài tôm sú mang lại nguồn lợi lớn này. Từ khóa: hệ phiên mã, lắp ráp de novo, giải trình tự thế hệ mới, chú giải, biểu hiện gene, microsat- ellite, SNP. I. ĐẶT VẤN ĐỀ tử để nâng cao năng suất nuôi về tính trạng Động vật giáp xác chiếm 10% tổng sản tăng trưởng và kháng bệnh là rất cần thiết. lượng thủy sản của cả thế giới và là một trong Hiện nay, nguồn dữ liệu về tôm sú P. những lĩnh vực nuôi trồng thủy sản tăng trưởng monodon còn khá khiêm tốn (Andriantahina và nhanh nhất (trung bình 15% hằng năm từ năm ctv., 2013). Trên ngân hàng Genbank có tổng 1970 và đạt 5 triệu tấn vào năm 2008 (FAO, cộng 39.908 EST được ứng dụng vào tìm các 2010). Trong đó, tôm là sản phẩm thủy sản điểm đa hình (ví dụ như SNP) và có khoảng có giá trị nhất trong nhóm này và được nuôi 600 trình tự microsatellite (cập nhật tháng 10 trồng ở Việt Nam hiện nay là tôm sú Penaeus năm 2013). Trong khi đó, P. monodon có 44 monodon. Mặc dù là ngành sản xuất nuôi trồng nhiễm sắc thể với kích thước hệ gene lớn là thủy sản đem lại nguồn lợi lớn cho quốc gia ~2,17 Gb (You EM và ctv., 2010). nhưng ngành sản xuất này vẫn bị ảnh hưởng Với sự ra đời và phát triển không ngừng nặng nề bởi thiên nhiên nhất là dịch bệnh như của công nghệ đọc trình tự thế hệ mới Next là dịch đốm trắng (WSSV). Do đó, nhu cầu Generation Sequencing (NGS), công suất đọc nghiên cứu sâu hơn về hệ gene và các marker trình tự có thể lên tới từ 8 Gb cho đến 600 Gb, phân tử hỗ trợ chọn giống dựa vào chỉ thị phân cho phép đọc trình tự nguyên bộ gene với mức 1 Viện Công nghệ Sinh học, Viện Hàn lâm KH&CN Việt Nam *Email: cuongnguyen@ibt.ac.vn 2 Vụ Khoa học Công nghệ & Môi trường, Bộ NN&PTNT 3 Viện Nghiên cứu Nuôi trồng Thủy sản I, Bộ NN&PTNT TAÏP CHÍ NGHEÀ CAÙ SOÂNG CÖÛU LONG - 6 - THAÙNG 8/2015 9 VIEÄN NGHIEÂN CÖÙU NUOÂI TROÀNG THUÛY SAÛN 2 độ lặp rất lớn lên tới cả 100x. Hơn nữa, chi phí trinityrnaseq.sourceforge.net/) (Grabherr và đọc trình tự và thời gian đọc trình tự của cả hệ ctv., 2011) với các tham số mặc định. Để đánh gene cũng đã giảm đi đáng kể và có thể thực giá chất lượng lắp ráp chúng tôi đưa ra 3 tiêu hiện được ở các phòng thí nghiệm có quy mô chí: N50, phân bố độ dài của các transcript và trung bình. Do đó, NGS là một công cụ mạnh số lượng trình tự đọc được ánh xạ ngược trở để có thể giải trình tự toàn bộ hệ gene hoặc hệ lại hệ phiên mã tham chiếu. phiên mã của một loài nào đó từ đó có thể ứng 2.2.2. Chú giải và phân loại transcript trong dụng rất nhiều trong phân tích sinh học phân hệ phiên mã tử như đánh giá biểu hiện gene, phát hiện chỉ Chú giải chức năng cho các transcript thị phân tử, phân tích SNP/InDel,... hoặc ứng trong hệ phiên mã đòi hỏi phải sử dụng những dụng trong chuẩn đoán bệnh. thuật toán tìm kiếm tương đồng trên các cơ sở Trong nghiên cứu này, chúng tôi đọc trình dữ liệu protein quan trọng. Trong nghiên cứu tự hệ phiên mã của tôm sú Penaeus monodon, này, chúng tôi sử dụng công cụ BLAST+ với tiến hành lắp ráp de novo để thu được ngân chế độ BLASTX để so sánh toàn bộ transcript hàng các transcript. Từ đó, chúng tôi tiến hành lên các cơ sở dữ liệu NCBI non-redundant chú giải các transcript thu được, phân tích protein (Nr, http://www.ncbi.nlm.nih.gov/), biểu hiện gene, tìm kiếm các chỉ thị phân tử Swiss-Prot (http://www.expasy.ch/sprot) với microsatellite và phát hiện các chỉ thị SNP. tham số E-value là 1e-6. Trong trường hợp kết Chúng tôi cũng tiến hành xây dựng hệ thống quả chú giải trên các cơ sở dữ liệu là khác nhau phần mềm quản lý ngân hàng các transcript thì thứ tự ưu tiên kết quả chú giải các vùng cùng với các công cụ phân tích cần thiết. mã hóa protein là Nr, Swiss-Prot. Kết quả chú II. VẬT LIỆU VÀ PHƯƠNG PHÁP giải từ ngân hàng Nr sau đó được phần mềm NGHIÊN CỨU Blast2GO (Conesa và ctv., 2005) sử dụng để 2.1. Vật liệu lấy ra mã Gene Ontology (GO) riêng biệt cho Một cá thể tôm sú Penaeus monodon được mỗi transcript. Toàn bộ tr ...
Tìm kiếm theo từ khóa liên quan:
Nuôi trồng thủy sản Bài viết về ngư nghiệp Hệ phiên mã Lắp ráp de novo Giải trình tự thế hệ mới Biểu hiện geneGợi ý tài liệu liên quan:
-
78 trang 343 2 0
-
Tổng quan về việc sử dụng Astaxanthin trong nuôi trồng thủy sản
10 trang 225 0 0 -
Thông tư số 08/2019/TT-BNNPTNT
7 trang 223 0 0 -
225 trang 215 0 0
-
Tìm hiểu các kỹ thuật nuôi trồng thuỷ sản (Tập 1): Phần 1
66 trang 190 0 0 -
2 trang 184 0 0
-
13 trang 181 0 0
-
Triển khai chương trình phát triển bền vững quốc gia trong ngành thủy sản
7 trang 177 0 0 -
91 trang 172 0 0
-
8 trang 152 0 0