Danh mục

Luận văn : THU THẬP VÀ TỔ CHỨC DỮ LIỆU GENE PHỤC VỤ NGHIÊN CỨU CÂY TRỒNG BIẾN ĐỔI DI TRUYỀN part 3

Số trang: 22      Loại file: pdf      Dung lượng: 785.04 KB      Lượt xem: 13      Lượt tải: 0    
Hoai.2512

Phí tải xuống: 11,000 VND Tải xuống file đầy đủ (22 trang) 0
Xem trước 3 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Vì không có cách nào mô tả hết các công cụ có sẵn, dưới đây chỉ trích một vài công cụ phổ biến dùng trong phân tích trình tự sinh học.II.3.1. Readseq Readseq là một phần mềm cũ, ra đời từ năm 1989. Được phát triển bởi Don Gilbert, chương trình này đọc và viết trình tự nucleotide và protein sang nhiều định dạng hữu dụng. Công cụ này được viết bằng ngôn ngữ Java.
Nội dung trích xuất từ tài liệu:
Luận văn : THU THẬP VÀ TỔ CHỨC DỮ LIỆU GENE PHỤC VỤ NGHIÊN CỨU CÂY TRỒNG BIẾN ĐỔI DI TRUYỀN part 3PHẦN B: TỔNG QUAN – Giới thiệu Bioinformatics – Vài công cụ 31 II.3. Vài công cụ Bioinformatics hiện nay Vì không có cách nào mô tả hết các công cụ có sẵn, dưới đây chỉ trích một vàicông cụ phổ biến dùng trong phân tích trình tự sinh học. II.3.1. Readseq Readseq là một phần mềm cũ, ra đời từ năm 1989. Được phát triển bởi DonGilbert, chương trình này đọc và viết trình tự nucleotide và protein sang nhiều địnhdạng hữu dụng. Công cụ này được viết bằng ngôn ngữ Java. II.3.2. BLAST BLAST (Basic Local Alignment Search Tools) là công cụ được biết tốt nhấttrong phân tích trình tự. Nó so sánh hai trình tự bởi cố gắng gióng (align) chúng, vàcũng được dùng để tìm kiếm trình tự trong cơ sở dữ liệu. Thuật toán bắt đầu bởi tìmkiếm sự so khớp chính xác, sau đó mở rộng vùng đã được gióng bởi những so khớpkhông chính xác (mismatches). blastall cho phép sử dụng tất cả các chương trình BLAST (blastn, blastp,blastx, và tblastn). Bảng sau đây tóm tắt trình tự dùng truy vấn (Query sequence), trìnhtự cơ sở dữ liệu (Database sequence), và loại gióng trình tự (Alignment sequence) đốivới lệnh BLAST khác nhau. Query Database Alignment Program sequence type sequence type sequence type blastn nucleotide Nucleotide nucleotide blastp protein Protein protein blastx nucleotide Protein protein tblastn protein Nucleotide protein tblastx nucleotide Nucleotide protein Bảng 2.1: Bảng liệt kê một số chương trình BLAST megablast sử dụng thuật toán gióng trình tự nucleotide tìm kiếm và nối nhiềutrình tự truy vấn để giảm thời gian quét (scanning) qua cơ sở dữ liệu.NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNGPHẦN B: TỔNG QUAN – Giới thiệu Bioinformatics – Vài công cụ 32 blastpgp thực hiện blastp có khe (gap) và có thể được dùng để thực hiện lặp đilặp lại tìm kiếm ở chế độ psi-blast và phi-blast. PSI-BLAST (Position-Specific Iterated BLAST) là sự tìm kiếm lặp lại trong đócác trình tự tìm thấy trong một vòng tìm kiếm được dùng để xây dựng mô hình tínhđiểm cho vòng tìm kiếm kế tiếp. PHI-BLAST (Pattern-Hit Initiated BLAST) là chương trình tìm kiếm kết hợp sựso khớp của regular expression với sự gióng khu vực xung quanh sự so khớp. bl2seq (BLAST 2 Sequences) cho phép gióng trình tự hai trình tự được nhận. II.3.3. BLAT BLAT là công cụ gióng trình tự rất nhanh tương tự như BLAST. Nó tương đốimới so với BLAST, nhưng nó đã trở nên rất phổ biến. BLAT thì chính xác hơn vànhanh hơn hàng trăm lần so với BLAST. Tốc độ của BLAT xuất phát từ thời gian chạycác phần tử là các trình tự nhỏ không trùng lắp từ chiều dài được cho. Phần tử này đủnhỏ phù hợp với bộ nhớ máy tính và được tính toán điển hình chỉ một lần đối với mỗitập hợp genome. Jim Kent phát triển BLAT đặc biệt trợ giúp xử lý tập hợp bộ genetrong quá trình làm việc với bộ gene người. II.3.4. ClustalW ClustalW là chương trình gióng đa trình tự dùng cho trình tự nucleotide và trìnhtự protein. Sự gióng có thể là toàn bộ (global) (toàn trình tự) hay khu vực (local) (giớihạn đoạn trình tự con). ClustalW tính toán sự khớp tốt nhất cho trình tự được chọn lựa,và sắp chúng thành hàng để xác định, những sự tương đồng và sự khác biệt có thểđược thấy. II.3.5. HMMER HMMER là tập hợp các chương trình tạo ra mô hình Markov ẩn (hidden Markovmodel-HMM) của họ trình tự được dùng như trình tự truy vấn đối với cơ sở dữ liệu đểxác định thêm sự tương đồng (homologs) của họ trình tự. HMMER được phát triển bởiSean Eddy tại đại học Washington.NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNGPHẦN B: TỔNG QUAN – Giới thiệu Bioinformatics – Vài công cụ 33 II.3.6. MEME/MAST Hệ thống MEME/MAST cho phép bạn: Khám phá motif (vùng có tính bảo tồn cao) trong nhóm trình tự DNA hayprotein sử dụng MEME. Tìm kiếm trình tự cơ sở dữ liệu bằng motif dùng MAST. MEME và MAST được phát triển bởi Timothy Bailey, Charles và Bill Grundy tạiphòng kỹ thuật và khoa học máy tính tại trung tâm San Diego Supercomputer. II.3.7. EMBOSS EMBOSS (European Molecular Biology Open Software Suite) là công cụ phântích trình tự với mã nguồn mở. Phần mềm này bao gồm nhiều chức năng và có thể xửlý dữ liệu với nhiều dạng format. Thư viện mở rộng được cung cấp với gói, cho phépngười dùng phát triển và đưa ra phần mềm riêng của họ. EMBOSS cũng tích hợp cácgói và công cụ có sẵn dùng cho phân tích trình tự, như BLAST và ClustalW. EMBOSS chứa khoảng 150 chương trình. Chúng xử lý một số lĩnh vực sau: o Gióng t ...

Tài liệu được xem nhiều: