Tìm kiếm trình tự sinh học và đăng kí trình tự trên cơ sở dữ liệu
Số trang: 47
Loại file: ppt
Dung lượng: 8.44 MB
Lượt xem: 9
Lượt tải: 0
Xem trước 5 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Mục tiêu của bài học: Có khả năng tìm kiếm được những trình tự sinh học như DNA, RNA, Protein; đăng lí những trình tự đã nghiên cứu được lên cơ sở dữ liệu sinh học bằng phần mềm Sequin.
Nguyên tắc trong giải trình tự: phương pháp Sanger: là phương pháp dựa trên sự tổng hợp gián đoạn DNA; Dựa theo phương pháp này chúng ta có thể xác định được trình tự nucleotide của DNA hay RNA (ATGC...TTT)....
Nội dung trích xuất từ tài liệu:
Tìm kiếm trình tự sinh học và đăng kí trình tự trên cơ sở dữ liệu TÌM KIẾM TRÌNH TỰ SINH HỌC VÀ ĐĂNG KÝ TRÌNH TỰ TRÊN CƠ SỞ DỮ LIỆU Mục tiêu của bài học Có khả tìm kiếm được những trình tự sinh học như DNA, RNA, Protein. Đăng ký những trình tự đã nghiên cứu được lên Cơ sở dữ liệu sinh học bằng phần mềm Sequin. 2 Tì kim rnh ự i họ m ế tì t snh c Nguyên tắc trong giải trình tự Phương pháp Sanger: là phương pháp dựa trên sự tổng hợp gián đoạn DNA. Dựa theo phương pháp này chúng ta có thể xác định được trình tự nucleotide của DNA hay RNA (ATGC… TTT) 3 Tì kim rnh ự i họ m ế tì t snh c Nhiễm sắc thể, DNA, Gene, Nucleotide 4 Gi it ệ mô họ ớ hiu n c Gửi trình tự lên Genebank của NCBI Sequin Đưa vào cơ sở dữ liệu sinh học: Trình tự đã giải -NCBI - Các cơ sở dữ liệu khác 5 Gi it ệ mô họ ớ hiu n c Nguyên tắc tìm kiếm trình tự sau khi đã giải trình tự .Tìm bằng từ khóa: 2.Công cụ tìm kiếm -Mã số truy cập Kế t quả -Tên (gene hay Protein) cần tìm -GI -Độ dài trình tự -Trọng lượng phân tử -Tên tác giả giải trình tự Tì kim rnh ự i họ m ế tì t snh c 6 Tìm kiếm trình tự sinh học qua NCBI Click 7 Tì kim rnh t i họ m ế tì ự snh c Tìm kiếm trình tự DNA 8 Tì kim rnh ự i họ m ế tì t snh c Tìm kiếm trình tự qua mã số truy cập Mã số truy cập của một trình tự là mã số do các nhà quản trị CSDLSH đặt cho một trình tự, thường có dạng : 8 ký tự : 2 chữ và 6 số ví dụ như AY690640 6 ký tự : 1 chữ và 5 số ví dụ như U20068 9 Tì kim rnh ự i họ m ế tì t snh c TÌM KIẾM TRÌNH TỰ SINH HỌC QUA MÃ SỐ TRUY CẬP 10 Tì kim rnh ự i họ m ế tì t snh c Kết quả tìm trình tự DNA qua mã số truy c ập 11 Gi it ệ mô họ ớ hiu n c Tìm kiếm trình tự qua tên gene 12 Tì kim rnh ự i ọ m ế tì t snh h c 13 Tì kim rnh t i ọ m ế tì ự snh h c Cách lấy trình tự theo định dang FASTA 14 Gi it ệ mô họ ớ hiu n c Định dạng FASTA FASTA là một giải thuật bắt cặp trình tự được David J. Lipman và William R. Pearson miêu tả lần đầu tiên vào năm 1985 ( Rapid and sensitive protein similarity searches). Nhiều phần mềm tin sinh học cần dữ liệu trình tự gene hoặc protein theo kiểu định dạng FASTA như ví dụ minh hoạ dưới đây: >tên trình tự gattctcacttggtctgctgcaaggacgcggaccattaaaactgttcatggcccttgtggcgttctcgttt cctaacaatcccaccaacagcagggatactaaaaagatggggaacgatcaaaaaatcaaaagctatc aatgtcttgagagggttcaggaaagagattggaaggatgctgaacatcttgaacaggagacgcagga cagcaggcgtgattgttatgttgattccacagcgatggcgttccatttaaccacacgcaatgg 15 Tì kim rnh ự i họ m ế tì t snh c Một số mã số truy cập của RefSeq database 1. mRNAs and Proteins NM_123456 Curated mRNA NP_123456 Curated Protein NR_123456 Curated non-coding RNA XM_123456 Predicted mRNA XP_123456 Predicted Protein XR_123456 Predicted non-coding RNA 2. Chromosome NC_123455 Microbial replicons, organelle genomes, human chromosomes 4. Assemblies NT_123456 Contig 16 Tì kim rnh ự i ọ m ế tì t snh h c Ví dụ 1: NM_123456 Curated mRNA NM_123456 17 Tì kim rnh i ọ m ế tì ssnh h c V í dụ 2: NC_12345 ...
Nội dung trích xuất từ tài liệu:
Tìm kiếm trình tự sinh học và đăng kí trình tự trên cơ sở dữ liệu TÌM KIẾM TRÌNH TỰ SINH HỌC VÀ ĐĂNG KÝ TRÌNH TỰ TRÊN CƠ SỞ DỮ LIỆU Mục tiêu của bài học Có khả tìm kiếm được những trình tự sinh học như DNA, RNA, Protein. Đăng ký những trình tự đã nghiên cứu được lên Cơ sở dữ liệu sinh học bằng phần mềm Sequin. 2 Tì kim rnh ự i họ m ế tì t snh c Nguyên tắc trong giải trình tự Phương pháp Sanger: là phương pháp dựa trên sự tổng hợp gián đoạn DNA. Dựa theo phương pháp này chúng ta có thể xác định được trình tự nucleotide của DNA hay RNA (ATGC… TTT) 3 Tì kim rnh ự i họ m ế tì t snh c Nhiễm sắc thể, DNA, Gene, Nucleotide 4 Gi it ệ mô họ ớ hiu n c Gửi trình tự lên Genebank của NCBI Sequin Đưa vào cơ sở dữ liệu sinh học: Trình tự đã giải -NCBI - Các cơ sở dữ liệu khác 5 Gi it ệ mô họ ớ hiu n c Nguyên tắc tìm kiếm trình tự sau khi đã giải trình tự .Tìm bằng từ khóa: 2.Công cụ tìm kiếm -Mã số truy cập Kế t quả -Tên (gene hay Protein) cần tìm -GI -Độ dài trình tự -Trọng lượng phân tử -Tên tác giả giải trình tự Tì kim rnh ự i họ m ế tì t snh c 6 Tìm kiếm trình tự sinh học qua NCBI Click 7 Tì kim rnh t i họ m ế tì ự snh c Tìm kiếm trình tự DNA 8 Tì kim rnh ự i họ m ế tì t snh c Tìm kiếm trình tự qua mã số truy cập Mã số truy cập của một trình tự là mã số do các nhà quản trị CSDLSH đặt cho một trình tự, thường có dạng : 8 ký tự : 2 chữ và 6 số ví dụ như AY690640 6 ký tự : 1 chữ và 5 số ví dụ như U20068 9 Tì kim rnh ự i họ m ế tì t snh c TÌM KIẾM TRÌNH TỰ SINH HỌC QUA MÃ SỐ TRUY CẬP 10 Tì kim rnh ự i họ m ế tì t snh c Kết quả tìm trình tự DNA qua mã số truy c ập 11 Gi it ệ mô họ ớ hiu n c Tìm kiếm trình tự qua tên gene 12 Tì kim rnh ự i ọ m ế tì t snh h c 13 Tì kim rnh t i ọ m ế tì ự snh h c Cách lấy trình tự theo định dang FASTA 14 Gi it ệ mô họ ớ hiu n c Định dạng FASTA FASTA là một giải thuật bắt cặp trình tự được David J. Lipman và William R. Pearson miêu tả lần đầu tiên vào năm 1985 ( Rapid and sensitive protein similarity searches). Nhiều phần mềm tin sinh học cần dữ liệu trình tự gene hoặc protein theo kiểu định dạng FASTA như ví dụ minh hoạ dưới đây: >tên trình tự gattctcacttggtctgctgcaaggacgcggaccattaaaactgttcatggcccttgtggcgttctcgttt cctaacaatcccaccaacagcagggatactaaaaagatggggaacgatcaaaaaatcaaaagctatc aatgtcttgagagggttcaggaaagagattggaaggatgctgaacatcttgaacaggagacgcagga cagcaggcgtgattgttatgttgattccacagcgatggcgttccatttaaccacacgcaatgg 15 Tì kim rnh ự i họ m ế tì t snh c Một số mã số truy cập của RefSeq database 1. mRNAs and Proteins NM_123456 Curated mRNA NP_123456 Curated Protein NR_123456 Curated non-coding RNA XM_123456 Predicted mRNA XP_123456 Predicted Protein XR_123456 Predicted non-coding RNA 2. Chromosome NC_123455 Microbial replicons, organelle genomes, human chromosomes 4. Assemblies NT_123456 Contig 16 Tì kim rnh ự i ọ m ế tì t snh h c Ví dụ 1: NM_123456 Curated mRNA NM_123456 17 Tì kim rnh i ọ m ế tì ssnh h c V í dụ 2: NC_12345 ...
Tìm kiếm theo từ khóa liên quan:
chuyên đề sinh học công nghệ sinh học tin học ứng dụng cơ sở dữ liệu trình tự sinh học phần mềm SequinGợi ý tài liệu liên quan:
-
62 trang 401 3 0
-
Đề thi kết thúc học phần học kì 2 môn Cơ sở dữ liệu năm 2019-2020 có đáp án - Trường ĐH Đồng Tháp
5 trang 376 6 0 -
Giáo trình Cơ sở dữ liệu: Phần 2 - TS. Nguyễn Hoàng Sơn
158 trang 290 0 0 -
13 trang 290 0 0
-
68 trang 284 0 0
-
Phân tích thiết kế hệ thống - Biểu đồ trạng thái
20 trang 283 0 0 -
Tài liệu học tập Tin học văn phòng: Phần 2 - Vũ Thu Uyên
85 trang 254 1 0 -
Đề cương chi tiết học phần Quản trị cơ sở dữ liệu (Database Management Systems - DBMS)
14 trang 243 0 0 -
Tài liệu bồi dưỡng giáo viên sử dụng SGK Tin học 10 Cánh diều (Định hướng Tin học ứng dụng)
61 trang 238 0 0 -
Tiểu luận: Trình bày cơ sở khoa học và nội dung của các học thuyết tiến hóa
39 trang 231 0 0