Bài giảng Tin sinh học: Chương 2 - ThS. Nguyễn Thành Luân
Thông tin tài liệu:
Nội dung trích xuất từ tài liệu:
Bài giảng Tin sinh học: Chương 2 - ThS. Nguyễn Thành Luân 13/03/2013 TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP THỰC PHẨM TPHCM KHOA CNSH & KTMT HỆ ĐẠI HỌC Chương IICơ sở dữ liệu Tin sinh học (Bioinformatic Databases) Sự thử thách của nguồn thông tin mở GV: ThS. Nguyễn Thành Luân luannt@cntp.edu.vn Mục tiêu của bài học Nắm được những nguyên tắc so sánh các trình tự sinh học Sử dụng chương trình BLAST giúp chúng ta nhanh chóng tìm ra những trình tự sinh học tương đồng (nếu có trong các CSDL lớn như NCBI, EMBL, DDPJ…) với trình tự yêu cầu. Cung cấp những số liệu về tỉ lệ tương đồng, nguồn gốc các trình tự tương đồng, … 1 13/03/2013 Nội dung bài học• Khái niệm cơ sở dữ liệu (CSDL)• Các công cụ về cơ sở dữ liệu: – GenBank – BankIt – BLAST• Các nguồn cơ sở dữ liệu sinh học cơ bản• Các công cụ tìm kiếm dữ liệu• Phân loại CSDL Tin sinh học WHAT ARE DATABASES Cơ sở dữ liệu là gì?• Là tổ chức các chuỗi thông tin theo dạng tệp• Thông tin có thể bỏ vào và lấy ra bất kz khi nào (Ease of Access)• Đơn giản hóa nguồn thông tin bằng các ký hiệu đặc biệt (Số hóa – Digital databases)• Lưu trữ mọi nguồn dữ liệu thông qua các ngân hàng CSDL là các website• Chứa đựng các khám phá mới trong nghiên cứu khoa học 2 13/03/2013 Chức năng & nhiệm vụ CSDL• Định nghĩa và miêu tả• Chìa khóa duy nhất về: – Cập nhật các phiên bản phần mềm tin sinh học – Liên kết tới những nguồn CSDL khác – Lưu trữ tài liệu• Ấn bản, cập nhật và chỉnh sửa tài liệu, trình tự dựa trên nguồn của CSDL,… Cơ sở dữ liệu sinh học (Biological databases)• Trình tự DNA, RNA và protein hoặc 1 gene• Hầu hết các trường hợp, 1 trình tự protein được hiểu là 1 trình tự trong sinh học• Hiểu rõ các dạng khác nhau của trình tự là mấu chốt cho bất cứ sự giải thích vấn đề nào.• Phân tích các lỗi có thể xuất hiện trên trình tự nhằm so sánh các sự khác biệt giữa các trình tự. 3 13/03/2013 BIOLOGICAL PATHWAYS GENBANK HOW DID THEY DO THAT?Nguồn: http://ncbi.nlm.nih.gov KHÁI NIỆM GenBank? Là nơi mà cơ sở dữ liệu được chứa đựng tất cả thông tin về đoạn gen đã được mã hóa (DNA, RNA) hoặc những trình tự protein gốc với việc đính kèm và biểu hiện tất cả thông tin sinh học chứa đựng về đoạn gen mã hóa đó. http://www.ncbi.nlm.nih.gov/GenBank/Genb ank overview.html 4 13/03/2013 Cách khai thác & sử dụng Genbank• Chú trọng vào xử lý nucleotide của gene - nơi chứa nguồn thông tin trung tâm (Molecular Databases)• Là chỗ chứa đựng tất cả các trình tự mã hóa phổ biến theo dạng công cộng (public)• Dữ liệu được nhóm lại với nhau theo các cơ sở phân loại khác biệt• Chỉ có thể sử dụng & quản lý thông qua Internet• Nhanh, hiệu quả, cứ mỗi 2 tháng là có 1 ấn bản hoàn chỉnh về 1 gen. Cơ sở dữ liệu Genbank Chứa nhiều đoạn gene đã được mã hóa và công bố theo dạng gói (zip batch) – Nhiều thông tin lệ thuộc nhau về • Tác giả dữ liệu • Loài/giống của gen • Cách phân loại chính xác – Chứa cả các đoạn gen mã hóa chưa được công bố – Mọi người đều có thể đưa trình tự vào (thông tin mở và tính khoa học không cao). Tuy nhiên, nó được chỉnh sửa liên tục để ngày một hoàn thiện hơn 5 13/03/2013 Cơ sở dữ liệu Genbank • Dựa trên vào các trung tâm dữ liệu tin sinh học có thể chấp thuận việc nhập dữ liệu các gen mã hóa dưới dạng web cho phép sự truy cập của người dùng theo 3 website cơ bản. – GenBank (US) – EMBL- EBI (Europe) – DDBJ (Japan) • Thông tin có thể được trao đổi giữa 3 trung tâm trênHệ thống phân loại loài trong GenBank• PRI –Primate (ĐV có vú • RNA -Structural (RNA cấu bậc cao như người, trúc) vượn) • VRL-Viral (Virus)• ROD -Rodent (Gặm • PHG-Phage (Các Phage nhấm) chuyển gen)• MAM -Mammalian (ĐV • SYN-Synthetic (Enzyme có vú) ...
Tìm kiếm theo từ khóa liên quan:
Cơ sở dữ liệu tin sinh học Dữ liệu tin sinh học Tin sinh học Công nghệ sinh học Ứng dụng công nghệ sinh học Bài giảng tin sinh học chương 2Gợi ý tài liệu liên quan:
-
68 trang 285 0 0
-
Tiểu luận: Trình bày cơ sở khoa học và nội dung của các học thuyết tiến hóa
39 trang 238 0 0 -
Tiểu luận môn Công nghệ xử lý khí thải và tiếng ồn: Xử lý khí thải bằng phương pháp ngưng tụ
12 trang 181 0 0 -
8 trang 177 0 0
-
Báo cáo thực hành Môn: Công nghệ vi sinh
15 trang 159 0 0 -
Luận văn tốt nghiệp Công nghệ thực phẩm: Nghiên cứu sản xuất nước uống thảo dược từ cây Lạc tiên
36 trang 153 0 0 -
Giáo trình Kỹ thuật thực phẩm: Phần 2 - NXB Đà Nẵng
266 trang 132 0 0 -
22 trang 126 0 0
-
Tiểu luận: Công nghệ sản xuất nước tương bằng phương pháp lên men
95 trang 123 0 0 -
Đồ án tốt nghiệp: Nghiên cứu quy trình sản xuất rượu vang từ mãng cầu xiêm
99 trang 118 0 0 -
Tiểu luận môn Công nghệ xử lý khí thải và tiếng ồn: Xử lý khí Sunfua Dioxit (SO2)
40 trang 114 0 0 -
KỸ THUẬT XỬ LÝ XOÀKỸ XOÀI RA HOA
2 trang 109 0 0 -
51 trang 106 0 0
-
27 trang 95 2 0
-
Báo cáo thực hành môn Thí nghiệm phân tích môi trường - Bài 5: Phân tích COD, Ammonia trong nước
13 trang 93 0 0 -
Đồ án tốt nghiệp: Tìm hiểu quy trình kiểm tra chất lượng bia thành phẩm của Công ty bia Vinaken
76 trang 91 0 0 -
77 trang 89 0 0
-
Tiểu luận 'Tài nguyên thiên nhiên- hiện trạng và giải pháp'
30 trang 86 0 0 -
21 trang 85 0 0
-
9 trang 85 0 0