Tin Sinh Học
Số trang: 16
Loại file: pdf
Dung lượng: 189.43 KB
Lượt xem: 16
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Tin Sinh Học BioinformaticsTin sinh học (bioinformatics) là một lĩnh vực khoa học sử dụng các công nghệ của các ngành toán học ứng dụng, tin học, thống kê và khoa học máy tính để giải quyết các vấn đề sinh học. Các nghiên cứu trong ngành sinh học tính toán (computational biology) thường trùng lặp với sinh học hệ thống (systems biology).
Nội dung trích xuất từ tài liệu:
Tin Sinh Học Tin Sinh Học - BioinformaticsTin sinh học (bioinformatics) là một lĩnh vựckhoa học sử dụng các công nghệ của cácngành toán học ứng dụng, tin học, thốngkê và khoa học máy tính để giải quyết các vấnđề sinh học.Các nghiên cứu trong ngành sinh học tínhtoán (computational biology) thường trùng lặpvới sinh học hệ thống (systems biology).Những lĩnh vực nghiên cứu chính của nó baogồm bắt cặp trình tự (sequencealignment), bắt cặp cấu trúc protein(proteinstructural alignment), dự đoán cấu trúcprotein (protein structure prediction), dựđoán biểu hiện gene (gene expression)và tương tác protein - protein (protein-proteininteractions), và mô hình hóa quá trình tiếnhoá. Thuật ngữ tin sinh học và sinh học tínhtoán thường được dùng hoán đổi cho nhau,mặc dù cái trước, nói một cách nghiêm túc, làtập con của cái sau. Những mối quan tâmchính trong các dự án tin sinh học và sinh họctính toán là việc sử dụng các công cụ toán họcđể trích rút các thông tin hữu ích từ các dữliệu hỗn độn được thu nhận từ các kĩ thuậtsinh học với lưu lượng mức độ lớn. (Lĩnhvực khai phá dữ liệu (data mining) trùng lắpvới sinh học tính toán về phương diện này.)Những bài toán đặc trưng trong sinh học tínhtoán bao gồm việc lắp ráp (assembly)những trình tự DNA chất lượng cao từ cácđoạn ngắn DNA được thu nhận từ k ỹ thuậtxác định trình tự DNA, và việc dự đoán quiluật điều hòa gene (gene regulation) với dữliệu từ các mRNA, microarray hay khốiphổ(mass spectrometry).Lý giải những thông tin thu được từ các nguồncơ sở dữ liệu khổng lồ về DNA chỉ là mộttrong nhiều bài toán mà các nhà tin sinh họcphải giải quyếtCác lĩnh vực nghiên cứu chínhGenomics - Hệ gene họcPhân tích trình tựBài chính: Bắt cặp trình tự, CSDL trình tựKể từ khi Phage Φ-X174 được xác định trìnhtự (1977) cho đến nay, trình tự DNA của rấtnhiều loài sinh vật đã được lưu trữ trong cácngân hàng cơ sở dữ liệu gene. Những dữ liệunày sẽ được phân tích để tìm ra những genecấu trúc (gene mã hoá cho một protein nàođó), cũng như tìm ra qui luật của những trìnhtự tương đồng giữa các protein). Việc so sánhcác gene trong cùng một loài hay giữa các loàikhác nhau có thể cho thấy sự tương đồng vềchức năng của protein, hay mối quan hệ phátsinh chủng loài giữa những loài này (thể hiệntrên cây phát sinh chủng loài (phylogenetictree)). Với sự tăng trưởng khổng lồ của dữliệu loại này, việc phân tích trình tự DNA mộtcách thủ công trở nên không thể thực hiện nổi.Ngày nay, các chương trình máy tính được sửdụng để giúp tìm các trình tự tương đồngtrong bản đồ gen (genome) của hàng loạt sinhvật, với số lượng nucleotide trong trình tự lênđến hàng tỉ. Những chương trình này có thểtìm kiếm những trình tự DNA không giốngnhau hoàn toàn do các đột biếnnucleotide (thay thế, mất hay thêm các gốcbase). Những giải thuật bắt cặp trìnhtự(sequence alignment) cũng được áp dụngngay cả trong quá trình xác định trình tự DNA,là k ỹ thuật xác định trình tự đoạn nhỏ(shotgunsequencing). (Kỹ thuật này đã được công tyCelera Genomics sử dụng để xác định trình tựgenome của vi khuẩnHaemophilus influenza.)Kỹ thuật xác định trình tự hiện nay không thểtiến hành với cả đoạn trình tự DNA lớn (cỡ vàichục nghìn nucleotide trở lên) nên người ta sửdụng xác định trình tự nhỏ để giải mã hàngnghìn đoạn trình tự với kích thước khoảng 600- 800 nucleotide. Sau đó, những đoạn trình tựnhỏ này sẽ được sắp xếp thứ tự và nối lại vớinhau (thông qua việc bắt cặp trình tựở nhữngđầu gối lên nhau (overlap)) tạo thành một trìnhtự genome hoàn chỉnh.Kỹ thuật xác định trình tự đoạn nhỏ tạo rachuỗi dữ liệu một cách nhanh chóng, nhưngnhiệm vụ sắp xếp lại các mảnh DNA có thể làkhá phức tạp cho các genome lớn. Trongtrường hợp dự án bản đồ gen người (HumanGenome Project), các nhà tin sinh học phảimất cả hàng tháng đồng thời sử dụng hàngloạt siêu máy tính (các máy DEC Alpha ra đờinăm 2000) để sắp xếp đúng trình tự ngắn lại.Xác định trình tự đoạn nhỏ là kỹ thuật ưu tiênsử dụng trong hầu hết các dự án giải mãgenome hiện nay vàgiải thuật lắp rápgenome (genome assembly algorithms) là mộttrong những lĩnh vực nóng của tin sinh học.Một khía cạnh khác của tin sinh học trong việcphân tích trình tự là việc tìm kiếm tự động cácgen và những trình tự điều khiển bên trongmột genome. Không phải là tất cả nucleotidesbên trong một genome đều là gene. Phần lớncác DNA bên trong genome của các sinh vậtbậc cao là các đoạn DNA không phục vụ chomột nhiệm vụ cụ thể nào (hoặc do khoa họchiện nay chưa nhận ra) được gọi là nhữngđoạn DNA rác (junk DNA). Tin sinh học còngiúp kết nối dữ liệu giữa các dựán genomics vàproteomics, ví dụ việc sử dụngtrình tự DNA để nhận dạng protein.Xem thêm: phân tích trình tự, công cụ địnhdanh chuỗi (sequence profiling tool), trình tựmotif.Chỉ định GenomeBài chính: Tìm kiếm geneVề phía lĩnh vực gen chuyên về nghiên cứubản đồ gen (genomics), annotation là quátrình đánh dấu các gen và cá ...
Nội dung trích xuất từ tài liệu:
Tin Sinh Học Tin Sinh Học - BioinformaticsTin sinh học (bioinformatics) là một lĩnh vựckhoa học sử dụng các công nghệ của cácngành toán học ứng dụng, tin học, thốngkê và khoa học máy tính để giải quyết các vấnđề sinh học.Các nghiên cứu trong ngành sinh học tínhtoán (computational biology) thường trùng lặpvới sinh học hệ thống (systems biology).Những lĩnh vực nghiên cứu chính của nó baogồm bắt cặp trình tự (sequencealignment), bắt cặp cấu trúc protein(proteinstructural alignment), dự đoán cấu trúcprotein (protein structure prediction), dựđoán biểu hiện gene (gene expression)và tương tác protein - protein (protein-proteininteractions), và mô hình hóa quá trình tiếnhoá. Thuật ngữ tin sinh học và sinh học tínhtoán thường được dùng hoán đổi cho nhau,mặc dù cái trước, nói một cách nghiêm túc, làtập con của cái sau. Những mối quan tâmchính trong các dự án tin sinh học và sinh họctính toán là việc sử dụng các công cụ toán họcđể trích rút các thông tin hữu ích từ các dữliệu hỗn độn được thu nhận từ các kĩ thuậtsinh học với lưu lượng mức độ lớn. (Lĩnhvực khai phá dữ liệu (data mining) trùng lắpvới sinh học tính toán về phương diện này.)Những bài toán đặc trưng trong sinh học tínhtoán bao gồm việc lắp ráp (assembly)những trình tự DNA chất lượng cao từ cácđoạn ngắn DNA được thu nhận từ k ỹ thuậtxác định trình tự DNA, và việc dự đoán quiluật điều hòa gene (gene regulation) với dữliệu từ các mRNA, microarray hay khốiphổ(mass spectrometry).Lý giải những thông tin thu được từ các nguồncơ sở dữ liệu khổng lồ về DNA chỉ là mộttrong nhiều bài toán mà các nhà tin sinh họcphải giải quyếtCác lĩnh vực nghiên cứu chínhGenomics - Hệ gene họcPhân tích trình tựBài chính: Bắt cặp trình tự, CSDL trình tựKể từ khi Phage Φ-X174 được xác định trìnhtự (1977) cho đến nay, trình tự DNA của rấtnhiều loài sinh vật đã được lưu trữ trong cácngân hàng cơ sở dữ liệu gene. Những dữ liệunày sẽ được phân tích để tìm ra những genecấu trúc (gene mã hoá cho một protein nàođó), cũng như tìm ra qui luật của những trìnhtự tương đồng giữa các protein). Việc so sánhcác gene trong cùng một loài hay giữa các loàikhác nhau có thể cho thấy sự tương đồng vềchức năng của protein, hay mối quan hệ phátsinh chủng loài giữa những loài này (thể hiệntrên cây phát sinh chủng loài (phylogenetictree)). Với sự tăng trưởng khổng lồ của dữliệu loại này, việc phân tích trình tự DNA mộtcách thủ công trở nên không thể thực hiện nổi.Ngày nay, các chương trình máy tính được sửdụng để giúp tìm các trình tự tương đồngtrong bản đồ gen (genome) của hàng loạt sinhvật, với số lượng nucleotide trong trình tự lênđến hàng tỉ. Những chương trình này có thểtìm kiếm những trình tự DNA không giốngnhau hoàn toàn do các đột biếnnucleotide (thay thế, mất hay thêm các gốcbase). Những giải thuật bắt cặp trìnhtự(sequence alignment) cũng được áp dụngngay cả trong quá trình xác định trình tự DNA,là k ỹ thuật xác định trình tự đoạn nhỏ(shotgunsequencing). (Kỹ thuật này đã được công tyCelera Genomics sử dụng để xác định trình tựgenome của vi khuẩnHaemophilus influenza.)Kỹ thuật xác định trình tự hiện nay không thểtiến hành với cả đoạn trình tự DNA lớn (cỡ vàichục nghìn nucleotide trở lên) nên người ta sửdụng xác định trình tự nhỏ để giải mã hàngnghìn đoạn trình tự với kích thước khoảng 600- 800 nucleotide. Sau đó, những đoạn trình tựnhỏ này sẽ được sắp xếp thứ tự và nối lại vớinhau (thông qua việc bắt cặp trình tựở nhữngđầu gối lên nhau (overlap)) tạo thành một trìnhtự genome hoàn chỉnh.Kỹ thuật xác định trình tự đoạn nhỏ tạo rachuỗi dữ liệu một cách nhanh chóng, nhưngnhiệm vụ sắp xếp lại các mảnh DNA có thể làkhá phức tạp cho các genome lớn. Trongtrường hợp dự án bản đồ gen người (HumanGenome Project), các nhà tin sinh học phảimất cả hàng tháng đồng thời sử dụng hàngloạt siêu máy tính (các máy DEC Alpha ra đờinăm 2000) để sắp xếp đúng trình tự ngắn lại.Xác định trình tự đoạn nhỏ là kỹ thuật ưu tiênsử dụng trong hầu hết các dự án giải mãgenome hiện nay vàgiải thuật lắp rápgenome (genome assembly algorithms) là mộttrong những lĩnh vực nóng của tin sinh học.Một khía cạnh khác của tin sinh học trong việcphân tích trình tự là việc tìm kiếm tự động cácgen và những trình tự điều khiển bên trongmột genome. Không phải là tất cả nucleotidesbên trong một genome đều là gene. Phần lớncác DNA bên trong genome của các sinh vậtbậc cao là các đoạn DNA không phục vụ chomột nhiệm vụ cụ thể nào (hoặc do khoa họchiện nay chưa nhận ra) được gọi là nhữngđoạn DNA rác (junk DNA). Tin sinh học còngiúp kết nối dữ liệu giữa các dựán genomics vàproteomics, ví dụ việc sử dụngtrình tự DNA để nhận dạng protein.Xem thêm: phân tích trình tự, công cụ địnhdanh chuỗi (sequence profiling tool), trình tựmotif.Chỉ định GenomeBài chính: Tìm kiếm geneVề phía lĩnh vực gen chuyên về nghiên cứubản đồ gen (genomics), annotation là quátrình đánh dấu các gen và cá ...
Tìm kiếm theo từ khóa liên quan:
Tin sinh học toán học ứng dụng khoa học máy tính sinh học hệ thống cấu trúc proteinGợi ý tài liệu liên quan:
-
Tóm tắt Đồ án tốt nghiệp Khoa học máy tính: Xây dựng ứng dụng quản lý quán cà phê
15 trang 475 1 0 -
Đề thi kết thúc học phần học kì 2 môn Cơ sở dữ liệu năm 2019-2020 có đáp án - Trường ĐH Đồng Tháp
5 trang 378 6 0 -
32 trang 230 0 0
-
Đồ án nghiên cứu khoa học: Ứng dụng công nghệ cảm biến IoT vào mô hình thủy canh
30 trang 201 0 0 -
6 trang 173 0 0
-
Giải thuật và cấu trúc dữ liệu
305 trang 161 0 0 -
76 trang 156 2 0
-
3 trang 143 2 0
-
Sửa chữa và lắp ráp máy tính tại nhà
276 trang 103 0 0 -
Tóm tắt luận án Tiến sĩ Kỹ thuật: Sử dụng ngôn ngữ trục trong dịch đa ngữ
27 trang 94 0 0