Thông tin tài liệu:
Mục đích cuối cùng của các chương trình ghi chú gene là chỉ định hay dự đoán một cách chính xác trình tự của từng gene một trong bộ gene của một sinh vật nào đó. Mặc dù bộ gene của C. elegants đã hòan tất và công bố rộng rãi từ năm 1998, nhưng đến nay vẫn còn hàng ngàn gene mà người ta chưa tìm thấy các dấu hiệu hay bằng chứng là thực sự chúng tồn tại (các bằng chứng cho sự hiện diện của một gene có thể dò thấy bằng cDNA hay EST). ...
Nội dung trích xuất từ tài liệu:
Chỉ định gene: Lấp lỗ hổng bộ gene giun tròn. Chỉ định gene: Lấp lỗ hổng bộ gene giun tròn.Mục đích cuối cùng của cácchương trình ghi chú gene là chỉđịnh hay dự đoán một cách chínhxác trình tự của từng gene mộttrong bộ gene của một sinh vậtnào đó. Dựa trên bộ genecủa Caenorhabditis elegants vàbằng cách sử dụng chương trìnhghi chú gene có tên làTWINSCAN, Wei và cộng sự(Genome Res, 15, 577-582 (2005))đã khám phá 1.119 gene mới củalòai giun tròn này.Mặc dù bộ gene của C. elegants đãhòan tất và công bố rộng rãi từ năm1998, nhưng đến nay vẫn còn hàngngàn gene mà người ta chưa tìmthấy các dấu hiệu hay bằng chứnglà thực sự chúng tồn tại (các bằngchứng cho sự hiện diện của mộtgene có thể dò thấy bằng cDNAhay EST). Do vậy, đến nay đã córất nhiều chương trình ghi chú geneđã được phát triển và tối ưu hóariêng cho lòai giun tròn này. Nằmtrong khuynh hướng nghiên cứu đó,Wei và cộng sự đã sử dụng cácnguồn dữ liệu sẵn có để tiến hànhcác phân tích của riêng họ. Điểmđặc biệt là Wei và cộng sự lại sửdụng thuật tóan TWINSCAN vốnlà một thuật tóan trước đây đượcxây dựng để ghi chú gene người.Điểm nổi bật trong phương phápcủa họ là sự kết hợp khuynh hướngHMM (Hidden Markov Model) vớicác thông tin thu được từ quá trìnhso sánh genome cần so sánh (C.elegants) và genome chuẩn (C.briggsae).Khi sử dụng thông tin từ tòan bộgenome C. elegants, các tác giả đãchỉ ra được 2.891 khung đọc mởkhông trùng với các khung đọc mởđã được ghi chú trên kho dữ liệuWormBase. Kế tiếp họ kiểm tra256 khung đọc mở này bằng quytrình khuyếch đại và tạo dòng. Kếtquả cho thấy 146 khung đọc mở(55%) là những khung đọc mởhòan tòan mới. Điều đặc biệt phảichú ý là những gene mới khám phácó đặc tính bảo thủ khá kém giữahai lòai C. elegant và C. briggsae,nên nhớ những gene bảo thủ kémthường rất khó khăn để chỉ định vàphân biệt chúng. Qua đó cho thấyphương pháp mà các tác giả sửdụng đã chứng tỏ điểm mạnh củanó.Câu hỏi đặt ra là tại sao hướngnghiên cứu của We và cộng sự lạithành công (?). Các tác giả giảithích rằng chính là nhờ mô hình màTWINSCAN sử dụng để phân biệt,chỉ định gene. Mô hình này dựatrên (1) điểm nối GC-AG, (2) phép phân bố độ dàiintron và (3) kết quả sắp xếpgenome C. elegants với C.briggsae. Chính mô hình này quyếtđịnh độ chính xác khi nhận diện,chỉ định gene của TWINSCAN.Như vậy, theo kết quả nghiên cứucủa Wei và cộng sự thì tổng sốlượng gene thực chất ở lòai C.elegants sẽ có sự thay đổi, mặc dùbộ gene của C. elegants là mộttrong những bộ gene được ghi chúkỹ lưỡng nhất. Phương pháp này cókhả năng áp dụng cho nhiều bộgene khác như Arapidopsisthaliana vốn còn hơn 1000 genechưa được ghi chú và hàng ngàngene bị ghi chú sai. Được đánh giálà phương pháp dựa trên máy tínhđầu tiên đạt được độ nhạy 60%trong việc chỉ định nhận diện chínhxác protein trong cơ thể sinh vật đabào, nên việc nghiên cứu ghi chúbộ gene khác trong tương lai sẽ cónhiều thuận lợi hơn.