Danh mục

PHƯƠNG PHÁP THỐNG KÊ TRONG KHÍ HẬU ( Phan Văn Tân - NXB Đại học Quốc gia Hà Nội ) - CHƯƠNG 6

Số trang: 17      Loại file: pdf      Dung lượng: 331.05 KB      Lượt xem: 5      Lượt tải: 0    
Jamona

Hỗ trợ phí lưu trữ khi tải xuống: 11,000 VND Tải xuống file đầy đủ (17 trang) 0
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

CHỈNH LÝ SỐ LIỆU KHÍ HẬU6.1 ĐẶT VẤN ĐỀNhư đã biết, số liệu là bộ phận quan trọng nhất mà từ đó ta có thể tiến hành tính toán, thống kê, thực hiện những vấn đề trong nghiên cứu khí hậu bằng phương pháp thống kê. Ngoài việc lựa chọn đúng phương pháp nghiên cứu, chất lượng số liệu là yếu tố quyết định đến sự chính xác của kết quả. Nói đến chất lượng số liệu trước hết cần xem xét đến độ chính xác của chúng. Có nhiều nguyên nhân gây nên sự thiếu chính xác, hay nói...
Nội dung trích xuất từ tài liệu:
PHƯƠNG PHÁP THỐNG KÊ TRONG KHÍ HẬU ( Phan Văn Tân - NXB Đại học Quốc gia Hà Nội ) - CHƯƠNG 6 CHƯƠNG 6. CHỈNH LÝ SỐ LIỆU KHÍ HẬU6.1 ĐẶT VẤN ĐỀ Như đã biết, số liệu là bộ phận quan trọng nhất mà từ đó ta có thể tiến hànhtính toán, thống kê, thực hiện những vấn đề trong nghiên cứu khí hậu bằngphương pháp thống kê. Ngoài việc lựa chọn đúng phương pháp nghiên cứu, chấtlượng số liệu là yếu tố quyết định đến sự chính xác của kết quả. Nói đến chất lượng số liệu trước hết cần xem xét đến độ chính xác củachúng. Có nhiều nguyên nhân gây nên sự thiếu chính xác, hay nói đúng hơn làsai số, trong bản thân các chuỗi được sử dụng để tính toán, như sai sót do quantrắc, nhầm lẫn trong quá trình xử lý ban đầu hoặc khi tiến hành lấy mẫu, do tácđộng ngẫu nhiên của những nhân tố bên ngoài,...Bởi vậy, bài toán đặt ra ở đây làcần loại bỏ sai số chứa đựng trong chuỗi số liệu ban đầu trước khi đưa vào xử lý,tính toán. Mặt khác, trong thực tế, nhất là ở nước ta, vì nhiều lý do khác nhau, chuỗisố liệu khí tượng thuỷ văn nói chung, số liệu khí hậu nói riêng, ít khi đảm bảotính liên tục. Điều đó gây không ít khó khăn cho việc triển khai nghiên cứu ứngdụng trong một loạt bài toán. Chẳng hạn, do điều kiện chiến tranh, chuỗi số liệucủa trạm A bị khuyết đi một số tháng của các năm nào đó; hoặc do điều kiện lưutrữ không tốt, số liệu của trạm B bị phai mờ hoặc mất lẻ tẻ một số điểm,... Vấnđề đặt ra là bằng cách nào đó hãy phục hồi lại những số liệu khuyết thiếu đểchuỗi trở thành liên tục. Một vấn đề khác cũng được đặt ra khi tiến hành xử lý số liệu. Đó là sự duytrì, thành lập các trạm phụ thuộc vào nhiều điều kiện khách quan cũng như chủquan mà kết quả là chuỗi thời gian quan trắc của các trạm dài ngắn khác nhau.Điều này làm nảy sinh hai vấn đề: Khi độ dài của chuỗi ngắn thì số liệu của trạm 189không mang đầy đủ tính tiêu biểu; và khi độ dài các chuỗi khác nhau thì số liệucủa toàn mạng lưới trạm sẽ không bảo đảm tính so sánh. Vậy vấn đề cần giảiquyết ở đây là bổ khuyết số liệu cho những trạm có độ dài chuỗi ngắn, tạo cơ sởđể tính toán các đặc trưng thống kê trên những chuỗi này.6.2 KHỬ SAI SỐ TRONG SỐ LIỆU BAN ĐẦU Thực tế khẳng định rằng, trong các chuỗi số liệu quan trắc luôn luôn chứađựng những sai số tiềm ẩn nào đó và người ta chia những sai số này ra làm 3loại: Sai số thô, sai số hệ thống và sai số ngẫu nhiên. Sai số thô sinh ra chủ yếu bởi những thao tác nhầm lẫn, sơ suất trong quátrình đo đạc hoặc lấy mẫu. Chẳng hạn, trong qui ước ban đầu, số liệu nhiệt độđược lấy chính xác đến phần mười độ và không ghi dấu phẩy thập phân, nhưngkhi tiến hành thu thập số liệu từ các báo biểu quan trắc, do thói quen người taghi lẫn lộn một vài số nào đó có dấu phẩy thập phân (tách phần nguyên và phầnmười độ - ví dụ, trị số 240 bị ghi sai thành 24). Như vậy, vô tình những giá trịnày đã bị giảm đi mười lần so với trị số thực. Trong nhiều trường hợp những giátrị có chứa sai số kiẻu này rất khó phát hiện do chúng bị ẩn dấu trên nền chuỗi sốliệu. Ví dụ, cũng với kiểu xảy ra sai sót nói trên nhưng không phải đối với nhiệtđộ mà là lượng mưa, thì hầu như không thể chỉ ra được số liệu nghi ngờ. Sai số hệ thống gây nên bởi rất nhiều nguyên nhân khác nhau, mỗi nguyênnhân mang một dáng vẻ. Đây là loại sai số rất khó phát hiện nếu không có sựkhảo sát tỷ mỷ. Ví dụ, khi xem xét các báo biểu quan trắc người ta nhận thấyrằng do hiệu đính dụng cụ không đúng nên số liệu nhiệt độ đã bị lệch đi mộtlượng nào đó, hoặc do thói quen, khi đọc nhiệt biểu quan trắc viên thường đọcgiá trị nhiệt độ trên nhiệt kế thấp hơn so với qui định chung. v.v. Sai số ngẫu nhiên là sai số còn lại sau khi đã khử bỏ sai số thô và sai số hệthống. Sai số ngẫu nhiên gây nên bởi một lượng vô cùng lớn các nguyên nhânmà ảnh hưởng của mỗi một trong chúng bé đến mức ta không thể phân định nổimức đóng góp của từng nguyên nhân, chúng luôn luôn tồn tại trong mọi chuỗisố liệu quan trắc. 190 Trong ba loại sai số nêu trên, sai số ngẫu nhiên không thể khử bỏ đượctrong từng thành phần của chuỗi quan trắc. Tuy vậy, bằng các phương pháp củalý thuyết xác suất ta có thể tính được ảnh hưởng của chúng đến việc xác địnhcác ước lượng thống kê. Đối với sai số hệ thống, nếu phát hiện được và biếtnguyên nhân gây nên sai số ta hoàn toàn có thể loại trừ chúng. Song, nói chungviệc phát hiện sai số hệ thống đòi hỏi phải khảo sát hết sức công phu. Sau đây tasẽ đề cập đến phương pháp phát hiện và loại bỏ sai số thô. 1) Cách phát hiện sai số thô Giả sử ta có chuỗi quan trắc {xt}={x1,x2,...,xn} của đại lượng khí hậu X.Khi đó sai số thô (nếu có) thường ẩn chứa trong những giá trị nằm ở các vị tríđầu hoặc cuối chuỗi trình tự {x(t)}={x(1),...,x(n)}, ( x(1) x + 3s hoặc∂R(ao,a1) ∂R(ao,a1) = 0, trong đó x và s là trung bình độ lệch chuẩn của X - ước lượng ...

Tài liệu được xem nhiều: