Danh mục

IT - Matlab Software part 7

Số trang: 8      Loại file: pdf      Dung lượng: 259.34 KB      Lượt xem: 24      Lượt tải: 0    
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Hoặc với dữ liệu longley m = median(ldata) m= 1.0E+003* 0.1012 0.3975 0.3351 0.2798 0.1174 1.9550 0.0660 Có thể trừ giá trị trung bình mỗi cột của ldata bằng cách dùng phép nhân bên ngoài lmean = ldata - ones(n,1)
Nội dung trích xuất từ tài liệu:
IT - Matlab Software part 7Chương 5. Phân tích dữ liệu 48 987 mv = 4.3333 5.3333 5.333 s= 124 365 987 Hoặc với dữ liệu longley m = median(ldata) m= 1.0E+003* 0.1012 0.3975 0.3351 0.2798 0.1174 1.9550 0.0660 Có thể trừ giá trị trung bình mỗi cột của ldata bằng cách dùng phép nhân bênngoài lmean = ldata - ones(n,1)*m; Có thể thêm vào danh sách này bằng cách dùng các siêu tệp M-file, nhưng khidùng hãy cẩn thận để xử lý trường hợp vectơ dòng. Nếu viết các tệp M-file theohướng cột riêng thì hãy xem cách hoàn thành điều này trong các tệp M-file khác,ví dụ mean.m và diff.m. Các giá trị bỏ qua 5.2. Giá trị đặc biệt, NaN, viết tắt chữ Not-a-Number trong MATLAB. Thôngthường cho ra bởi các biểu thức không xác định như 0/0, nguyên nhân của mộtthông báo lỗi, tùy theo quy ước thiết lập bởi chuẩn IEEE. Đối với công dụngthống kê thì các giá trị NaN có thể dùng để biểu hiện các giá trị bỏ qua hoặc dữliệu không dùng được, NA. Cách sửa đổi các giá trị NA là một điều khó khăn và thường khác nhau tùytheo từng trường hợp cụ thể. Tuy nhiên, MATLAB đồng dạng và nghiêm ngặttrong cách xem xét của nó về các giá trị NaN; chúng truyền một cách tự nhiên chokết quả cuối cùng của mọi tính toán. Do đó nếu một giá trị NaN được dùng trongPhan Thanh Tao - 2004Chương 5. Phân tích dữ liệu 49mọi lần tính toán trung gian thì kết quả cuối cùng sẽ là một NaN, trừ khi kết quảcuối cùng không phụ thuộc vào giá trị NaN. Về mặt thực hành, điều này có nghĩa là nên xóa các NaN trong dữ liệu trướckhi thực hiện việc tính toán thống kê. Các NaN trong vectơ x được tìm ở: i = find(isnan(x));vì vậy x = x(find(~isnan(x)))trả về dữ liệu trong x với các NaN đã xóa. Có 2 cách khác nhau để thực hiện việcnày là x = x(~isnan(x)); x(isnan(x)) = [ ];có lẽ cách thứ hai là rõ nhất. Phải dùng hàm đặc biệt isnan để tìm các NaN vìkhông thể dùng lệnh x(x==NaN) = [ ]; Các NaN trả về NaN cho mọi phép toán, kể cả các phép toán quan hệ. Nếu thay vì vectơ, dữ liệu ở trên các cột của ma trận, và xóa mọi dòng của matrận có NaN thì dùng X(any(isnan(X)),:) = [ ];đây là một lệnh khá thô, nhưng có hiệu lực. Nếu cho rằng khó nhớ thì hoàn toànbiện hộ. Nếu thường cần xóa các NaN thì cách giải quyết là viết một tệp M-file, vídụ function X = excise(X) X(any(isnan(X)),:) = [ ]; Bây giờ đánh vào X = excise(X);là hoàn thành cùng công việc. Biết thêm về các tệp M-file sau này.Phan Thanh Tao - 2004Chương 5. Phân tích dữ liệu 50 Cách xóa các giá trị quá hạn 5.3. Cách xóa các giá trị quá hạn trong dữ liệu giống như cách xóa các NaN. Vớidữ liệu Longley, giá trị trung bình và các độ lệch chuẩn của mỗi cột dữ liệu là: mv = mean(ldata) sigma = std(ldata) mv = 1.0E+003* 0.101 0.387 0.319 0.260 0.117 1.954 0.065 sigma = 10.448 96.238 90.479 67.382 6.735 4.609 3.400 Số dòng có giá trị chênh lệch lớn hơn 3 lần độ lệch chuẩn là: [n,p] = size(ldata); e = ones(n,1); dist = asb(ldata-e*mv); outliers = dist > 3*e*sigma; nout = sum(any(outliers)) nout = 0 Không có. Nếu có thì chúng bị xóa với lệnh X(any(outliers),:) = [ ]; Hồi quy và đường cong thực nghiệm 5.4. Trước khi đưa đường cong thực nghiệm vào dữ liệu thì phải chuẩn hóa dữ liệu.Việc chuẩn hóa có thể cải tiến độ chính xác của kết quả cuối cùng. Vẫn làm việcvới dữ liệu Longley, một cách chuẩn hóa là xóa giá trị trung bình X = X - e* mean(X);và để chuẩn hóa thành đơn vị độ lệch chuẩnPhan Thanh Tao - 2004Chương 5. Phân tích dữ liệu 51 X = X ./ (e*std(X); Có thể tính hồi quy thất nghiệp ( cột cuối cùng ) theo các cột trước đó, dùngtrong dữ liệu thô trong trường hợp này, y = ladat(:,7); A = [ldata(:,1:6) ones(y)]; coef = Aykết quả là coef = 1.0E+0003 0.00001506187227 ...

Tài liệu được xem nhiều: