Danh mục

Một cách chọn mẫu huấn luyện và thuật toán học để xây dựng cây quyết định trong khai phá dữ liệu

Số trang: 10      Loại file: pdf      Dung lượng: 5.81 MB      Lượt xem: 7      Lượt tải: 0    
10.10.2023

Phí tải xuống: 1,000 VND Tải xuống file đầy đủ (10 trang) 0
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

TRong bài viết này, các tác giả phân tích và chỉ ra một số cách chọn tập mẫu huấn luyện tốt từ cơ sở dữ liệu nghiệp vụ, từ đó đưa vào thuật toán học để tạo dựng cây quyết định có khả năng dự đoán cao, nhằm hỗ trợ ra quyết định trong các bài toán phân tích dữ liệu.
Nội dung trích xuất từ tài liệu:
Một cách chọn mẫu huấn luyện và thuật toán học để xây dựng cây quyết định trong khai phá dữ liệuT~p chi Tin hoc va Dieu khien hQC,T.23, S.4 (2007), 317-326,...,-;:::t<,...,MQT CACH CHQN MAU HUAN LUY~N VA THU~T TOAN HQC.lAADE XAY Dl/NG1 Vi~n~,CAY QUYET D!NH TRONG KHAI PHAGong ngh~ thOng tin, Vi~n Khoa h9C2f)t;Liva_oirALI~UGong ngh~ Vi~t Namh9C HueAbstract.Data mining for the purpose of discovering useful implicit information from data warehouse, i.e. knowledge discovery to serve supporting decision making in our activities, has becomemore and more important. Therefore, there exists a lot of methods and techniques focusing on thestudies and applications for data mining and knowledge discovery. Decision tree is known to be oneof the effective solutions to describe the characteristics of mined data. Building an effective decisiontree depends on the selection of training set. In practice, business data have been stored in multiformand of complexity, which consequently leads to the difficulty in selecting a good sample training set.If an untypical sample of training set is chosen, it will lead to low practicability in the correspondingdecision tree. In this article, we have analysed and presented one effective way of choosing sampletraining set from business database. Based on this, we will apply learning algorithm to build aneffective decision tree of high predictability for supporting decision making in data analysis problems.The obtained results show that proposed this method is more efficient.Tom t:it.Khai pha dir lieu ae phat hien cac thong tin bo Ich tiem an tir cac kho dir lieu, tire laphat hien cac tri thirc nharn phuc vu cho viec ho tro ra quyet dinh trong cac heat dong cua cluingta ngay cang tro nen quan trcng. Do vay, aa co nhieu phuang phap, ky thuat t~p trung nghien ciruva trien khai irng dung ae phuc vu cho cong viec khai pha dir lieu va phat hien tri thirc. Cay quyetdinh la mot trong nhirng giai phap hiru hieu ae mo ta cac aEj,ctinh dir lieu aa diroc khai pha. Vi~cxay dirng mot cay quyet dinh phuc V1,l khai pha dir lieu hieu qua phu thuoc vao viec chon t~p mauhuan luyen. Trong thuc te, dir lieu nghiep vu duoc hru trir rat da dang va phirc tap cho nen chontot be dir lieu mau con gEj,pnhieu kho khan. Neu chung ta chon bo mau khong oEj,ctrung thl cayquyet dinh diroc sinh ra S8 khong co kha nang dir doan cao. Trong bai viet nay, chung toi phan tichva aa chi ra mot each chon t~p mau huan luyen tot tir crydir lieu nghiep V tir do dira vao thuatsatoan hoc ae tao dung cay quyet dinh co kha nang du doan cao, nharn ho tro ra quyet dinh trongcac bai toan phan tich dir lieu. Ket qua aa diroc kiern tra tren thirc nghiern va aa chirng to tinhhieu qua cua thuat toano1. GH1I TRIEUSir phan lap la mot qua trinh quan trong trong khai pha dir lieu, n6 chinh la viec di timnhirng dac tinh cua doi tirong nharn mo ta mot each ro rang pham tru ma cac doi tirongthuoc ve mot lap nao do [1,2,4,5,9]. Khi da tlm diroc cac d~c tinh mo ta mau dir lieu khaipha thi cay quyet dinh la mot mo hinh true quan va hiru hieu de mo ta, Tren cay quyet318DoANVAN BAN, LE MANH THANH, LE VAN TUONGLANdedinh, clning ta de dang duyet cay de tim ra cac luat. Cac luat nay cho chung ta thong tingiai quyet mot van de nao d6 tire la cho chung ta tri thirc ve Iinh vue din nghien ciru. Docay quyet dinh rat hiru dung nen da c6 nhieu nghien ciru de xay dung n6 ma noi b~t la cacthuat toan h9C quy nap nhir CLS, ID3, C45, ... [7, 9,11,12,13,15]voi dQ phirc t9-P thuat toanla O( m x n x log n), trong do m la so thuoc tinh, n la so the hien cua tap huan luyen.Vi~c xay dung mot cay quyet dinh c6 hieu qua phu thuoc vao viec chon t~p mau huanluyen. Trong thirc te, dir lieu nghiep vu nit da dang VI chung diroc hru trir de phuc vu nhieucong viec khac nhau, nhieu thuoc tinh cung cap cac thong tin c6 kha nang dir doan su viecnhirng cling c6 nhieu thuoc tinh khong c6 kha nang phan anh thong tin dir doan ma chi co ynghia hru trir, thong ke binh thirong. Bieu nay gay kh6 khan cho chung ta khi chon tot tapmau huan luyen de xay dung cay.Cho bang dir lieu DIEUTRA hru trir ve tinh hinh mua may tinh cua khach hang tai motcong ty nhir Bang 1, can chon rnau huan luyen de xay dung cay quyet dinh cho viec dtr deankhach hang mua may hay khong.Bang 1. Bang dir lieu DIEUTRAS6PhieuBTM01045M01087M02043M02081H9VaTimS6CMNDNai S6ngCong ViecNguyen Van AnLe Van BlnhNguyen Thj HoaTdin Blnh193567450191568422196986568191003117CNVCCNVCSvCNTTHSSVM02046M03087M03025M03017M04036M04037M04042M04083M05041M05080Tran Thi H irongNguyen Thj La.iVU Tuan HoaLe Ba Linh......196001278198235457198875584191098234196224003196678578197543457192267457198234309196679345...T.Ph6N6ngTh6nT.Ph6T.Ph6T.Ph6B~ch AnLy Thj HoaVU Quang BlnhNguyen HoaLe Xuan HoaTran Que ChungNongTh6nN6ngTh6nT.Ph6T.Ph6T.Ph6NongTh6nN6ngTh6nT.PhONongThonHSSVHSSVSvCNTTCNVCCNVCHSSVCNVCSvCNTTSvCNTTHSSV......S6NglIaiGBNhieuNhieuNhieuTrung bmhIhul[hapGB45405234MuaMayKh6ngKh6ngCoCoItItIt50606535605060405550CoKh6ng......TrungbinhItTrungTrungTrungNhieuTrung...binhbinhbinhbinhCoKh6ngCoCoCoCoCoKh6ngGia str ta chon tap M; = (NaiSong, CongVi~c, SoNguaiGB, ThuNh~pGB, Mua may)gorn cac ban ghi tren Bang 1 de lam mau huan luyen cho viec xay dung cay. Luc nay cayquyet dinh thu dUQC Hinh 1 c6 su phan chia tai nut ThulvhapCf) rat Ian. Tren cay Hmh1, hrong thong tin thu duoc khong co dong, rat kh6 du doan.aa--Nong than~IKhOng~---muall Mua may IHinh 1. Cay quyet dinh cua mau huan luyen MlMOT CACH CHQN MAU HUAN LUY¢N V A THU;\TToANHQC319Chang han ta din dir doan trirong hop sau co mua may hay khong?H9VaTen = Nguyen Van B, CongViec = CNVC,ThuNh~pGB=49, NOiSong=Nong thon(1)Nlnr v ...

Tài liệu được xem nhiều:

Gợi ý tài liệu liên quan: