Tóm tắt Luận án tiến sĩ Toán học: Nghiên cứu phát triển mô hình, thuật toán khai phá tập phần tử có trọng số và lợi ích cao
Số trang: 28
Loại file: docx
Dung lượng: 379.45 KB
Lượt xem: 15
Lượt tải: 0
Xem trước 3 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Mục đích của luận án nhằm nghiên cứu các thuật toán khai phá tập phổ biến, tập phổ biến có trọng số và tập lợi ích cao. Xây dựng mô hình, điều kiện, cấu trúc dữ liệu nhằm giảm không gian tìm kiếm và dựa trên cơ sở đó để xây dựng các thuật toán khai phá tập phổ biến có trọng số và tập lợi ích cao.
Nội dung trích xuất từ tài liệu:
Tóm tắt Luận án tiến sĩ Toán học: Nghiên cứu phát triển mô hình, thuật toán khai phá tập phần tử có trọng số và lợi ích cao MỞĐẦU Khaipháluậtkếthợplàmộttrongnhữngkỹ thuậtquan trọngnhấttrongkhaiphádữ liệu.Mụcđíchchínhcủakhaipháluậtkếthợplàtìmramốiquanhệgiữacácphầntửkhácnhautrongcơsởdữliệu.Bàitoánkhaiphátậpluậtkếthợp gồmhaibàitoánconđólàkhaiphátậpphổbiếnvàsinhluậtkếthợp.Trongđó,bàitoánkhaiphátậpphổbiếnđãthuhút đượcnhiềunhànghiêncứutrongnướcvàthếgiớiquantâm.Nhưngkhaiphátậpphổbiếntruyềnthốngtrongthựctếvẫncònnhiềuhạnchế,khôngđápứngđượcnhucầucủangườisử dụngnhưđánhgiásự quantrọngcủatừngphầntửtrong từnggiaodịchhaytrongcơsởdữliệu .Đểkhắcphụcnhữnghạnchế củakhaiphátậpphổ biếntruyềnthống,nhiềunhànghiêncứuđãđềxuấtmôhìnhmởrộng trongđócótínhđếnmứcđộquantrọngkhácnhaucủacácphầntửtrongcơsởdữliệunhư:khaiphátậpphổbiếncótrọngsố WFI;khaiphátậplợiíchcaoHUI. Mộttrongnhữngtháchthứctrongkhaiphátậpphổbiếncótrọngsốvàtậplợiíchcaođólàtậpphổbiếncótrọngsố,tập lợiíchcaokhôngcótínhchấtđóngtínhchấtlàmgiảmsốlượng ứngviênđượcsinhravàkhônggiantìmkiếm.Hầuhếtcácthuậttoánkhaiphátậplợiíchcaođềusử dụngtínhchấtđóngcủalợiíchtrọngsố giaodịch–TWUdoLiuvàcộngsựcôngbốnăm2005.Tuynhiên,ngưỡngTWUvẫncònkhácaosovớilợiíchthựctếcủacáctậpphầntử,dođóvẫncònphátsinhmộtsốlượnglớncácứngviênkhôngcầnthiết, dođótiêutốnthờigianvàkhônggiantìmkiếm. Trêncơsở nhữngnghiêncứu,nhậnxétvàđánhgiáởtrên,nghiêncứusinh đã chọnđề tài“Nghiêncứupháttriểnmô hình,thuậttoánkhaiphátập phầntử cótrọngsố vàlợi íchcao”làmđềtàinghiêncứucholuậnántiếnsĩcủamình. Mụctiêunghiêncứu Nghiêncứucácthuậttoánkhaiphátậpphổ biến, tậpphổbiếncótrọngsốvàtậplợiíchcao. Xâydựngmôhình,điềukiện,cấutrúcdữ liệunhằm giảmkhônggiantìmkiếmvàdựatrêncơ sở đóđể xâydựngcácthuậttoánkhaiphátậpphổbiếncótrọngsốvàtậplợiíchcao.Chương1.TỔNGQUANVỀKHAIPHÁTẬPPHỔBIẾN1.1. Giớithiệuchung Khaiphátậpphổbiếnlàtìmracáctậpphầntửcósốlầnxuấthiệnlớnhơnmộtngưỡnghỗ trợ tốithiểu(minsupp). Tuynhiên,khaiphátậpphổ biếncónhữnghạnchế.Thứnhất,nóxử lýtấtcả cácphầntử cótầmquantrọngnhưnhau.Thứ hai,trongmộtgiaodịchmỗiphầntửch ỉcótrạngtháixuấthiệnhoặckhôngxuấthiện.Rõràngnhữnghạnchếnày làm cho bài toán khai phá tập phổ biến truyền thống khôngphùhợpvớicáccơsởdữliệuthựctế,vídụnhưtrong cơ sở dữliệucủasiêuthị,mỗimặthàngcótầmquantrọng haygiácảkhácnhau,sốlượngmuacácmặthàngtrongmỗi giaodịchcũngkhácnhau,…Vìvậy,môhìnhkhaiphátậpphổbiếnchỉ phản ánhmốitươngquangiữacácphầntử xuất hiệntrongcơsởdữliệu,nhưngkhôngphảnánhýnghĩacủatừngphầntửdữliệu.Đểkhắcphụcnhữngnhượcđiểmtrêncóhaimôhìnhđượcđưara:TậpphổbiếncótrọngsốWFIvàTậplợiíchcaoHUI.1.2. Tậpphổbiến Khaiphátậpphổbiếnlàquátrìnhtìmkiếmtậpcácphần tử cósố lầnxuấthiệncùngnhaulớnhơnmộtngưỡngchotrướctrongcơsởdữliệulớnđượcR.Agrawal,T.ImielinskivàA.Swamiđềxuấtnăm1993,xuấtpháttừnhucầubàitoánphântíchdữliệutrongcơsởdữliệugiaodịch,để pháthiệncácmốiquanhệ giữacáctậphànghóađãbántạisiêuthị.Việcxácđịnhnàykhôngphânbiệtsự khácnhaugiữacáchànghóamàchỉdựavàosựxuấthiệncủachúng. Mộtsốphươngphápkhaiphátậpphổbiến: Phươngphápdựatrênquanhệkếtnối Phươngphápsửdụngcấutrúccây Phươngpháptăngtrưởngđệquydựatrênhậutố Mộtsốphươngphápsongsong1.3. Tậpphổbiếncótrọngsố Năm1998,nhómcủaRamkumarđãđưaramôhìnhkhaiphá tậpphổ biếncó trọngsố (WeightFrequentItemsets– WFI).Trongđó,mỗiphầntửcómộttrọngsốkhácnhaunhư:lợiích,giácả,độ quantrọnghaysố lượng,…Mộttậpcácphầntử làphổ biếncótrọngsố khigiátrị cótrọngsố củachúnglớnhơnmộtngưỡngchotrước.Dựatrênmôhìnhnàyđãcónhiềuthuậttoánkhaiphátậpphổ biếncótrọngsốđượccôngbố. Mộtsốphươngphápkhaiphátậpphổbiếncótrọngsố: Thuậttoándựatrênkhoảngtrọngsố Thuậttoánsửdụngbảngbăm Thuậttoándựatrêntrọngsốphổbiếnxấpxỉ ThuậttoándựatrêncâyWIT1.4. Đềxuấtthuậttoánkhaiphámẫuphổbiến cótrọng sốtheochiềudọc Dựatrênnhững ưuđiểmcủathuậttoánVMDGkhaiphátậpphổ biến,đề xuấtthuậttoánkhaiphátậpphổ biếncó trọngsố vớitêngọiVMWFP(VerticalMiningofWeightedFrequentPatterns ...
Nội dung trích xuất từ tài liệu:
Tóm tắt Luận án tiến sĩ Toán học: Nghiên cứu phát triển mô hình, thuật toán khai phá tập phần tử có trọng số và lợi ích cao MỞĐẦU Khaipháluậtkếthợplàmộttrongnhữngkỹ thuậtquan trọngnhấttrongkhaiphádữ liệu.Mụcđíchchínhcủakhaipháluậtkếthợplàtìmramốiquanhệgiữacácphầntửkhácnhautrongcơsởdữliệu.Bàitoánkhaiphátậpluậtkếthợp gồmhaibàitoánconđólàkhaiphátậpphổbiếnvàsinhluậtkếthợp.Trongđó,bàitoánkhaiphátậpphổbiếnđãthuhút đượcnhiềunhànghiêncứutrongnướcvàthếgiớiquantâm.Nhưngkhaiphátậpphổbiếntruyềnthốngtrongthựctếvẫncònnhiềuhạnchế,khôngđápứngđượcnhucầucủangườisử dụngnhưđánhgiásự quantrọngcủatừngphầntửtrong từnggiaodịchhaytrongcơsởdữliệu .Đểkhắcphụcnhữnghạnchế củakhaiphátậpphổ biếntruyềnthống,nhiềunhànghiêncứuđãđềxuấtmôhìnhmởrộng trongđócótínhđếnmứcđộquantrọngkhácnhaucủacácphầntửtrongcơsởdữliệunhư:khaiphátậpphổbiếncótrọngsố WFI;khaiphátậplợiíchcaoHUI. Mộttrongnhữngtháchthứctrongkhaiphátậpphổbiếncótrọngsốvàtậplợiíchcaođólàtậpphổbiếncótrọngsố,tập lợiíchcaokhôngcótínhchấtđóngtínhchấtlàmgiảmsốlượng ứngviênđượcsinhravàkhônggiantìmkiếm.Hầuhếtcácthuậttoánkhaiphátậplợiíchcaođềusử dụngtínhchấtđóngcủalợiíchtrọngsố giaodịch–TWUdoLiuvàcộngsựcôngbốnăm2005.Tuynhiên,ngưỡngTWUvẫncònkhácaosovớilợiíchthựctếcủacáctậpphầntử,dođóvẫncònphátsinhmộtsốlượnglớncácứngviênkhôngcầnthiết, dođótiêutốnthờigianvàkhônggiantìmkiếm. Trêncơsở nhữngnghiêncứu,nhậnxétvàđánhgiáởtrên,nghiêncứusinh đã chọnđề tài“Nghiêncứupháttriểnmô hình,thuậttoánkhaiphátập phầntử cótrọngsố vàlợi íchcao”làmđềtàinghiêncứucholuậnántiếnsĩcủamình. Mụctiêunghiêncứu Nghiêncứucácthuậttoánkhaiphátậpphổ biến, tậpphổbiếncótrọngsốvàtậplợiíchcao. Xâydựngmôhình,điềukiện,cấutrúcdữ liệunhằm giảmkhônggiantìmkiếmvàdựatrêncơ sở đóđể xâydựngcácthuậttoánkhaiphátậpphổbiếncótrọngsốvàtậplợiíchcao.Chương1.TỔNGQUANVỀKHAIPHÁTẬPPHỔBIẾN1.1. Giớithiệuchung Khaiphátậpphổbiếnlàtìmracáctậpphầntửcósốlầnxuấthiệnlớnhơnmộtngưỡnghỗ trợ tốithiểu(minsupp). Tuynhiên,khaiphátậpphổ biếncónhữnghạnchế.Thứnhất,nóxử lýtấtcả cácphầntử cótầmquantrọngnhưnhau.Thứ hai,trongmộtgiaodịchmỗiphầntửch ỉcótrạngtháixuấthiệnhoặckhôngxuấthiện.Rõràngnhữnghạnchếnày làm cho bài toán khai phá tập phổ biến truyền thống khôngphùhợpvớicáccơsởdữliệuthựctế,vídụnhưtrong cơ sở dữliệucủasiêuthị,mỗimặthàngcótầmquantrọng haygiácảkhácnhau,sốlượngmuacácmặthàngtrongmỗi giaodịchcũngkhácnhau,…Vìvậy,môhìnhkhaiphátậpphổbiếnchỉ phản ánhmốitươngquangiữacácphầntử xuất hiệntrongcơsởdữliệu,nhưngkhôngphảnánhýnghĩacủatừngphầntửdữliệu.Đểkhắcphụcnhữngnhượcđiểmtrêncóhaimôhìnhđượcđưara:TậpphổbiếncótrọngsốWFIvàTậplợiíchcaoHUI.1.2. Tậpphổbiến Khaiphátậpphổbiếnlàquátrìnhtìmkiếmtậpcácphần tử cósố lầnxuấthiệncùngnhaulớnhơnmộtngưỡngchotrướctrongcơsởdữliệulớnđượcR.Agrawal,T.ImielinskivàA.Swamiđềxuấtnăm1993,xuấtpháttừnhucầubàitoánphântíchdữliệutrongcơsởdữliệugiaodịch,để pháthiệncácmốiquanhệ giữacáctậphànghóađãbántạisiêuthị.Việcxácđịnhnàykhôngphânbiệtsự khácnhaugiữacáchànghóamàchỉdựavàosựxuấthiệncủachúng. Mộtsốphươngphápkhaiphátậpphổbiến: Phươngphápdựatrênquanhệkếtnối Phươngphápsửdụngcấutrúccây Phươngpháptăngtrưởngđệquydựatrênhậutố Mộtsốphươngphápsongsong1.3. Tậpphổbiếncótrọngsố Năm1998,nhómcủaRamkumarđãđưaramôhìnhkhaiphá tậpphổ biếncó trọngsố (WeightFrequentItemsets– WFI).Trongđó,mỗiphầntửcómộttrọngsốkhácnhaunhư:lợiích,giácả,độ quantrọnghaysố lượng,…Mộttậpcácphầntử làphổ biếncótrọngsố khigiátrị cótrọngsố củachúnglớnhơnmộtngưỡngchotrước.Dựatrênmôhìnhnàyđãcónhiềuthuậttoánkhaiphátậpphổ biếncótrọngsốđượccôngbố. Mộtsốphươngphápkhaiphátậpphổbiếncótrọngsố: Thuậttoándựatrênkhoảngtrọngsố Thuậttoánsửdụngbảngbăm Thuậttoándựatrêntrọngsốphổbiếnxấpxỉ ThuậttoándựatrêncâyWIT1.4. Đềxuấtthuậttoánkhaiphámẫuphổbiến cótrọng sốtheochiềudọc Dựatrênnhững ưuđiểmcủathuậttoánVMDGkhaiphátậpphổ biến,đề xuấtthuậttoánkhaiphátậpphổ biếncó trọngsố vớitêngọiVMWFP(VerticalMiningofWeightedFrequentPatterns ...
Tìm kiếm theo từ khóa liên quan:
Luận án tiến sĩ Luận án tiến sĩ Toán học Khai phá luật kết hợp Tập phổ biến Tập phổ biến có trọng số Khai phá tập phổ biếnGợi ý tài liệu liên quan:
-
205 trang 418 0 0
-
Luận án Tiến sĩ Tài chính - Ngân hàng: Phát triển tín dụng xanh tại ngân hàng thương mại Việt Nam
267 trang 379 1 0 -
174 trang 305 0 0
-
206 trang 299 2 0
-
228 trang 264 0 0
-
32 trang 214 0 0
-
Luận án tiến sĩ Ngữ văn: Dấu ấn tư duy đồng dao trong thơ thiếu nhi Việt Nam từ 1945 đến nay
193 trang 212 0 0 -
208 trang 202 0 0
-
27 trang 184 0 0
-
124 trang 175 0 0