Luận văn thạc sĩ: Ứng dụng khai phá dữ liệu dự toán khách hàng rời mạng viễn thông
Số trang: 26
Loại file: pdf
Dung lượng: 392.11 KB
Lượt xem: 13
Lượt tải: 0
Xem trước 3 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Ứng dụng khai phá dữ liệu dự toán khách hàng rời mạng viễn thông nghiên cứu các kỹ thuật khai phá dữ liệu , lựa chọn mô hình, ứng dụng cho bài toán, tìm hiểu công cụ triển khai ứng dụng khai phá dữ liệu.
Nội dung trích xuất từ tài liệu:
Luận văn thạc sĩ: Ứng dụng khai phá dữ liệu dự toán khách hàng rời mạng viễn thông -1- B GIÁO D C VÀ ĐÀO T O Đ I H C ĐÀ N NG NGUY N MINH TÂN NG D NG KHAI PHÁ D LI U D ĐOÁN KHÁCH HÀNG R I M NG VI N THÔNG Chuyên ngành: KHOA H C MÁY TÍNH Mã s : 60.48.01 TÓM T T LU N VĂN TH C SĨ K THU T Đà N ng - Năm 2011 -2- Công trình ñư c hoàn thành t i Đ I H C ĐÀ N NG Ngư i hư ng d n khoa h c: PGS.TS. Võ Trung Hùng Ph n bi n 1: Ph n bi n 2: Lu n văn s ñư c b o v trư c H i ñ ng ch m Lu n văn t t nghi p th c sĩ k thu t h p t i Đ i h c Đà N ng vào ngày tháng năm 2011 Có th tìm hi u lu n văn t i: - Trung tâm Thông tin - H c li u, Đ i h c Đà N ng - Trung tâm H c li u, Đ i h c Đà N ng. -3- M Đ U 1. Lý do ch n ñ tài V i s bùng n và phát tri n c a công ngh thông tin ñã mang l i nhi u hi u qu ñ i v i khoa h c cũng như các ho t ñ ng th c t , trong ñó khai phá d li u là m t lĩnh v c mang l i hi u qu thi t th c cho con ngư i. Khai phá d li u ñã giúp ngư i s d ng thu ñư c nh ng tri th c h u ích t nh ng cơ s d li u ho c các kho d li u kh ng l khác. Cơ s d li u trong các ñơn v , t ch c kinh doanh, qu n lý khoa h c ch a ñ ng nhi u thông tin ti m n, phong phú và ña d ng, ñòi h i ph i có nh ng phương pháp nhanh, phù h p, chính xác, hi u qu ñ l y ñư c nh ng thông tin b ích. Nh ng “ tri th c ” chi t su t t ngu n cơ s d li u trên s là ngu n thông tin h tr cho lãnh ñ o trong vi c lên k ho ch ho t ñ ng ho c trong vi c ra quy t ñ nh s n xu t kinh doanh. Ti n hành công vi c như v y chính là th c hi n quá trình phát hi n tri th c trong cơ s d li u (Knowledge Discovery in Database) mà trong ñó k thu t khai phá d li u (Data Mining) cho phép phát hi n nh ng tri th c ti m n. Đ l y ñư c thông tin mang tính tri th c trong kh i d li u kh ng l , c n thi t ph i phát tri n các k thu t có kh năng tích h p các d li u t các h th ng giao d ch khác nhau, chuy n chúng thành m t t p h p các cơ s d li u n ñ nh có ch t lư ng. M t trong các n i dung cơ b n nh t trong khai phá d li u và r t ph bi n là k thu t gom c m. Phương pháp này nh m tìm ra các t p thu c tính thư ng xu t hi n ñ ng th i trong cơ s d li u và rút ra các lu t v nh hư ng c a m t t p thu c tính d n ñ n s xu t hi n c a m t (ho c m t t p) thu c tính khác như th nào. ng d ng -4- khai phá d li u ñã mang l i nh ng l i ích to l n trong vi c t ng h p và cung c p nh ng thông tin trong các ngu n cơ s d li u l n. EVNTelecom là m t nhà cung c p d ch v vi n thông m i trên th trư ng Vi t Nam. Chính th c cung c p d ch v vi n thông công c ng t cu i năm 2005, ñ n cu i năm 2007 ñã phát tri n ñư c hai tri u khách hàng. Đ n tháng 6 năm 2008, s lư ng khách hàng phát ñư c con s b n tri u. Tuy nhiên tình hình tr nên x u ñi khi các nhà cung c p ào t khuy n mãi và có nhi u ñ t ñ i h giá. K t qu là có nhi u khách hàng r i m ng chuy n sang s d ng d ch v c a nhà cung c p khác, doanh thu ngày m t gi m, khó thu h i v n ñ u tư. Đ phát tri n ñư c khách hàng, EVNTelecom ph i ñ u tư g n ba tri u ñ ng bao g m chi phí phát tri n khách hàng, ñ u tư h th ng và thi t b ñ u cu i. Trong khi ñó ARPU là 80.000 ñ ng và vòng ñ i trung bình c a khách hành là 20 tháng. Như v y m i khách hàng r i m ng s m t ñi 1.4 tri u ñ ng. Con s thi t h i s r t l n khi có hàng trăm ngàn khách hàng r i m ng m i năm. Trong b i c nh ñó ñ ng th i ñư c s ñ ng ý c a Th y PGS.TS Võ Trung Hùng, tác gi ch n ñ tài “ ng d ng khai phá d li u d ñoán khách hàng r i m ng vi n thông” cho lu n văn t t nghi p c a mình. Bài toán t p trung tìm phương pháp s d ng công c khai phá d li u ñ d ñoán ñư c nh ng khách hàng nào nguy cơ r i m ng cao ñ có bi n pháp gi khách hàng l i. Vi c tri n khai bài toán có ý nghĩa th i s cao, nh t là ñ i v i EVNTelecom trong hoàn c nh này. 2. M c tiêu c a ñ tài M c tiêu c a ñ tài là nghiên c u ng d ng các k thu t khai phá d li u trong công tác d báo khách hàng r i m ng. D a trên kho d li u tích lu trong nh ng năm g n ñây ñ làm d li u hu n -5- luy n, tính toán d báo khách hàng r i m ng. Th c hi n ñánh giá k t qu d ñoán trên cơ s các m u d li u trích ra t d li u thu th p. 3. N i dung tri n khai Đ gi i quy t bài toán d báo khách hàng r i m ng, lu n văn ti n hành nghiên c u các k thu t khai phá d li u, l a ch n mô hình ng d ng cho bài toán, tìm hi u công c tri n khai ng d ng khai phá d li u. Bư c ti p theo s t ch c thu th p d li u t các b ph n: qu n lý khách hàng, b ph n tính cư c, b ph n qu n lý n và chăm sóc khách hàng. Th c hi n xây d ng cơ s d li u trên h qu n tr cơ s d li u SQL Server 2005. Ti n hành l c, phân tích và n p d li u chu n b khai khoáng. Bư c k ti p th c hi n nghiên c u xây d ng mô hình gi i quy t bài toán. Trư c h t s ti n hành xây d ng mô hình gom c m ñ phân khách hàng thành 5 c m d a theo các tiêu chí danh sách d ch v ñang s d ng, m c ñ trung thành, doanh thu hàng tháng, quá trình thanh toán cư c d ch v và quá trình chăm sóc khách hàng. Sau ñó xây d ng cây quy t ñ nh d ñoán khách hàng r i m ng cho t ng c m. Th c hi n ki m tra mô hình trên 15% lư ng khách hàng r i m ng. Đây là m t quá trình l p ñ l a ch n mô hình h u ích nh t. Bư c cu i cùng th c hi n d ñoán kh năng khách hàng r i m ng cho lư ng khách hàng ñang ho t ñ ng. Trong quá trình tri n khai lu n văn, tôi ti n hành tìm hi u cơ s lý thuy t c a thu t toán cây quy t ñ nh và thu t toán gom c m – hai thu t toán s ñư c s d ng trong mô hình ng d ng d ñoán. Đ ng th i cũng s ti n hành nghiên c u các công c khai phá d li u c a Microsoft SQL Server 2005 ñ làm công c tri n khai mô hình. -6- 4. B c c c a lu n văn Ngoài ph n m ñ u và k t lu n, trong lu n văn tôi ñ c p ñ n các n i dung chính sau: Chương 1: Nghiên c u t ng quan v kho d li u, mô hình t ng quát v k thu t ...
Nội dung trích xuất từ tài liệu:
Luận văn thạc sĩ: Ứng dụng khai phá dữ liệu dự toán khách hàng rời mạng viễn thông -1- B GIÁO D C VÀ ĐÀO T O Đ I H C ĐÀ N NG NGUY N MINH TÂN NG D NG KHAI PHÁ D LI U D ĐOÁN KHÁCH HÀNG R I M NG VI N THÔNG Chuyên ngành: KHOA H C MÁY TÍNH Mã s : 60.48.01 TÓM T T LU N VĂN TH C SĨ K THU T Đà N ng - Năm 2011 -2- Công trình ñư c hoàn thành t i Đ I H C ĐÀ N NG Ngư i hư ng d n khoa h c: PGS.TS. Võ Trung Hùng Ph n bi n 1: Ph n bi n 2: Lu n văn s ñư c b o v trư c H i ñ ng ch m Lu n văn t t nghi p th c sĩ k thu t h p t i Đ i h c Đà N ng vào ngày tháng năm 2011 Có th tìm hi u lu n văn t i: - Trung tâm Thông tin - H c li u, Đ i h c Đà N ng - Trung tâm H c li u, Đ i h c Đà N ng. -3- M Đ U 1. Lý do ch n ñ tài V i s bùng n và phát tri n c a công ngh thông tin ñã mang l i nhi u hi u qu ñ i v i khoa h c cũng như các ho t ñ ng th c t , trong ñó khai phá d li u là m t lĩnh v c mang l i hi u qu thi t th c cho con ngư i. Khai phá d li u ñã giúp ngư i s d ng thu ñư c nh ng tri th c h u ích t nh ng cơ s d li u ho c các kho d li u kh ng l khác. Cơ s d li u trong các ñơn v , t ch c kinh doanh, qu n lý khoa h c ch a ñ ng nhi u thông tin ti m n, phong phú và ña d ng, ñòi h i ph i có nh ng phương pháp nhanh, phù h p, chính xác, hi u qu ñ l y ñư c nh ng thông tin b ích. Nh ng “ tri th c ” chi t su t t ngu n cơ s d li u trên s là ngu n thông tin h tr cho lãnh ñ o trong vi c lên k ho ch ho t ñ ng ho c trong vi c ra quy t ñ nh s n xu t kinh doanh. Ti n hành công vi c như v y chính là th c hi n quá trình phát hi n tri th c trong cơ s d li u (Knowledge Discovery in Database) mà trong ñó k thu t khai phá d li u (Data Mining) cho phép phát hi n nh ng tri th c ti m n. Đ l y ñư c thông tin mang tính tri th c trong kh i d li u kh ng l , c n thi t ph i phát tri n các k thu t có kh năng tích h p các d li u t các h th ng giao d ch khác nhau, chuy n chúng thành m t t p h p các cơ s d li u n ñ nh có ch t lư ng. M t trong các n i dung cơ b n nh t trong khai phá d li u và r t ph bi n là k thu t gom c m. Phương pháp này nh m tìm ra các t p thu c tính thư ng xu t hi n ñ ng th i trong cơ s d li u và rút ra các lu t v nh hư ng c a m t t p thu c tính d n ñ n s xu t hi n c a m t (ho c m t t p) thu c tính khác như th nào. ng d ng -4- khai phá d li u ñã mang l i nh ng l i ích to l n trong vi c t ng h p và cung c p nh ng thông tin trong các ngu n cơ s d li u l n. EVNTelecom là m t nhà cung c p d ch v vi n thông m i trên th trư ng Vi t Nam. Chính th c cung c p d ch v vi n thông công c ng t cu i năm 2005, ñ n cu i năm 2007 ñã phát tri n ñư c hai tri u khách hàng. Đ n tháng 6 năm 2008, s lư ng khách hàng phát ñư c con s b n tri u. Tuy nhiên tình hình tr nên x u ñi khi các nhà cung c p ào t khuy n mãi và có nhi u ñ t ñ i h giá. K t qu là có nhi u khách hàng r i m ng chuy n sang s d ng d ch v c a nhà cung c p khác, doanh thu ngày m t gi m, khó thu h i v n ñ u tư. Đ phát tri n ñư c khách hàng, EVNTelecom ph i ñ u tư g n ba tri u ñ ng bao g m chi phí phát tri n khách hàng, ñ u tư h th ng và thi t b ñ u cu i. Trong khi ñó ARPU là 80.000 ñ ng và vòng ñ i trung bình c a khách hành là 20 tháng. Như v y m i khách hàng r i m ng s m t ñi 1.4 tri u ñ ng. Con s thi t h i s r t l n khi có hàng trăm ngàn khách hàng r i m ng m i năm. Trong b i c nh ñó ñ ng th i ñư c s ñ ng ý c a Th y PGS.TS Võ Trung Hùng, tác gi ch n ñ tài “ ng d ng khai phá d li u d ñoán khách hàng r i m ng vi n thông” cho lu n văn t t nghi p c a mình. Bài toán t p trung tìm phương pháp s d ng công c khai phá d li u ñ d ñoán ñư c nh ng khách hàng nào nguy cơ r i m ng cao ñ có bi n pháp gi khách hàng l i. Vi c tri n khai bài toán có ý nghĩa th i s cao, nh t là ñ i v i EVNTelecom trong hoàn c nh này. 2. M c tiêu c a ñ tài M c tiêu c a ñ tài là nghiên c u ng d ng các k thu t khai phá d li u trong công tác d báo khách hàng r i m ng. D a trên kho d li u tích lu trong nh ng năm g n ñây ñ làm d li u hu n -5- luy n, tính toán d báo khách hàng r i m ng. Th c hi n ñánh giá k t qu d ñoán trên cơ s các m u d li u trích ra t d li u thu th p. 3. N i dung tri n khai Đ gi i quy t bài toán d báo khách hàng r i m ng, lu n văn ti n hành nghiên c u các k thu t khai phá d li u, l a ch n mô hình ng d ng cho bài toán, tìm hi u công c tri n khai ng d ng khai phá d li u. Bư c ti p theo s t ch c thu th p d li u t các b ph n: qu n lý khách hàng, b ph n tính cư c, b ph n qu n lý n và chăm sóc khách hàng. Th c hi n xây d ng cơ s d li u trên h qu n tr cơ s d li u SQL Server 2005. Ti n hành l c, phân tích và n p d li u chu n b khai khoáng. Bư c k ti p th c hi n nghiên c u xây d ng mô hình gi i quy t bài toán. Trư c h t s ti n hành xây d ng mô hình gom c m ñ phân khách hàng thành 5 c m d a theo các tiêu chí danh sách d ch v ñang s d ng, m c ñ trung thành, doanh thu hàng tháng, quá trình thanh toán cư c d ch v và quá trình chăm sóc khách hàng. Sau ñó xây d ng cây quy t ñ nh d ñoán khách hàng r i m ng cho t ng c m. Th c hi n ki m tra mô hình trên 15% lư ng khách hàng r i m ng. Đây là m t quá trình l p ñ l a ch n mô hình h u ích nh t. Bư c cu i cùng th c hi n d ñoán kh năng khách hàng r i m ng cho lư ng khách hàng ñang ho t ñ ng. Trong quá trình tri n khai lu n văn, tôi ti n hành tìm hi u cơ s lý thuy t c a thu t toán cây quy t ñ nh và thu t toán gom c m – hai thu t toán s ñư c s d ng trong mô hình ng d ng d ñoán. Đ ng th i cũng s ti n hành nghiên c u các công c khai phá d li u c a Microsoft SQL Server 2005 ñ làm công c tri n khai mô hình. -6- 4. B c c c a lu n văn Ngoài ph n m ñ u và k t lu n, trong lu n văn tôi ñ c p ñ n các n i dung chính sau: Chương 1: Nghiên c u t ng quan v kho d li u, mô hình t ng quát v k thu t ...
Tìm kiếm theo từ khóa liên quan:
Khai phá dữ liệu Lý thuyết khai phá dữ liệu Thực hành khai phá dữ liệu Ứng dụng khai phá dữ liệu Dự toán khách hàng rời Mạng viễn thông Luận văn thạc sĩ Luận văn thạc sĩ kỹ thuậtGợi ý tài liệu liên quan:
-
Luận văn Thạc sĩ Kinh tế: Quản trị chất lượng dịch vụ khách sạn Mường Thanh Xa La
136 trang 357 5 0 -
Bài tập lớn môn Khai phá dữ liệu: Phân lớp dữ liệu số bằng giải thuật K-NN
22 trang 349 1 0 -
24 trang 348 1 0
-
97 trang 309 0 0
-
Luận văn Thạc sĩ Khoa học máy tính: Tìm hiểu xây dựng thuật toán giấu tin mật và ứng dụng
76 trang 296 0 0 -
97 trang 266 0 0
-
115 trang 254 0 0
-
155 trang 249 0 0
-
64 trang 238 0 0
-
26 trang 235 0 0