Luận văn: Xây dựng ứng dụng thu thập dữ liệu tự động từ các Website
Số trang: 102
Loại file: pdf
Dung lượng: 22.17 MB
Lượt xem: 17
Lượt tải: 0
Xem trước 10 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Với sự bùng nổ về công nghệ thông tin những năm gần đây, đặc biệt là sự phát triểnmạnh mẽ như vũ bão của Internet, cuộc sống của con người đã càng ngày càng trở nên phongphú và đa dạng hơn. Kho tàng tri thức của Internet đã làm thay đổi đáng kể nhiều lĩnh vực, từhọc tập, nghiên cứu cho đến kinh doanh và thương mại. Tuy nhiên con người vẫn không dừnglại, họ luôn có những khát khao tìm tòi và phát triển, đặc biệt là đối với chiếc máy tính. Chiếcmáy tính cá nhân đã được ra...
Nội dung trích xuất từ tài liệu:
Luận văn: Xây dựng ứng dụng thu thập dữ liệu tự động từ các Website ĐẠI HỌC QUỐC GIA TP.HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA KHOA KHOA HỌC & KỸ THUẬT MÁY TÍNH LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC Xây dựng ứng dụng thu thậpdữ liệu tự động từ các Website HỘI ĐỒNG: TS. Võ Thị Ngọc Châu GVHD: ThS. Đặng Trần Trí GVPB: ThS. Nguyễn Văn Đoàn ---o0o--- SVTH 1: Nguyễn Trung Kiên 50501352 SVTH 2: Lê Quang Minh 50501668 TP. HỒ CHÍ MINH, 1/2009Luận văn tốt nghiệp Xây d ựng ứng dụng thu thập dữ liệu web tự động LỜI CAM ĐOAN “Chúng tôi cam đoan rằng, ngoại trừ các kết quả tham khảo từ các công trình khác nhưđã ghi rõ trong luận văn, các công việc trình bày trong lu ận văn này là do chính chúng tôi thựchiện và chưa có phần nội dung nào của luận văn này được nộp để lấy một bằng cấp ở trườngnày ho ặc trường khác”. Nguyễn Trung Kiên Lê Quang MinhNguyen Trung Kien Trang 2Luận văn tốt nghiệp Xây d ựng ứng dụng thu thập dữ liệu web tự động LỜI C ẢM ƠN Sau khoảng thời gian được học tập và rèn luyện tại trường Đại Học Bách KhoaTP.HCM, dưới sự chỉ bảo tận tình của các thầy cô trong các phòng khoa, nay chúng em đ ãgần mãn khoá học, đang trong giai đoạn ho àn thành luận văn tốt nghiệp và sắp sửa trở thànhmột người kỹ sư công nghệ thông tin có thể góp sức xây dựng cho sự phát triển xã hội, đấtnước. Để đ ược như ngày hôm nay chúng em vô cùng biết ơn tất cả các thầy cô trong KhoaKhoa Học và K ỹ Thuật Máy Tính đã tận tình giảng dạy, hướng dẫn, truyền đạt những kiếnthức, kinh nghiệm quý báu cho chúng em trong khoảng thời gian đ ược học tập, rèn luyện tạitrường. Thầy ThS. Đặng Trần Trí, người đã tận tình hướng dẫn, định hướng, giúp đỡ và chỉdạy chúng em rất nhiều trong suốt quá trình thực hiện luận văn tốt nghiệp. Các anh chị emsinh viên các khoá đã cùng chúng em học tập và chia sẻ kiến thức tiếp thu trong quá trình theohọc tại trường. Đồng thời chúng em cũng xin gửi lời cảm ơn đến cha mẹ, anh chị, bạn b ènhững người luôn đứng bên cạnh chúng em để động viên, an ủi, ủng hộ về vật chất lẫn tinhthần trong suốt khoảng thời gian qua. Với lòng biết ơn chân thành, chúng em xin gởi lời chúc sức khoẻ và những gì tốt đẹpnhất đến các thầy cô trong khoa, trong nhà trường, những bậc cha mẹ, anh chị đáng kính vàtoàn thể các bạn bè hiện đang còn học hoặc không còn học tại trường Đại Học Bách KhoaTP.HCM.. Nguyễn Trung Kiên và Lê Quang MinhNguyen Trung Kien Trang 3Luận văn tốt nghiệp Xây d ựng ứng dụng thu thập dữ liệu web tự động TÓM T ẮT LUẬN VĂN Với sự bùng nổ về công nghệ thông tin những năm gần đây, đặc biệt là sự phát triểnmạnh mẽ như vũ bão của Internet, cuộc sống của con người đã càng ngày càng trở nên phongphú và đa d ạng hơn. Kho tàng tri thức của Internet đã làm thay đổi đáng kể nhiều lĩnh vực, từhọc tập, nghiên cứu cho đến kinh doanh và thương mại. Tuy nhiên con người vẫn không dừnglại, họ luôn có những khát khao tìm tòi và phát triển, đặc biệt là đ ối với chiếc máy tính. Chiếcmáy tính cá nhân đ ã đ ược ra đời để trợ giúp cho con người, và họ vẫn luôn tìm cách làm chonó có thể hỗ trợ đ ược cho con người nhiều hơn nữa, thậm chí là làm thay cho con người. Trong thực tế hiện nay, lượng thông tin trên Internet càng ngày càng khổng lồ, điều nàykhiến việc sử dụng World Wide Web để khai thác thông tin hữu ích, phục vụ cho các mụcđích cá nhân luôn có những khó khăn nhất định của nó. Nhất là đối với những mục đích đ òihỏ i phải có sự thu thập thông tin với khối lượng lớn trên Web, chẳng hạn một công ty quảngcáo muốn thu thập thật nhiều thông tin liên lạc của các doanh nghiệp trong nhiều lĩnh vực đểgửi thư quảng cáo. Những công việc như thế này nếu được thực hiện thủ công bằng sức ngườithì sẽ mất rất nhiều thời gian, công sức, và chúng cũng khá tẻ nhạt do tính chất phải lặp đi lặpmột vài thao tác của việc thu thập dữ liệu. Đề tài Luận Văn Tốt Nghiệp này sẽ cố gắng giải quyết vấn đề nêu trên, bằng cách xâydựng một công cụ hỗ trợ có khả năng giúp con người trong những b ài toán thu thập dữ liệu,một cách tự động. Công cụ sẽ cố gắng làm thay cho con người ở một số công đoạn, giúp giảmthời gian và sức lực của con người trong việc thu thập dữ liệu từ các website. Ý tưởng nàynếu thành công sẽ đem lại được rất nhiều lợi ích vì nhu cầu thu thập dữ liệu trên web hiện nayđã trở thành một nhu cầu rất phổ biến và thiết thực.Nguyen Trung Kien ...
Nội dung trích xuất từ tài liệu:
Luận văn: Xây dựng ứng dụng thu thập dữ liệu tự động từ các Website ĐẠI HỌC QUỐC GIA TP.HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA KHOA KHOA HỌC & KỸ THUẬT MÁY TÍNH LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC Xây dựng ứng dụng thu thậpdữ liệu tự động từ các Website HỘI ĐỒNG: TS. Võ Thị Ngọc Châu GVHD: ThS. Đặng Trần Trí GVPB: ThS. Nguyễn Văn Đoàn ---o0o--- SVTH 1: Nguyễn Trung Kiên 50501352 SVTH 2: Lê Quang Minh 50501668 TP. HỒ CHÍ MINH, 1/2009Luận văn tốt nghiệp Xây d ựng ứng dụng thu thập dữ liệu web tự động LỜI CAM ĐOAN “Chúng tôi cam đoan rằng, ngoại trừ các kết quả tham khảo từ các công trình khác nhưđã ghi rõ trong luận văn, các công việc trình bày trong lu ận văn này là do chính chúng tôi thựchiện và chưa có phần nội dung nào của luận văn này được nộp để lấy một bằng cấp ở trườngnày ho ặc trường khác”. Nguyễn Trung Kiên Lê Quang MinhNguyen Trung Kien Trang 2Luận văn tốt nghiệp Xây d ựng ứng dụng thu thập dữ liệu web tự động LỜI C ẢM ƠN Sau khoảng thời gian được học tập và rèn luyện tại trường Đại Học Bách KhoaTP.HCM, dưới sự chỉ bảo tận tình của các thầy cô trong các phòng khoa, nay chúng em đ ãgần mãn khoá học, đang trong giai đoạn ho àn thành luận văn tốt nghiệp và sắp sửa trở thànhmột người kỹ sư công nghệ thông tin có thể góp sức xây dựng cho sự phát triển xã hội, đấtnước. Để đ ược như ngày hôm nay chúng em vô cùng biết ơn tất cả các thầy cô trong KhoaKhoa Học và K ỹ Thuật Máy Tính đã tận tình giảng dạy, hướng dẫn, truyền đạt những kiếnthức, kinh nghiệm quý báu cho chúng em trong khoảng thời gian đ ược học tập, rèn luyện tạitrường. Thầy ThS. Đặng Trần Trí, người đã tận tình hướng dẫn, định hướng, giúp đỡ và chỉdạy chúng em rất nhiều trong suốt quá trình thực hiện luận văn tốt nghiệp. Các anh chị emsinh viên các khoá đã cùng chúng em học tập và chia sẻ kiến thức tiếp thu trong quá trình theohọc tại trường. Đồng thời chúng em cũng xin gửi lời cảm ơn đến cha mẹ, anh chị, bạn b ènhững người luôn đứng bên cạnh chúng em để động viên, an ủi, ủng hộ về vật chất lẫn tinhthần trong suốt khoảng thời gian qua. Với lòng biết ơn chân thành, chúng em xin gởi lời chúc sức khoẻ và những gì tốt đẹpnhất đến các thầy cô trong khoa, trong nhà trường, những bậc cha mẹ, anh chị đáng kính vàtoàn thể các bạn bè hiện đang còn học hoặc không còn học tại trường Đại Học Bách KhoaTP.HCM.. Nguyễn Trung Kiên và Lê Quang MinhNguyen Trung Kien Trang 3Luận văn tốt nghiệp Xây d ựng ứng dụng thu thập dữ liệu web tự động TÓM T ẮT LUẬN VĂN Với sự bùng nổ về công nghệ thông tin những năm gần đây, đặc biệt là sự phát triểnmạnh mẽ như vũ bão của Internet, cuộc sống của con người đã càng ngày càng trở nên phongphú và đa d ạng hơn. Kho tàng tri thức của Internet đã làm thay đổi đáng kể nhiều lĩnh vực, từhọc tập, nghiên cứu cho đến kinh doanh và thương mại. Tuy nhiên con người vẫn không dừnglại, họ luôn có những khát khao tìm tòi và phát triển, đặc biệt là đ ối với chiếc máy tính. Chiếcmáy tính cá nhân đ ã đ ược ra đời để trợ giúp cho con người, và họ vẫn luôn tìm cách làm chonó có thể hỗ trợ đ ược cho con người nhiều hơn nữa, thậm chí là làm thay cho con người. Trong thực tế hiện nay, lượng thông tin trên Internet càng ngày càng khổng lồ, điều nàykhiến việc sử dụng World Wide Web để khai thác thông tin hữu ích, phục vụ cho các mụcđích cá nhân luôn có những khó khăn nhất định của nó. Nhất là đối với những mục đích đ òihỏ i phải có sự thu thập thông tin với khối lượng lớn trên Web, chẳng hạn một công ty quảngcáo muốn thu thập thật nhiều thông tin liên lạc của các doanh nghiệp trong nhiều lĩnh vực đểgửi thư quảng cáo. Những công việc như thế này nếu được thực hiện thủ công bằng sức ngườithì sẽ mất rất nhiều thời gian, công sức, và chúng cũng khá tẻ nhạt do tính chất phải lặp đi lặpmột vài thao tác của việc thu thập dữ liệu. Đề tài Luận Văn Tốt Nghiệp này sẽ cố gắng giải quyết vấn đề nêu trên, bằng cách xâydựng một công cụ hỗ trợ có khả năng giúp con người trong những b ài toán thu thập dữ liệu,một cách tự động. Công cụ sẽ cố gắng làm thay cho con người ở một số công đoạn, giúp giảmthời gian và sức lực của con người trong việc thu thập dữ liệu từ các website. Ý tưởng nàynếu thành công sẽ đem lại được rất nhiều lợi ích vì nhu cầu thu thập dữ liệu trên web hiện nayđã trở thành một nhu cầu rất phổ biến và thiết thực.Nguyen Trung Kien ...
Tìm kiếm theo từ khóa liên quan:
luận văn thu thập dữ liệu dữ liệu tự động dữ liệu tử website thông tin Internet cấu trúc dữ liệuGợi ý tài liệu liên quan:
-
Đề cương chi tiết học phần Cấu trúc dữ liệu và giải thuật (Data structures and algorithms)
10 trang 307 0 0 -
Thảo luận đề tài: Mối quan hệ giữa đầu tư theo chiều rộng và đầu tư theo chiều sâu
98 trang 295 0 0 -
Luận văn: Thiết kế xây dựng bộ đếm xung, ứng dụng đo tốc độ động cơ trong hệ thống truyền động điện
63 trang 235 0 0 -
79 trang 218 0 0
-
Đồ án: Kỹ thuật xử lý ảnh sử dụng biến đổi Wavelet
41 trang 217 0 0 -
Tiểu luận: Phân tích chiến lược của Công ty Sữa Vinamilk
25 trang 209 0 0 -
LUẬN VĂN: TÌM HIỂU PHƯƠNG PHÁP HỌC TÍCH CỰC VÀ ỨNG DỤNG CHO BÀI TOÁN LỌC THƯ RÁC
65 trang 204 0 0 -
Báo cáo thực tập nhà máy đường Bến Tre
68 trang 202 0 0 -
BÀI THUYẾT TRÌNH CÔNG TY CỔ PHẦN
11 trang 197 0 0 -
Báo cáo bài tập môn học : phân tích thiết kế hệ thống
27 trang 197 0 0