Danh mục

Luận văn: Xây dựng ứng dụng thu thập dữ liệu tự động từ các Website

Số trang: 102      Loại file: pdf      Dung lượng: 22.17 MB      Lượt xem: 17      Lượt tải: 0    
tailieu_vip

Xem trước 10 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Với sự bùng nổ về công nghệ thông tin những năm gần đây, đặc biệt là sự phát triểnmạnh mẽ như vũ bão của Internet, cuộc sống của con người đã càng ngày càng trở nên phongphú và đa dạng hơn. Kho tàng tri thức của Internet đã làm thay đổi đáng kể nhiều lĩnh vực, từhọc tập, nghiên cứu cho đến kinh doanh và thương mại. Tuy nhiên con người vẫn không dừnglại, họ luôn có những khát khao tìm tòi và phát triển, đặc biệt là đối với chiếc máy tính. Chiếcmáy tính cá nhân đã được ra...
Nội dung trích xuất từ tài liệu:
Luận văn: Xây dựng ứng dụng thu thập dữ liệu tự động từ các Website ĐẠI HỌC QUỐC GIA TP.HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA KHOA KHOA HỌC & KỸ THUẬT MÁY TÍNH LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC Xây dựng ứng dụng thu thậpdữ liệu tự động từ các Website HỘI ĐỒNG: TS. Võ Thị Ngọc Châu GVHD: ThS. Đặng Trần Trí GVPB: ThS. Nguyễn Văn Đoàn ---o0o--- SVTH 1: Nguyễn Trung Kiên 50501352 SVTH 2: Lê Quang Minh 50501668 TP. HỒ CHÍ MINH, 1/2009Luận văn tốt nghiệp Xây d ựng ứng dụng thu thập dữ liệu web tự động LỜI CAM ĐOAN “Chúng tôi cam đoan rằng, ngoại trừ các kết quả tham khảo từ các công trình khác nhưđã ghi rõ trong luận văn, các công việc trình bày trong lu ận văn này là do chính chúng tôi thựchiện và chưa có phần nội dung nào của luận văn này được nộp để lấy một bằng cấp ở trườngnày ho ặc trường khác”. Nguyễn Trung Kiên Lê Quang MinhNguyen Trung Kien Trang 2Luận văn tốt nghiệp Xây d ựng ứng dụng thu thập dữ liệu web tự động LỜI C ẢM ƠN Sau khoảng thời gian được học tập và rèn luyện tại trường Đại Học Bách KhoaTP.HCM, dưới sự chỉ bảo tận tình của các thầy cô trong các phòng khoa, nay chúng em đ ãgần mãn khoá học, đang trong giai đoạn ho àn thành luận văn tốt nghiệp và sắp sửa trở thànhmột người kỹ sư công nghệ thông tin có thể góp sức xây dựng cho sự phát triển xã hội, đấtnước. Để đ ược như ngày hôm nay chúng em vô cùng biết ơn tất cả các thầy cô trong KhoaKhoa Học và K ỹ Thuật Máy Tính đã tận tình giảng dạy, hướng dẫn, truyền đạt những kiếnthức, kinh nghiệm quý báu cho chúng em trong khoảng thời gian đ ược học tập, rèn luyện tạitrường. Thầy ThS. Đặng Trần Trí, người đã tận tình hướng dẫn, định hướng, giúp đỡ và chỉdạy chúng em rất nhiều trong suốt quá trình thực hiện luận văn tốt nghiệp. Các anh chị emsinh viên các khoá đã cùng chúng em học tập và chia sẻ kiến thức tiếp thu trong quá trình theohọc tại trường. Đồng thời chúng em cũng xin gửi lời cảm ơn đến cha mẹ, anh chị, bạn b ènhững người luôn đứng bên cạnh chúng em để động viên, an ủi, ủng hộ về vật chất lẫn tinhthần trong suốt khoảng thời gian qua. Với lòng biết ơn chân thành, chúng em xin gởi lời chúc sức khoẻ và những gì tốt đẹpnhất đến các thầy cô trong khoa, trong nhà trường, những bậc cha mẹ, anh chị đáng kính vàtoàn thể các bạn bè hiện đang còn học hoặc không còn học tại trường Đại Học Bách KhoaTP.HCM.. Nguyễn Trung Kiên và Lê Quang MinhNguyen Trung Kien Trang 3Luận văn tốt nghiệp Xây d ựng ứng dụng thu thập dữ liệu web tự động TÓM T ẮT LUẬN VĂN Với sự bùng nổ về công nghệ thông tin những năm gần đây, đặc biệt là sự phát triểnmạnh mẽ như vũ bão của Internet, cuộc sống của con người đã càng ngày càng trở nên phongphú và đa d ạng hơn. Kho tàng tri thức của Internet đã làm thay đổi đáng kể nhiều lĩnh vực, từhọc tập, nghiên cứu cho đến kinh doanh và thương mại. Tuy nhiên con người vẫn không dừnglại, họ luôn có những khát khao tìm tòi và phát triển, đặc biệt là đ ối với chiếc máy tính. Chiếcmáy tính cá nhân đ ã đ ược ra đời để trợ giúp cho con người, và họ vẫn luôn tìm cách làm chonó có thể hỗ trợ đ ược cho con người nhiều hơn nữa, thậm chí là làm thay cho con người. Trong thực tế hiện nay, lượng thông tin trên Internet càng ngày càng khổng lồ, điều nàykhiến việc sử dụng World Wide Web để khai thác thông tin hữu ích, phục vụ cho các mụcđích cá nhân luôn có những khó khăn nhất định của nó. Nhất là đối với những mục đích đ òihỏ i phải có sự thu thập thông tin với khối lượng lớn trên Web, chẳng hạn một công ty quảngcáo muốn thu thập thật nhiều thông tin liên lạc của các doanh nghiệp trong nhiều lĩnh vực đểgửi thư quảng cáo. Những công việc như thế này nếu được thực hiện thủ công bằng sức ngườithì sẽ mất rất nhiều thời gian, công sức, và chúng cũng khá tẻ nhạt do tính chất phải lặp đi lặpmột vài thao tác của việc thu thập dữ liệu. Đề tài Luận Văn Tốt Nghiệp này sẽ cố gắng giải quyết vấn đề nêu trên, bằng cách xâydựng một công cụ hỗ trợ có khả năng giúp con người trong những b ài toán thu thập dữ liệu,một cách tự động. Công cụ sẽ cố gắng làm thay cho con người ở một số công đoạn, giúp giảmthời gian và sức lực của con người trong việc thu thập dữ liệu từ các website. Ý tưởng nàynếu thành công sẽ đem lại được rất nhiều lợi ích vì nhu cầu thu thập dữ liệu trên web hiện nayđã trở thành một nhu cầu rất phổ biến và thiết thực.Nguyen Trung Kien ...

Tài liệu được xem nhiều: