Thông tin tài liệu:
Nguồn thông tin phong phú và hữu ích hiện đang được lưu trữ trên hàng tỷ web site trên mạng. Trong khi một website truyền thống chỉ hỗ trợ cho biểu diễn thông tin, thì việc tìm kiếm một ngôn ngữ có cấu trúc để biểu diễn các thông tin trên trang Web đang được đầu tư nghiên cứu. Mời các bạn cùng tham khảo.
Nội dung trích xuất từ tài liệu:
Tích hợp các cơ sở dữ liệu XMLTẠPCHÍKHOAHỌC,ĐạihọcHuế,Số22,2004 TÍCHHỢPCÁCCƠSỞDỮLIỆUXML LêThịThuThủy TrườngĐạihọcKhoahọc,ĐạihọcHuế ĐoànĐạiDương TrườngĐạihọcSưphạm,ĐạihọcHuế 1.GIỚITHIỆU Nguồnthôngtinphongphúvàhữuíchhiệnđangđượclưutrữtrênhàngtỷweb sitetrênmạng.Trongkhimộtwebsitetruyềnthốngchỉ hỗtrợchobiểudiễnthông tin,thìviệctìmkiếmmộtngônngữcócấutrúcđểbiểudiễncácthôngtintrêntrang Webđangđượcđầutư nghiêncứu.XML1(eXtensibleMarkupLanguage)xuấthiệnvànhanhchóngtrởthànhchuẩnchocácthế hệ webtrongtươnglai.Nócũnglànền tảngđểhìnhthànhmộtlớpcơsởdữliệu(CSDL)mới:CSDLXML[3,8]. Đểhỗtrợngườisửdụngtrongviệctìmvàsử dụngthôngtin,cácCSDLXML phântánđượctíchhợp,cungcấpmộtsựbiểudiễnduynhấttừcácCSDLXMLkhác nhauthamgiavàohệthống.MộthệthốngCSDLXMLtíchhợpsinhramộtlượcđồtoàncục(globalschema)chohệthống.Lượcđồnàylàsựthốngnhấtvàhòahợpcác lượcđồ cụcbộ (localschema)củacácnguồndữ liệuthamgiavàohệ thống.Nólà chìakhóahỗtrợchotấtcảcáctiếntrìnhcủahệthốngsaunày.Trêncơsởcủalược đồ tíchhợp,mộttậpcácánhxạ đếncácnguồncụcbộ đượctạorahỗ trợ choviệcxửlýcâutruyvấncủangườisửdụngnhư:táchcâutruyvấn,tíchhợpcácdữliệuthôtừ cácnguồn...,giúpngườisử dụnglấyđượcthôngtintíchhợpcầnthiếttừ hệthống,tiếtkiệmthờigianvàcôngsứccủangườisửdụng. Nhiềuhệ thốngtíchhợpđãvàđangđượcxâydựng[2,4,6],tuynhiêncáchệthốngnàyvẫncònnhiềuhạnchếtronggiảiquyếtxungđộtgiữacáclượcđồ [5]vàtíchhợpdữ liệu[3,7].Để khắcphụcnhữnghạnchế củanhữngnghiêncứutrên,chúngtôiđưaramộtkhunglàmviệc(framework)mớivề tíchhợpcácCSDLXML[3,7].Hệthốngmớinàyvừacókhảnăngtíchhợpcáclượcđồvừacóthểđưaracácquyếtđịnhxửlýcâutruyvấncủangườisửdụng.Đâylàmộttrongsốíthệthốngcó chiếnlượctíchhợpnlượcđồcụcbộmộtlần(oneshotstrategy)[2].Nócóthểgiảiquyếtcácxungđộtchínhbêntrongcáclượcđồtheohướngthốngnhất.Ngoàira,hệthốngcóthể táchcâutruyvấncủangườisử dụngtrênlượcđồ toàncụcthànhcáctruyvấnconcủatừngnguồncụcbộđồngthời.Đâylàmộtđiểmmớisovớicáchệ1 http://www.w3.org/TR/RECxml 45thốngđãđượcxâydựng[2,4,6].Một ưuđiểmnữacủahệ thốnglàdữ liệutừ cácnguồncụcbộ đượctíchhợpvàtrả về cácthôngtinthânthiệnvớingườisử dụng.NgônngữXDD(XMLDeclarativeDescription)[9]ngônngữmôtảkhaibáoXMLđượcsửdụnglàmnềntảngchotấtcảcácthànhphầncủahệthống. Phần2trìnhbàyngắngọntổngquanvề ngônngữ XDD.Phần3môtả kiếntrúcvàcácthànhphầntạonênhệthốngtíchhợpcácCSDLXML.Cuốicùng,phần4kếtluậncủabàiviết. 2.TỔNGQUANNGÔNNGỮXDD XDD(XMLDeclarativeDescription)mộtngônngữbiểudiễnthôngtindựavàokhuôndạngtàiliệuXML.Nóthựcchấtlàsự mở rộngkhả năngbiểudiễncủacác phầntử XMLbằngcáchsử dụngkếthợpvớicácbiếnnhằmmôtả mộttậpcácthôngtincóliênquanvớinhau.MộtphầntửXMLmởrộngnhưvậygọilàbiểuthứcXML(XMLexpresion).Bảng1liệtkêcácloạibiếnsử dụngtrongXDD.Vớiquan điểmnàythìmộtphầntử XMLbìnhthườngkhôngchứabiếnđượcgọilàbiểu thứcXMLnềntảng(groundXMLexpresion).MộtmôtảXDDlàmộttậpcácmệnh đềXMLvớikhuôndạngnhưsau: H B1,...,Bm, 1,..., ntrongđóm,n 0;HvàBi(i=1,..,m)làcácbiểuthứcXMLtrongkhi j(j=1,..,n)làràngbuộcXML(XMLconstraint)sửdụngđểđịnhnghĩacácràngbuộctrêncácbiểuthứcXML.Vớikhuôndạngmệnhđề XMLnhư trên, H còngọilàphầnđầucủamệnhđề(Head);tậphợp{B1,...,Bm, 1,..., n}gọilàphầnthâncủamệnhđề(Body). Bảng1:KiểucủacácbiếntrongXDD Kýhiệu Tênbiến Biểudiễn kiểuNamevariables:biếntên $N TênphầntửhoặctêncácthuộctínhStringvariables:biếnchuỗi $S ChuỗidữliệuPairvariables:biếncặpthuộctínhgiátrị $P Dãy0hoặcnhiềucặpthuộctínhgiá ...