Dự thảo tóm tắt Luận án Tiến sĩ Toán học: Lựa chọn biến bằng phương pháp Bayes biến phân với dữ liệu lớn
Số trang: 26
Loại file: pdf
Dung lượng: 524.24 KB
Lượt xem: 13
Lượt tải: 0
Xem trước 3 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Mục tiêu nghiên cứu của luận án là đề xuất phương pháp mới khắc phục những hạn chế này, dựa trên phương pháp Bayes biến phân thích nghi với một dạng l1-norm; nghiên cứu mở rộng mô hình này cho trường hợp y là đa biến.
Nội dung trích xuất từ tài liệu:
Dự thảo tóm tắt Luận án Tiến sĩ Toán học: Lựa chọn biến bằng phương pháp Bayes biến phân với dữ liệu lớn I HÅC QUÈC GIA H NËI TR×ÍNG I HÅC KHOA HÅC TÜ NHIN o Thanh Tòng LÜA CHÅN BIN BNG PH×ÌNG PHP BAYES BIN PH N VÎI DÚ LIU LÎNChuy¶n ngnh : Lþ thuy¸t X¡c su§t v Thèng k¶ To¡n håcM¢ sè: 62.46.01.06DÜ THO TÂM TT LUN N TIN S TON HÅC H NËI 2018Cæng tr¼nh ÷ñc hon thnh t¤i: Tr÷íng ¤i håc Khoa håc Tü nhi¶n - ¤i håc Quèc gia H Nëi Ng÷íi h÷îng d¨n khoa håc: -PGS.TS. TRN MINH NGÅC -TS. TRN MNH C×ÍNG Ph£n bi»n 1:.................................................................................................... Ph£n bi»n 2:.................................................................................................... Ph£n bi»n 3:.................................................................................................... Luªn ¡n s³ ÷ñc b£o v» tr÷îc Hëi çng c§p ¤i håc Quèc gia ch§mluªn ¡n ti¸n s¾ håp t¤i Tr÷íng ¤i håc Khoa håc Tü nhi¶n, ¤i håcQuèc gia H Nëi vo hçi ..... gií ..... ngy ..... th¡ng ..... n«m 20 ... Câ thº t¼m hiºu luªn ¡n t¤i: - Th÷ vi»n Quèc gia Vi»t Nam - Trung t¥m Thæng tin - Th÷ vi»n, ¤i håc Quèc gia H Nëi MÐ U Lüa chån mæ h¼nh l mët bi to¡n cì b£n trong thèng k¶ công nh÷ trong nhi·ul¾nh vüc khoa håc kh¡c. Gi£ sû r¬ng chóng ta ÷ñc cho mët tªp hñp c¡c mæ h¼nhph£n ¡nh mët lo¤t c¡c c§u tróc ti·m n«ng trong dú li»u v nhi»m vö l chåntrong sè â mët mæ h¼nh gi£i th½ch tèt nh§t ho°c phò hñp nh§t vîi dú li»u. Câr§t nhi·u ph÷ìng ph¡p lüa chån mæ h¼nh nêi ti¸ng nh÷ ph÷ìng ph¡p hñp lþ cüc¤i ph¤t, ph÷ìng ph¡p Bayes, ph÷ìng ph¡p thüc nghi»m. Còng vîi sü ph¡t triºn cõa khoa håc v cæng ngh», nhu c¦u thüc hi»n c¡c bito¡n lîn v phùc t¤p ngy cng ÷ñc n¥ng cao, ái häi c¦n ph£i ph¡t triºn nhúngthuªt to¡n nhanh phò hñp vîi c¡c bi to¡n â. Ph÷ìng ph¡p Bayes bi¸n ph¥n(Variational Bayes: VB) ra íi nh¬m gi£i quy¸t nhu c¦u thi¸t y¸u â, ÷ñc ph¡ttriºn v ùng döng rëng r¢i tø giúa nhúng n«m 1990. Trong nhi·u tr÷íng hñp ta ¢ bi¸t d¤ng mæ h¼nh ho°c ¢ x¡c ành ÷ñc c§utróc cõa mæ h¼nh. Khi â v§n · c¦n quan t¥m l chån bi¸n cho mæ h¼nh. Nâ ltr÷íng hñp °c bi»t (nh÷ng thæng döng nh§t) cõa bi to¡n lüa chån mæ h¼nh. Gi£sû Y l bi¸n ÷ñc quan t¥m v X1 , X2 , ..., Xp l tªp c¡c bi¸n ëc lªp câ thº gi£ith½ch hay dü o¡n Y . V§n · °t ra l c¦n chån lüa c¡c bi¸n quan trång, tùc llüa chån mët tªp con tø p bi¸n â, câ £nh h÷ðng nh§t ¸n Y º ÷a ra mæ h¼nhbiºu di¹n tèt nh§t mèi quan h» giúa Y v c¡c bi¸n ÷ñc chån.Möc ti¶u 1. Mæ h¼nh hçi quy tuy¸n t½nh hén hñp têng qu¡t (Generalized Linear MixedModels: GLMMs) câ nhi·u ùng döng rëng r¢i trong thüc t¸ nh÷ng lüa chån bi¸ncho GLMMs trong tr÷íng hñp nhi·u bi¸n ÷ñc xem l mët bi to¡n khâ. C¡cph÷ìng ph¡p lüa chån bi¸n cê iºn th¼ bà h¤n ch¸ bði mët sè ½t bi¸n, ph÷ìng 1ph¡p cõa Groll et al [29] v Schelldorfer et al [45] câ thº thüc hi»n lüa chånbi¸n cho GLMMs trong tr÷ìng hñp nhi·u bi¸n. Tuy nhi¶n, v¨n cán nhi·u v§n · Doº c£i ti¸n trong c¡ch ti¸p cªn cõa Groll et al [29] v Schelldorfer et al [45].â möc ti¶u thù nh§t cõa chóng tæi l · xu§t ph÷ìng ph¡p mîi khcphöc nhúng h¤n ch¸ ny, düa tr¶n ph÷ìng ph¡p Bayes bi¸n ph¥n th½chnghi vîi mët ph¤t d¤ng l1-norm.Möc ti¶u 2. Trong thüc t¸, h¦u h¸t dú li»u ÷ñc ph¡t sinh tø têng thº khæng çng nh§t. ºmæ h¼nh hâa dú li»u nh÷ vªy th¼ mæ h¼nh hçi quy hén hñp (Mixtures RegressionModels: MRMs) ÷ñc cho l phò hñp nh§t v¼ nâ cho ph²p mæ t£ chi ti¸t ph¥nphèi cõa tøng cöm dú li»u. Câ hai v§n · c¦n gi£i quy¸t trong bi to¡n lüa chånmæ h¼nh ð ¥y, thù nh§t l x¡c ành sè thnh ph¦n hay sè cöm dú li»u v thù hail chån bi¸n cho mæ h¼nh. C¡c ph÷ìng ph¡p cê iºn th÷íng thüc hi»n ri¶ng r³ haiv§n · ny v ë ch½nh x¡c ch÷a cao. º t«ng t½nh linh ëng, t½nh m·m d´o chomæ h¼nh, ng÷íi ta cán nghi¶n cùu c£ c¡c tr÷íng hñp m ph¥n phèi cõa tøng cömdú li»u l hm cõa c¡c bi¸n hçi quy z , tr÷ìng hñp ny gåi l mæ h¼nh hçi quyìn bi¸n linh ëng ¢ ÷ñc ¢ ÷ñc xem x²t trong Tran et al [50] , Nott et al [38]v Villani et al [52], trong â mªt ë câ i·u ki»n p(y|z) cõa bi¸n ¡p ùng y mëtchi·u ÷ñc mæ h¼nh hâa theo mªt ë cõa mët hén hñp c¡c ph¥n phèi chu©n vîi t§tc£ c¡c thnh ph¦n trung b¼nh, ph÷ìng sai v x¡c su§t trën l c¡c hm tuy¸n t½nhcõa c¡c hi»p bi¸n z . Tran et al [50] ¢ nghi¶n cùu mæ h¼nh ÷îc l÷ñng mªt ë hçiquy vîi c¡c hén hñp cõa k ph¥n phèi chu©n câ ph÷ìng sai phö thuëc (RegressionDensity Estimation with Mixtures of k Heteroscedastic Normals: RDE-MHN(k)) k z z z z ...
Nội dung trích xuất từ tài liệu:
Dự thảo tóm tắt Luận án Tiến sĩ Toán học: Lựa chọn biến bằng phương pháp Bayes biến phân với dữ liệu lớn I HÅC QUÈC GIA H NËI TR×ÍNG I HÅC KHOA HÅC TÜ NHIN o Thanh Tòng LÜA CHÅN BIN BNG PH×ÌNG PHP BAYES BIN PH N VÎI DÚ LIU LÎNChuy¶n ngnh : Lþ thuy¸t X¡c su§t v Thèng k¶ To¡n håcM¢ sè: 62.46.01.06DÜ THO TÂM TT LUN N TIN S TON HÅC H NËI 2018Cæng tr¼nh ÷ñc hon thnh t¤i: Tr÷íng ¤i håc Khoa håc Tü nhi¶n - ¤i håc Quèc gia H Nëi Ng÷íi h÷îng d¨n khoa håc: -PGS.TS. TRN MINH NGÅC -TS. TRN MNH C×ÍNG Ph£n bi»n 1:.................................................................................................... Ph£n bi»n 2:.................................................................................................... Ph£n bi»n 3:.................................................................................................... Luªn ¡n s³ ÷ñc b£o v» tr÷îc Hëi çng c§p ¤i håc Quèc gia ch§mluªn ¡n ti¸n s¾ håp t¤i Tr÷íng ¤i håc Khoa håc Tü nhi¶n, ¤i håcQuèc gia H Nëi vo hçi ..... gií ..... ngy ..... th¡ng ..... n«m 20 ... Câ thº t¼m hiºu luªn ¡n t¤i: - Th÷ vi»n Quèc gia Vi»t Nam - Trung t¥m Thæng tin - Th÷ vi»n, ¤i håc Quèc gia H Nëi MÐ U Lüa chån mæ h¼nh l mët bi to¡n cì b£n trong thèng k¶ công nh÷ trong nhi·ul¾nh vüc khoa håc kh¡c. Gi£ sû r¬ng chóng ta ÷ñc cho mët tªp hñp c¡c mæ h¼nhph£n ¡nh mët lo¤t c¡c c§u tróc ti·m n«ng trong dú li»u v nhi»m vö l chåntrong sè â mët mæ h¼nh gi£i th½ch tèt nh§t ho°c phò hñp nh§t vîi dú li»u. Câr§t nhi·u ph÷ìng ph¡p lüa chån mæ h¼nh nêi ti¸ng nh÷ ph÷ìng ph¡p hñp lþ cüc¤i ph¤t, ph÷ìng ph¡p Bayes, ph÷ìng ph¡p thüc nghi»m. Còng vîi sü ph¡t triºn cõa khoa håc v cæng ngh», nhu c¦u thüc hi»n c¡c bito¡n lîn v phùc t¤p ngy cng ÷ñc n¥ng cao, ái häi c¦n ph£i ph¡t triºn nhúngthuªt to¡n nhanh phò hñp vîi c¡c bi to¡n â. Ph÷ìng ph¡p Bayes bi¸n ph¥n(Variational Bayes: VB) ra íi nh¬m gi£i quy¸t nhu c¦u thi¸t y¸u â, ÷ñc ph¡ttriºn v ùng döng rëng r¢i tø giúa nhúng n«m 1990. Trong nhi·u tr÷íng hñp ta ¢ bi¸t d¤ng mæ h¼nh ho°c ¢ x¡c ành ÷ñc c§utróc cõa mæ h¼nh. Khi â v§n · c¦n quan t¥m l chån bi¸n cho mæ h¼nh. Nâ ltr÷íng hñp °c bi»t (nh÷ng thæng döng nh§t) cõa bi to¡n lüa chån mæ h¼nh. Gi£sû Y l bi¸n ÷ñc quan t¥m v X1 , X2 , ..., Xp l tªp c¡c bi¸n ëc lªp câ thº gi£ith½ch hay dü o¡n Y . V§n · °t ra l c¦n chån lüa c¡c bi¸n quan trång, tùc llüa chån mët tªp con tø p bi¸n â, câ £nh h÷ðng nh§t ¸n Y º ÷a ra mæ h¼nhbiºu di¹n tèt nh§t mèi quan h» giúa Y v c¡c bi¸n ÷ñc chån.Möc ti¶u 1. Mæ h¼nh hçi quy tuy¸n t½nh hén hñp têng qu¡t (Generalized Linear MixedModels: GLMMs) câ nhi·u ùng döng rëng r¢i trong thüc t¸ nh÷ng lüa chån bi¸ncho GLMMs trong tr÷íng hñp nhi·u bi¸n ÷ñc xem l mët bi to¡n khâ. C¡cph÷ìng ph¡p lüa chån bi¸n cê iºn th¼ bà h¤n ch¸ bði mët sè ½t bi¸n, ph÷ìng 1ph¡p cõa Groll et al [29] v Schelldorfer et al [45] câ thº thüc hi»n lüa chånbi¸n cho GLMMs trong tr÷ìng hñp nhi·u bi¸n. Tuy nhi¶n, v¨n cán nhi·u v§n · Doº c£i ti¸n trong c¡ch ti¸p cªn cõa Groll et al [29] v Schelldorfer et al [45].â möc ti¶u thù nh§t cõa chóng tæi l · xu§t ph÷ìng ph¡p mîi khcphöc nhúng h¤n ch¸ ny, düa tr¶n ph÷ìng ph¡p Bayes bi¸n ph¥n th½chnghi vîi mët ph¤t d¤ng l1-norm.Möc ti¶u 2. Trong thüc t¸, h¦u h¸t dú li»u ÷ñc ph¡t sinh tø têng thº khæng çng nh§t. ºmæ h¼nh hâa dú li»u nh÷ vªy th¼ mæ h¼nh hçi quy hén hñp (Mixtures RegressionModels: MRMs) ÷ñc cho l phò hñp nh§t v¼ nâ cho ph²p mæ t£ chi ti¸t ph¥nphèi cõa tøng cöm dú li»u. Câ hai v§n · c¦n gi£i quy¸t trong bi to¡n lüa chånmæ h¼nh ð ¥y, thù nh§t l x¡c ành sè thnh ph¦n hay sè cöm dú li»u v thù hail chån bi¸n cho mæ h¼nh. C¡c ph÷ìng ph¡p cê iºn th÷íng thüc hi»n ri¶ng r³ haiv§n · ny v ë ch½nh x¡c ch÷a cao. º t«ng t½nh linh ëng, t½nh m·m d´o chomæ h¼nh, ng÷íi ta cán nghi¶n cùu c£ c¡c tr÷íng hñp m ph¥n phèi cõa tøng cömdú li»u l hm cõa c¡c bi¸n hçi quy z , tr÷ìng hñp ny gåi l mæ h¼nh hçi quyìn bi¸n linh ëng ¢ ÷ñc ¢ ÷ñc xem x²t trong Tran et al [50] , Nott et al [38]v Villani et al [52], trong â mªt ë câ i·u ki»n p(y|z) cõa bi¸n ¡p ùng y mëtchi·u ÷ñc mæ h¼nh hâa theo mªt ë cõa mët hén hñp c¡c ph¥n phèi chu©n vîi t§tc£ c¡c thnh ph¦n trung b¼nh, ph÷ìng sai v x¡c su§t trën l c¡c hm tuy¸n t½nhcõa c¡c hi»p bi¸n z . Tran et al [50] ¢ nghi¶n cùu mæ h¼nh ÷îc l÷ñng mªt ë hçiquy vîi c¡c hén hñp cõa k ph¥n phèi chu©n câ ph÷ìng sai phö thuëc (RegressionDensity Estimation with Mixtures of k Heteroscedastic Normals: RDE-MHN(k)) k z z z z ...
Tìm kiếm theo từ khóa liên quan:
Luận án Tiến sĩ Dự thảo tóm tắt Luận án Tiến sĩ Lý thuyết xác suất Thống kê Toán học Luận án Tiến sĩ Toán học Phương pháp Bayes biến phân với dữ liệu lớnGợi ý tài liệu liên quan:
-
205 trang 413 0 0
-
Luận án Tiến sĩ Tài chính - Ngân hàng: Phát triển tín dụng xanh tại ngân hàng thương mại Việt Nam
267 trang 376 1 0 -
206 trang 299 2 0
-
174 trang 296 0 0
-
228 trang 259 0 0
-
19 trang 251 0 0
-
32 trang 211 0 0
-
Luận án tiến sĩ Ngữ văn: Dấu ấn tư duy đồng dao trong thơ thiếu nhi Việt Nam từ 1945 đến nay
193 trang 208 0 0 -
208 trang 198 0 0
-
27 trang 180 0 0