Đánh giá khả năng trả nợ vay của khách hàng bằng các phương pháp phân loại
Số trang: 8
Loại file: pdf
Dung lượng: 1.95 MB
Lượt xem: 10
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài viết trình bày các phương pháp phân loại và những vấn đề tính toán trong áp dụng thực tế của chúng. Bài viết cũng đề nghị một thuật toán xác định xác suất tiên nghiệm trong phân loại bằng phương pháp Bayes tốt hơn các phương pháp khác.
Nội dung trích xuất từ tài liệu:
Đánh giá khả năng trả nợ vay của khách hàng bằng các phương pháp phân loạiTạp chı́ Khoa học Trường Đại học Cầ n ThơTập 49, Phần A (2017): 110-117DOI:10.22144/jvn.2017.015ĐÁNH GIÁ KHẢ NĂNG TRẢ NỢ VAY CỦA KHÁCH HÀNGBẰNG CÁC PHƯƠNG PHÁP PHÂN LOẠIVõ Văn Tài, Nguyễn Thị Hồng Dân và Nghiêm Quang ThườngKhoa Khoa học Tự nhiên, Trường Đại học Cần ThơThông tin chung:Ngày nhận: 06/07/2016Ngày chấp nhận: 28/04/2017Title:Assessing ability ofcustomers in loan repaymentby classification methodsTừ khóa:Ngân hàng, phương phápBayes, phân loại, sai lầm,xác suất tiên nghiệmKeywords:Bank, Bayesian method,classification, mistake, priorprobabilityABSTRACTThis article presents the classification methods and calculable problems intheir real application. The article also proposes an algorithm to determinethe prior probability in classifying by Bayesian method that is better thanexisting ones. The application from real data in appraising ability to repayloans of customers is performed by all methods to illustrate for theoriesand to examine logic of the establishsed algorithm. This application alsoshows that the proposed approach is more advantage than others and itcan be applied for many other domains.TÓM TẮTBài báo trình bày các phương pháp phân loại và những vấn đề tính toántrong áp dụng thực tế của chúng. Bài báo cũng đề nghị một thuật toán xácđịnh xác suất tiên nghiệm trong phân loại bằng phương pháp Bayes tốthơn các phương pháp khác. Ứng dụng từ số liệu thực tế trong đánh giákhả năng trả nợ vay của khách hàng được thực hiện bằng tất cả cácphương pháp để minh họa cho lý thuyết và kiểm tra sự hợp lý của thuậttoán được thiết lập. Ứng dụng này cũng cho thấy phương pháp đề nghị cóưu điểm hơn các phương pháp khác và có thể được áp dụng cho nhiều lĩnhvực khác nhau.Trích dẫn: Võ Văn Tài, Nguyễn Thị Hồng Dân và Nghiêm Quang Thường, 2017. Đánh giá khả năng trả nợvay của khách hàng bằng các phương pháp phân loại. Tạp chí Khoa học Trường Đại học CầnThơ. 49a: 110-117.tổng thể, nhưng phương pháp hồi qui logistic đangđược sử dụng rất phổ biến hiện nay. Phương phápBayes có nhiều ưu điểm, có thể phân loại được chohai hay nhiều hơn hai tổng thể. Nó không bị ràngbuộc bởi các giả thiết phân phối chuẩn và phươngsai bằng nhau của các tổng thể. Hai vấn đề chínhđược quan tâm của phương pháp này là tìm hàmmật độ xác suất từ dữ liệu rời rạc và xác định xácsuất tiên nghiệm. Hiện nay, việc nghiên cứu haivấn đề này không những được sự quan tâm của cácnhà thống kê mà còn có sự kết hợp của các nhàkhoa học trong lĩnh vực công nghệ thông tin. Vấnđề ước lượng hàm mật độ xác suất đã được thảoluận rất nhiều trong các tổng kết và nghiên cứu,nhiều kết quả đã được áp dụng vào thực tế rất hiệu1 GIỚI THIỆUPhân loại là xếp một phần tử thích hợp vào cáctổng thể đã biết dựa trên các biến quan sát của nó.Hiện nay, các phương pháp chính được sử dụng làFisher, hồi qui logistic, SVM (Support VectorMachines) và Bayes (Webb, 2000; Tai, 2016).Phương pháp Fisher ra đời sớm nhất, có thể phânloại cho hai hay nhiều hơn hai tổng thể, phươngpháp này bị ràng buộc bởi giả thiết ma trận hiệpphương sai của chúng bằng nhau. Phương phápSVM chỉ phân loại cho hai tổng thể dựa trên số liệurời rạc. Hiện nay, phương pháp này được áp dụngkhá phổ biến trong khai khoáng dữ liệu. Mặc dùđược đề xuất muộn nhất và chỉ phân loại cho hai110Tạp chı́ Khoa học Trường Đại học Cầ n ThơTập 49, Phần A (2017): 110-117quả (Pham-Gia et al., 2008; Tai, 2016). Việc xácđịnh xác suất tiên nghiệm thường dựa vào các tổngkết thống kê, kinh nghiệm và tập dữ liệu thực hiện.Các xác suất tiên nghiệm thông thường được đềxuất theo phân phối đều, phương pháp Laplacehoặc tỉ lệ mẫu. Trong bài viết này, dựa vào phântích chùm mờ, chúng tôi đề xuất thuật toán xácđịnh xác suất tiên nghiệm mà nó được xem là hiệuquả hơn các phương pháp khác khi áp dụng vàothực tế (xác suất sai lầm nhỏ hơn).biến cố A xảy ra với giá trị của các biến độc lập x1,x2, . . ., xn. Phương trình dạng tuyến tính biểu diễnxác suất p qua một tổ hợp tuyến tính của các biếnđộc lập thường được nghĩ đến trước tiên. Tuynhiên, một phương trình tuyến tính như vậy làkhông hợp lý, vì p chỉ nhận giá trị giới hạn trong[0,1], trong khi đó tổ hợp tuyến tính của các biếnđộc lập có thể nhận giá trị bất kỳ trên tập số thực.Nhận xét thấy có mối quan hệ chặt chẽ giữa logaritcủa số chênh, (ln(p/(1 p)), và các biến độc lập xidưới dạng tuyến tính nên người ta thiết lập chúngdưới dạng:Bài toán phân loại đã và đang được áp dụngcho nhiều lĩnh vực khác nhau, đặc biệt trong ngânhàng. Khi khách hàng (cá nhân, doanh nghiệp…)đến vay vốn, cán bộ tín dụng phải có khả năngđánh giá đúng khách hàng và ra quyết định về việccho hay không cho khách hàng vay. Cán bộ tíndụng cần phải hạn chế sai lầm: Cho vay đối vớikhách hàng có rủi ro hoặc từ chối cho vay đối vớikhách hàng tốt. Trong những năm qua, hệ thốngngân hàng Việt Nam phát t ...
Nội dung trích xuất từ tài liệu:
Đánh giá khả năng trả nợ vay của khách hàng bằng các phương pháp phân loạiTạp chı́ Khoa học Trường Đại học Cầ n ThơTập 49, Phần A (2017): 110-117DOI:10.22144/jvn.2017.015ĐÁNH GIÁ KHẢ NĂNG TRẢ NỢ VAY CỦA KHÁCH HÀNGBẰNG CÁC PHƯƠNG PHÁP PHÂN LOẠIVõ Văn Tài, Nguyễn Thị Hồng Dân và Nghiêm Quang ThườngKhoa Khoa học Tự nhiên, Trường Đại học Cần ThơThông tin chung:Ngày nhận: 06/07/2016Ngày chấp nhận: 28/04/2017Title:Assessing ability ofcustomers in loan repaymentby classification methodsTừ khóa:Ngân hàng, phương phápBayes, phân loại, sai lầm,xác suất tiên nghiệmKeywords:Bank, Bayesian method,classification, mistake, priorprobabilityABSTRACTThis article presents the classification methods and calculable problems intheir real application. The article also proposes an algorithm to determinethe prior probability in classifying by Bayesian method that is better thanexisting ones. The application from real data in appraising ability to repayloans of customers is performed by all methods to illustrate for theoriesand to examine logic of the establishsed algorithm. This application alsoshows that the proposed approach is more advantage than others and itcan be applied for many other domains.TÓM TẮTBài báo trình bày các phương pháp phân loại và những vấn đề tính toántrong áp dụng thực tế của chúng. Bài báo cũng đề nghị một thuật toán xácđịnh xác suất tiên nghiệm trong phân loại bằng phương pháp Bayes tốthơn các phương pháp khác. Ứng dụng từ số liệu thực tế trong đánh giákhả năng trả nợ vay của khách hàng được thực hiện bằng tất cả cácphương pháp để minh họa cho lý thuyết và kiểm tra sự hợp lý của thuậttoán được thiết lập. Ứng dụng này cũng cho thấy phương pháp đề nghị cóưu điểm hơn các phương pháp khác và có thể được áp dụng cho nhiều lĩnhvực khác nhau.Trích dẫn: Võ Văn Tài, Nguyễn Thị Hồng Dân và Nghiêm Quang Thường, 2017. Đánh giá khả năng trả nợvay của khách hàng bằng các phương pháp phân loại. Tạp chí Khoa học Trường Đại học CầnThơ. 49a: 110-117.tổng thể, nhưng phương pháp hồi qui logistic đangđược sử dụng rất phổ biến hiện nay. Phương phápBayes có nhiều ưu điểm, có thể phân loại được chohai hay nhiều hơn hai tổng thể. Nó không bị ràngbuộc bởi các giả thiết phân phối chuẩn và phươngsai bằng nhau của các tổng thể. Hai vấn đề chínhđược quan tâm của phương pháp này là tìm hàmmật độ xác suất từ dữ liệu rời rạc và xác định xácsuất tiên nghiệm. Hiện nay, việc nghiên cứu haivấn đề này không những được sự quan tâm của cácnhà thống kê mà còn có sự kết hợp của các nhàkhoa học trong lĩnh vực công nghệ thông tin. Vấnđề ước lượng hàm mật độ xác suất đã được thảoluận rất nhiều trong các tổng kết và nghiên cứu,nhiều kết quả đã được áp dụng vào thực tế rất hiệu1 GIỚI THIỆUPhân loại là xếp một phần tử thích hợp vào cáctổng thể đã biết dựa trên các biến quan sát của nó.Hiện nay, các phương pháp chính được sử dụng làFisher, hồi qui logistic, SVM (Support VectorMachines) và Bayes (Webb, 2000; Tai, 2016).Phương pháp Fisher ra đời sớm nhất, có thể phânloại cho hai hay nhiều hơn hai tổng thể, phươngpháp này bị ràng buộc bởi giả thiết ma trận hiệpphương sai của chúng bằng nhau. Phương phápSVM chỉ phân loại cho hai tổng thể dựa trên số liệurời rạc. Hiện nay, phương pháp này được áp dụngkhá phổ biến trong khai khoáng dữ liệu. Mặc dùđược đề xuất muộn nhất và chỉ phân loại cho hai110Tạp chı́ Khoa học Trường Đại học Cầ n ThơTập 49, Phần A (2017): 110-117quả (Pham-Gia et al., 2008; Tai, 2016). Việc xácđịnh xác suất tiên nghiệm thường dựa vào các tổngkết thống kê, kinh nghiệm và tập dữ liệu thực hiện.Các xác suất tiên nghiệm thông thường được đềxuất theo phân phối đều, phương pháp Laplacehoặc tỉ lệ mẫu. Trong bài viết này, dựa vào phântích chùm mờ, chúng tôi đề xuất thuật toán xácđịnh xác suất tiên nghiệm mà nó được xem là hiệuquả hơn các phương pháp khác khi áp dụng vàothực tế (xác suất sai lầm nhỏ hơn).biến cố A xảy ra với giá trị của các biến độc lập x1,x2, . . ., xn. Phương trình dạng tuyến tính biểu diễnxác suất p qua một tổ hợp tuyến tính của các biếnđộc lập thường được nghĩ đến trước tiên. Tuynhiên, một phương trình tuyến tính như vậy làkhông hợp lý, vì p chỉ nhận giá trị giới hạn trong[0,1], trong khi đó tổ hợp tuyến tính của các biếnđộc lập có thể nhận giá trị bất kỳ trên tập số thực.Nhận xét thấy có mối quan hệ chặt chẽ giữa logaritcủa số chênh, (ln(p/(1 p)), và các biến độc lập xidưới dạng tuyến tính nên người ta thiết lập chúngdưới dạng:Bài toán phân loại đã và đang được áp dụngcho nhiều lĩnh vực khác nhau, đặc biệt trong ngânhàng. Khi khách hàng (cá nhân, doanh nghiệp…)đến vay vốn, cán bộ tín dụng phải có khả năngđánh giá đúng khách hàng và ra quyết định về việccho hay không cho khách hàng vay. Cán bộ tíndụng cần phải hạn chế sai lầm: Cho vay đối vớikhách hàng có rủi ro hoặc từ chối cho vay đối vớikhách hàng tốt. Trong những năm qua, hệ thốngngân hàng Việt Nam phát t ...
Tìm kiếm theo từ khóa liên quan:
Tạp chí khoa học Khả năng trả nợ vay của khách hàng Phương pháp phân loại Phương pháp Bayes Phần mềm MatlabTài liệu liên quan:
-
6 trang 302 0 0
-
Thống kê tiền tệ theo tiêu chuẩn quốc tế và thực trạng thống kê tiền tệ tại Việt Nam
7 trang 272 0 0 -
5 trang 234 0 0
-
10 trang 216 0 0
-
8 trang 214 0 0
-
Khảo sát, đánh giá một số thuật toán xử lý tương tranh cập nhật dữ liệu trong các hệ phân tán
7 trang 212 0 0 -
Quản lý tài sản cố định trong doanh nghiệp
7 trang 208 0 0 -
6 trang 206 0 0
-
Khách hàng và những vấn đề đặt ra trong câu chuyện số hóa doanh nghiệp
12 trang 204 0 0 -
9 trang 167 0 0