Thông tin tài liệu:
Thị trường cổ phiếu có một vai trò quan trọng trong sự phát triển của xã hội hiện đại. Chúng cho phép triển khai các nguồn lực kinh tế. Sự thay đổi giá cổ phiếu phản ánh những thay đổi trên thị trường. Với khả năng xử lý dữ liệu mạnh mẽ trên nhiều lĩnh vực, học sâu cũng được sử dụng một cách rộng rãi trong lĩnh vực tài chính như: Dự đoán thị trường cổ phiếu, đầu tư tối ưu, xử lý thông tin tài chính và thực hiện các chiến lược giao dịch tài chính.
Nội dung trích xuất từ tài liệu:
Dự đoán thị trường cổ phiếu bằng phương pháp học sâu không giám sát Generative adversarial network
Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XIII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR), Nha Trang, ngày 8-9/10/2020
DOI: 10.15625/vap.2020.00156
DỰ ĐOÁN THỊ TRƯỜNG CỔ PHIẾU BẰNG PHƯƠNG PHÁP
HỌC SÂU KHÔNG GIÁM SÁT GENERATIVE ADVERSARIAL NETWORK
Bùi Thanh Hùng, Nguyễn Minh Lợi
Lab Phân tích dữ liệu và Trí tuệ nhân tạo
Viện Kỹ thuật - Công nghệ
Đại học Thủ Dầu Một
Số 6 Trần Văn Ơn, phƣờng Phú Hòa, thành phố Thủ Dầu Một, Bình Dƣơng, Việt Nam
hungbt.cntt@tdmu.edu.vn, nmloi2010@gmail.com
TÓM TẮT: Thị trường cổ phiếu có một vai trò quan trọng trong sự phát triển của xã hội hiện đại. Chúng cho phép triển
khai các nguồn lực kinh tế. Sự thay đổi giá cổ phiếu phản ánh những thay đổi trên thị trường. Với khả năng xử lý dữ liệu mạnh mẽ
trên nhiều lĩnh vực, học sâu cũng được sử dụng một cách rộng rãi trong lĩnh vực tài chính như: dự đoán thị trường cổ phiếu, đầu tư
tối ưu, xử lý thông tin tài chính và thực hiện các chiến lược giao dịch tài chính. Do đó, dự đoán thị trường cổ phiếu được xem là một
trong những lĩnh vực khá phổ biến và quý giá nhất trong lĩnh vực tài chính. Trong nghiên cứu này, chúng tôi đề xuất phương pháp
học không giám sát Generative Adversarial Network (GAN) trong dự đoán giá cổ phiếu. Mô hình GAN gồm 2 lớp, một lớp bộ nhớ
ngắn dài 2 chiều Bidirectional Long Short-Term Memory (Bi-LSTM) được dùng để phân biệt (Discriminator) và lớp Long Short-
Term Memory (LSTM) được sử dụng để dự đoán giá cổ phiếu (Generator). LSTM dựa trên dữ liệu cổ phiếu đã giao dịch và tạo ra dữ
liệu giả giống như dữ liệu đã phân phối, trong khi đó lớp phân biệt được thiết kế bởi giải thuật Bi-LSTM với mục đích phân biệt dữ liệu
cổ phiếu thật và dữ liệu cổ phiếu giả được tạo ra. Chúng tôi thực nghiệm trên cổ phiếu AMZN (Amazon) là cổ phiếu có chuỗi ngày
giao dịch trong phạm vi rộng lớn và dùng chúng để thử dự đoán giá đóng hàng ngày. Kết quả thực nghiệm cho thấy phương pháp GAN
đề xuất của chúng tôi có thể đạt được kết quả tốt trong việc dự đoán giá cổ phiếu so với nhiều mô hình dự đoán khác.
Từ khóa: Học sâu không giám sát; Dự đoán thị trường chứng khoán; GAN; LSTM; Bi-LSTM.
I. GIỚI THIỆU
Dự đoán thị trƣờng cổ phiếu là một trong những vấn đề quan trọng và nhiều thách thức. Nhiều phân tích và giả
định trong lĩnh vực tài chính cho thấy rằng thị trƣờng cổ phiếu hoàn toàn có thể dự đoán đƣợc. Các kỹ thuật phân tích
lý thuyết đầu tƣ chính là phƣơng pháp để dự đoán trực tiếp giá cổ phiếu thông qua việc nghiên cứu dữ liệu thị trƣờng
cổ phiếu trong quá khứ. Một giả định ý nghĩa có tên là Mean Reversion mà trong đó giá trị cổ phiếu chỉ là tạm thời và
chúng có xu hƣớng thay đổi giá trị trung bình theo thời gian. Giả định này có sự phát triển cao hơn gọi là Moving Average
Reversion (MAR) [1], mà trong đó giá trị trung bình là giá trị có ý nghĩa trong cửa sổ thời gian trong quá khứ, ví dụ nhƣ
khoảng thời gian 5 ngày trong tuần. Trong nghiên cứu này chúng tôi đề xuất mô hình GAN để dự báo giá đóng hàng ngày
của cổ phiếu. Mô hình GAN 2 lớp Bi-LSTM và LSTM trong đó lớp Long Short Term Memory (LSTM) đƣợc xem nhƣ là
lớp tạo và lớp Bidirectional Long Short-Term Memory (Bi-LSTM) đƣợc xem nhƣ là lớp phân biệt. Phần còn lại của bài
báo đƣợc tổ chức nhƣ sau. Phần 2 bài báo đề cập tới các nghiên cứu liên quan. Phần 3 đề cập tới mô hình đề xuất. Phần 4
đánh giá thực nghiệm. Và cuối cùng là kết luận sẽ tổng kết lại những kết quả đạt đƣợc.
II. CÁC NGHIÊN CỨU LIÊN QUAN
Dự đoán thị trƣờng cổ phiếu đƣợc xem nhƣ là vấn đề dự báo về chuỗi thời gian và một trong những thuật toán
giải quyết bài toán này là thuật toán Autoregressive Integrated Moving Average (gọi tắt là ARIMA) [2]. Thuật toán
ARIMA thực hiện tốt trên chuỗi thời gian tuyến tính và không thay đổi nhƣng không thực hiện tốt trên dữ liệu phi
tuyến tính và biến đổi nhƣ trong thị trƣờng cổ phiếu. Cách tiếp cận khác để giải quyết vấn đề này là kết hợp giữa
ARIMA và SVM [3]. Vì trong thực tiễn dự báo có thể đƣợc cấu thành bởi một thành phần tuyến tính và phi tuyến, vì
thế có thể dự đoán một phần tuyến tính với ARIMA và một phần phi tuyến tính với SVM. Một cách tiếp cận khác là
kết hợp Wavelet với SVM [4], trong đó Wavelet thực hiện phân tích dữ liệu cổ phiếu và SVM dùng để dự báo. Các
nghiên cứu về sau sử dụng mạng nơ ron nhân tạo Artificial Neural Network (ANN) kết hợp với thuật toán ARIMA để
dự đoán một phần dữ liệu giá cổ phiếu phi tuyến tính [5]. Hỗn hợp biến đổi Wavelet và ANN cũng đƣợc đề xuất là giải
pháp hiệu quả trong việc giải quyết vấn đề này [6]. Thuật toán Convolutional Neural Network (CNN) cũng đƣợc dùng
trong việc dự đoán giá cổ phiếu [7]. Một số nghiên cứu đề xuất mô hình mạng nơ ron hồi quy - RNN, học tăng cƣờng -
Reinforcement learning [8-11].
III. MÔ HÌNH ĐỀ XUẤT
GAN là một khung huấn luyện mới với mô hình 2 lớp trong một trò chơi có tổng bằng 0 [12]. Trong quá trình
truyền nghịch, Một lớp đƣợc dùng để tạo ra dữ liệu giả giống hệt nhƣ dữ liệu thật, trong khi lớp kiểm tra đóng vai trò
thẩm phán để phân biệt dữ liệu thật và dữ liệu giả đƣợc tạo ra. Chúng có thể đạt tới điểm lý tƣởng mà lớp phân biệt
không thể phân biệt hai loại dữ liệu. Tại điểm này lớp tạo sẽ chụp lại dữ liệu phân phối tại trò chơi này. Dựa trên
nguyên tắc này, chúng tôi đề xuất cấu trúc GAN để dự đoán giá cổ phiếu.
102 DỰ ĐOÁN THỊ TRƢỜNG CỔ PHIẾU BẰNG PHƢƠNG PHÁP HỌC SÂU KHÔNG GIÁM SÁT GENERATIVE …
3.1. Lớp tạo - The Generator
Mô hình lớp tạo của chúng tôi đƣợc thiết kế bởi Mạng b ...