Phương pháp khuyến khích cộng tác đào tạo mô hình học máy bằng Blockchain và học liên kết
Số trang: 6
Loại file: pdf
Dung lượng: 1.09 MB
Lượt xem: 17
Lượt tải: 0
Xem trước 1 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài viết đề xuất một bộ khung giải pháp giúp tận dụng tối đa nguồn tài nguyên dữ liệu của người dùng, mà vẫn đảm bảo quyền riêng tư của họ. Chúng tôi áp dụng học liên kết (Federated Learning - FL) vào việc huấn luyện các mô hình máy học.
Nội dung trích xuất từ tài liệu:
Phương pháp khuyến khích cộng tác đào tạo mô hình học máy bằng Blockchain và học liên kết Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021) Phương pháp khuyến khích cộng tác đào tạo mô hình học máy bằng Blockchain và học liên kết Hoàng Tuấn Anh∗† , Ngân Văn Luyện∗† , Đỗ Hoàng Hiển∗† , Phan Thế Duy∗† ∗ Phòng Thí Nghiệm An Toàn Thông Tin, Trường Đại Học Công Nghệ Thông Tin † Đại Học Quốc Gia Tp. Hồ Chí Minh Email: {18520446, 18521074}@gm.uit.edu.vn, {hiendh, duypt}@uit.edu.vn Tóm tắt—Ngày nay, lượng dữ liệu được sinh ra từ các không sẵn sàng chia sẻ dữ liệu vì không được hưởng lợi thiết bị Vạn vật kết nối (Internet of Things - IoT) ngày càng từ việc đóng góp dữ liệu của mình cho quá trình đào tạo lớn, tạo tiền đề cho sự phát triển của các ứng dụng trí tuệ mô hình máy học. Vì vậy, để xây dựng được một một hệ nhân tạo. Tuy nhiên, với cách tiếp cận truyền thống, việc thu sinh thái thông minh, toàn diện, cần có một cách tiếp cận thập dữ liệu người dùng một cách tập trung đang ngày càng trở nên khó khăn. Đã có những báo cáo cho thấy tồn tại máy học mới. Cách tiếp cận này cần phải giải quyết được những hành vi xâm hại đến quyền riêng tư trên dữ liệu của vấn đề liên quan đến quyền riêng tư của người dùng, và người dùng. Hơn nữa, lợi ích nhận được từ việc đào tạo các đảm bảo được nguồn lợi cho chủ sở hữu dữ liệu. mô hình học máy đa phần không được phân chia cho người Trong bối cảnh đó, phương pháp học cộng tác/học liên sở hữu dữ liệu. Do đó, người dùng thường không sẵn sàng kết (Federated Learning- FL) xuất hiện như một giải pháp chia sẻ dữ liệu của họ với người khác. Trong bài báo này, có thể đáp ứng được yêu cầu huấn luyện mô hình ML hiệu chúng tôi đề xuất một bộ khung giải pháp giúp tận dụng tối đa nguồn tài nguyên dữ liệu của người dùng, mà vẫn đảm quả mà vẫn đảm bảo tính bảo mật và riêng tư của dữ liệu. bảo quyền riêng tư của họ. Chúng tôi áp dụng học liên kết Sử dụng phương pháp FL, các thực thể (các tổ chức, cá (Federated Learning - FL) vào việc huấn luyện các mô hình nhân, thiết bị IoT, ...) tham gia cộng tác được phân phối máy học. Người dùng chỉ chia sẻ mô hình học máy được đào mô hình hiện tại từ máy chủ trung tâm và thực hiện huấn tạo trên dữ liệu của họ thay vì chia sẽ dữ liệu thô. Do đó luyện ngay tại chính thực thể đó bằng cách sử dụng bộ quyền riêng tư của người dùng được đảm bảo. Hơn nữa, các dữ liệu cục bộ. Người dùng chia sẻ mô hình kết quả cho hoạt động đóng góp của người dùng trong hệ thống được ghi lại vào Blockchain. Điều này đảm bảo được sự minh bạch trung tâm tổng hợp thay vì chia sẻ dữ liệu thô của mình. trong quá trình vận hành hệ thống và khuyến khích người Điều này giúp giải quyết được phần lớn các vấn đề liên dùng tham gia đóng góp đào tạo mô hình học máy. quan đến quyền riêng tư dữ liệu người dùng. Tại máy chủ Từ khóa—Blockchain, federated learning, học máy. tổng hợp, quy trình huấn luyện diễn ra nhiều chu kì cho đến khi mô hình toàn cục được tối ưu và đạt hiệu năng I. GIỚI THIỆU như mong đợi. Hiện nay, nhiều quốc gia đã và đang đẩy mạnh chiến Tuy nhiên, trong thực tế còn rất nhiều vấn đề xoay quanh lược xây dựng đô thị thông minh để đón đầu cuộc đua việc triển khai hệ thống học liên kết. Trong đó, điển hình là về sáng tạo khoa học kỹ thuật trong bối cảnh Cách mạng việc thiếu kiểm soát hoạt động sử dụng nguồn tài nguyên Công nghiệp lần thứ Tư (CMCN 4.0). Chìa khoá để hiện mà người dùng cung cấp vào các mục đích xấu và vấn thực chiến lược này chính là trí tuệ nhân tạo (Artificial đề làm sao để sự đóng góp của người dùng được trả công Intelligence - AI), yếu tố đang định hình một hệ sinh thái xứng đáng. Việc chỉ gửi mô hình cục bộ đã được huấn công nghệ xoay quanh việc phục vụ tối đa lợi ích của luyện trên dữ liệu cá nhân lên hệ thống thay vì dữ liệu người dân thông qua việc thực hiện quá trình chuyển đổi thô chưa hoàn toàn giải quyết được các vấn đề về quyền số - số hóa dữ liệu. Trong đó, dữ liệu được người dùng riêng tư. Nhiều nghiên cứu đã chỉ ra rằng, thông qua các chia sẻ đóng vai trò quan trọng trong việc xây dựng hệ mô hình nhận được, kẻ tấn công có thể thực hiện cuộc tấn sinh thái thông minh, mềm dẻo và bền vững trong từng công suy ngược [7]. Bên cạnh đó, vấn đề các nguồn lợi từ lĩnh vực của đời sống kinh tế - xã hội. Các mô hình AI việc huấn luyện mô hình học máy không được phân chia hiện nay đang tận dụng những tiến bộ trong mô hình học hợp lý cho các bên tham gia cũng khiến chủ sở hữu dữ máy (Machine Learning - ML) để nâng cao tính ưu việt liệu do dự khi được mời tham gia đóng góp. Để giải quyết của hệ sinh thái thông minh. Điều này cần một khối lượng các vấn đề trên, Blockchain được chúng tôi đề xuất như dữ liệu lớn và đa dạng để đào tạo. Cách tiếp cận xây dựng một giải pháp hỗ trợ FL trong việc lưu trữ bằng chứng về mô hình ML hiện nay chủ yếu là thu thập dữ liệu cho hoạt động của các thực thể trong hệ thống. Những bằng việc đào tạo tập trung tại một máy chủ, sau đó đào tạo chứng này phục vụ cho quá trình điều ...
Nội dung trích xuất từ tài liệu:
Phương pháp khuyến khích cộng tác đào tạo mô hình học máy bằng Blockchain và học liên kết Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021) Phương pháp khuyến khích cộng tác đào tạo mô hình học máy bằng Blockchain và học liên kết Hoàng Tuấn Anh∗† , Ngân Văn Luyện∗† , Đỗ Hoàng Hiển∗† , Phan Thế Duy∗† ∗ Phòng Thí Nghiệm An Toàn Thông Tin, Trường Đại Học Công Nghệ Thông Tin † Đại Học Quốc Gia Tp. Hồ Chí Minh Email: {18520446, 18521074}@gm.uit.edu.vn, {hiendh, duypt}@uit.edu.vn Tóm tắt—Ngày nay, lượng dữ liệu được sinh ra từ các không sẵn sàng chia sẻ dữ liệu vì không được hưởng lợi thiết bị Vạn vật kết nối (Internet of Things - IoT) ngày càng từ việc đóng góp dữ liệu của mình cho quá trình đào tạo lớn, tạo tiền đề cho sự phát triển của các ứng dụng trí tuệ mô hình máy học. Vì vậy, để xây dựng được một một hệ nhân tạo. Tuy nhiên, với cách tiếp cận truyền thống, việc thu sinh thái thông minh, toàn diện, cần có một cách tiếp cận thập dữ liệu người dùng một cách tập trung đang ngày càng trở nên khó khăn. Đã có những báo cáo cho thấy tồn tại máy học mới. Cách tiếp cận này cần phải giải quyết được những hành vi xâm hại đến quyền riêng tư trên dữ liệu của vấn đề liên quan đến quyền riêng tư của người dùng, và người dùng. Hơn nữa, lợi ích nhận được từ việc đào tạo các đảm bảo được nguồn lợi cho chủ sở hữu dữ liệu. mô hình học máy đa phần không được phân chia cho người Trong bối cảnh đó, phương pháp học cộng tác/học liên sở hữu dữ liệu. Do đó, người dùng thường không sẵn sàng kết (Federated Learning- FL) xuất hiện như một giải pháp chia sẻ dữ liệu của họ với người khác. Trong bài báo này, có thể đáp ứng được yêu cầu huấn luyện mô hình ML hiệu chúng tôi đề xuất một bộ khung giải pháp giúp tận dụng tối đa nguồn tài nguyên dữ liệu của người dùng, mà vẫn đảm quả mà vẫn đảm bảo tính bảo mật và riêng tư của dữ liệu. bảo quyền riêng tư của họ. Chúng tôi áp dụng học liên kết Sử dụng phương pháp FL, các thực thể (các tổ chức, cá (Federated Learning - FL) vào việc huấn luyện các mô hình nhân, thiết bị IoT, ...) tham gia cộng tác được phân phối máy học. Người dùng chỉ chia sẻ mô hình học máy được đào mô hình hiện tại từ máy chủ trung tâm và thực hiện huấn tạo trên dữ liệu của họ thay vì chia sẽ dữ liệu thô. Do đó luyện ngay tại chính thực thể đó bằng cách sử dụng bộ quyền riêng tư của người dùng được đảm bảo. Hơn nữa, các dữ liệu cục bộ. Người dùng chia sẻ mô hình kết quả cho hoạt động đóng góp của người dùng trong hệ thống được ghi lại vào Blockchain. Điều này đảm bảo được sự minh bạch trung tâm tổng hợp thay vì chia sẻ dữ liệu thô của mình. trong quá trình vận hành hệ thống và khuyến khích người Điều này giúp giải quyết được phần lớn các vấn đề liên dùng tham gia đóng góp đào tạo mô hình học máy. quan đến quyền riêng tư dữ liệu người dùng. Tại máy chủ Từ khóa—Blockchain, federated learning, học máy. tổng hợp, quy trình huấn luyện diễn ra nhiều chu kì cho đến khi mô hình toàn cục được tối ưu và đạt hiệu năng I. GIỚI THIỆU như mong đợi. Hiện nay, nhiều quốc gia đã và đang đẩy mạnh chiến Tuy nhiên, trong thực tế còn rất nhiều vấn đề xoay quanh lược xây dựng đô thị thông minh để đón đầu cuộc đua việc triển khai hệ thống học liên kết. Trong đó, điển hình là về sáng tạo khoa học kỹ thuật trong bối cảnh Cách mạng việc thiếu kiểm soát hoạt động sử dụng nguồn tài nguyên Công nghiệp lần thứ Tư (CMCN 4.0). Chìa khoá để hiện mà người dùng cung cấp vào các mục đích xấu và vấn thực chiến lược này chính là trí tuệ nhân tạo (Artificial đề làm sao để sự đóng góp của người dùng được trả công Intelligence - AI), yếu tố đang định hình một hệ sinh thái xứng đáng. Việc chỉ gửi mô hình cục bộ đã được huấn công nghệ xoay quanh việc phục vụ tối đa lợi ích của luyện trên dữ liệu cá nhân lên hệ thống thay vì dữ liệu người dân thông qua việc thực hiện quá trình chuyển đổi thô chưa hoàn toàn giải quyết được các vấn đề về quyền số - số hóa dữ liệu. Trong đó, dữ liệu được người dùng riêng tư. Nhiều nghiên cứu đã chỉ ra rằng, thông qua các chia sẻ đóng vai trò quan trọng trong việc xây dựng hệ mô hình nhận được, kẻ tấn công có thể thực hiện cuộc tấn sinh thái thông minh, mềm dẻo và bền vững trong từng công suy ngược [7]. Bên cạnh đó, vấn đề các nguồn lợi từ lĩnh vực của đời sống kinh tế - xã hội. Các mô hình AI việc huấn luyện mô hình học máy không được phân chia hiện nay đang tận dụng những tiến bộ trong mô hình học hợp lý cho các bên tham gia cũng khiến chủ sở hữu dữ máy (Machine Learning - ML) để nâng cao tính ưu việt liệu do dự khi được mời tham gia đóng góp. Để giải quyết của hệ sinh thái thông minh. Điều này cần một khối lượng các vấn đề trên, Blockchain được chúng tôi đề xuất như dữ liệu lớn và đa dạng để đào tạo. Cách tiếp cận xây dựng một giải pháp hỗ trợ FL trong việc lưu trữ bằng chứng về mô hình ML hiện nay chủ yếu là thu thập dữ liệu cho hoạt động của các thực thể trong hệ thống. Những bằng việc đào tạo tập trung tại một máy chủ, sau đó đào tạo chứng này phục vụ cho quá trình điều ...
Tìm kiếm theo từ khóa liên quan:
Thiết bị Vạn vật kết nối Mô hình học máy Trí tuệ nhân tạo Kiến trúc của hệ thống FedChain Môi trường thực nghiệm BlockchainGợi ý tài liệu liên quan:
-
Đề cương chi tiết học phần Trí tuệ nhân tạo
12 trang 417 0 0 -
7 trang 210 0 0
-
Kết quả bước đầu của ứng dụng trí tuệ nhân tạo trong phát hiện polyp đại tràng tại Việt Nam
10 trang 167 0 0 -
Xu hướng và tác động của cách mạng công nghiệp lần thứ tư đến môi trường thông tin số
9 trang 161 0 0 -
6 trang 152 0 0
-
9 trang 150 0 0
-
Tìm hiểu về Luật An ninh mạng (hiện hành): Phần 1
93 trang 146 0 0 -
Trích xuất danh mục khía cạnh sử dụng BERT với hàm mất mát cân bằng
9 trang 130 0 0 -
Luận văn tốt nghiệp: Ứng dụng trí tuệ nhân tạo trong xây dựng GAME
0 trang 129 0 0 -
158 trang 126 0 0