Danh mục

Thiết kế, phân tích và phát triển một thuật toán di truyền tương tác để tạo sinh ảnh dựa theo hướng dẫn đánh giá của con người: Dự án Permutopainter

Số trang: 10      Loại file: pdf      Dung lượng: 1.02 MB      Lượt xem: 9      Lượt tải: 0    
tailieu_vip

Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Trong bài báo này, các tác giả sử dụng một số kỹ thuật nhằm trích rút đặc trưng của từng ảnh, sau đó sử dụng thuật toán K-medoids để phân cụm ảnh. Cuối cùng là sử dụng thuật toán rừng ngẫu nhiên kết hợp với sự tương tác của người dùng tạo ra các hình ảnh giống với ý muốn của người dùng.
Nội dung trích xuất từ tài liệu:
Thiết kế, phân tích và phát triển một thuật toán di truyền tương tác để tạo sinh ảnh dựa theo hướng dẫn đánh giá của con người: Dự án PermutopainterKỷ yếu công trình khoa học 2015 - Phần ITHIẾT KẾ, PHÂN TÍCH VÀ PHÁT TRIỂN MỘT THUẬTTOÁN DI TRUYỀN TƢƠNG TÁC ĐỂ TẠO SINH ẢNHDỰA THEO HƢỚNG DẪN ĐÁNH GIÁ CỦA CON NGƢỜI :DỰ ÁN PERMUTOPAINTERĐào Thị DuyênKhoa Toán-Tin, Đại học Thăng LongEmail: dtduyen90@gmail.comTóm tắt: Dự án PermutoPainter dựa trên ý tưởng của bộ sưu tập“Arrangement avec le hasard” (Sắp xếp ngẫu nhiên) được triển lãm tại Paris vàotháng 11 năm 2014 của họa sĩ người pháp Bernard Gortais. Bộ sưu tập này giống nhưviệc nghiên cứu thứ tự sắp xếp của 6x4 ô vuông trong một bức tranh bằng cách xoayquay chúng một góc 90o hoặc tráo đổi vị trí giữa các ô cho nhau. Mục đích chính củadự án này là tạo ra những cấu trúc thú vị bằng cách kết hợp ngẫu nhiên 24 ô của bứctranh. Vì với mỗi cách bố trí đường nét (lên, xuống, ngang, dọc), màu sắc và bố cụckhác nhau, nó sẽ đem lại cho người xem những cảm xúc khác nhau. Trong bài báonày,chúng tôi sử dụng một số kỹ thuật nhằm trích rút đặc trưng của từng ảnh, sau đó sửdụng thuật toán K-medoids để phân cụm ảnh. Cuối cùng là sử dụng thuật toán rừngngẫu nhiên kết hợp với sự tương tác của người dùng tạo ra các hình ảnh giống với ýmuốn của người dùng.Từ khóa: Giải thuật di truyền, phân cụm, Rừng ngẫu nhiên, Xử lý ảnh, KMedoids.1. Mở đầuHội họa là điều mà chúng ta không nghĩ rằng một chiếc máy tính có thể tạo ra.Bởi nó trừu tượng, biểu cảm, gắn liền với các nền văn hóa, tâm lý học và chủ quan. Cònmáy tính thì khách quan, chính xác và chi phối bởi các nguyên tắc toán học. Tuy nhiên,trong thực tế, hội họa và các lĩnh vực nghệ thuật thị giác khác sử dụng rất nhiều toánhọc như hình học, luật phối cảnh, thuật toán, cái mà máy tính có thể hiểu được để tạo ranhững hình ảnh đa dạng, tinh tế giống như người họa sĩ. Một người tiên phong tronglĩnh vực này là họa sĩ Harold Cohen. Ông đã xây dựng một chương trình sáng tạo nghệthuật sử dụng trí thông mình nhân tạo AARON năm 1973 [1].Việc sử dụng các thuật toán tiến hóa tương tác như giải thuật di truyền để tạosinh ảnh đã trở nên khá phổ biến mà nguốn gốc của nó được tìm thấy trong cuốn sách“The Blind Watchmaker” [2] được viết bởi nhà sinh học tiến hóa Richard Dawkins. Sauđó, là các hệ thống được phát triển bởi [3] và [4]. Chúng được xem là các tác phẩmnghệ thuật có ảnh hưởng nhất trong lĩnh vực nghệ thuật thị giác. Trào lưu này đã mở ramột lĩnh vực nghệ thuật mới, đó là “Nghệ thuật tiến hóa” [5].Trường Đại học Thăng Long1Kỷ yếu công trình khoa học 2015 - Phần ITrong bài báo này, chúng tôi sẽ trình bày về dự án PermutoPainter được pháttriển trong bộ sưu tập “Sắp xếp ngẫu nhiên” của họa sĩ người pháp Bernard Gortais. Nóđược triển lãm tại Paris vào tháng 11 năm 2014. Một tác phẩm hội họa (ví dụ như mộtđường trải dài trên bức tranh như hình 1) được căt ra thành 24 ô vuông bằng nhau rồilại được ghép lại một cách ngẫu nhiên, hoàn toàn độc lập với ảnh ban đầu.Hình 1- Ví dụ một kiểu sắp xếpYêu cầu của người dùng là xây dựng một công cụ cho phép khám phá một ýkiến khách quan mang tính nghệ thuật với một số lượng lớn các hoán vị có thể trên mộttập không gian (khái niệm không gian ở đây chính là bố cục của một bức ảnh) kết hợpvới sự phát hiện những tính chất nổi bật của từng hoán vị, cái được xác định bởi ngườisử dụng. Đó là lý do chúng tôi đi xây dựng dự án PermutoPainter. Bằng cách phân tíchvà cài đặt một thuật toán tiến hóa nhằm giúp tìm kiếm và xác định một cách hiệu quảcác kết hợp “interesting” từ các mảnh nhỏ của ảnh với sự tương tác của người dùng(Feng & Ting, 2014). Trước tiên, một ảnh được cắt ra thành 6x4 phần bằng nhau, sauđó chúng được chuyển sang dạng nhị phân, tính toán các điểm đặc trưng trên ảnh vàbiểu diễn các đặc trưng này thành một véctơ mô tả n-chiều. Các véctơ này được phânnhóm vào k-cụm (cluster) bởi thuật toán K-medoids. Những ảnh là trung tâm của mỗicụm sẽ được hiển thị cho người dùng đánh giá độ thú vị (interest) và định tính của từngảnh (ví dụ: buồn, vui, tĩnh mịch hay sôi động…). Tiếp đến, chúng tôi sử dụng thuậttoán rừng ngẫu nhiên để huấn luyện. Thuật toán này thường phù hợp với các bộ dữ liệucó số chiều rất lớn. Cuối cùng, chương trình sẽ tạo sinh ra những ảnh thuộc lớp thuộctính mà người dùng yêu cầu.Phần còn lại của bài báo được tổ chức như sau: phần 2 mô tả các nghiên cứu, cơsở lý thuyết liên quan tới đề tài; phần 3 mô tả khái quát về các phương pháp nghiên cứuđược áp dụng trong đề tài. Sau đó là kết quả thực nghiệm được trình bày ở phần 4. Cuốicùng là phần 5 kết luận và hướng phát triển2. Các nghiên cứu liên quanTrường Đại học Thăng Long2Kỷ yếu công trình khoa học 2015 - Phần ITrong mục này chúng tôi phân tích các cơ sở lý thuyết liên quan tới bài báo.Trước tiên là một ứng dụng tạo sinh ảnh dựa trên giải thuật di truyền của nhóm tác giảngười Đài Loan [6]. Tiếp đến, với mục đích giúp người đọc hiểu đư ...

Tài liệu được xem nhiều:

Tài liệu cùng danh mục:

Tài liệu mới: