Nghiên cứu đề xuất thuật toán giả lập âm thanh 3D dùng hai nguồn phát âm
Số trang: 8
Loại file: pdf
Dung lượng: 415.52 KB
Lượt xem: 23
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài báo đưa ra đề xuất xây dựng thuật toán và chương trình có tác dụng giả lập âm thanh 3D từ hai nguồn phát âm. Chương trình giả lập sự lan truyền của một nguồn âm thanh từ một hướng bất kỳ trong không gian 3D sử dụng 2 loa nằm ở phía trước của người nghe, bằng cách sử dụng phép đo dữ liệu hàm HRTF để giả lập sự lan truyền của âm thanh và sau đó loại bỏ các hiệu ứng không gian khác của loa. Chương trình được phát triển trên ngôn ngữ lập trình Python và dựa trên 4 bước: định hướng tín hiệu âm thanh, phát hiện độ cao của nguồn, xây dựng hàm truyền đạt âm thanh và cuối cùng là khử nhiễu xuyên âm của loa.
Nội dung trích xuất từ tài liệu:
Nghiên cứu đề xuất thuật toán giả lập âm thanh 3D dùng hai nguồn phát âm Kỹ thuật điều khiển & Điện tử NGHIÊN CỨU ĐỀ XUẤT THUẬT TOÁN GIẢ LẬP ÂM THANH 3D DÙNG HAI NGUỒN PHÁT ÂM Lương Công Duẩn*, Nguyễn Ngọc Minh, Nguyễn Quốc Uy Tóm tắt: Bài báo đưa ra đề xuất xây dựng thuật toán và chương trình có tác dụng giả lập âm thanh 3D từ hai nguồn phát âm. Chương trình giả lập sự lan truyền của một nguồn âm thanh từ một hướng bất kỳ trong không gian 3D sử dụng 2 loa nằm ở phía trước của người nghe, bằng cách sử dụng phép đo dữ liệu hàm HRTF để giả lập sự lan truyền của âm thanh và sau đó loại bỏ các hiệu ứng không gian khác của loa. Chương trình được phát triển trên ngôn ngữ lập trình Python và dựa trên 4 bước: định hướng tín hiệu âm thanh, phát hiện độ cao của nguồn, xây dựng hàm truyền đạt âm thanh và cuối cùng là khử nhiễu xuyên âm của loa. Từ khóa: DSP, Xử lý âm thanh, Giả lập, Âm thanh 3D, Biến đổi Fourier. 1. GIỚI THIỆU CHUNG Hiệu ứng âm thanh 3D là một nhóm các hiệu ứng âm thanh và các dao động âm thanh được tạo ra bởi các loa stereo, loa âm thanh vòm, loa mảng, hoặc tai nghe, giúp con người không chỉ cảm nhận được nguồn âm thanh đến từ trước mặt mà nó sẽ tạo ra nguồn âm thanh sẽ đến từ bất cứ nơi nào trong không gian ba chiều, bao gồm cả phía sau, phía trên và phía dưới người nghe. Về bản chất, tác động của âm thanh 3D lên tai cũng giống như tác động của hình ảnh 3D đối với mắt. Để kiểm soát cảm giác của người nghe một cách tích cực thì đòi hỏi cần phải kiểm soát tất cả các khía cạnh về sự cảm nhận của con người đối với âm thanh. Hoạt động của hệ thống âm thanh 3D sẽ báo trước những thay đổi về các thuộc tính trong không gian âm thanh của người nghe. Hình 1. Các thuộc tính liên quan đến sự cảm nhận âm thanh trong không gian. Trong các nghiên cứu tâm lý trước đây, các điểm tham chiếu được dùng cho việc mô tả khoảng cách và vị trí của âm thanh ảo (Sound image) được đặt tại điểm gốc giữa hai tai, gần mắt và ở điểm trung tâm của đầu. Ngoài ra, cần xác định một nguồn âm thanh ảo, điều đó cũng có nghĩa khoảng cách tuyến tính giữa nguồn âm thanh ảo đó và người nghe là khoảng cách thấy được. Hình 1 đưa ra hai quy ước cho việc mô tả góc cảm nhận đối với một nguồn âm ảo gồm góc phương vị và độ cao. Góc phương vị là 00 thì đây là điểm trực tiếp trên 78 L. C. Duẩn, N. N. Minh, N. Q. Uy, “Nghiên cứu đề xuất thuật toán… hai nguồn phát âm.” Nghiên cứu khoa học công nghệ đầu của người nghe, dọc theo đường chia đôi góc từ điểm xuất phát. Trong một số hệ thống, góc phương vị được miêu tả như chiều quay theo kim đồng hồ, góc quay từ 00 đến 3600 dọc theo vòng tròn góc phương vị. Việc miêu tả góc phương vị và độ cao có thể xác định vị trí của nguồn âm xung quanh bề mặt hình cầu trên đầu người nghe. Yếu tố cần nghiên cứu cuối cùng trong không gian âm thanh này, chủ yếu đề cập đến những tác động ảnh hưởng của âm vang được sinh ra từ sự lặp đi lặp lại của nguồn âm xuất phát từ bề mặt khoang kín (hình 2). S là Nguồn âm, E là Môi trường nghiên cứ, L là vị trí tai nghe. Hình 2. Mô hình 2 chiều đơn giản. Các phản xạ âm từ bề mặt của khoang kín hoặc môi trường bên ngoài mà ảnh hưởng của nó được thể hiện qua tập hợp các nguồn âm thứ cấp, có thể gây ảnh hưởng rất nhiều đến cách cảm nhận nguồn âm. 2. ĐỊNH VỊ ÂM THANH TRONG KHÔNG GIAN ÂM THANH ẢO VÀ TỔNG HỢP PHA CỦA HÀM TRUYỀN ĐẠT Định vị âm thanh trong không gian ảo: Một giả định cơ bản trong việc tạo ra một không gian âm thanh ảo là nếu các sóng âm thanh xuất hiện tại màng nhĩ của người nghe giống với khi đang sử dụng tai nghe, thì những trải nghiệm của người nghe cũng phải được như vậy. Sử dụng Head Related Transfer Function (HRTF), âm thanh có thể được định vị trong không gian bằng cách sử dụng những nguồn tín hiệu sau: x1(t) là tín hiệu đến từ loa, y1(t) là tín hiệu nhận được từ một micro bên trong màng nhĩ của người nghe, x2(t) là tín hiệu đến từ tai nghe và y2(t) là phản ứng của micro bên trong màng nhĩ của người nghe. Mục đích của không gian âm thanh ảo là chọn được x2(t) sao cho y2(t) = y1(t). Áp dụng biến đổi Fourier với các tín hiệu này, chúng ta có 2 phương trình sau đây: Y1=X1LFM và Y2=X2HM (1) Trong đó: L: Hàm truyền đạt của loa trong trường tự do F: Hàm truyền đạt vào đầu (hàm truyền đạt) M: Hàm truyền đạt của micro H: Hàm truyền đạt từ headphone – màng nhĩ. LF X 2 X 1 H Đặt Y1 = Y2 , ta có: X 1 LFM X 2 HM (2) X LF 2 X 1 H Tạp chí Nghiên cứu KH&CN quân sự, Số 46, 12 - 2016 79 Kỹ thuật điều khiển & Điện tử LF Vậy hàm truyền đạt cần có: T (3) H Nếu x1(t) vượt qua được bộ lọc này và x2(t) được phát trên tai nghe, thì nó sẽ sinh ra các tín hiệu tương tự ở màng nhĩ. Do các bộ lọc chỉ áp dụng cho một tai, nên một số khác sẽ phải lấy cho tai khác. Quá trình này được lặp lại tại nhiều nơi trong không gian ảo để tạo ra một loạt các hàm HRTF cho mỗi vị trí có thể tái tạo lại mà vẫn đảm bảo rằng các điều kiện lấy mẫu tuân thủ theo định luật Nyquist. Một pha HRTF có thẻ được mô tả bởi một hệ số tỉ lệ Interaural Time Difference (ITD). Được định lượng bởi dữ liệu nhân trắc học của một cá nhân đưa ra như một nguồn tham khảo. Đối với những trường hợp chung, chúng ta coi β như một vector rải rác. ...
Nội dung trích xuất từ tài liệu:
Nghiên cứu đề xuất thuật toán giả lập âm thanh 3D dùng hai nguồn phát âm Kỹ thuật điều khiển & Điện tử NGHIÊN CỨU ĐỀ XUẤT THUẬT TOÁN GIẢ LẬP ÂM THANH 3D DÙNG HAI NGUỒN PHÁT ÂM Lương Công Duẩn*, Nguyễn Ngọc Minh, Nguyễn Quốc Uy Tóm tắt: Bài báo đưa ra đề xuất xây dựng thuật toán và chương trình có tác dụng giả lập âm thanh 3D từ hai nguồn phát âm. Chương trình giả lập sự lan truyền của một nguồn âm thanh từ một hướng bất kỳ trong không gian 3D sử dụng 2 loa nằm ở phía trước của người nghe, bằng cách sử dụng phép đo dữ liệu hàm HRTF để giả lập sự lan truyền của âm thanh và sau đó loại bỏ các hiệu ứng không gian khác của loa. Chương trình được phát triển trên ngôn ngữ lập trình Python và dựa trên 4 bước: định hướng tín hiệu âm thanh, phát hiện độ cao của nguồn, xây dựng hàm truyền đạt âm thanh và cuối cùng là khử nhiễu xuyên âm của loa. Từ khóa: DSP, Xử lý âm thanh, Giả lập, Âm thanh 3D, Biến đổi Fourier. 1. GIỚI THIỆU CHUNG Hiệu ứng âm thanh 3D là một nhóm các hiệu ứng âm thanh và các dao động âm thanh được tạo ra bởi các loa stereo, loa âm thanh vòm, loa mảng, hoặc tai nghe, giúp con người không chỉ cảm nhận được nguồn âm thanh đến từ trước mặt mà nó sẽ tạo ra nguồn âm thanh sẽ đến từ bất cứ nơi nào trong không gian ba chiều, bao gồm cả phía sau, phía trên và phía dưới người nghe. Về bản chất, tác động của âm thanh 3D lên tai cũng giống như tác động của hình ảnh 3D đối với mắt. Để kiểm soát cảm giác của người nghe một cách tích cực thì đòi hỏi cần phải kiểm soát tất cả các khía cạnh về sự cảm nhận của con người đối với âm thanh. Hoạt động của hệ thống âm thanh 3D sẽ báo trước những thay đổi về các thuộc tính trong không gian âm thanh của người nghe. Hình 1. Các thuộc tính liên quan đến sự cảm nhận âm thanh trong không gian. Trong các nghiên cứu tâm lý trước đây, các điểm tham chiếu được dùng cho việc mô tả khoảng cách và vị trí của âm thanh ảo (Sound image) được đặt tại điểm gốc giữa hai tai, gần mắt và ở điểm trung tâm của đầu. Ngoài ra, cần xác định một nguồn âm thanh ảo, điều đó cũng có nghĩa khoảng cách tuyến tính giữa nguồn âm thanh ảo đó và người nghe là khoảng cách thấy được. Hình 1 đưa ra hai quy ước cho việc mô tả góc cảm nhận đối với một nguồn âm ảo gồm góc phương vị và độ cao. Góc phương vị là 00 thì đây là điểm trực tiếp trên 78 L. C. Duẩn, N. N. Minh, N. Q. Uy, “Nghiên cứu đề xuất thuật toán… hai nguồn phát âm.” Nghiên cứu khoa học công nghệ đầu của người nghe, dọc theo đường chia đôi góc từ điểm xuất phát. Trong một số hệ thống, góc phương vị được miêu tả như chiều quay theo kim đồng hồ, góc quay từ 00 đến 3600 dọc theo vòng tròn góc phương vị. Việc miêu tả góc phương vị và độ cao có thể xác định vị trí của nguồn âm xung quanh bề mặt hình cầu trên đầu người nghe. Yếu tố cần nghiên cứu cuối cùng trong không gian âm thanh này, chủ yếu đề cập đến những tác động ảnh hưởng của âm vang được sinh ra từ sự lặp đi lặp lại của nguồn âm xuất phát từ bề mặt khoang kín (hình 2). S là Nguồn âm, E là Môi trường nghiên cứ, L là vị trí tai nghe. Hình 2. Mô hình 2 chiều đơn giản. Các phản xạ âm từ bề mặt của khoang kín hoặc môi trường bên ngoài mà ảnh hưởng của nó được thể hiện qua tập hợp các nguồn âm thứ cấp, có thể gây ảnh hưởng rất nhiều đến cách cảm nhận nguồn âm. 2. ĐỊNH VỊ ÂM THANH TRONG KHÔNG GIAN ÂM THANH ẢO VÀ TỔNG HỢP PHA CỦA HÀM TRUYỀN ĐẠT Định vị âm thanh trong không gian ảo: Một giả định cơ bản trong việc tạo ra một không gian âm thanh ảo là nếu các sóng âm thanh xuất hiện tại màng nhĩ của người nghe giống với khi đang sử dụng tai nghe, thì những trải nghiệm của người nghe cũng phải được như vậy. Sử dụng Head Related Transfer Function (HRTF), âm thanh có thể được định vị trong không gian bằng cách sử dụng những nguồn tín hiệu sau: x1(t) là tín hiệu đến từ loa, y1(t) là tín hiệu nhận được từ một micro bên trong màng nhĩ của người nghe, x2(t) là tín hiệu đến từ tai nghe và y2(t) là phản ứng của micro bên trong màng nhĩ của người nghe. Mục đích của không gian âm thanh ảo là chọn được x2(t) sao cho y2(t) = y1(t). Áp dụng biến đổi Fourier với các tín hiệu này, chúng ta có 2 phương trình sau đây: Y1=X1LFM và Y2=X2HM (1) Trong đó: L: Hàm truyền đạt của loa trong trường tự do F: Hàm truyền đạt vào đầu (hàm truyền đạt) M: Hàm truyền đạt của micro H: Hàm truyền đạt từ headphone – màng nhĩ. LF X 2 X 1 H Đặt Y1 = Y2 , ta có: X 1 LFM X 2 HM (2) X LF 2 X 1 H Tạp chí Nghiên cứu KH&CN quân sự, Số 46, 12 - 2016 79 Kỹ thuật điều khiển & Điện tử LF Vậy hàm truyền đạt cần có: T (3) H Nếu x1(t) vượt qua được bộ lọc này và x2(t) được phát trên tai nghe, thì nó sẽ sinh ra các tín hiệu tương tự ở màng nhĩ. Do các bộ lọc chỉ áp dụng cho một tai, nên một số khác sẽ phải lấy cho tai khác. Quá trình này được lặp lại tại nhiều nơi trong không gian ảo để tạo ra một loạt các hàm HRTF cho mỗi vị trí có thể tái tạo lại mà vẫn đảm bảo rằng các điều kiện lấy mẫu tuân thủ theo định luật Nyquist. Một pha HRTF có thẻ được mô tả bởi một hệ số tỉ lệ Interaural Time Difference (ITD). Được định lượng bởi dữ liệu nhân trắc học của một cá nhân đưa ra như một nguồn tham khảo. Đối với những trường hợp chung, chúng ta coi β như một vector rải rác. ...
Tìm kiếm theo từ khóa liên quan:
Thuật toán giả lập âm thanh 3D Hai nguồn phát âm Âm thanh 3D Biến đổi Fourier Xử lý âm thanhGợi ý tài liệu liên quan:
-
Xử lý tín hiệu số và Matlab: Phần 2
134 trang 135 0 0 -
Chương trình khung trình độ trung cấp nghề Thiết kế đồ họa - Trường CĐN GTVT Đường Thuỷ 1
6 trang 34 0 0 -
Bài giảng Xử lý số tín hiệu: Chương 3 - ĐH Sài Gòn
36 trang 33 0 0 -
Bài giảng Xử lý tín hiệu số: Chương 5 - ĐH Công nghệ
26 trang 29 0 0 -
Giáo trình Xử lý tín hiệu số 2: Phần 1
104 trang 29 0 0 -
Bài giảng Xử lý số tín hiệu - ThS. Đào Thị Thu Thủy
307 trang 29 0 0 -
Về một phương pháp nâng cao hiệu năng che giấu thông tin trong âm thanh
7 trang 26 0 0 -
Bài giảng Toán kỹ thuật: Chương 2.1 - Tích phân Fourier & biến đổi Fourier (ĐH Bách Khoa TP.HCM)
20 trang 25 0 0 -
Bài giảng xử lý số tín hiệu - Chương 3
54 trang 24 0 0 -
Chương 3: Phân tích tín hiệu miền tần số
35 trang 23 0 0