TẠI SAO PHẢI DÙNG BỘ XỬ LÝ VECTOR
Số trang: 46
Loại file: doc
Dung lượng: 953.00 KB
Lượt xem: 11
Lượt tải: 0
Xem trước 5 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Chúng ta đã biết cách để có thể tăng đáng kể hiệu suất của một bộ xửlý bằng cách thiết lập nhiều lệnh trên một chu kỳ đồng hồ và độ sâu hơnđường ống dẫn các đơn vị thực hiện để cho phép khai thác lớn hơn củachỉ thị cấp xử lí song song. Tuy nhiên,bao giờ chúng ta cũng thấy rằng cónhững khó khăn lớn trong việc khai thác độ lớn của ILP.
Nội dung trích xuất từ tài liệu:
TẠI SAO PHẢI DÙNG BỘ XỬ LÝ VECTOR 1, TẠI SAO PHẢI DÙNG BỘ XỬ LÝ VECTOR ? Chúng ta đã biết cách để có thể tăng đáng kể hiệu suất của một bộ xửlý bằng cách thiết lập nhiều lệnh trên một chu kỳ đồng hồ và độ sâu hơnđường ống dẫn các đơn vị thực hiện để cho phép khai thác lớn hơn củachỉ thị cấp xử lí song song. Tuy nhiên,bao giờ chúng ta cũng thấy rằng cónhững khó khăn lớn trong việc khai thác độ lớn của ILP. Khi chúng ta tăng cả chiều rộng của vấn đề lệnh và độ độ sâu củaống dẫn máy tính, chúng ta cũng tăng số lượng các lệnhđộc lập cần thiếtđể giữ cho các bộ xử lý hoạt động rộn với công việc hữu ích. Điều này cónghĩa là sự gia tăng số lượng lệnh thực hiện đồng thời cùng một thờigian. Đối với một máy tính tự động theo lịch trình, cấu trúc phần cứng,chẳng hạn như cửa sổ hướng dẫn, sắp xếp lại bộ đệm, và đổi tên thanhghi tập tin, phải phát triển để có đủ năng lực để giữ tất cả trong các lệnhtrên máy bay, và tệ hơn, số cổng trên mỗi phần tử của các cấu trúc phảiphát triển với vấn đề chiều rộng . Các logic để theo dõi phụ thuộc giữatất cả các lệnh trong chuyến bay bình phương phát triển về số lượnglệnh. Ngay cả một VLIW tĩnh máy dự kiến, mà thay đổi nhiều khó khănlên trình tự để biên dịch, thanh ghi yêu cầu nhiều hơn, các cổng mỗithanh ghi nhiều hơn, và khóa liên động nguy hiểm hơn logic (giả định mộtvấn đề thiết kế hợp phần cứng quản lý các khóa liên động sau thời gian)để hỗ trợ nhiều hơn trong việc chuyển lệnh, mà tương tự gây ra mạchtăng hai bậc có kích thước và độ sâu. Sự gia tăng nhanh chóng trong mạchđộ sâu làm khó khăn cho máy tính có thể kiểm soát số lượng lớn cáclệnh chuyển, và do đó giới hạn độ độ sâu thực tế vấn đề độ rộng đườngống . Bộ xử lý véc tơ đã được sử dụng thành công từ lâu trước khi lệnh -mức lệnh máy song song và lấy phương pháp khác để kiểm soát đơn vịchức năng với nhiều đường ống dẫn độ sâu. Bộ xử lý véc tơ cung cấpthao tác cao cấp làm việc trên véc tơ - tuyến tính mảng của số. Thao tácvéc tơ điển hình có thể thêm hai phần 64 - ph ần tử, véc tơ d ấu ph ẩy đ ộngđể đạt được kết quả hơn 64 - phần tử véc tơ . Lệnh véc t ơ t ương đ ươngvới toàn bộ vòng lặp, với mỗi một máy tính lặp đi lặp lại kết qu ả c ủa 64phần tử , cập nhật các chỉ số , và phân nhánh ở đầu. Lệnh véc tơ có vàithuộc tính quan trọng giải quyết hầu hết các vấn đề đề cập ở trên : ■ lệnh véc tơ đơn xác định nhiều công việc - nó t ương đương với th ựchiện toàn bộ vòng lặp. Mỗi lệnh đại diện cho hàng chục hoặc hàng trăm 1thao tác, và vì thế tìm nạp lệnh và giải mã băng thông c ần gi ữ nhi ều đ ơnvị chức năng là giảm đáng kể thao tác của các đường ống dẫn độ sâu. ■ bằng cách sử dụng lệnh véc tơ, trình biên dịch hoặc lập trình viên chothấy tính toán mỗi lệnh đến véc tơ không lệ thuộc vào tính toán khác màlệnh đến véc tơ giống nhau và phần cứng không cần ph ải kiểm tra nh ữngkho khăn về dữ liệu trong lệnh véc tơ. Phần tử trong véc tơ có thể tínhtoán sử dụng mảng của đơn vị xử lí song song, hoặc rất độ sâu đ ơn v ịchức năng, hoặc bất kỳ cấu hình trung gian của xử lí song song và đ ườngống dẫn đơn vị chức năng. ■ Phần cứng chỉ cần kiểm tra những khó khăn về dữ liệu giữa haivéctơ lệnh một lần mỗi toán hạng véc tơ, không kiểm tra cho mỗi mộtphần tử trong véc tơ. Điều đó có nghĩa là tính phụ thuộc ki ểm tra lôgiccần thiết giữa hai véc tơ lệnh là khoảng như bắt buộc giữa hai lệnh vôhướng, nhưng bây giờ nhiều thao tác căn bản có thể đang chuy ển cho đ ộđộ sâu hơn tương tự của lôgic điều khiển . ■ lệnh Véc tơ được bộ nhớ truy cập có mẫu truy cập biết đến. Nếu t ấtcả các phần tử của véc tơ được liền kề, vậy thì tìm nạp xen kẽ nhi ềuvéc tơ từ tập hợp các bộ nhớ máy tính làm việc rất tốt . Độ trễ cao củakhởi xướng truy cập bộ nhớ chính đối với truy cập bộ nhớ cache đượctruyền lại, vì truy cập đơn được khởi tạo cho toàn bộ véc tơ thay vì đếnmột từ riêng lẻ. Vì vậy, chi phí của độ trễ cho bộ nhớ chính là xem toànbộ véc tơ một lần, thay vì mỗi lần đối với mỗi từ của véc tơ. ■ Vì toàn bộ vòng lặp được thay bằng lệnh véc tơ được th ực hiện làxác định trước, những hiểm nguy điều khiển thường phát sinh từ nhánhvòng lặp là không còn nữa. Vì những lý do này, thao tác véc tơ có th ể làm nhanh h ơn dãy các thaotác ống xoắn trên cùng một số các tập dữ liệu, và người thiết kế đượcthúc đẩy để bao gồm đơn vị véc tơ nếu lĩnh vực ứng dụng có thể sử dụngchúng thường xuyên. Như đã đề cập trên đây, ống dẫn bộ xử lý véc tơ và đặt ngang hàngthao tác trên các phần tử riêng lẻ của véc tơ. Thao tác bao g ồm khôngnhững phép toán số học ( phép nhân,v.v..), mà còn cơ sở dữ liệu bộ nhớvà hiệu quả tính toán địa chỉ. Ngoài ra, hầu hết bộ xử lý véc tơ cao cấp đểnhiều lệnh véc tơ được tiến hành cùng một lúc, tạo ra tính tương đươnggiữa thao tác trên véc tơ khác nhau. Bộ xử lý véc tơ có hữu ích đặc biệt lớn cho khoa h ọc và k ỹ thu ật ứngdụng, bao gồm mô phỏng các vụ đâm xe và dự báo th ời ti ết, theo đó vi ...
Nội dung trích xuất từ tài liệu:
TẠI SAO PHẢI DÙNG BỘ XỬ LÝ VECTOR 1, TẠI SAO PHẢI DÙNG BỘ XỬ LÝ VECTOR ? Chúng ta đã biết cách để có thể tăng đáng kể hiệu suất của một bộ xửlý bằng cách thiết lập nhiều lệnh trên một chu kỳ đồng hồ và độ sâu hơnđường ống dẫn các đơn vị thực hiện để cho phép khai thác lớn hơn củachỉ thị cấp xử lí song song. Tuy nhiên,bao giờ chúng ta cũng thấy rằng cónhững khó khăn lớn trong việc khai thác độ lớn của ILP. Khi chúng ta tăng cả chiều rộng của vấn đề lệnh và độ độ sâu củaống dẫn máy tính, chúng ta cũng tăng số lượng các lệnhđộc lập cần thiếtđể giữ cho các bộ xử lý hoạt động rộn với công việc hữu ích. Điều này cónghĩa là sự gia tăng số lượng lệnh thực hiện đồng thời cùng một thờigian. Đối với một máy tính tự động theo lịch trình, cấu trúc phần cứng,chẳng hạn như cửa sổ hướng dẫn, sắp xếp lại bộ đệm, và đổi tên thanhghi tập tin, phải phát triển để có đủ năng lực để giữ tất cả trong các lệnhtrên máy bay, và tệ hơn, số cổng trên mỗi phần tử của các cấu trúc phảiphát triển với vấn đề chiều rộng . Các logic để theo dõi phụ thuộc giữatất cả các lệnh trong chuyến bay bình phương phát triển về số lượnglệnh. Ngay cả một VLIW tĩnh máy dự kiến, mà thay đổi nhiều khó khănlên trình tự để biên dịch, thanh ghi yêu cầu nhiều hơn, các cổng mỗithanh ghi nhiều hơn, và khóa liên động nguy hiểm hơn logic (giả định mộtvấn đề thiết kế hợp phần cứng quản lý các khóa liên động sau thời gian)để hỗ trợ nhiều hơn trong việc chuyển lệnh, mà tương tự gây ra mạchtăng hai bậc có kích thước và độ sâu. Sự gia tăng nhanh chóng trong mạchđộ sâu làm khó khăn cho máy tính có thể kiểm soát số lượng lớn cáclệnh chuyển, và do đó giới hạn độ độ sâu thực tế vấn đề độ rộng đườngống . Bộ xử lý véc tơ đã được sử dụng thành công từ lâu trước khi lệnh -mức lệnh máy song song và lấy phương pháp khác để kiểm soát đơn vịchức năng với nhiều đường ống dẫn độ sâu. Bộ xử lý véc tơ cung cấpthao tác cao cấp làm việc trên véc tơ - tuyến tính mảng của số. Thao tácvéc tơ điển hình có thể thêm hai phần 64 - ph ần tử, véc tơ d ấu ph ẩy đ ộngđể đạt được kết quả hơn 64 - phần tử véc tơ . Lệnh véc t ơ t ương đ ươngvới toàn bộ vòng lặp, với mỗi một máy tính lặp đi lặp lại kết qu ả c ủa 64phần tử , cập nhật các chỉ số , và phân nhánh ở đầu. Lệnh véc tơ có vàithuộc tính quan trọng giải quyết hầu hết các vấn đề đề cập ở trên : ■ lệnh véc tơ đơn xác định nhiều công việc - nó t ương đương với th ựchiện toàn bộ vòng lặp. Mỗi lệnh đại diện cho hàng chục hoặc hàng trăm 1thao tác, và vì thế tìm nạp lệnh và giải mã băng thông c ần gi ữ nhi ều đ ơnvị chức năng là giảm đáng kể thao tác của các đường ống dẫn độ sâu. ■ bằng cách sử dụng lệnh véc tơ, trình biên dịch hoặc lập trình viên chothấy tính toán mỗi lệnh đến véc tơ không lệ thuộc vào tính toán khác màlệnh đến véc tơ giống nhau và phần cứng không cần ph ải kiểm tra nh ữngkho khăn về dữ liệu trong lệnh véc tơ. Phần tử trong véc tơ có thể tínhtoán sử dụng mảng của đơn vị xử lí song song, hoặc rất độ sâu đ ơn v ịchức năng, hoặc bất kỳ cấu hình trung gian của xử lí song song và đ ườngống dẫn đơn vị chức năng. ■ Phần cứng chỉ cần kiểm tra những khó khăn về dữ liệu giữa haivéctơ lệnh một lần mỗi toán hạng véc tơ, không kiểm tra cho mỗi mộtphần tử trong véc tơ. Điều đó có nghĩa là tính phụ thuộc ki ểm tra lôgiccần thiết giữa hai véc tơ lệnh là khoảng như bắt buộc giữa hai lệnh vôhướng, nhưng bây giờ nhiều thao tác căn bản có thể đang chuy ển cho đ ộđộ sâu hơn tương tự của lôgic điều khiển . ■ lệnh Véc tơ được bộ nhớ truy cập có mẫu truy cập biết đến. Nếu t ấtcả các phần tử của véc tơ được liền kề, vậy thì tìm nạp xen kẽ nhi ềuvéc tơ từ tập hợp các bộ nhớ máy tính làm việc rất tốt . Độ trễ cao củakhởi xướng truy cập bộ nhớ chính đối với truy cập bộ nhớ cache đượctruyền lại, vì truy cập đơn được khởi tạo cho toàn bộ véc tơ thay vì đếnmột từ riêng lẻ. Vì vậy, chi phí của độ trễ cho bộ nhớ chính là xem toànbộ véc tơ một lần, thay vì mỗi lần đối với mỗi từ của véc tơ. ■ Vì toàn bộ vòng lặp được thay bằng lệnh véc tơ được th ực hiện làxác định trước, những hiểm nguy điều khiển thường phát sinh từ nhánhvòng lặp là không còn nữa. Vì những lý do này, thao tác véc tơ có th ể làm nhanh h ơn dãy các thaotác ống xoắn trên cùng một số các tập dữ liệu, và người thiết kế đượcthúc đẩy để bao gồm đơn vị véc tơ nếu lĩnh vực ứng dụng có thể sử dụngchúng thường xuyên. Như đã đề cập trên đây, ống dẫn bộ xử lý véc tơ và đặt ngang hàngthao tác trên các phần tử riêng lẻ của véc tơ. Thao tác bao g ồm khôngnhững phép toán số học ( phép nhân,v.v..), mà còn cơ sở dữ liệu bộ nhớvà hiệu quả tính toán địa chỉ. Ngoài ra, hầu hết bộ xử lý véc tơ cao cấp đểnhiều lệnh véc tơ được tiến hành cùng một lúc, tạo ra tính tương đươnggiữa thao tác trên véc tơ khác nhau. Bộ xử lý véc tơ có hữu ích đặc biệt lớn cho khoa h ọc và k ỹ thu ật ứngdụng, bao gồm mô phỏng các vụ đâm xe và dự báo th ời ti ết, theo đó vi ...
Tìm kiếm theo từ khóa liên quan:
điện tử ứng dụng bộ xử lý vector lệnh vector VMIPS công ciệc bộ xử lý vector thanh ghi kiến trúcGợi ý tài liệu liên quan:
-
27 trang 131 0 0
-
Giáo trình PLC S7-300 lý thuyết và ứng dụng
84 trang 111 0 0 -
Đồ án tốt nghiệp: Chi tiết máy
30 trang 38 0 0 -
99 trang 36 0 0
-
Đồ án môn học : Thiết kế phần điện nhà máy nhiệt điện công suất 200 MW gồm 4 tổ máy
84 trang 34 0 0 -
Các loại động cơ sử dụng cho ô tô điện
10 trang 30 0 0 -
Điện tử ứng dụng - THS. Nguyễn Văn Hiệp.
153 trang 29 0 0 -
52 trang 27 0 0
-
107 trang 27 0 0
-
CÂU HỎI VÀ ĐÁP ÁN PHẦN THI QUY TRÌNH AN TOÀN ĐIỆN
123 trang 27 0 0 -
CHƯƠNG 2.1: ĐẶC TÍNH CƠ CỦA CÁC ĐỘNG CƠ ĐIỆN
26 trang 27 0 0 -
5 trang 26 0 0
-
29 trang 25 0 0
-
Giáo trình Điện tử ứng dụng trong điều khiển tự động - CĐ Nghề Công Nghiệp Hà Nội
235 trang 25 0 0 -
Đề thi kết thúc môn Điện tử ứng dụng có đáp án - Trường TCDTNT-GDTX Bắc Quang (Đề số 2)
3 trang 25 0 0 -
Bài giảng môn học Điện tử ứng dụng - Vũ Thế Đảng
124 trang 25 0 0 -
259 trang 24 0 0
-
Giáo trình Điện tử ứng dụng (Nghề: Điện công nghiệp) - Trường CĐ Cộng đồng Lào Cai
108 trang 24 0 0 -
7 trang 24 0 0
-
41 trang 24 0 0