Danh mục

Bên trong kiến trúc Core của Intel (Phần 2)

Số trang: 8      Loại file: pdf      Dung lượng: 0.00 B      Lượt xem: 9      Lượt tải: 0    
10.10.2023

Hỗ trợ phí lưu trữ khi tải xuống: 1,000 VND Tải xuống file đầy đủ (8 trang) 0
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bên trong kiến trúc Core của Intel (Phần 2)Pentium M có 5 cổng gửi đi được đặt trên trạm dành riêng Reservation Station của nó, nhưng chỉ có hai cổng được sử dụng để gửi đi các chỉ lệnh micro-ops đến các khối thực thi. Ba chỉ lệnh còn lại được sử dụng bởi các khối có liên quan đến bộ nhớ (Load, Store Address và Store Data). Kiến trúc Core cũng có 5 cổng gửi đi như vậy nhưng ba trong số chúng được sử dụng cho việc gửi các chỉ lệnh nối micro-ops đến các khối thực thi....
Nội dung trích xuất từ tài liệu:
Bên trong kiến trúc Core của Intel (Phần 2) Bên trong kiến trúc Core của Intel (Phần 2)Pentium M có 5 cổng gửi đi được đặt trên trạm dành riêng ReservationStation của nó, nhưng chỉ có hai cổng được sử dụng để gửi đi các chỉ lệnhmicro-ops đến các khối thực thi. Ba chỉ lệnh còn lại được sử dụng bởi cáckhối có liên quan đến bộ nhớ (Load, Store Address và Store Data). Kiến trúcCore cũng có 5 cổng gửi đi như vậy nhưng ba trong số chúng được sử dụngcho việc gửi các chỉ lệnh nối micro-ops đến các khối thực thi. Điều đó cónghĩa rằng các CPU đang sử dụng kiến trúc Core đó có thể gửi ba chỉ lệnhmicro-ops đến khối thực thi trên một chu kỳ clock.Kiến trúc Core cung cấp một FPU mở rộng và một IEU mở rộng (ALU) khichúng ta mang ra so với kiến trúc Pentium M. Điều này có nghĩa rằng kiếntrúc Core có thể xử lý đến ba chỉ lệnh số nguyên trên một chu kỳ clock,trong khi Pentium M chỉ có hai.Tuy nhiên không phải tất cả các chỉ lệnh toán học đều có thể được thực thitrên tất cả các FPU. Như những gì bạn có thể quan sát được trong hình 2, cáctoán tử nhân floating-point chỉ có thể được thực thi trong FPU thứ ba vàphần thêm vào floating-point chỉ có thể được thực thi trên FPU thứ hai. Cácchỉ lệnh Fpmov có thể được thực thi trên FPU thứ nhất hoặc trên hai FPUkhác nếu không có chỉ lệnh phức tạp hơn (FPadd or FPmul) đã sẵn sàngđược gửi đến chúng. Các chỉ lệnh MMX/SSE đều được xử lý bởi FPU.Trong hình 2 bạn sẽ thấy sơ đồ khối chính của các khối thực thi trong kiếntrúc Core.Hình 2: Các khối thực thi trong kiến trúc CoreMột sự khác nhau lớn giữa hai kiến trúc Pentium M và Pentium 4 với kiếntrúc Core là trên kiến trúc Core, các khối Load và Store có khối tạo địa chỉcủa riêng nó nhúng trong. Pentium 4 và Pentium M có các khối tạo địa chỉriêng và trên Pentium 4 ALU đầu tiên được sử dụng để lưu dữ liệu trên bộnhớ.Dưới đây là những giải thích nhỏ về những khối có trong CPU này:  IEU: Instruction Execution Unit là nơi các chỉ lệnh được thực thi. Khối này cũng được biết đến là khối ALU (Arithmetic and Logic Unit). Các chỉ lệnh thông thường cũng được biết là các chỉ lệnh số nguyên.  JEU: Jump Execution Unit xử lý rẽ nhánh và cũng được biết đến với tên Branch Unit.  FPU: Floating-Point Unit. Khối này chịu trách nhiệm cho việc thực thi các biểu thức toán học floating-point và cũng cả các chỉ lệnh MMX và SSE. Trong CPU này, các FPU không “hoàn thiện” vì một số kiểu chỉ lệnh (FPmov, FPadd và FPmul) chỉ được thực thi trên các FPU nào đó: o FPadd: Chỉ có FPU này mới có thể xử lý các chỉ lệnh cộng floating-point như ADDPS. o FPmul: Chỉ có FPU này mới có thể xử lý các chỉ lệnh nhân floating-point như MULPS o FPmov: Các chỉ lệnh cho việc nạp hoặc copy một thanh ghi FPU, như MOVAPS (được dùng để truyền tải dữ liệu đến thanh ghi SSE 128-bit XMM). Kiểu chỉ lệnh này có thể được thực thi trên các FPU, nhưng chỉ trên các FPU thứ hai và thứ ba nếu các chỉ lệnh Fpadd hay Fpmul không có trong Reservation Station.  Load: khối này dùng để xử lý các chỉ lệnh yêu cầu dữ liệu được đọc từ bộ nhớ RAM.  Store Data: Khối này xử lý các chỉ lệnh yêu cầu dữ liệu được ghi vào bộ nhớ RAM.Lưu ý rằng các chỉ lệnh phức tạp có thể mất đến một số chu kỳ clock trongkhi xử lý. Chúng ta hãy lấy một ví dụ về cổng 2, nơi khối FPmul nằm ở đó.Khi khối này đang xử lý một chỉ lệnh rất phức tạp phải mất đến vài chu kỳclock để được thực thi thì cổng 2 sẽ không chết: nó sẽ luôn gửi các chỉ lệnhđơn giản đến IEU trong khi FPU đang bận.Đường dẫn 128-bit bên trongMột tính năng khác có trong kiến trúc Core là đường dẫn dữ liệu 128 bit bêntrong. Trong các CPU trước, đường dẫn dữ liệu bên trong chỉ có 64bit. Đâylà một vấn đề đối với các chỉ lệnh SSE, chỉ lệnh được gọi là XMM có dài128 bit. Chính vì vậy khi thực thi một chỉ lệnh đã biến đổi thành 128 bit dữliệu thì toán tử này được chia thành hai toán tử 64bit.Đường dữ liệu 128 bit mới làm cho kiến trúc Core trở nên nhanh hơn trongviệc xử lý các chỉ lệnh SSE có 128 bit dữ liệu.Kiến trúc nhớ mớiKiến trúc nhớ mới là kỹ thuật tăng tốc thực thi các chỉ lệnh có liên quan đếnbộ nhớ.Tất cả các CPU của Intel từ Pentium Pro đều có cơ chế không tuân theo trìnhtự (out-of-order), cơ chế này cho phép CPU có thể thực thi các chỉ lệnhkhông phụ thuộc theo bất cứ một thứ tự nào. Những gì xảy ra với các chỉlệnh liên quan đến bộ nhớ được thực thi theo kiểu truyền thống diễn ra theomột thứ tự giống hệt với thứ tự chúng xuất hiện trong chương trình. Ví dụ,nếu chương trình gốc có một chỉ lệnh như “store 10 at address 5555” và sauđó là một chỉ lệnh “load data stored at 5555”, thì chúng sẽ không thể đượcđảo ngược (nghĩa là được thực thi không tuân theo thứ tự) hoặc chỉ lệnh thứhai sẽ lấy sai dữ liệu, vì dữ liệu ở địa chỉ 5555 đã bị thay đổ ...

Tài liệu được xem nhiều: