Intel Arc GPU là gì
Định nghĩa Intel Arc GPU
Intel Arc GPU là bộ xử lý độ họa chuyên dụng rời (dGPU) của hãng Intel được thiết kế chủ yếu để cung cấp sức mạnh tăng tốc quá trình xử lý và trực quan kết xuất đồ họa.
Intel Arc GPU không chỉ có phần cứng GPU mà còn cả các phần mềm và dịch vụ đồ họa hướng đến người tiêu dùng, chủ yếu nhắm vào thị trường máy tính chơi game cá nhân (PC gaming) hiệu năng cao, một phân khúc có biên lợi nhuận hấp dẫn.
Với thương hiệu Arc, Intel không giấu giếm tham vọng cạnh tranh trực tiếp và sòng phẳng với hai thế lực hiện hữu trên thị trường GPU rời là Nvidia với dòng sản phẩm GeForce và AMD với dòng sản phẩm Radeon.
Đáng chú ý, cái tên “Arc” được Intel lấy cảm hứng từ khái niệm “story arcs” (cung bậc cốt truyện) thường thấy trong các trò chơi điện tử nên có một hàm ý quan trọng về sự tập trung mạnh mẽ của Intel vào cộng đồng game thủ.
Lộ trình các thế hệ
Alchemist (Ký hiệu A, kiến trúc Xe-HPG)
Alchemist đánh dấu cột mốc quan trọng khi Intel chính thức gia nhập cuộc đua GPU rời sau nhiều năm chỉ tập trung vào đồ họa tích hợp.
Thế hệ đầu tiên này như một “nhà giả kim” đang thử nghiệm công thức mới để biến ước mơ thành hiện thực.
Lịch trình ra mắt cụ thể:
- 30/3/2022: Arc A-series dành cho laptop được công bố đầu tiên, nhắm vào phân khúc gaming di động
- Quý 3/2022: GPU rời Arc A-series cho desktop ra mắt với các model như A380, A750, A770
- 8/2022: Dòng Arc Pro A-series chuyên nghiệp xuất hiện, phục vụ workstation và content creator
Ví dụ: Arc A750 với giá khoảng 250-300 USD cạnh tranh trực tiếp với RTX 3060 của NVIDIA, mang lại hiệu năng tương đương trong các game AAA ở độ phân giải 1080p.
Battlemage (Ký hiệu B, kiến trúc Xe2-HPG)
Nếu Alchemist là sự khởi đầu thì Battlemage chính là “chiến binh” đã trưởng thành hơn với kinh nghiệm từ thế hệ trước.
Intel đã học hỏi và cải thiện đáng kể về driver, hiệu năng và tính ổn định.
Hành trình phát triển:
- 9/2024: Xe2-HPG xuất hiện đầu tiên dưới dạng iGPU trong chip Lunar Lake, cho thấy hiệu năng đồ họa tích hợp vượt trội
- 3/12/2024: Intel chính thức công bố Arc B-series cho desktop
- 13/12/2024: Arc B580 chính thức lên kệ với mức giá 249 USD, tạo ra làn sóng trong cộng đồng game thủ
- Đầu 2025: B570 và các model khác dự kiến ra mắt
Ví dụ: Arc B580 với 12GB VRAM được xem như “cơn gió mới” khi cung cấp dung lượng bộ nhớ cao hơn nhiều so với RTX 4060 (8GB) trong cùng tầm giá.
Celestial (Ký hiệu C, kiến trúc Xe3)
Tên gọi Celestial gợi lên hình ảnh của những vì sao xa xôi, thể hiện tham vọng của Intel muốn đạt tới những đỉnh cao mới trong công nghệ GPU.
Thế hệ thứ ba này hứa hẹn những bước tiến vượt bậc.
Kế hoạch phát triển:
- Dự kiến tích hợp cùng CPU Panther Lake của Intel
- Thời điểm ra mắt: 2026-2027
- Kiến trúc Xe3 được kỳ vọng sẽ thu hẹp khoảng cách với GPU cao cấp từ NVIDIA và AMD
- Dự đoán tác động: Với kiến trúc Xe3, Intel có thể sẽ cạnh tranh ở phân khúc high-end, không chỉ dừng lại ở mainstream như hiện tại.
Druid (Ký hiệu D, kiến trúc Xe4)
Druid, những pháp sư trong thần thoại Celtic có khả năng điều khiển thiên nhiên, đại diện cho tầm nhìn xa nhất trong lộ trình Intel Arc.
Đây là thế hệ thứ tư với nhiều điều bí ẩn.
Những gì đã biết:
- Sử dụng kiến trúc đồ họa Xe4 hoàn toàn mới
- Thời điểm dự kiến: 2028 hoặc muộn hơn
- Có thể là thế hệ đầu tiên của Intel thực sự cạnh tranh với flagship GPU từ đối thủ
Tầm nhìn dài hạn: Đến thời điểm Druid ra mắt, Intel có thể đã tích lũy đủ kinh nghiệm để tạo ra những sản phẩm GPU thực sự đáng gờm, không còn là “người mới” trong ngành.
Kiến trúc của Intel Arc GPU
Kiến trúc Intel® Xe
Khả năng mở rộng
Điểm cốt lõi trong thiết kế Intel Xe chính là khả năng mở rộng hiệu quả trên các danh mục sản phẩm khác nhau.
Điều này này có nghĩa là Intel có thể tùy chỉnh và triển khai kiến trúc dưới nhiều hình thức từ card đồ họa tích hợp tiết kiệm năng lượng trong các ultrabook đến GPU rời mạnh mẽ.
Do đó đủ sức xử lý các tựa game khó nhằn và khối lượng công việc chuyên nghiệp.
Khả năng mở rộng mang lại lợi thế lớn cho Intel vì hãng có thể sử dụng chung một nền tảng công nghệ trong khi nhắm vào các phân khúc đa dạng.
Ví dụ: cùng một nguyên lý kiến trúc vừa nằm dưới GPU công suất thấp được tích hợp trong laptop mỏng nhẹ, vừa có mặt trong GPU cao cấp thiết kế cho desktop gaming hoặc hệ thống HPC.
Cách tiếp cận thống nhất này không chỉ giúp tinh giản chi phí phát triển mà còn tạo điều kiện tương thích phần mềm và tối ưu hóa trên các thiết bị.
Khả năng mở rộng của Intel Xe cũng hỗ trợ triển khai trong trung tâm dữ liệu cho các tác vụ tính toán khó khăn.
Khả năng mở rộng đa-tile của kiến trúc này giúp GPU được xây dựng với nhiều tile hoặc đơn vị hoạt động cùng nhau.
Đây là điều đặc biệt quan trọng đối với GPU cực lớn, hiệu năng cao được sử dụng trong huấn luyện AI hoặc mô phỏng khoa học.
Ví dụ: Giống như cách Intel Core i3 và i9 đều dựa trên cùng kiến trúc nhưng khác nhau về số lượng lõi và tốc độ, Intel Xe cũng hoạt động tương tự từ chip đồ họa nhỏ trong laptop văn phòng đến siêu GPU trong trung tâm dữ liệu đều chia sẻ DNA công nghệ.
Nhiều biến thể được điều chỉnh
Kiến trúc Intel Xe chia thành nhiều biến thể, mỗi loại được tinh chỉnh để đáp ứng yêu cầu của các ứng dụng và thị trường khác nhau:
Xe-LP (Low Power – Công Suất Thấp)
- Biến thể này ưu tiên hiệu quả năng lượng và được thiết kế cho đồ họa tích hợp trong bộ xử lý Intel Core (như Tiger Lake) cùng GPU rời cấp nhập môn như Intel Iris Xe MAX (DG1).
- Xe-LP tập trung vào việc cung cấp hiệu năng đồ họa cơ bản ổn định, xử lý đa phương tiện bao gồm giải mã phần cứng các định dạng video AV1 và khả năng chơi game giải trí.
- Tập trung vào hiệu quả năng lượng khiến nó lý tưởng cho laptop mỏng và thiết bị dạng nhỏ gọn.
Xe-HPG (High Performance Graphics – Đồ Họa Hiệu Năng Cao)
- Được tối ưu cho game thủ và chuyên gia sáng tạo, Xe-HPG tạo nên cốt lõi của GPU rời Arc thế hệ đầu tiên của Intel (tên mã Alchemist).
- Biến thể này nhắm vào hiệu năng đồ họa cao và tích hợp các tính năng hiện đại như ray tracing tăng tốc phần cứng và công nghệ siêu lấy mẫu dựa trên AI có tên XeSS (Xe Super Sampling).
- Xe-HPG là câu trả lời của Intel trong cuộc cạnh tranh với GPU gaming của NVIDIA và AMD.
Xe-HP (High Performance – Hiệu Năng Cao)
- Thiết kế cho trung tâm dữ liệu, Xe-HP ưu tiên các tác vụ tính toán đòi hỏi các phép toán dấu phẩy động nặng, đặc biệt là tính toán độ chính xác kép 64-bit (FP64).
- Nó cũng hỗ trợ khả năng mở rộng đa-tile.
- Điều này đồng nghĩa với nhiều tile GPU có thể hoạt động song song trong một thiết bị.
- Đây là điều cần thiết cho các ứng dụng HPC quy mô lớn.
Xe-HPC (High Performance Compute – Tính Toán Hiệu Năng Cao)
- Thành viên mạnh nhất trong gia đình, Xe-HPC phục vụ siêu máy tính và các khối lượng công việc HPC khó khăn nhất.
- Điển hình là GPU Intel Ponte Vecchio khi tích hợp biến thể này.
- Xe-HPC có sức mạnh tính toán khổng lồ, kiến trúc bộ nhớ tiên tiến và được thiết kế để đẩy giới hạn của tính toán khoa học và huấn luyện AI.
Xe-LPG (Low Power Graphics – Đồ Họa Công Suất Thấp)
- Xe-LPG được tối ưu để có hiệu năng tốt hơn trên mỗi watt cho các giải pháp đồ họa tích hợp thế hệ tiếp theo trong các bộ xử lý Intel sắp tới như Meteor Lake và Arrow Lake.
- Nó giữ lại nhiều tính năng từ GPU Arc Alchemist nhưng nhắm vào các kịch bản tiêu thụ điện năng thấp hơn.
Ví dụ: Hãy tưởng tượng Intel Xe như một hệ thống module LEGO, cùng một thiết kế cơ bản nhưng có thể lắp ráp thành mô hình xe đua F1 (Xe-HPG), xe tải công nghiệp (Xe-HP), hay siêu xe khái niệm (Xe-HPC).
Thiết kế lại kiến trúc tập lệnh (ISA)
Intel Xe không chỉ đại diện cho một thiết kế vật lý mới mà còn là việc thiết kế lại cơ bản kiến trúc tập lệnh đồ họa.
ISA được thiết kế lại để cải thiện cách thức xử lý lệnh và dữ liệu ở cấp độ thấp nhất trong GPU.
Thông qua tạo ra ISA mới được thiết kế riêng cho các khối lượng công việc hiện đại, Intel có thể tối ưu hiệu năng và hiệu quả tốt hơn so với việc đơn thuần điều chỉnh các tập lệnh cũ.
Vì vậy tạo điều kiện cho khả năng song song tốt hơn, sử dụng tài nguyên tính toán hiệu quả hơn.
Do đó cải thiện hỗ trợ cho các tính năng đồ họa đương đại như ray tracing và thuật toán dựa trên AI.
ISA được cập nhật cũng giúp tinh giản việc phát triển và tối ưu hóa phần mềm vì nó có thể được căn chỉnh chặt chẽ với tầm nhìn rộng lớn hơn của Intel về tính toán không đồng nhất.
Điều này có nghĩa là các nhà phát triển có thể viết phần mềm tận dụng triệt để sự cộng tác CPU-GPU và các tính năng tiên tiến độc đáo của lõi Intel Xe.
Ví dụ: Nếu ISA cũ giống như ngôn ngữ máy tính từ thập niên 90, thì ISA mới của Intel Xe giống như ngôn ngữ lập trình hiện đại được thiết kế từ đầu để xử lý AI, thực tế ảo và tính toán song song.
Nền tảng thống nhất
Việc phát triển kiến trúc GPU có khả năng mở rộng như Intel Xe mang giá trị chiến lược đáng kể vượt ra ngoài phần cứng.
Thông qua dựa trên một kiến trúc chung cho nhiều dòng sản phẩm, Intel có thể xây dựng một hệ sinh thái phần mềm thống nhất hơn, hỗ trợ CPU, GPU và các bộ tăng tốc khác.
Đáng chú ý là sáng kiến oneAPI của Intel, một mô hình lập trình được thiết kế để đơn giản hóa phát triển trên các loại bộ xử lý khác nhau bao gồm CPU, GPU và FPGA.
Tính chung của kiến trúc Xe trên nhiều dòng sản phẩm giúp oneAPI hiệu quả hơn vì các nhà phát triển có thể nhắm vào phần cứng đa dạng mà không cần viết lại code một cách rộng rãi.
Cách tiếp cận thống nhất giúp giảm sự phân mảnh trong phát triển phần mềm và tăng tốc đổi mới thông qua tạo điều kiện tối ưu hóa nhất quán trên các thiết bị.
Nó cũng giảm chi phí liên quan đến nghiên cứu và phát triển vì những cải tiến được thực hiện cho kiến trúc cốt lõi sẽ có lợi cho nhiều sản phẩm cùng lúc.
Về bản chất, Intel Xe không chỉ là ra mắt GPU rời mà đại diện cho một mảnh ghép nền tảng trong chiến lược rộng lớn hơn của Intel nhằm cung cấp các giải pháp tính toán đa dạng.
Từ thiết bị di động siêu mỏng đến các cơ sở trung tâm dữ liệu khổng lồ—dưới một ô kiến trúc chung.
Ví dụ: Giống như cách Apple tạo ra hệ sinh thái liền mạch giữa iPhone, iPad, Mac và Apple Watch, Intel Xe đang tạo nên một hệ sinh thái tính toán thống nhất từ laptop cá nhân đến siêu máy tính trong phòng thí nghiệm.
Kiến trúc Xe-HPG (Alchemist)
Đơn vị tính toán Modular
Trái tim của Xe-HPG là Xe-core, đóng vai trò đơn vị tính toán và kết xuất cơ bản.
Thiết kế modular giúp Intel mở rộng cấu hình GPU thông qua việc thay đổi số lượng Xe-core để tạo ra các SKU sản phẩm khác nhau.
Vì vậy phù hợp với từng điểm hiệu năng và giá cả cụ thể.
Mỗi Xe-core là một cụm phức tạp bao gồm nhiều thành phần quan trọng:
Xe Vector Engines (XVE)
- Trước đây được gọi là Execution Units (EUs) trong các kiến trúc Intel cũ như Xe-LP.
- Chúng chịu trách nhiệm thực thi các lệnh đồ họa và tính toán đa mục đích.
- XVE xử lý các phép toán dấu phẩy động và số nguyên cùng với các hàm toán học mở rộng cần thiết cho kết xuất và tính toán.
Xe Matrix eXtensions Engines (XMX)
- Một bổ sung quan trọng độc quyền cho Xe-HPG.
- Đây là các engine XMX là mảng systolic chuyên biệt được thiết kế để tăng tốc các phép toán nhân ma trận.
- Những phép toán này là nền tảng cho các khối lượng công việc trí tuệ nhân tạo (AI) và thuật toán học sâu.
- Hỗ trợ nhiều định dạng dữ liệu như FP16, BF16, INT8, INT4, và INT2, các engine XMX có thể đạt được thông lượng tính toán được đo lường bằng hàng trăm tera phép toán mỗi giây (TOPs).
- Tăng tốc phần cứng là nền tảng cho công nghệ XeSS (Xe Super Sampling) của Intel, tận dụng AI để cải thiện việc nâng cấp hình ảnh.
L1 Cache / Shared Local Memory (SLM)
- Mỗi Xe-core chứa bộ nhớ đệm L1 riêng và có thể được cấu hình để sử dụng bộ nhớ cục bộ chia sẻ.
- Thiết kế này tăng cường hiệu quả trao đổi dữ liệu giữa các luồng xử lý trong Xe-core, giảm độ trễ và cải thiện thông lượng.
- Đơn vị modular của Xe-core giúp Intel tạo ra GPU với nhiều khả năng khác nhau trong khi duy trì tính nhất quán về kiến trúc trên các tầng sản phẩm.
Ví dụ: Hãy tưởng tượng Xe-core như một “siêu nhân đa năng” trong một đội siêu anh hùng, mỗi nhân có thể xử lý đồ họa thông thường (XVE) và có khả năng đặc biệt về AI (XMX), giống như Superman vừa có thể bay vừa có tia laser mắt.
Cấu trúc Render Slice
Ngoài các Xe-core riêng lẻ, Xe-HPG nhóm nhiều core thành các đơn vị gọi là Render Slices.
Một Render Slice thường bao gồm nhiều Xe-core.
Bốn core mỗi slice trong các GPU lớn hơn như ACM-G10 được sử dụng trong một số mẫu Arc cùng với các đơn vị phần cứng chức năng cố định thiết yếu cho kết xuất đồ họa.
Những đơn vị cố định này bao gồm
Ray Tracing Units (RTUs)
- Bộ tăng tốc phần cứng chuyên dụng cho các tác vụ ray tracing thời gian thực. Mỗi Xe-core thường được ghép đôi với một RTU xử lý các chức năng tính toán thâm dụng như duyệt cây phân cấp thể tích bao quanh (BVH) và tính toán giao điểm tam giác.
- Những tính năng này tạo ra các hiệu ứng ánh sáng chân thực bao gồm bóng đổ, phản chiếu và chiếu sáng toàn cục.
Rasterizers
- Chịu trách nhiệm chuyển đổi đồ họa vector thành pixel trên màn hình.
Caches và Memory Controllers
- Để tạo điều kiện luồng dữ liệu hiệu quả giữa các core GPU và bộ nhớ.
Ví dụ: GPU Intel Arc A770 có 32 Xe-core được tổ chức thành 8 Render Slice.
Thiết kế phân cấp giúp Intel mở rộng hiệu năng thông qua điều chỉnh số lượng slice và core trong khi tích hợp phần cứng chuyên biệt cho các kỹ thuật kết xuất tiên tiến.
Ví dụ: Render Slice giống như một “phòng ban chuyên nghiệp” trong công ty. Mỗi phòng có nhiều nhân viên đa năng (Xe-core) và các chuyên gia đặc biệt như “chuyên gia ánh sáng” (RTU) và “chuyên gia màu sắc” (Rasterizer).
Tăng tốc phần cứng Ray Tracing
Xe-HPG tích hợp các đơn vị phần cứng chuyên dụng riêng cho ray tracing thời gian thực.
Đây là một tính năng ngày càng được yêu cầu bởi các trò chơi hiện đại và ứng dụng sáng tạo do khả năng tạo ra các hiệu ứng ánh sáng cực kỳ chân thực.
Ray Tracing Units (RTUs) được tích hợp trong mỗi Xe-core tăng tốc các phép toán ray tracing thiết yếu, bao gồm các kiểm tra giao điểm giữa tia sáng và hình học cảnh.
Thông qua giảm tải những tác vụ này khỏi các core đa mục đích, RTU tạo điều kiện cho hình ảnh ray-traced mượt mà hơn với ít tác động hơn đến tốc độ khung hình tổng thể.
Ngoài hỗ trợ phần cứng, Intel đã đảm bảo Xe-HPG hỗ trợ đầy đủ các API ray tracing nổi bật như Microsoft DirectX Raytracing (DXR) phiên bản 1.0 và 1.1, cũng như Vulkan Ray Tracing.
Vì vậy các nhà phát triển có thể dễ dàng hơn trong việc tích hợp các hiệu ứng ray tracing vào trò chơi của họ trong khi đảm bảo hỗ trợ phần cứng rộng rãi.
Các tính năng đồ họa hiện đại khác được hỗ trợ bởi Xe-HPG bao gồm:
- DirectX 12 Ultimate: Hỗ trợ đầy đủ bao gồm Mesh Shading (cải thiện tính linh hoạt xử lý hình học), Variable Rate Shading (VRS) Tier 2 (điều khiển tinh tế khối lượng công việc shading) và Sampler Feedback (tối ưu hóa tải texture).
- Hardware AV1 Encoding/Decoding: Một tính năng nổi bật khi ra mắt, cung cấp khả năng nén video hiệu quả quan trọng cho luồng công việc streaming và tạo nội dung.
- Hỗ trợ PCI Express Gen4: Đảm bảo giao tiếp băng thông cao giữa GPU và các thành phần hệ thống.
Những công nghệ này định vị Xe-HPG như một kiến trúc GPU đương đại có khả năng xử lý các khối lượng công việc đồ họa thế hệ tiếp theo.
Ví dụ: Xe-HPG giống như một rạp chiếu phim hiện đại với hệ thống âm thanh Dolby Atmos (DirectX 12 Ultimate), máy chiếu 4K HDR (Ray Tracing) và khả năng stream Netflix 4K (AV1).
Tất cả đều tích hợp sẵn thay vì phải mua thêm thiết bị ngoài.
Hệ thống bộ nhớ tốc độ cao
Để đáp ứng nhu cầu của các khối lượng công việc gaming và tạo nội dung hiện đại, Xe-HPG sử dụng hệ thống bộ nhớ được thiết kế cho băng thông cao và độ trễ thấp:
GDDR6 Memory
- Thông qua sử dụng VRAM GDDR6 tốc độ cao, Xe-HPG cung cấp thông lượng dữ liệu cần thiết cho texture, frame buffer và dữ liệu tính toán.
- Loại bộ nhớ này cân bằng tốc độ với hiệu quả chi phí so với các giải pháp đặc biệt hơn như HBM.
L2 Cache lớn được chia sẻ trên GPU
- Arc A770 có bộ nhớ đệm L2 lớn 16MB được chia sẻ giữa tất cả các core GPU.
- Cache sẽ giảm độ trễ truy cập bộ nhớ thông qua việc lưu trữ dữ liệu thường xuyên được sử dụng gần hơn với các đơn vị tính toán.
- Từ đó cải thiện băng thông hiệu quả và hiệu năng tổng thể.
Kết hợp của VRAM tốc độ cao và cache dồi dào giúp duy trì tốc độ khung hình mượt mà và khả năng sẵn có dữ liệu nhanh chóng trong các tác vụ kết xuất hoặc tính toán phức tạp.
Ví dụ: Hệ thống bộ nhớ của Xe-HPG giống như một thư viện hiện đại với kho sách chính (GDDR6) và khu vực đọc nhanh (L2 Cache 16MB).
Độc giả có thể lấy sách phổ biến từ khu đọc nhanh ngay lập tức, còn sách ít dùng hơn thì lấy từ kho chính mà vẫn đảm bảo tốc độ phục vụ tối ưu.
Kiến trúc Xe2-HPG (Battlemage)
Tăng trưởng đáng kể về hiệu năng
Một trong những tiến bộ quan trọng nhất mà Battlemage mang lại là sự thúc đẩy cơ bản về hiệu quả và sức mạnh tính toán.
Intel đã công bố những con số ấn tượng cho thấy mức tăng lên đến 70% về hiệu năng trên mỗi Xe-core và cải thiện 50% về hiệu quả năng lượng so với thế hệ Alchemist.
Những cải thiện này đến từ tinh chỉnh kiến trúc kết hợp với lợi thế của tiến trình sản xuất 5nm nhỏ hơn.
Do đó giúp tăng mật độ transistor và quản lý điện năng tốt hơn.
Điều này có nghĩa là người dùng có thể kỳ vọng hoặc hiệu năng thô mạnh hơn ở cùng mức tiêu thụ điện hoặc hiệu năng tương tự với mức tiêu thụ năng lượng thấp hơn nhiều.
Những cải thiện như vậy rất quan trọng đối với laptop gaming, desktop và các hệ thống khác nơi mà ràng buộc nhiệt và ngân sách điện năng có tác động trực tiếp đến trải nghiệm người dùng thực tế.
Ví dụ: Nếu Alchemist giống như động cơ xe hơi thế hệ cũ tiêu thụ 10 lít/100km, thì Battlemage giống như động cơ hybrid hiện đại chỉ tiêu thụ 5 lít/100km nhưng vẫn mạnh hơn 70%.
Do đo svừa tiết kiệm nhiên liệu vừa tăng sức mạnh.
Nâng cấp Xe Core và Vector Engine
Trong Battlemage, Intel đã tăng cường Xe Vector Engines (XVE) bên trong mỗi Xe-core để hỗ trợ nguyên bản độ rộng thực thi SIMD16.
Do đó tăng gấp đôi độ rộng xử lý vector so với các đơn vị SIMD8 trong Alchemist.
Thay đổi này tạo ra khả năng song song tốt hơn đáng kể trong mỗi core, tăng thông lượng cho các tác vụ đồ họa và tính toán đa mục đích.
Hơn nữa, Battlemage giúp thực thi đồng thời nhiều loại phép toán trong mỗi core:
- Các phép toán ma trận thông qua engine XMX.
- Lệnh shader đa mục đích.
- Tính toán số nguyên và dấu phẩy động.
Lập lịch tài nguyên đa dạng tối đa hóa sử dụng các core GPU, giảm thiểu các đơn vị rảnh rỗi và tăng cường hiệu quả tổng thể.
Các làn SIMD rộng hơn và khả năng thực thi đồng thời có nghĩa là Battlemage có thể xử lý tốt hơn các khối lượng công việc hiện đại đòi hỏi tính toán phức tạp, chẳng hạn như suy luận AI, tính toán ray tracing và các mô hình shading tiên tiến.
Ví dụ: Nếu Alchemist giống như một đường cao tốc 4 làn, thì Battlemage là đường cao tốc 8 làn với thêm khả năng các loại xe khác nhau (xe tải-XMX, xe con-shader, xe buýt-floating-point) có thể chạy cùng lúc mà không cản trở nhau.
Ray Tracing Units (RTU) mạnh mẽ hơn
Ray tracing là tính năng xác định của GPU gaming đương đại và Battlemage nâng cấp đáng kể khả năng này với các RTU của mình.
Mỗi RTU hiện có ba pipeline duyệt, tăng từ hai trong Alchemist.
Vì thế tăng cường số lượng kiểm tra giao điểm hộp phân cấp thể tích bao quanh (BVH) được xử lý mỗi chu kỳ xung nhịp lên 50%, đạt tới 18 giao điểm mỗi chu kỳ.
Đồng thời, Battlemage duy trì khả năng xử lý hai giao điểm tam giác mỗi chu kỳ, đảm bảo rằng các tương tác tia-cảnh chi tiết vẫn hiệu quả.
Do đó chuyển đổi trực tiếp thành các hiệu ứng ray tracing mượt mà và chân thực hơn trong game và ứng dụng chuyên nghiệp dựa vào chiếu sáng, bóng đổ và phản chiếu thời gian thực.
Các RTU được nâng cấp thể hiện sự tập trung của Intel vào việc theo kịp các đối thủ cạnh tranh thông qua cung cấp hiệu năng ray tracing tăng tốc phần cứng cần thiết cho trải nghiệm hình ảnh hiện đại.
Ví dụ: RTU trong Battlemage giống như nâng cấp từ studio chụp ảnh có 2 máy ảnh lên 3 máy ảnh chuyên nghiệp.
Từ đó có thể chụp nhiều góc độ ánh sáng hơn cùng lúc, tạo ra những bức ảnh (hiệu ứng ray tracing) đẹp và chân thực hơn 50%.
Geometry Engine nâng cao
Battlemage giới thiệu Geometry Engine được tăng cường mạnh mẽ với khả năng xử lý gấp ba lần số lượng vertex fetch so với Alchemist.
Tương tự, thông lượng mesh shader tăng gấp ba lần.
Điều này giúp giảm khối lượng công việc CPU thông qua xử lý dữ liệu hình học phức tạp hiệu quả hơn ngay trong chính GPU.
Từ đó tăng tốc kết xuất các cảnh phức tạp đầy những đối tượng số lượng lớn.
Thêm vào đó, các phép toán lấy mẫu và pha trộn texture có những cải thiện lớn.
Lấy mẫu texture được thực hiện không theo thứ tự để tăng hiệu quả, trong khi hiệu năng pha trộn và texture không lọc tăng gấp đôi so với thế hệ trước.
Kiến trúc cũng hưởng lợi từ cache lớn hơn:
- Kích thước cache màu pixel tăng hơn 33%.
- Ccache HiZ/Z/Stencil tăng 50%.
- Kích thước cache L2 mở rộng (từ 16MB trên Arc A770 lên 18MB trên Arc B580).
Những cải tiến này giảm độ trễ bộ nhớ và nhu cầu băng thông để tiếp tục thúc đẩy hiệu năng kết xuất.
Các tối ưu hóa khác bao gồm prefetching cho render target và cải thiện primitive culling trong buffer HiZ để tránh các tính toán không cần thiết.
Khả năng nén cache L2 tốt hơn cũng giúp cải thiện thông lượng dữ liệu tổng thể trong GPU.
Ví dụ: Geometry Engine trong Battlemage giống như nâng cấp từ dây chuyền lắp ráp xe hơi thông thường lên dây chuyền robot tự động có thể xử lý gấp 3 lần số lượng chi tiết (vertex), kho chứa linh kiện (cache) lớn hơn 33-50% và hệ thống dự đoán nhu cầu (prefetching) thông minh hơn.
Công nghệ đồ họa tiên tiến
Công nghệ Ray Tracing
Phần cứng chuyên dụng
Một trong những nền tảng cốt lõi tạo nên khả năng ray tracing của Intel Arc chính là tích hợp các đơn vị phần cứng chuyên biệt được thiết kế riêng cho các tác vụ ray tracing.
Các đơn vị Ray Tracing (RTU) được tích hợp vào cả kiến trúc Xe-HPG thế hệ đầu tiên (Alchemist) và Xe2-HPG thế hệ thứ hai (Battlemage).
Sự hiện diện của RTU có nghĩa là các phép tính ray tracing như truy vết đường đi của tia sáng, phát hiện giao điểm và tính toán phản xạ được chuyển từ các lõi đa mục đích sang phần cứng chuyên dụng.
Phân tách giúp xử lý hiệu quả hơn và cải thiện hiệu suất tổng thể so với các phương pháp ray tracing dựa trên phần mềm hoặc tăng tốc một phần.
Ví dụ: Giống như có một bộ phận chuyên trách xử lý hình ảnh trong công ty, thay vì nhân viên văn phòng phải kiêm nhiệm, RTU hoạt động như những “chuyên gia đồ họa” riêng biệt, xử lý hiệu ứng ánh sáng phức tạp mà không làm ảnh hưởng đến các tác vụ khác của GPU.
Tập trung vào phần cứng chứng tỏ Ray Tracing không còn là tính năng phụ mà đã trở thành thành phần quan trọng của kết xuất đồ họa hiện đại.
Thông qua nhúng RTU trực tiếp vào GPU, Intel đảm bảo card đồ họa Arc có thể xử lý hiệu quả các khối lượng công việc ray tracing đòi hỏi cao mà không ảnh hưởng đến các khía cạnh khác của hiệu suất GPU.
Hỗ trợ API toàn diện
GPU Intel Arc hỗ trợ tất cả các giao diện lập trình ứng dụng (API) ray tracing chính thống, bao gồm DirectX Raytracing (DXR) của Microsoft và Vulkan Ray Tracing.
Khả năng tương thích toàn diện vô cùng quan trọng vì nó đảm bảo GPU Intel Arc có thể hoạt động mượt mà với nhiều loại game và ứng dụng đồ họa hiện đại sử dụng các API này để tạo hiệu ứng ray tracing.
DirectX Raytracing (DXR) là API được sử dụng phổ biến hơn trong nhiều game nổi tiếng trên Windows trong khi Vulkan Ray Tracing được ưa chuộng trong các game đa nền tảng và một số ứng dụng đồ họa chuyên nghiệp.
Khi hỗ trợ cả hai API giúp GPU Intel Arc tối đa hóa khả năng sử dụng trên các môi trường phần mềm khác nhau.
Ví dụ: Giống như smartphone hỗ trợ đồng thời cả iOS và Android apps nên người dùng sẽ có nhiều lựa chọn hơn và không bị giới hạn bởi hệ sinh thái nào.
Hỗ trợ API đa dạng mang lại lợi ích cho cả game thủ và nhà phát triển.
Đối với game thủ, điều này có nghĩa họ có thể tận hưởng hình ảnh Ray Tracing trong các tựa game yêu thích mà không cần lo lắng về vấn đề tương thích.
Đối với nhà phát triển, nó khiến GPU Intel Arc trở thành lựa chọn đáng tin cậy để kiểm thử và tối ưu hóa nội dung hỗ trợ Ray Tracing.
Hiệu suất cạnh tranh trong thực tế
Về mặt hiệu suất, GPU Intel Arc dựa trên kiến trúc Alchemist (như các mẫu Arc A750 và A770) đã chứng minh khả năng ray tracing ấn tượng trong phân khúc thị trường của chúng.
Các đánh giá độc lập và benchmark đã cho thấy những GPU này thường mang lại hiệu suất ray tracing tốt hơn so với các card AMD dựa trên RDNA 2 ( card thuộc dòng RX 6000) ở mức giá tương đương.
Hơn nữa, trong một số tựa game, GPU Intel Arc đã sánh ngang hoặc thậm chí vượt qua Nvidia GeForce RTX 3060.
Đây là một thành tích đáng chú ý khi xét đến danh tiếng mạnh mẽ của Nvidia trong lĩnh vực hiệu suất ray tracing.
Điều này cho thấy Intel đã thành công trong việc xây dựng GPU rời thế hệ đầu tiên có khả năng cạnh tranh khá tốt trong các khối lượng công việc ray tracing, một lĩnh vực truyền thống do Nvidia thống trị.
Ví dụ: Trong game Cyberpunk 2077 với ray tracing bật, Arc A770 có thể đạt 45-50 FPS ở độ phân giải 1080p với cài đặt High, so với RTX 3060 đạt khoảng 40-45 FPS trong cùng điều kiện.
Lợi thế cạnh tranh này đặc biệt có ý nghĩa đối với game thủ muốn có hiệu ứng ray tracing tăng tốc phần cứng nhưng đang tìm kiếm các lựa chọn hiệu quả về chi phí.
Sự gia nhập của Intel với GPU Arc mang đến một giải pháp thay thế mới mẻ kết hợp giữa tính kinh tế và hiệu suất ray tracing vững chắc.
Cải tiến kiến trúc thế hệ Battlemage
Nhìn về tương lai, kiến trúc Xe2-HPG (Battlemage) thế hệ thứ hai của Intel hứa hẹn sẽ đẩy hiệu suất ray tracing lên tầm cao mới.
Một nâng cấp quan trọng liên quan đến chính thiết kế RTU: Battlemage giới thiệu thiết lập traversal ba pipeline, so với chỉ hai pipeline trên Alchemist.
Điều này có nghĩa là về mặt thực tế, GPU Battlemage có thể xử lý nhiều giao điểm tia hơn trong mỗi chu kỳ xung nhịp.
Gia tăng này trong tính song song bên trong RTU tạo điều kiện xử lý nhanh hơn và mượt mà hơn các cảnh ray tracing phức tạp.
Các game và ứng dụng phụ thuộc nhiều vào ray tracing thời gian thực sẽ được hưởng lợi từ độ trễ giảm và tốc độ khung hình cao hơn.
Ví dụ: Nếu RTU trên Alchemist như một đường cao tốc 2 làn, thì Battlemage sẽ có 3 làn xe, giúp lưu lượng “tia sáng” di chuyển nhanh hơn và ít ùn tắc hơn.
Cam kết của Intel trong việc cải thiện phần cứng ray tracing từ thế hệ này sang thế hệ khác nhấn mạnh mức độ nghiêm túc mà họ đánh giá công nghệ này như yếu tố thiết yếu cho trải nghiệm gaming và kết xuất đồ họa trong tương lai.
Intel® Xe Super Sampling (XeSS)
Nâng cấp hình ảnh thông minh
Trọng tâm của XeSS là một quy trình nâng cấp độ phân giải thông minh được hỗ trợ bởi các thuật toán trí tuệ nhân tạo.
Khác với các phương pháp nâng cấp truyền thống chỉ đơn giản kéo giãn hình ảnh có độ phân giải thấp, XeSS kết xuất game ở độ phân giải thấp hơn rồi sử dụng AI để tái tạo các khung hình ở độ phân giải mục tiêu cao hơn.
Cách tiếp cận này tạo ra sự cải thiện đáng kể về số khung hình trên giây (FPS) vì GPU xử lý ít pixel hơn ban đầu nhưng đầu ra cuối cùng vẫn trông gần như độ phân giải gốc.
Quá trình tính toán AI này được tăng tốc đặc biệt bởi Động Cơ XMX (Xe Matrix eXtensions) của Intel được tích hợp trong GPU Arc.
Những đơn vị phần cứng chuyên dụng này được tối ưu hóa cho các phép toán ma trận sử dụng trong các tác vụ học máy.
Do đó giúp XeSS cung cấp nâng cấp chất lượng cao một cách hiệu quả và với chi phí hiệu suất tối thiểu.
Ví dụ: Hãy tưởng tượng XeSS như một họa sĩ AI. Thay vì phải vẽ một bức tranh chi tiết 4K từ đầu (tốn rất nhiều thời gian), họa sĩ này vẽ một bản phác thảo 1080p rồi sử dụng kinh nghiệm AI để “điền đầy” các chi tiết còn thiếu, tạo ra tác phẩm 4K trong thời gian ngắn hơn nhiều.
Nhờ tăng tốc phần cứng, XeSS đạt được sự cân bằng giữa tốc độ và độ trung thực hình ảnh, đặc biệt có lợi cho game thủ muốn gameplay mượt mà hơn ở độ phân giải cao hoặc với cài đặt hình ảnh đòi hỏi cao.
Nhiều chế độ chất lượng
XeSS cung cấp nhiều chế độ đặt sẵn giúp người dùng tinh chỉnh trải nghiệm dựa trên sở thích hoặc khả năng phần cứng.
Các chế độ này bao gồm Quality (Chất lượng), Balanced (Cân bằng), Performance (Hiệu suất) và đôi khi có Ultra Performance (Siêu hiệu suất).
Mỗi chế độ điều chỉnh mức độ ưu tiên của công nghệ giữa độ rõ nét hình ảnh hoặc cải thiện tốc độ khung hình.
Tính linh hoạt phản ánh cách tiếp cận của các công nghệ đối thủ như DLSS của Nvidia và FSR của AMD.
Vì vậy giúp người chơi lựa chọn muốn có hình ảnh đẹp nhất có thể hay tăng FPS tối đa.
Gần đây, Intel đã tinh chỉnh cài đặt mặc định của các chế độ này để hiệu suất tương đối của XeSS phù hợp hơn với các cài đặt DLSS tương ứng.
Do đó giúp người dùng dễ hiểu hơn về những gì có thể mong đợi.
Các chế độ chính:
- Chế độ Quality: Như chụp ảnh với máy ảnh chuyên nghiệp, hình ảnh đẹp nhất nhưng mất thời gian xử lý
- Chế độ Performance: Như chụp ảnh với smartphone nhanh hơn nhưng chất lượng có thể giảm đôi chút
- Chế độ Ultra Performance: Như chụp ảnh action, ưu tiên tốc độ tối đa để không bỏ lỡ khoảnh khắc
Chế độ Quality ưu tiên độ sắc nét và chi tiết hình ảnh của hình ảnh được nâng cấp, mang lại độ rõ nét gần như độ phân giải gốc trong khi vẫn cải thiện FPS.
Các chế độ Performance hoặc Ultra Performance thiên về việc tăng tốc độ khung hình.
Đây là có thể lý tưởng cho game thủ cạnh tranh tìm kiếm gameplay mượt mà hơn trong các tựa game nhịp độ nhanh.
Tương thích nhiều phần cứng
Một tính năng nổi bật của XeSS là khả năng chạy trên nhiều loại phần cứng thông qua hai mô hình khác nhau.
Mô hình chính tận dụng XMX chuyên biệt của GPU Intel Arc để mang lại chất lượng và hiệu suất cao nhất.
Tuy nhiên, Intel cũng thiết kế một chế độ phụ chạy trên bộ lệnh DP4a.
Đây là phép toán tích vô hướng được hỗ trợ rộng rãi bởi các GPU không phải Intel, bao gồm cả GPU của Nvidia và AMD.
Mặc dù chế độ dựa trên DP4a không đạt được chất lượng hình ảnh hoặc hiệu quả như XeSS được tăng tốc XMX nhưng nó mở rộng đáng kể phạm vi tiếp cận của công nghệ.
Các nhà phát triển game có thể triển khai XeSS với thông tin nó sẽ hoạt động trên nhiều loại card đồ họa, ngay cả khi những card đó thiếu phần cứng AI chuyên dụng.
Ví dụ: Giống như ứng dụng di động có thể chạy trên cả iPhone (tối ưu nhất) và Android (tương thích rộng rãi). Người dùng iPhone sẽ có trải nghiệm tốt nhất, nhưng người dùng Android vẫn có thể sử dụng được.
Cách tiếp cận mở này tương phản với một số giải pháp đối thủ chỉ hoạt động trên các mẫu GPU hoặc thương hiệu cụ thể.
Vì vậy khiến XeSS hấp dẫn không chỉ như một tính năng độc quyền cho GPU Intel Arc mà còn như một lựa chọn dễ tiếp cận cho cộng đồng gaming rộng lớn hơn.
Hệ sinh thái phát triển
Khi so sánh với các công nghệ nâng cấp khác như DLSS của Nvidia và FSR của AMD, XeSS đặc biệt trong phiên bản 1.3 mới nhất đã nhận được đánh giá tích cực về khả năng mang lại hình ảnh sắc nét với ít hiện tượng nhiễu như ghosting hoặc mờ ảnh.
Nhiều nhà đánh giá lưu ý XeSS có thể tiến gần đến chất lượng hình ảnh của DLSS trong khi vượt trội hơn FSR ở các chế độ tương tự.
Intel liên tục tinh chỉnh thuật toán XeSS kết hợp với tăng tốc phần cứng giúp duy trì các cạnh sắc nét và chi tiết tinh tế ngay cả khi chạy game ở độ phân giải cơ sở thấp hơn.
Điều này tạo ra trải nghiệm nhập vai hơn và thỏa mãn về mặt thị giác mà không ảnh hưởng đến hiệu suất.
Ví dụ: Đến đầu năm 2025, XeSS đã được áp dụng nhanh chóng trong ngành công nghiệp game với hơn 150 tựa game hỗ trợ.
Các game nổi tiếng như Cyberpunk 2077, Call of Duty: Modern Warfare II & III, Hogwarts Legacy, The Witcher 3: Wild Hunt, và Forza Horizon 5 đã tích hợp hỗ trợ XeSS.
Điều đó thể hiện sự tin tưởng mạnh mẽ từ phía nhà phát triển đối với công nghệ này.
Hệ sinh thái ngày càng phát triển nhấn mạnh tầm quan trọng chiến lược của XeSS đối với Intel khi định vị nó như một công cụ thiết yếu trong cạnh tranh trên thị trường GPU.
Khả năng chạy trên các phần cứng khác nhau và cung cấp nâng cấp chất lượng cao khiến nó trở thành lý do quan trọng tại sao game thủ có thể chọn GPU Intel Arc thay vì các lựa chọn khác.
Intel® Deep Link
Phân bổ năng lượng thông minh
Một trong những thành phần cốt lõi của Deep Link là Dynamic Power Share, quản lý thông minh cách phân phối điện năng giữa CPU Intel và GPU Arc.
Thay vì gán ngân sách điện năng cố định, tính năng này chuyển đổi tài nguyên năng lượng linh hoạt dựa trên nhu cầu khối lượng công việc.
Ví dụ: nếu tác vụ đòi hỏi GPU nhiều hơn, như gaming hoặc kết xuất 3D, nhiều điện năng hơn sẽ được phân bổ cho GPU để tối đa hóa hiệu suất.
Ngược lại, nếu khối lượng công việc phụ thuộc nhiều vào xử lý CPU, như biên dịch code hoặc chạy mô phỏng phức tạp, CPU sẽ nhận phần lớn hơn của điện năng.
Thông qua cách này, Dynamic Power Share hướng đến tối ưu hóa thông lượng tổng thể của hệ thống thay vì để một trong hai thành phần hoạt động dưới mức tối ưu.
Ví dụ: Giống như quản lý nguồn điện trong một tòa nhà văn phòng thông minh. Vào ban ngày, khi tầng làm việc cần nhiều điện hơn, hệ thống sẽ giảm điện cho khu vực nghỉ ngơi. Vào giờ ăn trưa, khi căng tin hoạt động mạnh, điện sẽ được chuyển hướng tương ứng.
Cân bằng điện năng hiệu quả có thể dẫn đến cải thiện tốc độ khung hình và hiệu suất mượt mà hơn trong các khối lượng công việc hỗn hợp, đặc biệt trên các hệ thống được trang bị bộ xử lý Intel Core từ thế hệ 11 đến 13 kết hợp với GPU Intel Arc Alchemist.
Tận dụng đồng thời GPU và CPU
Hyper Compute hỗ trợ các ứng dụng khai thác đồng thời cả lõi CPU (bao gồm GPU tích hợp khi có) và GPU Arc rời để tính toán song song.
Điều này đặc biệt có lợi cho các tác vụ song song cao như xử lý hình ảnh, suy luận học máy, và các khối lượng công việc trí tuệ nhân tạo.
Thông qua tích hợp bộ công cụ OpenVINO của Intel, hỗ trợ tối ưu hóa mô hình AI trên các phần cứng khác nhau, Hyper Compute giúp các nhà phát triển dễ dàng phân phối các tác vụ tính toán một cách hiệu quả trên các đơn vị xử lý có sẵn.
Vì vậy có thể giảm thời gian xử lý và nâng cao hiệu suất trong các ứng dụng được hỗ trợ.
Ví dụ: Hãy tưởng tượng việc xử lý một video AI upscaling. Thay vì chỉ sử dụng GPU Arc để làm tất cả, Hyper Compute có thể chia công việc: GPU Arc xử lý các frame phức tạp, CPU xử lý các frame đơn giản, và iGPU hỗ trợ các tác vụ tiền xử lý.
Quy trình xử lý này giống như một dây chuyền sản xuất với nhiều công nhân chuyên môn khác nhau.
Tính năng như vậy có giá trị đối với các chuyên gia làm việc về sáng tạo nội dung, mô phỏng khoa học hoặc các tác vụ tính toán nặng khác có thể khai thác đồng thời cả CPU và GPU thay vì chỉ dựa vào một bộ xử lý duy nhất.
Tăng tốc mã hóa video
Có lẽ khía cạnh được quảng bá rộng rãi nhất của Deep Link là Hyper Encode.
Đây là tính năng giúp tăng tốc đáng kể các quy trình mã hóa video một tác vụ quan trọng đối với streamer, biên tập viên video và người sáng tạo nội dung.
Hyper Encode hoạt động khi đồng thời sử dụng tăng tốc media trên cả GPU tích hợp của CPU và GPU Arc rời.
Do đó có thể cắt giảm thời gian kết xuất video một cách đáng kể.
Intel tuyên bố giảm tới 60% trong một số tình huống.
Ví dụ: Video 4K dài 10 phút thông thường có thể mất 30 phút để render trên GPU đơn lẻ nhưng với Hyper Encode, thời gian này có thể giảm xuống còn 12-15 phút nhờ sử dụng đồng thời cả iGPU và dGPU.
Mã hóa nhanh hơn có nghĩa là thời gian hoàn thiện nhanh hơn cho sản xuất video và trải nghiệm live streaming mượt mà hơn.
Đối với những người sáng tạo xử lý khối lượng lớn cảnh quay độ phân giải cao hoặc phát sóng gameplay thường xuyên, Hyper Encode mang lại sự cải thiện năng suất có ý nghĩa.
Tối ưu hiệu suất Streaming Game
Stream Assist được thiết kế để nâng cao quy trình streaming bằng cách chuyển các tác vụ liên quan đến streaming từ GPU Arc rời sang GPU tích hợp trên CPU Intel.
Vì vậy giải phóng GPU Arc để tập trung hoàn toàn vào việc kết xuất chính game.
Từ đó giúp duy trì tốc độ khung hình ổn định và cao hơn trong quá trình chơi game.
Thông qua giảm tải cho card đồ họa chuyên dụng khi streaming, Stream Assist hướng đến việc mang lại trải nghiệm tổng thể tốt hơn cho game thủ phát sóng trong các lần chơi của họ hoặc tạo nội dung trực tiếp sử dụng phần mềm như OBS (Open Broadcaster Software).
Khi một streamer chơi Cyberpunk 2077 ở cài đặt Ultra và đồng thời stream 1080p 60fps:
- Không có Stream Assist: GPU Arc phải xử lý cả game (85% tài nguyên) và encoding stream (15% tài nguyên), có thể gây giảm FPS xuống 55-60
- Với Stream Assist: GPU Arc chỉ lo game (100% tài nguyên cho 70+ FPS), iGPU xử lý encoding stream, tạo ra trải nghiệm mượt mà hơn
Tính năng này phản ánh thông tin về cách người dùng hiện đại thường thực hiện đồng thời gaming và streaming và nó cố gắng cân bằng tài nguyên một cách hiệu quả để tránh các nút thắt hiệu suất.
Mã hóa và giải mã AV1
Mã hóa AV1 tăng tốc phần cứng
Khi ra mắt GPU Alchemist, Intel nằm trong số những hãng đầu tiên tích hợp mã hóa AV1 dựa trên phần cứng vào card đồ họa dành cho người tiêu dùng.
Trước đó, nhiều GPU từ các đối thủ như Nvidia và AMD hỗ trợ giải mã AV1 nhưng thiếu mã hóa phần cứng tích hợp.
Thay vào đó dựa vào các giải pháp dựa trên phần mềm tiêu thụ nhiều tài nguyên CPU và năng lượng hơn.
Điều này giúp GPU Intel Arc mã hóa hiệu quả các luồng video sử dụng AV1 trực tiếp ở cấp độ phần cứng.
Vì vậy tốc độ mã hóa nhanh hơn với mức tiêu thụ điện năng và tải CPU thấp hơn.
Tính năng này đặc biệt có lợi cho các tác vụ như live streaming hoặc sản xuất video nơi mã hóa thời gian thực hoặc gần thời gian thực là quan trọng.
Ví dụ: Bộ mã hóa AV1 phần cứng của Intel trên các GPU như Arc A380 đã chứng minh khả năng tạo ra chất lượng video có thể so sánh với các bộ mã hóa phần mềm như x264 chạy ở chế độ “veryslow”.
Đây là chế độ nổi tiếng về đầu ra chất lượng rất cao nhưng đòi hỏi tính toán đáng kể.
Do đó người dùng có được chất lượng hàng đầu mà không cần CPU mạnh mẽ để xử lý mã hóa phần mềm.
Ví dụ: Nếu mã hóa AV1 bằng phần mềm giống như vẽ tranh bằng tay (chậm nhưng chi tiết), thì mã hóa phần cứng giống như sử dụng máy in chuyên nghiệp nhanh chóng và chất lượng ổn định.
Chất lượng video vượt trội
Một trong những khía cạnh ấn tượng nhất của bộ mã hóa AV1 Intel Arc là khả năng duy trì chất lượng video rõ ràng, sắc nét ngay cả ở bitrate thấp hơn.
Ví dụ: khi streaming video 1080p ở 60 khung hình trên giây với bitrate khoảng 3.5 Mbps, bộ mã hóa AV1 phần cứng của Intel tạo ra hình ảnh sắc nét hơn đáng chú ý và ít bị nhiễu như hiện tượng khối hoặc pixel hóa so với các bộ mã hóa AVC phần cứng từ Nvidia và AMD.
Lợi thế này không chỉ là lý thuyết.
Đối với người sáng tạo nội dung và streamer thường phải cân bằng giữa hạn chế băng thông internet và duy trì chất lượng video chấp nhận được.
Vì thế họ có thể cung cấp các stream mượt mà hơn, hấp dẫn hơn về mặt thị giác mà không cần kết nối internet nhanh hơn.
- Streaming 1080p60 với AVC (H.264): Cần 6-8 Mbps để có chất lượng tốt
- Streaming 1080p60 với AV1 phần cứng Intel: Chỉ cần 3.5-4 Mbps cho chất lượng tương đương hoặc tốt hơn
Đối với người xem, điều này dẫn đến trải nghiệm xem tốt hơn với ít gián đoạn hoặc lỗi hình ảnh hơn.
Lợi ích thực tế đem lại
Khả năng mã hóa AV1 phần cứng mang lại lợi ích hữu hình cho hai nhóm người dùng chính:
Sáng tạo nội dung và streamer
- Sử dụng GPU Intel Arc có nghĩa họ có thể tải video lên các nền tảng như YouTube nhanh hơn và với kích thước file nhỏ hơn nhờ nén AV1 hiệu quả.
- YouTube đã sử dụng AV1 nội bộ để streaming nên các video được mã hóa ở định dạng này được xử lý nhanh hơn trên máy chủ của nền tảng.
- Do đó dẫn đến đăng tải nội dung chất lượng cao nhanh hơn.
- Ngoài ra, streamer có thể cung cấp live stream chất lượng cao hơn với cùng băng thông hoặc giảm nhu cầu băng thông trong khi duy trì hình ảnh sắc nét.
Người dùng hàng ngày
- Những người ghi video trên PC hoặc stream nội dung thường xuyên, khả năng mã hóa AV1 giúp tiết kiệm không gian lưu trữ đáng kể mà không ảnh hưởng đáng chú ý đến chất lượng video.
- Điều này giúp lưu trữ video cá nhân hiệu quả hơn và cải thiện trải nghiệm streaming bằng cách giảm buffering và sử dụng dữ liệu.
Một video 4K dài 10 phút:
- Mã hóa H.264: xấp xỉ 2-3 GB
- Mã hóa AV1: xấp xỉ 1-1.5 GB (giảm 30-50% dung lượng với chất lượng tương đương)
Chiến lượng phản ánh xu hướng
Intel tích hợp mã hóa AV1 phần cứng sớm trong dòng GPU Arc thể hiện cách tiếp cận có tầm nhìn xa phù hợp với xu hướng phát triển trong công nghệ video.
Nhu cầu áp dụng AV1 phát triển nhanh chóng trong các dịch vụ streaming, nền tảng mạng xã hội, và ngành phát sóng do hiệu quả và mô hình cấp phép mở.
Do đó hỗ trợ cả mã hóa và giải mã trong phần cứng đảm bảo GPU Intel đủ khả năng cạnh tranh.
Trong khi các đối thủ đã dần bổ sung các tính năng tương tự trong các sản phẩm mới hơn, việc áp dụng sớm của Intel đã mang lại cho họ sự khởi đầu thuận lợi.
Từ đó thu hút mạnh mẽ các chuyên gia làm việc với nội dung video.
Xu hướng thị trường minh chứng:
- YouTube: Sử dụng AV1 cho hầu hết nội dung 4K và 8K
- Netflix: Triển khai AV1 để giảm băng thông 20-30%
- Twitch: Đang thử nghiệm AV1 cho streaming chất lượng cao
Vì vậy nhấn mạnh sự nhạy bén của Intel đối với nhu cầu thị trường và làm nổi bật cam kết cung cấp các tính năng thực tế nâng cao trải nghiệm người dùng trên gaming, sáng tạo nội dung và sử dụng media.
Hỗ trợ API đồ họa hiện đại
Hỗ trợ đầy đủ DirectX 12 Ultimate
Một trong những tính năng quan trọng nhất của GPU Intel Arc là hỗ trợ toàn diện Microsoft DirectX 12 Ultimate.
Đây là phiên bản nâng cấp mới nhất của API DirectX, được sử dụng rộng rãi trong các game và ứng dụng trên Windows.
DirectX 12 Ultimate giới thiệu bộ tính năng đồ họa tiên tiến giúp các nhà phát triển tạo ra hình ảnh chân thực hơn và cải thiện hiệu quả kết xuất.
Những tính năng này bao gồm:
- Ray Tracing tăng tốc phần cứng (DXR).
- Mô phỏng hành vi ánh sáng chân thực.
- Variable Rate Shading (VRS).
- Tối ưu hóa hiệu suất kết xuất bằng cách điều chỉnh chi tiết shading một cách linh hoạt.
- Mesh Shading, cung cấp xử lý hình học linh hoạt hơn.
- Sampler Feedback, nâng cao khả năng streaming texture.
Ví dụ về VRS: Trong game Gears 5, khi nhân vật đang nhìn thẳng về phía trước trong trận chiến, VRS sẽ giảm chi tiết shading ở các góc màn hình (nơi mắt ít chú ý) nhưng vẫn duy trì chất lượng cao ở trung tâm.
Vì vậy có thể tăng FPS lên 15-20% mà không làm giảm trải nghiệm hình ảnh.
.
Do đó đảm bảo người dùng chạy các tựa game mới nhất có thể trải nghiệm hiệu ứng đồ họa tiên tiến mà không cần phải đắn đo về hiệu năng phần cứng.
Hỗ trợ API Vulkan toàn diện
Vulkan là API đồ họa và tính toán đa nền tảng, mã nguồn mở được phát triển bởi Khronos Group.
Nó cung cấp cho các nhà phát triển quyền truy cập cấp thấp vào phần cứng GPU.
Vì thế tạo khả năng kiểm soát chi tiết các hoạt động kết xuất và tính toán.
Điều này giúp tối ưu hóa tốt hơn và hiệu suất cao hơn đặc biệt trong các ứng dụng phức tạp hoặc đòi hỏi tài nguyên cao.
GPU Intel Arc hỗ trợ Vulkan phiên bản 1.3, bao gồm các tiện ích mở rộng cho ray tracing (Vulkan RT).
Do đó các nhà phát triển nhắm đến Vulkan có thể triển khai các hiệu ứng hình ảnh tiên tiến như ánh sáng và bóng đổ chân thực trực tiếp trên phần cứng Intel.
Ví dụ: Game DOOM Eternal khi sử dụng Vulkan thay vì DirectX 11 có thể tăng hiệu suất lên 20-25% trên cùng một GPU. Vulkan cũng giảm đáng kể tải CPU, đặc biệt quan trọng trong các hệ thống có CPU yếu hơn.
Hỗ trợ Vulkan đặc biệt quan trọng vì nó được sử dụng rộng rãi trong cả ứng dụng gaming và chuyên nghiệp trên nhiều hệ điều hành khác nhau bao gồm Windows và Linux.
Bản chất mở của nó khuyến khích sự đổi mới và linh hoạt.
Do đó sự hỗ trợ của Intel đảm bảo GPU Arc có khả năng cạnh tranh trên nhiều môi trường phần mềm.
Khả năng tương thích với OpenGL
Mặc dù OpenGL là API đồ họa cũ hơn so với DirectX 12 Ultimate và Vulkan, nhưng nó vẫn được sử dụng trong một số ứng dụng chuyên nghiệp và game.
GPU Intel Arc hỗ trợ OpenGL lên đến phiên bản 4.6, đảm bảo khả năng tương thích với các ứng dụng hiện có.
Khả năng tương thích ngược này quan trọng vì nhiều ngành công nghiệp dựa vào phần mềm được xây dựng xung quanh OpenGL:
- Chương trình CAD.
- Công cụ trực quan hóa khoa học.
- Một số game engine chưa chuyển đổi hoàn toàn sang các API mới hơn.
Ứng dụng thực tế:
- Autodesk Maya và 3ds Max: Sử dụng OpenGL cho viewport rendering, giúp người dùng xem và chỉnh sửa mô hình 3D trong thời gian thực
- Blender: Dựa vào OpenGL để hiển thị giao diện 3D và các công cụ modeling
- Các game indie cũ: Nhiều game độc lập được phát triển bằng engine như Unity hoặc Unreal phiên bản cũ vẫn sử dụng OpenGL
Mặc dù OpenGL có thể không cung cấp các tính năng tiên tiến có trong API mới hơn nhưng tiếp tục hỗ trợ bởi GPU Intel Arc đảm bảo người dùng làm việc với phần mềm cũ hoặc game cũ sẽ không gặp vấn đề tương thích hoặc bị buộc phải nâng cấp phần cứng sớm.
Hỗ trợ OpenCL 3.0
OpenCL (Open Computing Language) là tiêu chuẩn mở tạo khả năng lập trình song song trên các nền tảng không đồng nhất bao gồm CPU, GPU và các bộ xử lý khác.
Nó giúp các nhà phát triển khai thác sức mạnh GPU cho các tác vụ ngoài kết xuất đồ họa như mô phỏng khoa học, phân tích dữ liệu và các khối lượng công việc trí tuệ nhân tạo.
GPU Intel Arc cung cấp hỗ trợ cho OpenCL 3.0, giúp chúng được sử dụng hiệu quả cho tính toán đa mục đích trên đơn vị xử lý đồ họa (GPGPU).
Vì thế mở rộng tiện ích của chúng ngoài gaming và các ứng dụng đồ họa nặng vào các vai trò tính toán rộng lớn hơn.
Ứng dụng cụ thể:
- Xử lý hình ảnh y tế: Phân tích hình ảnh MRI hoặc CT scan có thể nhanh hơn 10-50 lần khi sử dụng GPU thay vì CPU
- Mô phỏng tài chính: Tính toán rủi ro và mô hình hóa Monte Carlo trong giao dịch tài chính
- Machine Learning: Huấn luyện mạng neural cho các tác vụ như nhận dạng hình ảnh hoặc xử lý ngôn ngữ tự nhiên
- Cryptocurrency mining: Mặc dù không phải mục đích chính, OpenCL cũng có thể được sử dụng cho khai thác tiền điện tử
Tính năng này đặc biệt có giá trị trong môi trường chuyên nghiệp nơi tận dụng tăng tốc GPU có thể tăng tốc đáng kể các phép tính phức tạp hoặc quy trình làm việc.
Nó cũng phản ánh tham vọng của Intel trong việc định vị GPU Arc như phần cứng đa năng có khả năng phục vụ cả game thủ và chuyên gia.
Các dòng sản phẩm
GPU Arc™ A-Series cho Máy tính để bàn
| Tính năng | Intel® Arc™ A310 |
Intel® Arc™ A380 |
Intel® Arc™ A580 |
Intel® Arc™ A750 |
Intel® Arc™ A770 (8GB) |
Intel® Arc™ A770 (16GB) |
|---|---|---|---|---|---|---|
| Kiến trúc | Xe-HPG (Alchemist) |
Xe-HPG (Alchemist) |
Xe-HPG (Alchemist) |
Xe-HPG (Alchemist) |
Xe-HPG (Alchemist) |
Xe-HPG (Alchemist) |
| Tiến trình | TSMC N6 | TSMC N6 | TSMC N6 | TSMC N6 | TSMC N6 | TSMC N6 |
| Xe-cores | 6 | 8 | 24 | 28 | 32 | 32 |
| Render Slices | 2 | 2 | 6 | 7 | 8 | 8 |
| Ray Tracing Units | 6 | 8 | 24 | 28 | 32 | 32 |
| XMX Engines | 96 | 128 | 384 | 448 | 512 | 512 |
| Xung nhịp GPU (MHz) | 2000 | 2000 | 1700 | 2050 | 2100 | 2100 |
| Xung nhịp Boost (MHz) | N/A | 2050 | 2000 | 2400 | 2400 | 2400 |
| Loại bộ nhớ | GDDR6 | GDDR6 | GDDR6 | GDDR6 | GDDR6 | GDDR6 |
| Dung lượng bộ nhớ | 4 GB | 6 GB | 8 GB | 8 GB | 8 GB | 16 GB |
| Giao tiếp bộ nhớ | 64-bit | 96-bit | 256-bit | 256-bit | 256-bit | 256-bit |
| Tốc độ bộ nhớ (Gbps) | 15.5 | 15.5 | 16 | 16 | 16 | 17.5 |
| Băng thông bộ nhớ (GB/s) | 124 | 186 | 512 | 512 | 512 | 560 |
| TBP (W) | 75 | 75 | 185 | 225 | 225 | 225 |
| PCIe | 4.0 x8 | 4.0 x8 | 4.0 x16 | 4.0 x16 | 4.0 x16 | 4.0 x16 |
GPU Arc™ A-Series cho Máy tính xách tay
| Tính năng | A350M | A370M | A530M | A550M | A570M | A730M | A770M |
|---|---|---|---|---|---|---|---|
| Kiến trúc | Xe-HPG | Xe-HPG | Xe-HPG | Xe-HPG | Xe-HPG | Xe-HPG | Xe-HPG |
| Tiến trình | TSMC N6 | TSMC N6 | TSMC N6 | TSMC N6 | TSMC N6 | TSMC N6 | TSMC N6 |
| Xe-cores | 6 | 8 | 12 | 16 | 16 | 24 | 32 |
| Render Slices | 2 | 2 | 3 | 4 | 4 | 6 | 8 |
| Ray Tracing Units | 6 | 8 | 12 | 16 | 16 | 24 | 32 |
| XMX Engines | 96 | 128 | 192 | 256 | 256 | 384 | 512 |
| Xung nhịp GPU (MHz) | 1150 | 1550 | 1200 | 900 | 1300 | 1100 | 1650 |
| Loại bộ nhớ | GDDR6 | GDDR6 | GDDR6 | GDDR6 | GDDR6 | GDDR6 | GDDR6 |
| Dung lượng bộ nhớ | 4 GB | 4 GB | 4-8 GB | 8 GB | 8 GB | 12 GB | 16 GB |
| Giao tiếp bộ nhớ | 64-bit | 64-bit | 128-bit | 128-bit | 128-bit | 192-bit | 256-bit |
| Tốc độ bộ nhớ (Gbps) | 14 | 14 | 14 | 14 | 16 | 14 | 16 |
| Băng thông bộ nhớ (GB/s) | 112 | 112 | 224 | 224 | 256 | 336 | 512 |
| TGP (W) | 25-35 | 35-50 | 65-95 | 60-80 | 75-95 | 80-120 | 120-150 |
| PCIe | 4.0 x8 | 4.0 x8 | 4.0 x16 | 4.0 x16 | 4.0 x16 | 4.0 x16 | 4.0 x16 |
GPU Intel® Arc™ B-Series Desktop
| Tính năng | Arc B380 (Tin đồn) |
Arc B570 (Chính thức) |
Arc B580 (Chính thức) |
Arc B750 (Tin đồn) |
Arc B770 (Tin đồn) |
|---|---|---|---|---|---|
| Kiến trúc GPU | BMG-G31 | BMG-G21 | BMG-G21 | BMG-G10 | BMG-G10/G31 (đã hủy?) |
| Tiến trình | TSMC N5 | TSMC N5 | TSMC N5 | TSMC N5 | TSMC N5 |
| Số Transistor (tỷ) | ? | 19.6 | 19.6 | ? | ? (lớn hơn) |
| Kích thước Die (mm²) | ? | 272 | 272 | ? | ? |
| Xe-Cores | 10 | 18 | 20 | 28 | 32 |
| GPU Shaders (ALUs) | 1280 | 2304 | 2560 | 3584 | 4096 |
| Tensor/AI Cores (XMX) | 80 | 144 | 160 | 224 | 256 |
| Ray Tracing Units | 10 | 18 | 20 | 28 | 32 |
| Xung nhịp Boost (MHz) | 2850 | 2750 | 2850 | 2850 | 2850 |
| VRAM (Loại, Tốc độ) | 8GB GDDR6 18 Gbps |
10GB GDDR6 19 Gbps |
12GB GDDR6 19 Gbps |
14GB GDDR6 20 Gbps |
16GB GDDR6 20 Gbps |
| Bus bộ nhớ (bit) | 128 | 160 | 192 | 224 | 256 |
| L2 Cache (MB) | 9 | 13.5 | 18 | 30.5 | 36 |
| Băng thông bộ nhớ (GB/s) | 288 | 380 | 456 | 560 | 640 |
| TBP (watts) | 75 | 150 | 190 | 250 | 250 |
| Ngày ra mắt | 2025 | Tháng 1, 2025 | Tháng 12, 2024 | ? | 2025 |
| Giá dự kiến (USD) | $149 | $219 | $249 | $329 | $399 |
Có thể bạn quan tâm
Liên hệ
Địa chỉ
Tầng 3 Toà nhà VNCC 243A Đê La Thành Str Q. Đống Đa-TP. Hà Nội

