NVIDIA Vera Rubin Superchip: Bước đi chiến lược của NVIDIA trong cuộc đua AI Factory 2026
NVIDIA Vera Rubin Superchip là nền tảng siêu chip được NVIDIA giới thiệu vào tháng 3/2025 với mục tiêu nâng cấp sức mạnh cho các trung tâm AI thế hệ tiếp theo. Superchip này có thiết kế dạng bo mạch đơn, kết hợp một CPU Vera 88 core với hai GPU Rubin bằng kết nối NVLink-C2C nhất quán bộ nhớ, xoá bỏ ranh giới CPU-GPU truyền thống để tạo thành một miền thực thi AI thống nhất trên quy mô toàn rack. Mỗi Superchip Vera Rubin có thể mang đến hiệu năng AI tới 100 PetaFLOPS cho hệ thống.

Siêu chip NVIDIA Vera Rubin sẽ là yếu tố chủ chốt để phát triển các sản phẩm xương sống của NVIDIA trong năm 2026 như NVIDIA Vera Rubin NVL72, NVIDIA Vera Rubin NVL144, NVIDIA DGX SuperPOD cho các AI Factory hiện đại và giúp cho công ty này tăng giá trị lên hàng ngàn tỉ USD nữa.
Những đặc điểm nổi bật nhất của NVIDIA Vera Rubin Superchip
Có thể nói rằng NVIDIA Vera Rubin Superchip là siêu chip mạnh nhất từ trước đến nay. Nó sở hữu những công nghệ hàng đầu để trở thành nền tảng tính toán chủ chốt cho các hệ thống rack-scale của AI Factory thế hệ mới. Sau đây, hãy cùng điểm qua những đặc điểm nổi bật nhất của Superchip này.

Xoá bỏ ranh giới giữa CPU và GPU
NVIDIA đã hướng tới thiết kế tích hợp chặt chẽ GPU và CPU trên cùng một nền tảng bắt đầu từ NVIDIA Grace Hopper và tiếp tục hoàn thiện thiết kế này qua các thế hệ Superchip tiếp theo.
Trên NVIDIA Vera Rubin, CPU Vera và hai GPU Rubin được tích hợp trên cùng một bo mạch và kết nối với nhau bằng công nghệ NVLink-C2C memory-coherent interconnect với băng thông tới 1,8TB/s. Nhờ đó, CPU và GPU có thể truy cập dữ liệu với độ trễ rất thấp và sử dụng không gian bộ nhớ nhất quán, giảm mạnh overhead sao chép dữ liệu khi thực hiện các workload AI phức tạp.
Tranformer Engine thế hệ mới mang đến hiệu năng AI 100 PetaFLOPS
Hai GPU Rubin trên siêu chip NVIDIA Vera Rubin được trang bị Tranformer Engine thế hệ thứ 3 cùng với các Tensor core thế hệ thứ 6 để mang đến hiệu năng AI tới 100 PetaFLOPS. Hai GPU này hỗ trợ các định dạng tính toán NVFP4, FP8/FP6, FP16/BF16, TF32 và FP64, giúp cho superchip xử lý hiệu quả cả huấn luyện và suy luận các mô hình AI hiện đại như MoE và Agentic AI.
Hệ thống bộ nhớ tối ưu cho cả CPU và GPU
Trên bo mạch superchip, NVIDIA sử dụng các module SOCAMM LPDDR5X để cung cấp bộ nhớ cho CPU Vera, đồng thời hai GPU Rubin cũng được trang bị bộ nhớ HBM4 dung lượng lớn. Cả hai bộ nhớ này đều có băng thông cực cao.
Thiết kế này cho phép các ứng dụng có thể coi LPDDR5X và HBM4 như một vùng nhớ đồng bộ duy nhất, giúp giảm overhead di chuyển dữ liệu, dễ dàng triển khai kỹ thuật KV cache-offload cũng như chạy nhiều mô hình song song một cách hiệu quả.
NVIDIA Vera Rubin Superchip sẽ là trung tâm của các AI Factory hiện đại
Hiệu năng của một AI Factory không được quyết định bởi từng con chip riêng lẻ mà bởi cách các chip này được kết hợp thành những hệ thống có thể triển khai, vận hành và mở rộng một cách ổn định.
NVIDIA đã thực hiện một lộ trình phát triển lấy Vera Rubin Superchip làm nền tảng điện toán trung tâm rồi mở rộng quy mô thông qua kiến trúc NVL72 và cuối cùng là đơn vị triển khai AI Factory lớn nhất NVIDIA DGX SuperPOD.
Hai Vera Rubin Superchip sẽ được đặt trong một NVL72 compute tray có tích hợp nguồn, làm mát bằng chất lỏng, kết nối mạng và quản lý vào một cụm mô-đun không dây. Các compute tray này kết hợp cùng với NVLink 6 Switch tray, ConnectX-9 SuperNIC, DPU BlueField-4 và Spectrum-X Ethernet Switch để tạo nên một hệ thống Vera Rubin NVL72 hoàn chỉnh.

Tám rack Vera Rubin NVL72 được liên kết để tạo thành một hệ thống NVIDIA DGX SuperPOD. Đây là một đơn vị triển khai chuẩn của AI Factory, nơi khối compute, networking, lưu trữ và phần mềm vận hành NVIDIA Mission Control được đồng thiết kế và chứng thực để đảm bảo hiệu năng ổn định và khả năng phục vụ liên tục. Một AI Factory hiện đại với nhiều DGX SuperPOD có khả năng mở rộng quy mô tới hàng chục ngàn GPU để đáp ứng các khối lượng công việc huấn luyện, sau huấn luyện và suy luận thời gian thực.

Phần kết luận
Sự xuất hiện của NVIDIA Vera Rubin Superchip cho thấy NVIDIA đang đẩy chiến lược AI Factory rack-scale lên một mức độ hoàn thiện cao hơn, tiếp nối lộ trình đã được đặt nền móng từ Grace Hopper Superchip và các hệ thống như GB200 NVL72 hay GB300 NVL72.
Với Vera Rubin Superchip làm nền tảng, kết hợp cùng kiến trúc NVL72 và DGX SuperPOD, NVIDIA đang đặt ra một chuẩn mực mới cho các trung tâm AI thế hệ tiếp theo, đặc biệt trong bối cảnh MoE, agentic AI và inference long contexts dần trở thành xu hướng chủ đạo. Đây không chỉ là một bước tiến về phần cứng, mà là tuyên bố rõ ràng về tầm nhìn dài hạn của NVIDIA đối với tương lai của AI ở quy mô công nghiệp.
CNTTShop là đơn vị cung cấp các sản phẩm và giải pháp NVIDIA uy tín hàng đầu tại Việt Nam, từ các GPU hiệu năng cao cho đến các máy chủ AI mạnh mẽ. Các sản phẩm NVIDIA chính hãng tại CNTTShop đều đi kèm với dịch vụ hỗ trợ kỹ thuật tận tình và chính sách bảo hành hậu mãi rõ ràng giúp khách hàng hoàn toàn yên tâm trong suốt quá trình đầu tư, vận hành và mở rộng hạ tầng AI.
Công Ty TNHH Công Nghệ Việt Thái Dương (CNTTShop)
Đ/C tại Hà Nội: NTT03, Line1, Thống Nhất Complex, 82 Nguyễn Tuân, Thanh Xuân, Hà Nội.
Đ/C tại HCM: Số 13, đường 7C, khu phố 4, phường An Phú, TP Thủ Đức, Hồ Chí Minh
Điện Thoại: 0906 051 599
Email: kd@cnttshop.vn
Website: www.cnttshop.vn




.png)























Bình luận bài viết!