GB200 NVL2 là máy chủ Rack Module NVIDIA MGX™ của hãng công nghệ NVIDIA. GB200 NVL2 có cấu hình 2 CPU Grace 144 lõi Arm® Neoverse V2 và 2 GPU Blackwell cung cấp sức mạnh tính toán cho trung tâm dữ liệu, hiệu suất suy luận mô hình ngôn ngữ lớn (LLM) vượt trội, tìm kiếm cơ sở dữ liệu vector và xử lý dữ liệu một cách nhanh chóng và mạnh mẽ.
1. Xây dựng với nền tảng NVIDIA MGX™.
Server GB200 NVL2 được xây dựng với nền tảng NVIDIA MGX™ dạng module linh hoạt và dễ dàng mở rộng, có các kích thước 1U, 2U hoặc 4U với tùy chọn làm mát bằng chất lỏng và không khí. NVIDIA GB200 NVL2 có thiết kế 2 GB200, mỗi GB200 được hàn bên trong bao gồm Chip kép Blackwell và một CPU Grace 72 lõi ARM. Như vậy GB200 NVL2 sẽ bao gồm 2 CPU Grace 144 lõi ARM và 2 GPU Blackwell được liên kết với nhau bởi công nghệ NVLINK C2C đa làn với tốc độ 900GB/s, với thiết kế này máy chủ sẽ có sức mạnh tính toán nhanh như chớp lý tưởng để phân tích dữ liệu lớn, đào tạo các mô hình lớn cho các ứng dụng AI tạo ra.
2. Bộ nhớ kết hợp lên tới 1,3 terabyte (TB).
Máy chủ NVIDIA GB200 NVL2 có bộ nhớ kết hợp lên tới 1,3 TByte RAM được chia sẻ giữa hai CPU Grace và hai GPU Blackwell, trong đó 384GB RAM HMB3e với băng thông 16TB/giây được gắn trên GPU Blackwell và 960GB RAM LPDDR5X với băng thông 1.024GB/giây trên CPU Grace. Bộ nhớ dùng chung này được kết hợp với NVIDIA® NVLink™ thế hệ thứ năm và các kết nối chip-to-chip (C2C) tốc độ cao để mang lại hiệu suất suy luận LLM thời gian thực nhanh hơn 5 lần cho các mô hình ngôn ngữ chính thống như Llama 3 70B.
NVIDIA GB200 NLV2 có bộ nhớ của CPU Grace là 960GB với liên kết NVLINK C2C tốc độ cao 900GB/s giúp tăng cường khả năng tìm kiếm vector RAG lên tới 9 lần với có độ trễ thấp. Như vậy với dữ liệu 200GB dưới dạng vector (dữ liệu số) của Wikipedia, máy chủ GB200 NLV2 sẽ đọc và nhớ toàn bộ tập dữ liệu này ngay lập tức trong nháy mắt. Trong một số thử nghiệm thì NVIDIA GB200 NVL2 có khả năng tìm kiếm và đọc dữ liệu vectơ nhanh hơn NVIDIA H100 9 lần.
3. Khả năng xử lý dữ liệu nhanh hơn CPU 18 lần.
Cơ sở dữ liệu đóng vai trò quan trọng trong việc xử lý, xử lý và phân tích khối lượng lớn dữ liệu cho doanh nghiệp. Máy chủ NVIDIA GBNVL2 tận dụng hiệu năng bộ nhớ băng thông cao NVLink-C2C đây là một công nghệ liên kết trực tiếp giữa các GPU, cho phép chúng truyền dữ liệu trực tiếp cho nhau mà không cần thông qua bộ nhớ chính, giúp tăng tốc độ truy cập dữ liệu giữa các GPU. Kết hợp với công cụ nén và giải nén chuyên dụng trong kiến trúc NVIDIA Blackwell để tăng tốc các truy vấn cơ sở dữ liệu quan trọng lên 18 lần so với CPU truyền thống.
4. Các công nghệ đột phá trên NVIDIA GB200 NVL2
4.1. Kiến trúc GPU Blackwell
GPU NVIDIA Blackwell chứa 208 tỷ bóng bán dẫn trên máy chủ NVIDIA GB200 NVL2 là một cải tiến quan trọng trong kiến trúc liên kết "chip-chip" tốc độ 10 terabyte mỗi giây (TB/s). Giúp nâng cao mạnh mẽ khả năng tính toán, cải thiện đáng kể hiệu suất và hiệu quả năng lượng, đồng thời có thể mở rộng quy mô để đáp ứng các nhu cầu tính toán ngày càng lớn và phức tạp.
4.2. CPU NVIDIA Grace
Máy chủ GB200 NVL2 sử dụng 2 CPU Grace, đây là bộ vi xử lý CPU đầu tiên của NVIDIA được thiết kế đặc biệt để xử lý các khối lượng công việc AI và HPC. Grace CPU được xây dựng trên kiến trúc ARM 74 Cores và cung cấp hiệu suất cao, bộ nhớ lớn và tiết kiệm năng lượng, lý tưởng cho các trung tâm dữ liệu lớn và siêu máy tính.
4.3. Công nghệ kết nối NVLINK C2C
Công nghệ kết nối chip với chip NVLINK C2C (Chip-to-Chip) tiên tiến, cho phép truyền dữ liệu nhanh chóng nhiều làn giữa các chip trong hệ thống máy chủ NVIDIA GB200 NVL2. Công nghệ này giúp giảm độ trễ và tăng băng thông truyền dữ liệu, từ đó cải thiện hiệu suất tổng thể của máy chủ.
4.4. Bộ nhớ đệm Key Value (KV)
Bộ nhớ đệm Key-Value (KV) cải thiện tốc độ phản hồi của các mô hình ngôn ngữ lớn (LLM) bằng cách lưu trữ ngữ cảnh và lịch sử cuộc trò chuyện. GB200 NVL2 tối ưu hóa bộ nhớ đệm KV thông qua sự kết hợp hoàn chỉnh giữa CPU Grace và bộ nhớ GPU Blackwell, kết nối bằng NVLink-C2C, nhanh hơn 7 lần so với PCIe, giúp các mô hình ngôn ngữ lớn dự đoán từ nhanh hơn so với các triển khai GPU dựa trên kiến trúc x86.
4.5. NVLink thế hệ thứ năm của NVIDIA
Máy chủ NVIDIA GB200 NVL2 được thiết kế để khai thác toàn bộ tiềm năng tính toán ở cấp độ exascale và các mô hình AI với hàng nghìn tỷ tham số đòi hỏi sự giao tiếp nhanh chóng, liền mạch giữa các GPU trong một cụm máy chủ. NVLink thế hệ thứ năm là một công nghệ kết nối đa làn băng thông lớn giúp tăng tốc hiệu suất cho các mô hình AI có hàng nghìn tỷ và nhiều nghìn tỷ tham số.
4.6. Công nghệ mạng tiên tiến của NVIDIA
Mạng của trung tâm dữ liệu đóng một vai trò quan trọng trong việc thúc đẩy các tiến bộ và hiệu suất của AI, nó đóng vai trò là xương sống cho việc đào tạo mô hình AI phân tán (các ứng dụng AI trên các thiết bị IoT và các thiết bị ở điểm biên, AI Cloud, đào tạo AI trên các cụm máy chủ trong các trung tâm dữ liệu) và hiệu suất AI tổng quát. Các công nghệ NVIDIA Quantum-X800 InfiniBand , NVIDIA Spectrum™-X800 Ethernet và NVIDIA BlueField®-3 DPU trên máy chủ NVIDIA GB200 NVL2 cung cấp kết nối mạng phức tạp lên tới 800Gb/s, cho phép khả năng mở rộng hiệu quả trên hàng trăm và hàng nghìn GPU Blackwell để có hiệu suất ứng dụng tối ưu.
5. Thông số kỹ thuật chi tiết của GB200 NVL2
GB200 NVL2 Specs |
Configuration |
2x Grace CPUs, 2x Blackwell GPUs |
FP4 Tensor Core |
40 PFLOPS |
FP8/FP6 Tensor Core |
20 PFLOPS |
INT8 Tensor Core |
20 POPS |
FP16/BF16 Tensor Core |
10 PFLOPS |
TF32 Tensor Core |
5 PFLOPS |
FP32 |
180 TFLOPS |
FP64/FP64 Tensor Core |
90 TFLOPS |
GPU Memory | Bandwidth |
Up to 384GB | 16TB/s |
CPU Core Count |
144 Arm® Neoverse V2 cores |
LPDDR5X Memory | Bandwidth |
Up to 960GB | Up to 1,024GB/s |
Interconnect |
NVLink: 1.8TB/s
NVLink-C2C: 2x 900GB/s
PCIe Gen6: 2x 256GB/s
|
Server Options |
Various NVIDIA GB200 NVL2 configuration options using NVIDIA MGX |
6. CNTTShop - Đơn vị uy tín cung cấp sản phẩm và giải pháp NVIDIA.
CNTTShop.vn là đơn vị uy tín cung cấp các sản phẩm và giải pháp công nghệ của NVIDIA, mang đến các sản phẩm chất lượng và giải pháp NVIDIA, AI, HPC hàng đầu tới khách hàng. Trên đây là thông tin chi tiết về máy chủ NVIDIA GB200 NVL2 với cấu hình mạnh mẽ và các công nghệ tiên tiến là lựa chọn lý tưởng cho các trung tâm dữ liệu hiện đại, đáp ứng nhu cầu xử lý dữ liệu lớn, AI, và các ứng dụng đòi hỏi hiệu suất cao. Nếu bạn đọc có nhu cầu đặt mua hoặc cần tư vấn giải pháp NVIDIA, AI, HPC từ chuyên gia, vui lòng liên hệ tới chúng tôi để nhận báo giá tốt nhất.
Đọc thêm
Bạn đang cần tư vấn về sản phẩm: #GB200 NVL2 ?