ไม่นานมานี้เราได้เห็นผู้ผลิต GPU จากประเทศจีนอย่าง Birentech ได้ประกาศว่ากำลังพัฒนา GPU ที่ทรงพลังที่สุดที่บริษัทเคยสร้างมา ภายใต้ชื่อ Biren BR100 .. ซึ่งถ้าดูจากข้อมูลที่ทางบริษัทเปิดเผยมาแล้ว GPU ตัวนี้จะเป็นแบบ General Purpose ก็คือรองรับการทำงานประมวลผลทุกรูปแบบ และจุดมุ่งหมายของบริษัทก็คือจะทำให้มันทรงพลังกว่า NVIDIA A100 ในส่วนการประมวลผล AI .. และล่าสุดนี้ทางบริษัทก็ได้เปิดเผยข้อมูลของ GPU ตัวใหม่นี้มาเพิ่มเติม
BR100 จะเป็น GPU แบบ General Purpose เรือธงที่แรงที่สุดจากประเทศจีน โครงสร้างสถาปัตยกรรมจะเป็นแบบ In-House ออกแบบขึ้นมาเองของบริษัท ซึ่ง Process Node นั้นจะเป็นแบบ 7nm และมี Transistor 77 พันล้านหน่วยภายใน die ของมัน .. ตัว GPU นี้จะถูก Fabricate โดยการออกแบบ 2.5D CoWoS ของ TSMC และจะมี Cache แบบ On-Chip สูงถึง 300MB ใช้ Memory HBM2e ขนาด 64GB และมี Bandwidth สูงถึง 2.3TB/s และรองรับ PCIe Gen 5.0 ผ่าน CXL Interconnect Protocol .. ขนาดตัวชิปนั้นจะอยู่ที่ 1074 ตารางมิลลิเมตร
พูดกันเรื่องโครงสร้างสถาปัตยกรรมแล้ว BR100 จะถูกสร้างขึ้นโดยมี Chiplet สองตัว แต่ละตัวก็จะมี Streaming Processing Clusters (SPC) 16 หน่วย และ SPC แต่ละตัวก็จะมี 16 Execution Unit และจำนวน 4 ตัวจาก 16 ตัวนี้จะเป็น Internal Compute Unit หรือ CU ที่จะติดกับ L1 Cache ขนาด 64KB ในขณะที่ SPC จะมี L2 Cache ขนาด 8MB ที่แชร์กันระหว่างตัว Execution Unit ทั้งหมด .. เพราะเช่นนั้นแล้วจะมีตัว SPC ทั้งหมด 32 หน่วย , Execution Unit 512 หน่วย , ขนาด L2 Cache ที่ 256MB และ L1 Cache ที่ 1MB
Birentech ยังมีการเปิดเผยประสิทธิภาพต่างๆของ BR100 ซึ่งจะทำประสิทธิภาพ INT8 ที่ 2048 TOPs , 1024 TFLOPs (BF16) , 512TFOPs (TF32+) และ 256 TFLOPs (FP32) ซึ่งดูจากตัวเลขแล้ว มันก็น่าจะทำประสิทธิภาพได้ดีกว่า NVIDIA Ampere A100 (อย่างน้อยก็บนสเปกและกระดาษแหละนะ) ถ้าเอามาเทียบกันบน Workload ระดับ HPC จริงๆแล้วมันก็จ่าจะทำประสิทธิภาพได้ดีกว่า A100 อยู่ราวๆ 2.8 เท่า
ข้อมูล : Wccftech