มีการเผยภาพของ Ascend 950 ตัวเร่งประมวลผล AI เจเนอเรชันถัดไปของ Huawei เป็นครั้งแรก โดยแสดงให้เห็นถึง ชิปซิลิคอนที่ Huawei ออกแบบเอง และ หน่วยความจำ HBM ที่พัฒนาขึ้นภายในบริษัท
ชิปดังกล่าวผสาน HBM ที่ Huawei พัฒนาขึ้นเองเป็นครั้งแรก เข้ากับสถาปัตยกรรมเร่งประมวลผล AI รุ่นใหม่ โดยกลยุทธ์ของ Huawei คือการ แข่งขันด้วยสเกลของระบบ (system-scale) มากกว่าการมุ่งเน้นประสิทธิภาพของชิปเดี่ยวเพียงอย่างเดียว แม้ในแง่ประสิทธิภาพต่อชิปจะยังตามหลัง NVIDIA อยู่ แต่โซลูชันระดับระบบของ Huawei ก็ยังสามารถแข่งขันได้ในตลาดจริง
Huawei ได้ประกาศ Ascend 950 family อย่างเป็นทางการแล้ว โดยมีกำหนดเปิดตัวในช่วงต้นปี 2026 และจะมีให้เลือก 2 รุ่นย่อย
-
รุ่น Ascend 950PR มาพร้อมหน่วยความจำ HBM ที่พัฒนาภายในขนาด 128GB ให้แบนด์วิดท์ประมาณ 1.6TB/s
-
รุ่น Ascend 950DT เพิ่มความจุหน่วยความจำเป็น 144GB และดันแบนด์วิดท์ขึ้นไปเกือบ 4TB/s
ชิปทั้งสองรุ่นถูกวางเป้าประสิทธิภาพไว้ที่ประมาณ 1 PetaFLOP สำหรับ FP8 และสูงถึง 2 PetaFLOPS สำหรับ FP4
กลยุทธ์การแข่งขันของ Huawei เน้นไปที่ การแพ็กชิปแบบหนาแน่น (dense packaging) และ เครือข่ายความเร็วสูงเชิงรุก แทนการพึ่งพาพลังดิบของชิปเดี่ยวเป็นหลัก
แม้จะยังไม่มีข้อมูลชัดเจนเกี่ยวกับกระบวนการผลิต (node) แต่มีความเป็นไปได้สูงว่าจะใช้ กระบวนการ N+3 ล่าสุดของ SMIC ซึ่งมีคุณสมบัติในระดับ 5 นาโนเมตร โดย SMIC ของจีนได้ประกาศแล้วว่าสามารถผลิตเชิงพาณิชย์ในปริมาณมากได้ ด้วยเทคโนโลยี DUV (Deep Ultraviolet) และเนื่องจากลูกค้ารายแรกของ N+3 คือ Huawei กับชิป Kirin 9030 SoC จึงมีเหตุผลอย่างยิ่งที่ Ascend AI accelerator ซึ่งเป็นผลิตภัณฑ์สำคัญกว่า จะใช้กระบวนการผลิตเดียวกัน
จากการตรวจสอบตัวชิป พบว่ามีการใช้ ได 2 ตัว รวมกันในรูปแบบ multi-chip module (MCM) พร้อมด้วยไดซิลิคอนเพิ่มเติมอีก 2 ตัว ซึ่งมีแนวโน้มว่าจะทำหน้าที่เป็นโมดูล I/O และระบบเครือข่าย สำหรับเชื่อมต่อกับ SuperPoD และ SuperCluster ขนาดใหญ่ที่ประกอบขึ้นจาก Ascend 950 จำนวนมาก
การเชื่อมต่อทั้งหมดใช้โปรโตคอลใหม่ที่เรียกว่า Lingqu interconnect ร่วมกับ ลิงก์ออปติคัล (optical links) ซึ่งออกแบบมาเพื่อเชื่อมต่อการ์ด Ascend 950 ได้เป็น หลักแสนใบ ภายในคลัสเตอร์เดียว
รอบ ๆ ตัวซิลิคอนเปลือยยังพบโครงสร้างที่มีลักษณะคล้าย หน่วยความจำแบบไฮบริด LPDDR/HBM ซึ่งคาดว่าเป็น HBM ที่ Huawei พัฒนาขึ้นเอง โดยบริษัทอาจผลิตโมดูล HBM เหล่านี้เป็นชิปแยก แล้วนำมาซ้อน (stack) ลงบนแพ็กเกจเดียวกัน
ที่มา: TechPowerUp



