Moore Threads ได้เผยแพร่ GPU Compute Driver Bench เป็นโอเพนซอร์ส
Moore Threads ได้เปิดตัว GPU Compute Driver Bench ในรูปแบบโอเพนซอร์ส ซึ่งเป็นชุดเบนช์มาร์กสำหรับทดสอบประสิทธิภาพของไดรเวอร์ GPU โดยเฉพาะ โครงการนี้มุ่งวิเคราะห์โอเวอร์เฮดของไดรเวอร์ในงานที่ใช้การประมวลผล (Compute) และหน่วยความจำอย่างหนัก พร้อมตั้งเป้าให้สามารถเปรียบเทียบผลลัพธ์ได้อย่างสม่ำเสมอข้ามผู้ผลิตและแพลตฟอร์มต่าง ๆ
ซอร์สโค้ดถูกเผยแพร่บน GitHub ภายใต้สัญญาอนุญาต Apache 2.0
Moore Threads เป็นผู้พัฒนา GPU จากกรุงปักกิ่ง ก่อตั้งในปี 2020 โดย Zhang Jianzhong อดีตผู้บริหารของ NVIDIA China บริษัทพัฒนาการ์ดจอแบบแยก (Discrete GPU) และสแตกซอฟต์แวร์ MUSA สำหรับงานกราฟิกและการประมวลผล
Moore Threads ระบุว่า GPU Compute Driver Bench เป็นเครื่องมือที่ใช้ประเมินประสิทธิภาพไดรเวอร์อย่างเป็นระบบและในระดับมืออาชีพ
เพื่อช่วยให้นักพัฒนา นักวิจัย สถาปนิกระบบ และผู้รวมระบบ วิเคราะห์ประสิทธิภาพของไดรเวอร์ GPU ได้ลึกยิ่งขึ้นในสถานการณ์ที่ใช้การคำนวณและหน่วยความจำเข้มข้น
การเปิดซอร์สครั้งนี้เกิดขึ้นหลังจากบริษัทเปิดเผยอัปเดตสถาปัตยกรรม Huagang ในงานประชุมนักพัฒนา MUSA เมื่อเดือนธันวาคม 2025 โดยสถาปัตยกรรมใหม่นี้:
-
รองรับความแม่นยำตั้งแต่ FP4 ถึง FP64
-
เคลมว่าเพิ่ม ความหนาแน่นการประมวลผล (Compute Density) ได้ 50%
-
ตั้งเป้าขยายระบบได้ถึง 100,000 GPU ผ่านเทคโนโลยี MTLink
-
ใช้ร่วมกับชิปรุ่นใหม่ “Lushan” (กราฟิก) และ “Huashan” (AI)
ตามข้อมูลของบริษัท GPU Compute Driver Bench จะโฟกัส 5 ด้านหลักที่การออกแบบไดรเวอร์ส่งผลต่อประสิทธิภาพ ได้แก่:
-
การจัดตารางงาน (Scheduling)
-
พฤติกรรมแบบหลายสตรีม (Multi-stream Behavior)
-
การทำงานของหน่วยความจำ (Memory Operations)
-
การสื่อสารหลาย GPU (Multi-GPU Communication)
-
การจัดการทรัพยากร (Resource Management)
ภายในรีโพซิทอรีประกอบด้วย:
-
ซับเทสต์มากกว่า 30 รายการ
-
ระบบให้คะแนนและค่าอ้างอิง (Baseline)
-
สคริปต์อัตโนมัติสำหรับรันชุดทดสอบและคำนวณผลลัพธ์
-
รองรับการคอมไพล์ด้วยทั้ง MUSA และ CUDA toolchains
-
มีเครื่องมือช่วยพอร์ตโค้ด CUDA ↔ MUSA ที่ผูกกับเวิร์กโฟลว์ musify
สรุป: เครื่องมือนี้ถูกออกแบบมาเพื่อให้เห็น “ประสิทธิภาพเชิงซอฟต์แวร์ของ GPU” อย่างแท้จริง ซึ่งเป็นปัจจัยสำคัญมากขึ้นเรื่อย ๆ ในยุค AI และ HPC ที่ไดรเวอร์สามารถเป็นตัวชี้ขาด throughput และ latency ได้ไม่แพ้ตัวฮาร์ดแวร์เลย
ที่มา: VideoCardz



