Moore Threads ผู้ผลิต GPU ที่เป็นกรรมสิทธิ์ของบริษัทในจีน (ตามรายงาน) เป็นบริษัทล่าสุดที่เข้าร่วมกระแส DeepSeek-R1 ตั้งแต่ปลายเดือนมกราคม NVIDIA, Microsoft และ AMD ได้เข้ามาตีความและปรับใช้ผลิตภัณฑ์ของตนเอง ตามมาตรฐานทั่วโลก GPU ของ Moore Threads ยังตามหลังผลิตภัณฑ์ที่พัฒนาโดยตะวันตกอยู่มาก โดยการประเมินในช่วงต้นปี 2024 แสดงให้เห็นว่าการ์ดจอเดสก์ท็อปเฉพาะ MTT S80 ของบริษัทต้องดิ้นรนกับโซลูชันแบบบูรณาการของ AMD: Radeon 760M การเกิดขึ้นล่าสุดของโมเดลโอเพ่นซอร์สของ DeepSeek ได้ส่งสัญญาณถึงการเปลี่ยนแปลงจากการพึ่งพาฮาร์ดแวร์ประมวลผล AI ที่ทรงพลังและราคาแพงมาก (ซึ่งมักเข้าถึงได้ผ่านคลาวด์) โดยความตื่นเต้นที่แพร่หลายเกิดขึ้นจากโซลูชันของ DeepSeek ที่ค่อนข้างประหยัดในแง่ของข้อกำหนดในการประมวลผล Tom's Hardware ได้สังเกตเห็นกรณีของโมเดล AI โอเพ่นซอร์สที่ทำงาน (ภายในเครื่อง) บน: "ฮาร์ดแวร์ราคาไม่แพง เช่น Raspberry Pi"
ตามรายงานข่าวจากสื่อจีนล่าสุด Moore Threads ได้ประกาศความสำเร็จในการนำโมเดลกลั่น R1-Distill-Qwen-7B ของ DeepSeek มาปรับใช้กับ GPU MTT S80 ดังที่กล่าวมาข้างต้น นอกจากนี้ บริษัทยังเปิดเผยด้วยว่าได้ดำเนินการในลักษณะเดียวกันนี้กับฮาร์ดแวร์กราฟิกที่เน้นไปที่ศูนย์ข้อมูล MTT S4000 โฆษกของ Moore Threads กล่าวถึงการดัดแปลงดังกล่าวว่า "โดยอิงตามกรอบงานโอเพ่นซอร์ส Ollama บริษัท Moore Threads ได้นำโมเดลกลั่น DeepSeek-R1-Distill-Qwen-7B มาปรับใช้จนเสร็จสมบูรณ์ และแสดงให้เห็นถึงประสิทธิภาพที่ยอดเยี่ยมในงานต่างๆ ของจีน ซึ่งยืนยันถึงความคล่องตัวและความเข้ากันได้ของ CUDA ของ GPU ที่มีคุณลักษณะครบถ้วนที่ Moore Threads พัฒนาขึ้นเอง" ตัวเลขประสิทธิภาพที่แน่นอน ผลการทดสอบประสิทธิภาพ และรายละเอียดทางเทคนิคไม่ได้รับการเปิดเผยต่อสาธารณชนจีน ดังนั้น Moore Threads จึงดูเหมือนจะกำลังล้อเลียนความสามารถของการออกแบบ GPU MTT ของตน ITHome รายงานว่า: "ผู้ใช้ยังสามารถดำเนินการปรับใช้การอนุมานของแบบจำลองการกลั่น DeepSeek-R1 บนพื้นฐานของ MTT S80 และ MTT S4000 ผู้ใช้บางรายเคยทำการฝึกฝนด้วยตนเองบน MTT S80 มาแล้ว" Moore Threads เชื่อว่า: "กลไกการอนุมานประสิทธิภาพสูงที่พัฒนาขึ้นเอง รวมกับเทคโนโลยีการเพิ่มประสิทธิภาพร่วมกันของซอฟต์แวร์และฮาร์ดแวร์ ช่วยปรับปรุงประสิทธิภาพการประมวลผลและการใช้ทรัพยากรของแบบจำลองได้อย่างมีนัยสำคัญผ่านการเร่งความเร็วของตัวดำเนินการที่กำหนดเองและการจัดการหน่วยความจำ กลไกนี้ไม่เพียงแต่รองรับการทำงานที่มีประสิทธิภาพของแบบจำลองการกลั่น DeepSeek เท่านั้น แต่ยังให้การสนับสนุนทางเทคนิคสำหรับการปรับใช้แบบจำลองขนาดใหญ่เพิ่มเติมในอนาคตอีกด้วย"
ที่มา : TechPowerUp
ที่มา : TechPowerUp