Intel กำลังเลือกเส้นทางที่แตกต่างออกไปด้วยชิปเร่งความเร็ว Gaudi 3 โดยจะหลีกเลี่ยงตลาดที่มีความต้องการสูงสำหรับการฝึกโมเดล AI ขนาดใหญ่ ซึ่งทำให้ NVIDIA ประสบความสำเร็จอย่างมาก แต่ Intel ต้องการช่วยเหลือธุรกิจที่ต้องการโซลูชัน AI ที่ถูกกว่าในการฝึกและเรียกใช้โมเดลเฉพาะขนาดเล็กและตัวเลือกโอเพนซอร์ส ในงานอีเวนต์ล่าสุด Intel ได้พูดถึง "ข้อได้เปรียบด้านประสิทธิภาพราคา" ของ Gaudi 3 เมื่อเทียบกับ GPU H100 ของ NVIDIA สำหรับงานอนุมาน Intel กล่าวว่า Gaudi 3 เร็วกว่าและคุ้มต้นทุนกว่า H100 เมื่อเรียกใช้โมเดล Llama 3 และ Llama 2 ที่มีขนาดต่างกัน
Intel ยังอ้างว่า Gaudi 3 ประหยัดพลังงานเท่ากับ H100 สำหรับการอนุมานโมเดลภาษาขนาดใหญ่ (LLM) ด้วยเอาต์พุตโทเค็นขนาดเล็ก และทำงานได้ดีกว่าด้วยเอาต์พุตขนาดใหญ่ บริษัทยังแนะนำด้วยว่า Gaudi 3 เอาชนะ H200 รุ่นใหม่กว่าของ NVIDIA ในด้านปริมาณงานอนุมาน LLM สำหรับเอาต์พุตโทเค็นขนาดใหญ่ อย่างไรก็ตาม Gaudi 3 ไม่ตรงกับ H100 ในการประมวลผลข้อมูลแบบจุดลอยตัวโดยรวมสำหรับรูปแบบ 16 บิตและ 8 บิต สำหรับเมทริกซ์ความแม่นยำจุดลอยตัว bfloat16 และ 8 บิต Gaudi 3 มีความเร็วถึง 1,835 TFLOPS ในแต่ละรูปแบบ ในขณะที่ H100 มีความเร็วถึง 1,979 TFLOPS สำหรับ BF16 และ 3,958 TFLOPS สำหรับ FP8
ในการสัมภาษณ์กับ CRN อนิล นันดูรี หัวหน้าสำนักงานเร่งความเร็ว AI ของ Intel กล่าวว่าการตัดสินใจซื้อโครงสร้างพื้นฐานการฝึกอบรม AI มุ่งเน้นไปที่ประสิทธิภาพเป็นหลัก มากกว่าต้นทุน “และหากคุณคิดในบริบทนั้น จะมีประโยชน์ตามมา โดยที่การวิจัยโมเดลแนวหน้าทั้งหมด ความสามารถทั้งหมดได้รับการพัฒนาบนแพลตฟอร์มโดยพฤตินัยที่คุณกำลังสร้างมัน คุณกำลังวิจัยมัน และโดยพื้นฐานแล้ว คุณกำลังเพิ่มประสิทธิภาพโดยไม่รู้ตัวด้วยเช่นกัน จากนั้นการพอร์ตมันไป [ยังแพลตฟอร์มอื่น] ก็เป็นงานหนัก
โลกที่เราเริ่มเห็นคือ ผู้คนเริ่มตั้งคำถามเกี่ยวกับ [ผลตอบแทนจากการลงทุน] ต้นทุน พลังงาน และทุกสิ่งทุกอย่าง นี่คือจุดที่—ฉันไม่มีลูกแก้ววิเศษ—แต่เราคิดเกี่ยวกับเรื่องนี้ว่า คุณต้องการโมเดลยักษ์ใหญ่ที่รู้ทุกอย่างหรือไม่” Anil Nanduri หัวหน้าฝ่ายเร่งความเร็ว AI ของ Intel
Intel เชื่อว่าสำหรับธุรกิจจำนวนมาก คำตอบคือ "ไม่" และพวกเขาจะเลือกใช้โมเดลที่เล็กกว่าตามงานที่มีความต้องการประสิทธิภาพน้อยกว่าแทน Nanduri กล่าวว่าแม้ว่า Gaudi 3 จะไม่สามารถ "ตามทัน" GPU ล่าสุดของ NVIDIA ได้ แต่จากมุมมองประสิทธิภาพการทำงานแบบตัวต่อตัว ชิป Gaudi 3 ถือเป็นตัวเลือกที่เหมาะสมอย่างยิ่งในการทำให้ระบบที่เหมาะสมสามารถรันแบบจำลองตามงานและโอเพ่นซอร์สได้
ในอีกเรื่องหนึ่ง Intel ได้ประกาศเลิกจ้างพนักงานจำนวนมากในหลายรัฐ ซึ่งเป็นส่วนหนึ่งของแผนที่กว้างขึ้นในการลดจำนวนพนักงาน บริษัทจะเลิกจ้างพนักงาน 1,300 ตำแหน่งในโอเรกอน 385 ตำแหน่งในแอริโซนา 319 ตำแหน่งในแคลิฟอร์เนีย และ 251 ตำแหน่งในเท็กซัส Intel มีพนักงานมากกว่า 23,000 คนในโอเรกอน 12,000 คนในแอริโซนา 13,500 คนในแคลิฟอร์เนีย และ 2,100 คนในเท็กซัส การเลิกจ้างดังกล่าวจะมีขึ้นเป็นระยะเวลา 14 วัน เริ่มตั้งแต่วันที่ 15 พฤศจิกายน
ที่มา : TechPowerUp
ที่มา : TechPowerUp