โมเดลใหม่ของ OpenAI ทำงานได้เร็วที่สุดบน GPU NVIDIA RTX

NVIDIA ประกาศความร่วมมือกับ OpenAI เพื่อนำเสนอโมเดลเปิดตระกูล gpt-oss ใหม่ให้กับผู้บริโภค ช่วยให้ AI ล้ำสมัยที่ครั้งหนึ่งเคยมีเฉพาะในศูนย์ข้อมูลบนคลาวด์ สามารถทำงานด้วยความเร็วอันน่าทึ่งบนพีซีและเวิร์กสเตชันที่ใช้ชิป RTX

การเปิดตัวครั้งนี้ถือเป็นการเปิดศักราชใหม่ของ AI บนอุปกรณ์ที่เร็วขึ้นและชาญฉลาดยิ่งขึ้น เสริมประสิทธิภาพด้วยพลังของ GPU GeForce RTX และ GPU PRO มีสองรุ่นใหม่ที่ออกแบบมาเพื่อรองรับระบบนิเวศทั้งหมด:

รุ่น gpt-oss-20b ได้รับการปรับแต่งให้ทำงานได้อย่างเต็มประสิทธิภาพบนพีซี NVIDIA RTX AI ที่มี VRAM อย่างน้อย 16GB มอบประสิทธิภาพสูงสุด 250 โทเค็นต่อวินาทีบน GPU RTX 5090

รุ่น gpt-oss-120b ขนาดใหญ่กว่า รองรับบนเวิร์กสเตชันระดับมืออาชีพที่เร่งความเร็วด้วย GPU NVIDIA RTX PRO

โมเดลเหล่านี้ได้รับการฝึกฝนบน GPU NVIDIA H100 และเป็นโมเดลแรกที่รองรับความแม่นยำ MXFP4 บน NVIDIA RTX ซึ่งเป็นเทคนิคที่เพิ่มคุณภาพและความแม่นยำของโมเดลโดยไม่เพิ่มต้นทุนด้านประสิทธิภาพเมื่อเทียบกับวิธีการแบบเดิม โมเดลทั้งสองรองรับความยาวบริบทสูงสุด 131,072 ความยาว ซึ่งเป็นหนึ่งในความยาวบริบทที่ยาวที่สุดในการอนุมานแบบโลคัล โมเดลเหล่านี้สร้างขึ้นบนสถาปัตยกรรมแบบผสมผสานของผู้เชี่ยวชาญ (MoE) ที่มีความยืดหยุ่น โดดเด่นด้วยความสามารถในการคิดแบบเป็นลำดับชั้น (chain-of-thought) และการรองรับการติดตามคำสั่งและการใช้เครื่องมือ

งาน RTX AI Garage สัปดาห์นี้เน้นย้ำถึงวิธีที่ผู้ที่ชื่นชอบ AI และนักพัฒนาสามารถเริ่มต้นใช้งานโมเดล OpenAI ใหม่บน GPU NVIDIA RTX ได้อย่างไร:

แอป Ollama: วิธีที่ง่ายที่สุดในการทดสอบโมเดลเหล่านี้คือแอป Ollama ใหม่ อินเทอร์เฟซผู้ใช้รองรับโมเดล gpt-oss ได้ทันที ซึ่งได้รับการปรับแต่งให้เหมาะสมที่สุดสำหรับ GPU RTX

Llama.cpp: NVIDIA กำลังร่วมมือกับชุมชนโอเพนซอร์สเพื่อเพิ่มประสิทธิภาพการทำงานของ GPU RTX โดยล่าสุดได้นำ CUDA Graphs มาใช้งานเพื่อลดค่าใช้จ่าย นักพัฒนาสามารถเริ่มต้นใช้งานได้ที่คลังเก็บ Llama.cpp GitHub

Microsoft AI Foundry: นักพัฒนาระบบ Windows สามารถเข้าถึงโมเดลเหล่านี้ได้ผ่าน Microsoft AI Foundry Local (ในเวอร์ชันตัวอย่างสาธารณะ) การเริ่มต้นใช้งานทำได้ง่ายเพียงแค่รันคำสั่ง Foundry model run gpt-oss-20b ในเทอร์มินัล

Jensen Huang ผู้ก่อตั้งและซีอีโอของ NVIDIA ได้เน้นย้ำถึงความสำคัญของการเปิดตัวครั้งนี้:

“OpenAI ได้แสดงให้โลกเห็นถึงสิ่งที่สามารถสร้างขึ้นบน NVIDIA AI ได้ และตอนนี้พวกเขากำลังพัฒนานวัตกรรมในซอฟต์แวร์โอเพนซอร์ส” Jensen Huang ผู้ก่อตั้งและซีอีโอของ NVIDIA กล่าว “โมเดล gpt-oss ช่วยให้นักพัฒนาทั่วโลกสามารถพัฒนาบนรากฐานโอเพนซอร์สที่ทันสมัยนี้ เสริมสร้างความเป็นผู้นำด้านเทคโนโลยี AI ของสหรัฐอเมริกา ทั้งหมดนี้บนโครงสร้างพื้นฐานการประมวลผล AI ที่ใหญ่ที่สุดในโลก”