ข้อมูลเชิงลึกเกี่ยวกับ AI software ของ AMD ทั้งในเรื่องของประสิทธิภาพ การทำงาน ประโยชน์ที่องค์กรจะได้รับจาก AI software ของ AMD และการส่งเสริมระบบนิเวศแบบเปิด รวมถึงการเปิดตัว AMD Developer Cloud ที่ช่วยให้นักพัฒนาสามารถเข้าถึง GPU ได้ทันที

ROCm พัฒนาไปไกลแค่ไหนในด้านการรองรับ LLM ขนาดใหญ่และงาน AI สำคัญอื่น ๆ?

ซอฟต์แวร์ AMD ROCm ได้พัฒนาความสามารถอย่างก้าวกระโดดในช่วงหลายปีที่ผ่านมา จากเดิมที่เป็นแพลตฟอร์มเฉพาะทางสำหรับระบบ HPC อย่าง Frontier และ El Capitan ก็ขยายสู่การเป็นสแตกซอฟต์แวร์ด้าน AI แบบครบวงจร รองรับทั้งการเทรนและอินเฟอเรนซ์ LLM ครอบคลุมดาต้าเซ็นเตอร์, ระบบฝั่งไคลเอนต์ และอุปกรณ์ Edge — รวมถึง AMD Instinct GPUs, AMD Radeon GPUs และ AMD Ryzen AI Max APUs
ปัจจุบัน AMD รองรับโมเดลชั้นนำแบบ Day-one เช่น Llama, DeepSeek, OpenAI GPT-OSS 20B และ 120B พร้อมโมเดลมากกว่า 2.1 ล้านรายการบน Hugging Face ที่รันได้ทันทีบน ROCm โดยไม่ต้องแก้โค้ดหนักหรือจูนพิเศษ
ROCm ยังออกอัปเดตรุ่นใหม่ทุก 2 สัปดาห์ เพิ่มความเสถียร ประสิทธิภาพ และฟีเจอร์อย่างต่อเนื่อง
ในเวอร์ชันล่าสุด ROCm 7 ได้เพิ่มประสิทธิภาพด้านการเทรนและอินเฟอเรนซ์แบบรุ่นต่อรุ่น พร้อมฟีเจอร์รองรับการสเกลงาน AI เช่น Distributed Inference และการรองรับ Deployment ระดับองค์กร
การพัฒนานี้สะท้อนถึงการเปลี่ยนโฉมของ AMD — จากแพลตฟอร์มที่เคยต้องอาศัยผู้เชี่ยวชาญเฉพาะทาง สู่ระบบที่ “แค่ใช้งานแล้วมันก็ทำงาน” สำหรับนักพัฒนาทุกระดับ ตั้งแต่นิสิตมหาวิทยาลัยจนถึงทีมวิจัย LLM ในดาต้าเซ็นเตอร์ระดับ Hyperscale

AMD ทำงานร่วมกับ PyTorch, TensorFlow และ JAX อย่างไรเพื่อให้การย้ายงาน AI มาสู่ AMD ง่ายขึ้น?

หัวใจสำคัญของการพัฒนา AI คือผลิตภาพของนักพัฒนา ดังนั้น ROCm จึงเชื่อมต่อโดยตรงกับเฟรมเวิร์กยอดนิยมอย่าง PyTorch, TensorFlow และ JAX

PyTorch รองรับ ROCm ในตัว ทำให้รันบน GPU AMD ได้ทันทีโดยไม่ต้องแยกโค้ด
ROCm ทำงานร่วมกับ TensorFlow และ JAX ผ่าน toolchain compiler ที่รองรับ API เดิม
มี Docker ที่ตรวจสอบแล้ว และแพ็กเกจเฟรมเวิร์กที่ตั้งค่าไว้ล่วงหน้า
รองรับบนดิสโทร Linux ชั้นนำ (Ubuntu, Red Hat) รวมถึงไดรเวอร์ Windows
สำหรับการย้ายงาน AI มายัง AMD เครื่องมืออย่าง HIPIFY สามารถแปลงโค้ด CUDA ได้ประมาณ 98% อัตโนมัติ
ROCm มีการตรวจสอบ nightly builds กับโมเดลและเฟรมเวิร์กต่าง ๆ เพื่อให้ความเสถียร
ผลลัพธ์คือ ROCm “หายตัวไป” จากมุมมองของนักพัฒนา — ใช้โค้ดเดิม ย้ายจากเครื่องทดสอบไปสู่คลัสเตอร์ AMD ได้โดยไม่ต้องแก้โค้ดใหม่

AMD มีแผนรองรับภาษาโปรแกรมใหม่หรือการเพิ่มประสิทธิภาพระดับล่างสำหรับงานวิจัย AI อย่างไร?

ทิศทางของวงการพัฒนา AI มุ่งไปสู่ระดับนามธรรมที่สูงขึ้น นักพัฒนาอยากได้ความเร็ว ความยืดหยุ่น และไม่ถูกผูกติดกับการเขียนโค้ดระดับล่าง AMD จึงเน้นให้เทคโนโลยีทำงานร่วมกับเฟรมเวิร์กที่นิยมอยู่แล้ว เช่น PyTorch, JAX และ Triton compiler แทนที่จะสร้างภาษาใหม่
แต่สำหรับนักวิจัยที่ต้องการปรับแต่งละเอียด ROCm ก็เปิดให้ใช้งานได้ทั้งระดับสูงและระดับล่าง

ระดับสูง: ทำงานใน Python ผ่าน PyTorch ที่รองรับ ROCm โดยตรง
ระดับต่ำ: มี API C/C++ สำหรับเขียนเคอร์เนลเองเพื่อเพิ่มความเร็ว
HIP และเครื่องมือต่าง ๆ เช่น Hipify ช่วยให้หลายโปรแกรม CUDA ที่คอมไพล์แล้วรันบน GPU AMD ได้
โครงสร้างหลายชั้นนี้ทำให้นักพัฒนาสามารถเลือกได้ว่าจะใช้งานระดับไหน พร้อมได้ประโยชน์จากระบบแบบเปิดที่รองรับหลายผู้ผลิต

จากมุมซอฟต์แวร์ จุดแข็งทางสถาปัตยกรรมของ GPU และ APU จาก AMD คืออะไร?

AI ใช้งานประสิทธิภาพของ GPU/APU ผ่าน 3 จุดเด่นหลักของ AMD:

หน่วยความจำ (Memory)
- AMD Instinct MI350 ใช้ HBM3E ความจุและแบนด์วิดท์สูงที่สุดในอุตสาหกรรม
- รองรับโมเดลได้สูงถึง 520 พันล้านพารามิเตอร์บน GPU เดียว
ความแม่นยำและฟอร์แมตข้อมูล (Precision)
- รองรับ datatype ตั้งแต่ FP64 ลงถึง FP4/FP6
- มี Matrix Cores และ XDNA AI Engines สำหรับงาน Deep Learning
การผสานรวม (Integration)
- APU มี Unified Memory ลดค่า overhead ของการย้ายข้อมูล
- ROCm ทำให้ความสามารถเหล่านี้ใช้งานได้ผ่าน PyTorch และ JAX โดยตรง

จุดแข็งทั้งหมดนี้ช่วยให้เทรนโมเดลใหญ่ได้เร็วขึ้น ขยายสเกลง่าย และรองรับการใช้งานตั้งแต่แล็ปท็อปจนถึงซูเปอร์คอมพิวเตอร์

มุมมองของ AMD: ทำไมระบบนิเวศแบบเปิดถึงมีบทบาทสำคัญต่อการเข้าถึง AI อย่างทั่วถึง?

“ความเปิด” คือหัวใจยุทธศาสตร์ของ AMD ความตั้งใจคือทำให้ทุกคนเข้าถึง AI ได้ ตั้งแต่นักวิจัยจนถึงสตาร์ทอัป โดยไม่ถูกผูกขาดด้วยเทคโนโลยีปิด
แพลตฟอร์มแบบเปิดช่วยลดต้นทุน ลดความยุ่งยาก เพิ่มอิสระในการพัฒนา และขยายไอเดียได้เร็ว
AMD จึงลงทุนในระบบตั้งแต่ฮาร์ดแวร์ โอเพ่นซอฟต์แวร์ ROCm จนถึงโครงสร้างระบบมาตรฐานสเกลระดับ Rack
ROCm 7 ผสาน PyTorch แบบสมบูรณ์ รองรับโมเดลอย่าง Llama และ DeepSeek ตั้งแต่วันแรก
AMD Developer Cloud ก็ช่วยให้นักพัฒนาทดลองและสเกลงาน AI บน GPU AMD ได้ทันทีผ่านคอนเทนเนอร์ที่ตั้งค่าไว้แล้ว
ทั้งหมดนี้ทำให้ AI พัฒนาโดยถูกขับเคลื่อนโดยนักพัฒนา ไม่ใช่โดยข้อจำกัดจากผู้ขายรายใดรายหนึ่ง

ในมุมของ AMD สแตก AI ในอีก 5 ปีจะมีหน้าตาแบบไหน?

AMD คาดว่าสแตก AI จะมี 3 คุณสมบัติหลัก:

เปิดและทำงานร่วมกันได้ (Open & Interoperable)
ไม่มี vendor lock-in AMD สนับสนุนมาตรฐานเปิดต่าง ๆ เช่น ROCm, UALink, Ultra Ethernet Consortium (UEC)
ลดความยุ่งยาก (Frictionless)
ต้องมีคอนเทนเนอร์สำเร็จรูป เฟรมเวิร์กที่ validated และเครื่องมือที่ย้ายงานได้ง่ายจากวิจัยสู่โปรดักชัน
สเกลง่าย (Scalable)
รองรับตั้งแต่ inference บนอุปกรณ์ Edge ไปจนถึงการเทรนระดับ Multi-Exaflop ในดาต้าเซ็นเตอร์
ROCm 7 ที่มี Distributed Inference คือก้าวแรกของสแตกอนาคตนี้

AMD แก้ปัญหาด้านมาตรฐาน การทำงานร่วมกัน และความปลอดภัยในระบบเปิดอย่างไร?

ความเปิดจะมีคุณค่าได้ก็ต่อเมื่อมีมาตรฐาน การข้ามแพลตฟอร์ม และความปลอดภัยรองรับ

AMD เข้าร่วมโครงการเปิดหลายอย่าง เช่น UEC, UALink, OCP และใช้ซอฟต์แวร์โอเพ่นซอร์สอย่าง ROCm
เทคโนโลยีความปลอดภัย เช่น Caliptra (root-of-trust แบบโอเพ่นซอร์ส) และ SEV-SNP ช่วยปกป้องเวิร์กโหลดสำคัญแม้อยู่ในระบบ Multi-tenant หรือคลาวด์ขนาดใหญ่
ทั้งหมดนี้ทำให้ผู้พัฒนาเชื่อมั่นได้ว่างานของตนสามารถพกพา ขยาย และทำงานได้อย่างปลอดภัยในระบบนิเวศแบบเปิด