Arm เปิดตัวแพลตฟอร์มใหม่ Lumex Compute Subsystem (CSS) ที่ออกแบบมาเพื่อผลักดันการประมวลผล AI บนอุปกรณ์ (On-device AI) ให้เร็วขึ้นบนสมาร์ทโฟน, พีซี และอุปกรณ์ขนาดเล็ก โดยแพลตฟอร์มนี้ผสานรวม CPU ที่รองรับ SME2, จีพียูตระกูลใหม่ Mali G1, และรองรับการทำงานกับเฟรมเวิร์ก AI หลัก ๆ
คอร์ใหม่ C1 บนสถาปัตยกรรม Armv9.3
คอร์ C1 CPU cluster เป็นรุ่นแรกที่ใช้ Scalable Matrix Extension 2 (SME2) ซึ่งมอบประสิทธิภาพ AI สูงขึ้นถึง 5 เท่า, ลดเวลาในการประมวลผลเสียงลง 4.7 เท่า และสร้างเสียงได้เร็วขึ้น 2.8 เท่า เมื่อเทียบกับรุ่นก่อนหน้า
-
ในการทดสอบจริง SME2 ทำให้การแปลงข้อความเป็นเสียง (Text-to-Speech) เร็วขึ้น 2.4 เท่า และลดเวลาในการตอบสนองของ LLM ลง 40% (ทดสอบร่วมกับ Alipay และ vivo)
ตระกูล C1 ประกอบด้วย:
-
C1-Ultra – เร็วขึ้น 25% ต่อคอร์เดี่ยว เมื่อเทียบกับ Cortex-X925
-
C1-Premium – ใช้พื้นที่บนชิปเล็กลง 35% เมื่อเทียบกับ Ultra เจาะกลุ่มสมาร์ทโฟนระดับรองเรือธง
-
C1-Pro – ประสิทธิภาพ sustained สูงขึ้น 16% เหมาะกับงานเกมและวิดีโอ
-
C1-Nano – ประหยัดพลังงานมากขึ้น 26% เมื่อเทียบกับ Cortex-A520 เหมาะสำหรับอุปกรณ์สวมใส่ (wearables)
กราฟิกใหม่ Mali G1-Ultra GPU
จีพียูรุ่นใหม่นี้มาพร้อม RTU v2 ที่ทำให้ประสิทธิภาพ Ray Tracing สูงขึ้น 2 เท่า และเพิ่มเฟรมเรต/การตอบสนองในเกมและ AI inference ได้อีก 20% โดย Arm ระบุว่าจะช่วยยกระดับกราฟิกและความลื่นไหลในเกมดัง ๆ เช่น Fortnite, Genshin Impact, Arena Breakout และ Honkai Star Rail
-
รุ่นเล็กอย่าง G1-Premium และ G1-Pro เน้นประสิทธิภาพต่อวัตต์ สำหรับอุปกรณ์ระดับกลาง
เทคโนโลยี Ray Tracing RTUv2
-
ใช้ hardware-accelerated traversal ใน RTU โดยตรง (ไม่ต้องพึ่ง compute shader แบบ RTUv1)
-
เปลี่ยนจาก packed ray model ไปเป็น single ray model ทำให้จัดการกับการสะท้อนหลายชั้นได้ยืดหยุ่นขึ้น และให้แสงเงาสมจริงกว่าเดิม
ผลการทดสอบ:
-
2 เท่า ใน microbenchmarks
-
Lumilings demo +40%
-
Genshin Impact +17%
-
Fortnite +11%
-
Arena Breakout +25%
-
Mori demo +26%
วิสัยทัศน์ของ Arm
Arm คาดว่า SME และ SME2 จะมอบกำลังประมวลผลกว่า 10 พันล้าน TOPS ครอบคลุมอุปกรณ์กว่า 3 พันล้านเครื่องภายในปี 2030 โดยมีพาร์ทเนอร์อย่าง Samsung, Tencent, Alibaba, vivo และ Alipay นำแพลตฟอร์ม Lumex ไปใช้แล้ว
แพลตฟอร์ม Lumex CSS ถือเป็นการรวม CPU, GPU และ System IP เข้าด้วยกัน เพื่อสร้างผู้ช่วยอัจฉริยะที่ตอบสนองได้ไวขึ้น, การแปลภาษาแบบเรียลไทม์, การถ่ายภาพที่ดียิ่งขึ้น และการเล่นเกมมือถือที่เข้าใกล้คุณภาพระดับเดสก์ท็อป
ที่มา : VideoCardz