โค้ดแปลงวิดีโอ AV2 ลดบิตเรตได้ต่ำกว่า AV1 ถึง 30% โดยสเปกฉบับสมบูรณ์คาดว่าจะเสร็จในช่วงปลายปี 2025

โค้ดแปลงวิดีโอ (video codec) แบบเปิดรุ่นถัดไปจาก Alliance for Open Media (AOM) ซึ่งขณะนี้ใกล้เสร็จสมบูรณ์แล้ว หลังจากใช้เวลาพัฒนานานกว่า 5 ปี โดยสเปกฉบับสมบูรณ์คาดว่าจะประกาศได้ภายใน ปลายปี 2025 ตอนนี้เครื่องมือหลักทั้งหมดของระบบได้พัฒนาเสร็จแล้ว เหลือเพียงส่วนของไวยากรณ์ระดับสูง (high-level syntax) ที่อยู่ระหว่างการจัดทำ

จากผลทดสอบในปัจจุบัน AV2 สามารถลดบิตเรตได้ประมาณ 30% เมื่อเทียบกับ AV1 ในคุณภาพวิดีโอระดับเดียวกัน

Andrey Norkin นักวิทยาศาสตร์ด้านการวิจัยของ Netflix และหนึ่งในประธานร่วมของ AOM ยืนยันว่า จากผลการทดสอบล่าสุด AV2 ลดบิตเรตได้ 28.63% เมื่อเทียบกับ AV1 ในค่าประเมิน PSNR-YUV (14:1:1) และ 32.59% ในการประเมินด้วย VMAF (Video Multi-Method Assessment Fusion) ซึ่งเป็นเกณฑ์วัดคุณภาพวิดีโอที่ Netflix พัฒนาเอง

ถ้าใครคาดว่าเบื้องหลังจะเป็นอัลกอริธึม AI ขั้นเทพ — ต้องบอกว่าไม่ใช่แบบนั้นครับ
AOM ระบุว่าอาจมี “ส่วนขยาย” ที่ใช้ AI ได้ในอนาคต แต่ตัว AV2 เองยังคงอาศัยคณิตศาสตร์ อัลกอริธึม และความคิดสร้างสรรค์ของวิศวกรล้วน ๆ มากกว่า

สิ่งใหม่ที่ AV2 นำมา

จากข้อมูลที่เปิดเผย AV2 ยังคงใช้โครงสร้าง hybrid block-based แบบเดียวกับ AV1 แต่เพิ่มความสามารถและความยืดหยุ่นหลายด้าน เช่น

ใช้ superblock ขนาดใหญ่ขึ้น (256×256)
ระบบแบ่งบล็อกแบบ recursive ที่ยืดหยุ่นกว่า
แยกการประมวลผลของ luma (ความสว่าง) และ chroma (สี) ได้ละเอียดขึ้น

การพยากรณ์ภาพ (Prediction) ถูกปรับปรุงด้วย

โหมด intra prediction แบบใช้ข้อมูลจริง (data-driven)
แบบจำลอง chroma-from-luma ที่แม่นยำขึ้น
ระบบ reference ranking ที่เลือกเฟรมอ้างอิงได้สูงสุดถึง 7 เฟรม

ส่วน inter prediction เพิ่มฟังก์ชัน Temporal Interpolation Prediction (TIP) เพื่อให้จัดการการเคลื่อนไหวในฉากความละเอียดสูงหรือฉากเคลื่อนไหวเร็วได้ดีขึ้น

ระบบบีบอัดและควอนไทเซชันใหม่

AV2 นำเสนอ quantizer แบบ unified exponential ที่ครอบคลุมทั้งวิดีโอ 8-, 10- และ 12-bit พร้อมความละเอียดมากขึ้น
มีการใช้ Trellis-coded quantization และ user-defined matrices เพื่อปรับการบีบอัดในบิตเรตต่ำได้อย่างยืดหยุ่น
ระบบ transform ถูกออกแบบใหม่ให้ใช้ cross-component transforms และเทคนิคแบบเรียนรู้ (learned transforms) เพื่อรักษา texture ของภาพโดยลดอาการแตก (artifact) ให้น้อยลง
ส่วน coefficient coding ก็ได้รับการปรับปรุงให้เหมาะกับวิดีโอแบบจอภาพ (screen content) และเนื้อหาผสมมากขึ้น

ระบบกรองภาพและประมวลผลหลัง (Filtering & Post-processing)

ฟิลเตอร์และระบบหลังการบีบอัดได้รับการยกเครื่องใหม่ เช่น

generalized deblocker ตัวเดียวที่ช่วยรักษารายละเอียดได้ดีกว่า
ฟิลเตอร์ใหม่อย่าง Guided Detail Filter และ Cross-Component Sample Offset สำหรับลด noise จากการบีบอัด
ระบบจำลองฟิล์มเกรน (film grain synthesis) ที่ปรับแต่งได้ยืดหยุ่นกว่าเดิม
รองรับ multi-layer video และ stereo video สำหรับงานภาพหลายมิติ

ทุกเครื่องมือของ AV2 ได้รับการทดสอบให้เหมาะกับการนำไปใช้งานจริงใน ฮาร์ดแวร์ (hardware efficiency) แล้ว
ขั้นตอนต่อไปของกลุ่ม AOM คือการปรับแต่ง encoder optimization และการขยายความสามารถเพิ่มเติม เช่น bit depth ที่สูงขึ้น และ โปรไฟล์ที่ใช้ AI ช่วยประมวลผล

พูดได้ว่า AV2 คือวิวัฒนาการครั้งใหญ่ของโลกวิดีโอคอมเพรสชัน ที่จะมอบคุณภาพสูงขึ้น ใช้บิตเรตน้อยลง และพร้อมรองรับอนาคตของวิดีโอความละเอียดสูงและสตรีมมิ่งยุคใหม่ในปี 2026 เป็นต้นไป

ที่มา: VideoCardz