Announcement

Collapse
No announcement yet.

ข่าวคราว K10 เครดิต ITharem.com

Collapse
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • ข่าวคราว K10 เครดิต ITharem.com

    หลังจากปล่อยให้คู่แข่งอย่าง Intel ทำตลาดซีพียูระดับเพาเวอร์ยูสเซอร์มาเป็นเวลานาน วันนี้ทาง AMD ก็มีข้อมูลสำคัญเกี่ยวกับโพรเซสเซอร์รุ่นล่าสุดในรหัส Barcelona ซึ่งเลื่อนการวางตลาดหลายครั้งหลายครา ซึ่งในซีพียู Barcelona นี้จะเป็นโพรเซสเซอร์ตัวแรกที่จะใช้สถาปัตยกรรมล่าสุดที่มีชื่อว่า K10 Micro-Architecture ก็เป็นเทคโนโลยีที่ทาง AMD คาดหวังและลงแรงไปกับสถาปัตยกรรมดังกล่าวนี้ค่อนข้างมากทีเดียว


    โดยล่าสุดทาง AMD นั้น ได้สัญญาว่าจะเปิดตัวโพรเซสเซอร์ Quad-Core ที่ใช้งานร่วมกับ K10 Micro-Architecture นี้ ช่วงปลายเดือนสิงหาคมถึงกันยายน ซึ่งเราอาจจะได้เห็นซีพียูตัวนี้ วางตลาดแล้วก็เป็นได้ ตามรายงานนั้น ทาง AMD ได้ให้ข้อมูลว่าเจ้าโพรเซสเซอร์ Barcelona ตัวนี้ จะเข้าสู่ตลาด Server ก่อน เนื่องจากทางวิศวกร ไม่สามารถที่จะผลิตออกมาเป็น Mass Production ได้ทันการ เนื่องด้วยการผลิต Quad-Core ที่สัญญาณนาฬิกาสูงๆนั้น จะบริโภคพลังงาน TDP อย่างมหาศาล เกินกว่าที่เดสก์ทอปทั่วๆ ไปจะใช้งานได้ ซึ่งก็ต้องรอการพัฒนา (Revision) จนกว่าจะลดการใช้พลังงานลงมาในระดับที่สามารถจะใช้งานบนเดสก์ทอป ทั่วๆไปได้ และโพรเซสเซอร์ตัวแรกที่ AMD คาดว่าจะออกสู่ตลาดก็จะอยู่ใน Opteron Quad-Core Server 2.0GHz นั่นเอง



    ในช่วงไตรมาสที่ 4 ทาง AMD ก็ได้ให้สัญญาว่าจะพัฒนา Opteron ตัวนี้ให้ไปวิ่งที่สัญญาณนาฬิการะดับ 2.4-2.5GHz พร้อมเปิดตัวตลาดเดสก์ทอปด้วย ซึ่งก็จะมีอยู่ทั้งหมดสองรุ่น ที่เป็น Quad-Core

    * Phenom FX (รหัสพัฒนา Agena FX) 4 Cores, 2MB L3 Cache, สัญญาณนาฬิกาที่ 2.2-2.4GHz และมีสองซ็อกเก็ตให้เลือกคือ AM2+ และ F+
    * Phenom X4 (รหัสพัฒนา Agena) 4 Cores, 2MB L3 Cache, สัญญาณนาฬิกาที่ 2.2-2.4GHz และใช้ซ็อกเก็ตเดียวคือ AM2+
    ถัดมาในช่วงต้นปี 2008 นั้น ทาง AMD ก็จะเปิดตัวรุ่นเล็ก ที่ตัดฟีเจอร์บางอย่างออกไป
    * Phenom X2 (รหัสพัฒนา Kuma) 2 Cores, 2MB L3 Cache, สัญญาณนาฬิกาที่ 2.2-2.6GHz และใช้ซ็อกเก็ตเดียวคือ AM2+
    * Phenom X2 (รหัสพัฒนา Rana) 2 Cores, ไม่มี L3 Cache, สัญญาณนาฬิกาเริ่มที่ 2.2GHz และใช้
    ซ็อกเก็ต AM2+
    * Sempron (รหัสพัฒนา Spica) 1 Core, สัญญาณนาฬิกา 2.2-2.4GHz และใช้ช็อกเก็ต AM2+

    เท่านี้ก็น่าจะเห็นภาพคร่าวๆ ของโพรเซสเซอร์ตัวถัดไปที่ทาง AMD จะปล่อยลงสู่ตลาดในปลายปีนี้แล้วนะครับ คราวนี้เราไปดูเจาะลึกในส่วนของโครงสร้างภายในของเจ้า K10 Micro-Architecture กันเลยครับ

    Instructions Fetch
    การทำงานของโพรเซสเซอร์นั้น เริ่มทำงานโดยการดึงชุดคำสั่งที่ต้องประมวลผลมาจาก L1 Instruction Cache และเริ่มแปลผลชุดคำสั่งนั้นๆ ซึ่งชุดคำสั่งของ X86 นั้น มีขนาดของชุดคำสั่งที่แตกต่างกันไป ตามแต่ละชุดของมัน ซึ่งทำให้โพรเซสเซอร์นั้น ยากที่จะกำหนดขอบเขตของช่วงชุดคำสั่งแต่ละชุด ทำให้การโหลดชุดคำสั่งแต่ละสัญญาณนาฬิกานั้น เป็นไปได้อย่างไม่มีประสิทธิภาพเท่าใดนัก ใน K8 และ K10 นั้น ทำการประมวลผลชุดคำสั่ง โดยการแปลงชุดคำสั่งขณะที่ชุดคำสั่งถูกโหลดลงบน L1I Cache และได้ติดป้ายบอกในทุกๆชุดคำสั่ง (3-bit แรกของแต่ละชุดคำสั่ง) เพื่อบอกขนาดของแต่ละชุดคำสั่ง เพื่อให้การประมวลผลชุดคำสั่งเป็นไปได้อย่างมีประสิทธิภาพ

    สำหรับ K10 Micro-Architecture นั้น ได้มีการพัฒนาให้สามารถดึง (Fetch) ชุดคำสั่งจาก L1I Cache ได้มากกว่าเดิมเท่าตัว จาก 16-byte blocks ใน K8 เป็น 32-byte blocks ใน K10 เนื่องจากขนาดชุดคำสั่งในทุกวันนี้มีขนาดใหญ่ขึ้นกว่าเดิม ทำให้การขยายขนาดการดึงชุดคำสั่งช่วยลดปัญหาคอขวดได้เป็นอย่างดี

    Branch Prediction
    Branch Prediction ก็คือการคาดเดาของโพรเซสเซอร์ที่จะทำนายล่วงหน้าว่าการทำงานในคำสั่งถัดไปจะเป็นอย่างไร และก็จะดึงข้อมูลหรือชุดคำสั่งถัดไปมาเตรียมไว้ล่วงหน้า เพื่อป้องกันการเกิด Decoding Interruption ซึ่งใน K8 จะใช้ Two-level adaptive algorithm ที่จะทำนายข้อมูล โดยการย้อนกลับไปพิจารณาจากชุดคำสั่ง 8 ชุดก่อนหน้า และใช้การคำนวณ เพื่อหาผลลัพธ์ถัดไป ซึ่งอัลกอริธึมแบบนี้ ไม่สามารถใช้งานกับข้อมูลประเภท Indirect ได้ เพราะข้อมูลชนิดนี้จะใช้ Pointer ที่จะคำนวณหา Address ระหว่างประมวลผลทำให้ไม่สามารถทำนาย Address ของข้อมูลล่วงหน้าได้ ทำให้โพรเซสเซอร์ K8 นั้น ทำงานได้ช้ากับโค้ดจำพวก Object-Oriented
    ใน K10 ได้มีการพัฒนา Conditional branch prediction algorithm ขึ้นมาจากเดิม

    * มีการพัฒนา Prediction algorithm เพื่อข้อมูลประเภท Indirect โดยสร้างตารางขนาด 512 elements ในการคาดเดา
    * เพิ่มขนาด Global history register ที่ใช้เก็บชุดคำสั่งก่อนหน้าจากเดิม 8 เพิ่มขึ้นเป็น 12
    * เพิ่มขนาดของ Return-Address Stack จากเดิม 12 เป็น 24 ตำแหน่ง

    การพัฒนาใน K10 นี้จะช่วยให้สามารถประมวลผลโค้ดจำพวก Object-Oriented ได้เร็วมากยิ่งขึ้น


  • #2
    Integer Execution Unit
    IEU ของ K8 และ K10 นั้นประกอบไปด้วยท่อในการประมวลผลเลขจำนวนเต็ม 3 ท่อด้วยกัน ซึ่งแต่ละท่อก็จะมี Scheduler ที่ไว้จัดสรรลำดับข้อมูลแยกออกจากกัน ดังรูป ใน K10 นั้นแก้ปัญหาการเกิด out-of-order reads ซึ่งคือการประมวลผลชุดคำสั่งที่ไม่เป็นลำดับ อย่างเช่นการประมวลผลให้เขียนชุดคำสั่ง ก่อนที่จะอ่านชุดคำสั่ง ก็จะไม่เกิดปัญหา Conflict กับ Memory Address แต่อย่างใด (ปัญหานี้เกิดขึ้นใน K8 ซึ่งทำให้ประสิทธิภาพในการประมวลผลชุดคำสั่งที่เป็น Out-of-Order นั้น ลดลงอย่างมาก) และก็ปรับปรุงการอัลกอริธึมการหาร (Divide) ซึ่งปกติเป็นอัลกอริธึมที่ผู้เขียนโปรแกรมไม่ค่อยได้ใช้ เนื่องจากจะใช้การคูณกับส่วนกลับแทนมากกว่า



    Floating Point Unit
    ใน K10 นั้น ความกว้างของขนาด FPU ได้เพิ่มขึ้นเป็น 128 บิต ทำให้ K10 สามารถประมวลผล Vector 128-bit ได้ในสัญญาณนาฬิกาเดียว ซึ่งเพิ่มประสิทธิภาพขึ้นสองเท่าในทางทฤษฏี เมื่อทำงานเกี่ยวกับ Vector SSE-instructions (เทียบกับ K8)


    Memory Controller
    ใน K10 ได้เพิ่มช่องสัญญาณของ Data Cache จากเดิม 64-bit ต่อสัญญาณนาฬิกา ใน K8 เป็น 128-bit ต่อสัญญาณนาฬิกาใน K10 และเพิ่มช่องสัญญาณของ Memory Controller เป็น 128-bit ด้วยเช่นกัน ในส่วนของ Cache ใน K10 ก็มีเพิ่มแคชระดับ 3 (L3 Cache) ขึ้นมา เพื่อเป็นจุดเชื่อมต่อของแต่ละคอร์ เพื่อจะสามารถส่งข้อมูลหากันได้


    Virtualization
    มีการพัฒนาชุดคำสั่งที่ AMD-V ที่เพิ่มประสิทธิภาพการทำงานหลาย OS บนเครื่องเดียวกัน โดย K10 นั้น อนุญาตให้แต่ละ OS บน Virtualization สามารถมี Memory Management เป็นของตัวเองได้ ซึ่ง AMD เรียกว่า “Nested Paging” ซึ่งเทคโนโลยีนี้ ช่วยลดระยะเวลาที่ VM จะใช้ในการจัดการพวก Shadow Page และทาง AMD ได้อ้างว่าสามารถเพิ่มประสิทธิภาพได้ถึง 79%

    New Instructions (SSE4a)
    เพิ่มชุดคำสั่งจากเดิมใน K8 เข้าไป ทำให้ช่วยประมวลผลชุดคำสั่งเฉพาะทางได้รวดเร็วขึ้น อย่าง LZCNT ที่นับจำนวนเลข 0 ในชุดคำสั่ง และ POPCNT ที่นับจำนวนเลข 1 ในชุดคำสั่ง ซึ่งชุดคำสั่งพวกนี้ จะใช้งานกับโปรแกรมที่ถูกออกแบบมาโดยเฉพาะ จะสามารถทำงานได้เร็วกว่าปกติ เปรียบเสมือนการลดจำนวนสัญญาณนาฬิกาที่จะต้องทำงานในแต่ละชุดคำสั่งนั้นๆ จากปกติต้องทำงาน 8 ถึง 32 สัญญาณนาฬิกาเพื่อนับจำนวนบิต แต่พอใช้คำสั่งพิเศษ ก็เหลือเพียงสัญญาณนาฬิกาเดียว เป็นต้น




    Power Management
    ใน K10 ก็ได้มีการพัฒนาส่วนของการประหยัดพลังงาน ที่แต่ละคอร์จะมีการทำงานอิสระจากกัน ซึ่งสัญญาณนาฬิกาของแต่ละคอร์จะมีความเร็วที่แตกต่างขึ้น ขึ้นอยู่กับ Work Load ที่เข้ามาในโพรเซสเซอร์ โดยเทคโนโลยีนี้มีชื่อว่า AMD “CoolCore” รวมทั้งเทคโนโลยีที่อาจจะเคยผ่านตากันแล้วอย่าง “Split Power Planes” ที่จะเพิ่มประสิทธิภาพในการจัดการพลังงาน ทาง AMD ก็นำมาจับเปลี่ยนชื่อใหม่เป็น AMD “Dual Dynamic Power Management” ซึ่งเทคโนโลยีนี้จำเป็นที่จะต้องใช้ร่วมกันเมนบอร์ด Socket 1207+ ที่เป็นบอร์ดรุ่นใหม่ ซึ่งจะมาพร้อมเทคโนโลยีตัวนี้ โดยบอร์ด Socket 1207 ธรรมดาที่ออกมาก่อนหน้านี้ จะไม่รองรับ

    Comment


    • #3
      Review & Benchmark


      หลังจากดูในส่วนเทคโนโลยีที่มีการพัฒนาขึ้นมาแล้ว เราไปดูตัวเป็นๆของเจ้า Barcelona นี้กันเลย ว่าหน้าตาตัวจริงที่ส่งให้สื่อต่างๆได้เทสกันมีหน้าตาเป็นยังไง ซึ่งก็มีอยู่ทั้งหมดสามตัว ที่ถูกส่งไปให้แลปทดสอบของ Anandtech ทำ Preview เป็นเจ้าแรก โดยรุ่นที่นำมาทดสอบก็เป็นโพรเซสเซอร์ที่อยู่ในตระกูล Server อย่าง Opteron ทั้งหมด ในส่วนของเดสก์ทอปก็คงต้องรอกันไปก่อน


      Barcelona ในความเร็ว 1.9GHz Socket-1207

      Barcelona ในความเร็ว 2.0GHz

      ตัว Engineer Sample จาก AMD ในความเร็วระดับ 2.5GHz ซึ่งยังคงไม่พร้อมจะวางตลาดเหมือนกับสองตัวแรก



      รายละเอียดของ Barcelona ผ่าน CPU-Z มาพร้อม L3Cache ขนาด 2MB

      ภาพของระบบที่ใช้ในการทดสอบ Opteron Server 2CPUs // 8GB ECC DDR2-667

      ผลคะแนนการทดสอบต่างๆ เมื่อเทียบกับ Athlon64 X2 ในระดับ Clock Speed ที่เท่าๆกัน 2GHz

      ผลเปรียบเทียบระหว่าง Barcelona ด้วยกันที่ความเร็ว 2.0GHz และ 2.5GHz

      ผลสรุปอันนี้ก็คงได้ผลเปรียบเทียบคร่าวๆระหว่างสถาปัตยกรรม K8 และ K10 ได้พอสมควร แต่เรายังต้องดูรุ่นที่จะเปิดในตลาดเดสก์ทอปอีกครั้ง เพราะอุปกรณ์ในการทดสอบครั้งนี้ ยังเป็นชิปเซต Server และการใช้แรมประเภท ECC ที่อาจจะมีผลต่อประสิทธิภาพเมื่อเทียบกับเดสก์ทอปของ K8 แต่เมื่อดูจากคะแนนที่ออกมา ดูเหมือนครั้งนี้ K10 จะต่อกรกับทาง Intel ได้ค่อนข้างยาก เมื่อเทียบกับประสิทธิภาพ ที่ไม่ได้โด่ดเด่น หวือหวาเมื่อเทียบกับตอน Intel เปิดตัว Conroe ซึ่งเราก็ต้องไปดูในส่วนของราคาเปิดตัวและตลาดเดสก์ทอปอีกครั้ง อาจจะมีการเปลี่ยนแปลงมากกว่านี้

      Comment


      • #4
        ตายละ ดีกว่าK8อิ๊บเดียวเอง

        Comment


        • #5
          ทำใจๆๆ ทำใจก็แล้วกันทำใจ ทำใจ

          ขอบคุณมากครับที่ไห้ข้อมูลที่มีประโยชน์

          Comment


          • #6
            อิ๊บเดียวก็ดีก่าไม่ได้อิ๊บนะงับท่าน

            Comment


            • #7
              Originally posted by ผู้จัดการหญ่ายย.. View Post
              อิ๊บเดียวก็ดีก่าไม่ได้อิ๊บนะงับท่าน
              -*-

              Comment


              • #8
                ใจครับผม

                Comment


                • #9
                  เพิ่มเติมอีกหน่อยครับ เนตใครแรงๆ ลองดูก็ได้ครับ

                  คลิกดู Next Generation VGA ของ AMD

                  Comment


                  • #10
                    น้องสาวโผ๊มมมมม น้องสาวโผ๊มมมม K10เป็นน้องสาวโผ๊มมมม อิอิ แอบเนียน

                    Comment


                    • #11
                      Originally posted by K8 View Post
                      น้องสาวโผ๊มมมมม น้องสาวโผ๊มมมม K10เป็นน้องสาวโผ๊มมมม อิอิ แอบเนียน
                      ไม่เอาอย่าแอบเนียนไม่ดีพี่ อิอิ

                      Comment


                      • #12
                        chipset ยัง ไม่สมบูรณ์ เลย -*- ถ้า ทำดีแล้ว มันคง จะ 2 - 3 อึ๊บ หล่ะมั้ง

                        Comment

                        Working...
                        X