MPEG-2: โปรแกรมการศึกษา: วิดีโอ

การแปลงสัญญาณอนาล็อกเป็นดิจิตอล

ประเภทของการทำนายภาพชดเชยในเฟรม

การแปลงโคไซน์ไม่ต่อเนื่อง

MPEG-2 เป็นมาตรฐานสำหรับการเข้ารหัสสัญญาณโทรทัศน์ออกอากาศดังนั้นคุณต้องเริ่มต้นเรื่องราวเกี่ยวกับมันด้วยประวัติของวิดีโอดิจิทัล น่าแปลกที่มันไม่ได้เชื่อมต่อกับคอมพิวเตอร์อย่างที่ดูเหมือนตอนนี้ แต่มีการออกอากาศทางโทรทัศน์เพราะข้อบกพร่องของสัญญาณอะนาล็อกส่งผลกระทบต่อผู้ชมโทรทัศน์เป็นหลัก มีสองปัญหาหลัก - นี่คือคุณภาพที่ลดลงอย่างรวดเร็วกับการทำสำเนาใหม่แต่ละครั้ง (มันน่ากลัวที่จะจำสิ่งที่ "สำเนาที่ห้า" ใน VHS) และเสียงรบกวนขนาดใหญ่ในการส่งสัญญาณซึ่งเป็นเรื่องยากมากที่จะจัดการ ครั้งแรกที่มีผลต่อคุณภาพของโปรแกรมที่สองมีผลต่อคุณภาพของภาพของผู้ชม วิธีการกำจัดข้อบกพร่องเหล่านี้เป็นที่รู้จักกันมาตั้งแต่ยุค 50 - นี่คือการแปลงสัญญาณเป็นรูปแบบดิจิตอล อย่างไรก็ตามความสามารถทางเทคนิคสำหรับการแปลงวิดีโอแบบเรียลไทม์ปรากฏขึ้นเพียงประมาณหนึ่งในสี่ของศตวรรษที่แล้วและในปี 1979 สหภาพยุโรป Broadcasting Union (EBU) และสมาคมวิศวกรภาพยนตร์และโทรทัศน์ (SMPTE) ได้เตรียมร่างมาตรฐานสากลสำหรับการเข้ารหัสสัญญาณดิจิตอลโทรทัศน์สี ปีที่มีการรับรองมาตรฐาน MPEG-2 นั้นยึดตามมาตรฐาน ITU-R BT.601 อย่างแม่นยำ

วิธีรับสัญญาณวิดีโอดิจิตอล

เป็นที่ทราบกันว่าหนึ่งในล้านเฉดสีใด ๆ ที่บุคคลสามารถจำแนกได้คือการรวมกันของสามสีอ้างอิง: สีแดง (สีแดง), สีเขียว (สีเขียว) และสีฟ้า (สีน้ำเงิน) - นี่คือรูปแบบสี RGB ที่เรียกว่า เมื่อใช้รุ่นนี้สัญญาณอะนาล็อกสี (ตัวอย่างเช่นภาพที่“ เห็น” เลนส์ของกล้องวิดีโอแอนะล็อก) สามารถแยกย่อยเป็นส่วนประกอบ RGB

อย่างไรก็ตามการแยกย่อยดังกล่าวไม่เหมาะสำหรับโทรทัศน์: เมื่อเปลี่ยนเป็นการกระจายสัญญาณสีจำเป็นต้องมีการรับส่งสัญญาณสีที่สามารถรับชมบนทีวีขาวดำและสิ่งนี้เป็นไปไม่ได้หากสัญญาณประกอบด้วยส่วนประกอบ RGB วิธีแก้ไขคือการแปลงสัญญาณ RGB เป็นสัญญาณความสว่าง Y และสัญญาณต่างสีสองแบบ U และ V - ในกรณีนี้ข้อมูลสี (U และ V) จะถูกส่งแยกต่างหากจากข้อมูลความสว่าง Y และสัญญาณความสว่างเท่านั้นที่ใช้ในโทรทัศน์ขาวดำและสี - ความสว่างพร้อมกับสี ในเวลาเดียวกันมันเป็นไปได้ที่จะปรับสัญญาณโทรทัศน์สีให้เป็นแบนด์วิดท์มาตรฐาน: เนื่องจากความจริงที่ว่าสายตามนุษย์ไวต่อการเปลี่ยนแปลงสีเชิงพื้นที่น้อยกว่าการเปลี่ยนแปลงความสว่างทำให้ข้อมูลสีสามารถ "ตัด" ได้โดยไม่กระทบต่อการรับรู้

สำหรับการเข้ารหัสดิจิทัลการย่อยสลายทั้งสองมีความเหมาะสมเท่ากัน

ดังนั้นเพื่อสร้างสัญญาณดิจิตอลมีความจำเป็นต้องดำเนินการดังต่อไปนี้ในแต่ละองค์ประกอบของสัญญาณอะนาล็อก (R, G, B หรือ Y, U, V): การสุ่มตัวอย่างการหาปริมาณและการเข้ารหัส

Discretization เป็นตัวแทนของสัญญาณอะนาล็อกต่อเนื่องโดยลำดับของค่าแอมพลิจูดของมัน (ตัวอย่างที่เรียกว่า) ความถี่ที่เลือกค่าเรียกว่าอัตราการสุ่มตัวอย่าง ไดอะแกรมทางด้านขวาแสดงสัญญาณอะนาล็อกและ 1 / T- ตัวอย่างสัญญาณ เห็นได้ชัดว่ายิ่งอัตราการสุ่มตัวอย่างสูงขึ้นจะทำให้สัญญาณอะนาล็อกมีความแม่นยำยิ่งขึ้น เพื่อให้ได้ภาพที่มีคุณภาพสูงความถี่ในการสุ่มตัวอย่างต้องมีอย่างน้อย 12 MHz (เช่น 12 ล้านตัวอย่างต่อวินาที) ในมาตรฐานการเข้ารหัสแบบดิจิตอลนั้นจะถูกเลือกเท่ากับ 13.5 MHz

Quantization - การปัดเศษของค่าตัวอย่าง เนื่องจากตามนุษย์มีความละเอียด จำกัด จึงไม่จำเป็นต้องส่งค่าการอ่านค่าทั้งหมดอย่างแน่นอน มันคิดว่าจะแทนที่ค่าอ้างอิงด้วยค่าที่ใกล้ที่สุดจากค่าคงที่บางชุดซึ่งเรียกว่าระดับควอนติชันนั่นคือปัดเศษเป็นระดับที่ใกล้ที่สุด แผนภาพทางด้านขวาแสดงสัญญาณเชิงปริมาณ ในการสร้างสัญญาณที่มีคุณภาพที่ต้องการระดับการควอนตัม 256 ก็เพียงพอแล้ว

และสุดท้ายการเข้ารหัส เนื่องจากสัญญาณเชิงปริมาณสามารถใช้ค่าจำนวน จำกัด เท่านั้น (ตามชุดของระดับการทำให้เป็นควอนตัม) สำหรับแต่ละตัวอย่างมันสามารถแสดงได้อย่างง่ายดายโดยจำนวนเท่ากับจำนวนเลขลำดับของระดับควอนตัมเอง หมายเลขนี้สามารถเข้ารหัสด้วยอักขระไบนารี่ (ตัวอย่างเช่นเลขศูนย์และเลขที่) ในการเข้ารหัสระดับควอนตัม 256 จำเป็นต้องมีอย่างน้อยแปดบิต (28 = 256) นั่นคือค่าของแต่ละตัวอย่างจะถูกส่งเป็นแปดบิต

เป็นผลให้หลังจากการสุ่มตัวอย่างการหาปริมาณและการเข้ารหัสเราได้รับจากสัญญาณอะนาล็อกชุดของพัลส์ที่มีเพียงสองค่าคือ 0 และ 1 ซึ่งสามารถส่งเป็นข้อมูลธรรมดาได้ สิ่งนี้เรียกว่าการแปลงแอนะล็อกเป็นดิจิทัลหรือ ADC

มันง่ายในการคำนวณอัตราการไหลที่จำเป็นเมื่อส่งสัญญาณดิจิทัล: เราคูณแปดบิตด้วยจำนวนตัวอย่างที่ส่งต่อวินาที (เราจะไม่ลืมว่าเรามีสามองค์ประกอบ): 8 [bits] x 13.5 [MHz] x 3 = 324 Mb / s !!! การทำงานกับสตรีมดังกล่าวมีราคาแพงมากและแทบจะไม่สามารถเข้าถึงได้ (สำหรับการเปรียบเทียบ: โมเด็มมาตรฐานส่งสัญญาณด้วยความเร็วเฉลี่ย 33.2 kb / s นั่นคือช้ากว่าหมื่นครั้ง)

นี่เป็นเวลาที่ต้องระลึกไว้ว่าในโทรทัศน์แบบแอนะล็อกเมื่อทำการแปลงเป็นดิจิตอล Y, U และ V เป็นไปได้ที่จะลบข้อมูลสีบางส่วนอย่างไม่เจ็บปวดนั่นคือลดอัตราการสุ่มสัญญาณสัญญาณแตกต่างของสีหลาย ๆ ครั้ง ดังนั้นการเข้ารหัส YUV (เรียกว่าแยก) ในแง่ของขนาดสตรีมจะได้เปรียบกว่า RGB ด้วยการเข้ารหัสที่แยกต่างหากมันเป็นธรรมเนียมในการระบุอัตราส่วนของความถี่การสุ่มตัวอย่างของส่วนประกอบ ตัวอย่างเช่น 4: 2: 2 หมายความว่า Y ถูกส่งในแต่ละตัวอย่างในแต่ละแถวและ U และ V ในทุก ๆ วินาทีตัวอย่างในแต่ละแถว (เช่นอัตราการสุ่มตัวอย่างของ Y คือ 13.5 MHz และ U และ V เป็นสองเท่า น้อยกว่า - 6.75 MHz)

การอัด

อย่างไรก็ตามผลการเข้ารหัสที่เกี่ยวกับขนาดสตรีมแบบดิจิทัลยังคงไม่เหมาะกับใคร สำหรับโทรทัศน์ที่ออกอากาศต้องมีการเข้ารหัสแยกต่างหากอย่างน้อย 4: 2: 2 - นี่คือ 216 Mb / s แม้ว่าเราจะไม่ได้พูดคุยเกี่ยวกับการถ่ายโอนข้อมูลเพียงแค่เขียนกระแสข้อมูลดังกล่าวไปยังเทปหรือฮาร์ดไดรฟ์ดูเหมือนว่าจะมีปัญหา

มีทางเดียวเท่านั้นคือการบีบอัดสตรีมวิดีโอดิจิทัล โชคดีที่สัญญาณวิดีโอดิจิตอลมีความซ้ำซ้อนจึงเหมาะสำหรับการบีบอัดและทำได้: คุณสามารถบีบอัดวิดีโอได้โดยไม่สูญเสียการรับรู้ถึง 30 เท่า! ความซ้ำซ้อนของสัญญาณวิดีโอประการแรกเกิดจากความจริงที่ว่าสายตามนุษย์ไม่ได้สังเกตเห็นการเปลี่ยนแปลงของความสว่างและสีในพื้นที่เล็ก ๆ นั่นคือในรายละเอียดเล็ก ๆ ความซ้ำซ้อนนี้เรียกว่าอวกาศและถูกลบออกระหว่างการเข้ารหัสภายใน - การลดข้อมูลภายในกรอบเดียว

ประการที่สองปกติภายในไม่กี่วินาทีเฟรมต่อเนื่องจะแตกต่างกันเล็กน้อยซึ่งเป็นความซ้ำซ้อนชั่วคราวที่เรียกว่า ไม่จำเป็นต้องโอนเฟรมทั้งหมดให้สมบูรณ์เพราะบางเฟรมก็เพียงพอที่จะถ่ายโอนความแตกต่างจากเฟรมก่อนหน้าหรือเฟรมถัดไปเท่านั้น ความซ้ำซ้อนชั่วคราวจะถูกลบออกโดยการเข้ารหัสระหว่างเฟรมซึ่งจะช่วยลดข้อมูลเกี่ยวกับกลุ่มเฟรมโดยรวม

ฉันต้องบอกว่าตั้งแต่เริ่มทำงานกับวิดีโอดิจิตอลรูปแบบการบีบอัดที่ยอดเยี่ยมมากมายได้ถูกสร้างขึ้น: จาก Cinepak และ Intel Indeo ถึง H.263, MJPEG และ DV บางส่วนเท่านั้นลบความซ้ำซ้อนเชิงพื้นที่ (เช่น DV หรือ MJPEG) แต่อัลกอริทึมบางอย่าง (ตัวอย่างเช่น Intel Indeo) ก็ใช้ความแตกต่างระหว่างเฟรม

ชีวิตที่มีมาตรฐานจำนวนมากที่ไม่สามารถใช้งานร่วมกันได้นั้นซับซ้อนเกินไปดังนั้นในปี 2531 กลุ่มผู้เชี่ยวชาญได้ถูกสร้างขึ้น - กลุ่มผู้เชี่ยวชาญด้านภาพเคลื่อนไหว (MPEG) ซึ่งควรจะพัฒนาวิธีการบีบอัดและกู้คืนสัญญาณวิดีโอดิจิตอล กลุ่มเริ่มทำงานกับมาตรฐาน MPEG2 ในปี 1990 มาตรฐานนี้มีจุดประสงค์เฉพาะสำหรับโทรทัศน์ระบบดิจิทัลนั่นคือสำหรับการส่งภาพโทรทัศน์คุณภาพสูงและได้รับการรับรองในปี 1994 ปัจจุบันนี้เป็นมาตรฐานทั่วไปและใช้งานได้หลากหลายของมาตรฐาน MPEG ทั้งหมด

วิธีบีบอัดใน MPEG-2

ก่อนอื่นในแต่ละเฟรมองค์ประกอบภาพที่มีขนาด 16 x 16 พิกเซลจะถูกเลือกตามลำดับซึ่งเป็น macroblock ที่เรียกว่า

MPEG ยอมรับการเข้ารหัส YUV ดังนั้น macroblock แต่ละรายการจะแสดงเป็นกลุ่มชุดของบล็อกขนาด 8 x 8 พิกเซลซึ่งแต่ละบล็อกจะมีข้อมูลเกี่ยวกับความสว่างหรือสี ตัวอย่างเช่นในรูปแบบสี 4: 2: 2 สี่บล็อก 8 x 8 ที่มีข้อมูลเกี่ยวกับความสว่างและสองบล็อกขนาด 8 x 8 ที่มีข้อมูลเกี่ยวกับองค์ประกอบความแตกต่างของสีแต่ละอันจะต้องมีทั้งหมดแปดบล็อก แต่ละองค์ประกอบในบล็อกของความสว่างหรือสีแสดงถึงค่าอ้างอิง ในอนาคต MPEG-2 ทำงานร่วมกับ macroblock ได้แล้ว

MPEG-2 มีเฟรมสามประเภท I-frames (Intra) - เฟรมอ้างอิงที่ macroblock แต่ละตัวถูกเข้ารหัสโดยไม่มีการอ้างอิงถึง macroblocks ในเฟรมก่อนหน้าหรือเฟรมถัดไป โดยพื้นฐานแล้วเฟรม I ถูกเข้ารหัสเป็นภาพนิ่ง

P frames (Predicted) - เฟรมที่ macroblocks ถูกเข้ารหัสเทียบกับ I หรือ P-frames ก่อนหน้า (แม้ว่า macroblocks ทั้งหมดจะไม่สามารถเข้ารหัสด้วยวิธีนี้ได้มากกว่าด้านล่าง) ภาพในเฟรมถูกคาดการณ์โดยใช้ข้อมูลของเฟรมก่อนหน้า - การทำนายที่เรียกว่า "ไปข้างหน้า" ดังนั้นเฟรม P มีการอ้างอิงถึง macroblocks ในเฟรมก่อนหน้าบางส่วนเท่านั้นดังนั้นเฟรมเหล่านี้จึงถูกบีบอัดยิ่งกว่า I-frames

B-frames (คาดคะเนทิศทางสองทิศทาง) - เฟรมที่ macroblocks จะถูกเข้ารหัสสัมพันธ์กับทั้งก่อนหน้าหรือถัดไปหรือทั้งสองอย่างและเฟรม I และ P-frames การคาดคะเนแบบสองทิศทาง (“ ไปข้างหน้า” และ“ ย้อนกลับ”) ถูกนำมาใช้ที่นี่: รูปภาพในเฟรมถูกคาดการณ์โดยใช้ข้อมูลจากเฟรมก่อนหน้าและเฟรมถัดไป นั่นคือการอ่านเฟรมโดยตัวถอดรหัสควรเกิดขึ้นเร็วกว่าการกู้คืน

หากปรากฎว่า macroblock ใน P-frame หรือ B-frame ไม่สามารถเข้ารหัสโดยอ้างอิงกับเฟรมอื่น (ตัวอย่างเช่นหากวัตถุใหม่ปรากฏขึ้นในเฟรม) จากนั้น macroblock จะถูกเข้ารหัสเป็น macroblock ใน I-frame

เฟรมจะรวมกันเป็นลำดับ (Group Of Pictures, GOP) และการคาดคะเนจะดำเนินการเฉพาะภายในกลุ่มเดียวกันเท่านั้น เป็นที่ชัดเจนว่าภายใต้เงื่อนไขนี้แต่ละกลุ่มควรเริ่มต้นด้วย I-frame ที่มีข้อมูลที่สมบูรณ์ที่สุดเกี่ยวกับภาพเพราะ I-frame เป็นจุดอ้างอิงที่เกี่ยวข้องกับการเข้ารหัสเฟรมที่เหลือ มันจะดีถ้า I-frames อยู่ที่จุดเริ่มต้นของพล็อตเสมอ แต่น่าเสียดายที่แผนการทั้งหมดมีระยะเวลาที่แตกต่างกัน

MPEG-2 กำหนดประเภทลำดับมาตรฐาน - ตัวอย่างเช่น IPBBPBBPBBPBBPBB หากพล็อตเกือบจะไม่เปลี่ยนจากเฟรมเป็นเฟรมคุณสามารถเข้ารหัสด้วยเฟรม B จำนวนมากและหากจำเป็นต้องใช้คุณภาพสูงมากในทางกลับกันให้ใช้กลุ่มที่ประกอบด้วย I-frame เพียงเฟรมเดียว โดยหลักการแล้วมันเป็นไปได้ที่จะปรับการเลือกประเภทของเฟรมให้เหมาะสมตัวอย่างเช่นเมื่อเกิดข้อผิดพลาดในการทำนายขนาดใหญ่ปรากฏใน B-frames ให้เพิ่ม I-frames ในลำดับ

เพียงแค่พูดคำว่า "การทำนาย" ค่อนข้างสับสน - นี่เป็นคำศัพท์แม้ว่าจะเป็นที่ยอมรับ แต่ไม่เป็นความจริง เราไม่ได้คาดเดาอะไรเราตัดสินได้อย่างแม่นยำว่าควรอยู่ในกรอบใด เมื่อต้องการทำเช่นนี้จะมีการคำนวณข้อผิดพลาดการคาดการณ์ - ความแตกต่างระหว่างภาพที่ถ่ายจากเฟรมอื่นและรูปภาพในเฟรมปัจจุบันและความแตกต่างนี้ใช้ในการถอดรหัส

โดยการชดเชยการเคลื่อนไหวหมายถึงการคำนึงถึงการกระจัดของรูปภาพเทียบกับเฟรมก่อนหน้าหรือเฟรมถัดไป การชดเชยการเคลื่อนไหวในเฟรม P และ B นั้นมีการใช้งานดังนี้: สำหรับ macroblock แต่ละอันที่พบในเฟรมก่อนหน้า / ถัดไปจะมีการคำนวณเวกเตอร์แบบเคลื่อนไหวนั่นคือมันจะถูกกำหนดว่าการเคลื่อนที่แบบสัมพัทธ์ของ macroblock ที่เกี่ยวข้องคืออะไร ดังนั้นในการทำนายการชดเชยการเคลื่อนที่ไม่เพียง แต่การทำนายข้อผิดพลาด แต่ยังรวมถึงเวกเตอร์การเคลื่อนไหวด้วยจึงถูกส่งไปยังตัวถอดรหัส

ตอนนี้เรามาถึงการเขียนโค้ด intraframe เราจำเป็นต้องบีบอัดข้อมูลใน macroblock ที่ไม่ได้อ้างถึงอะไร สิ่งนี้ทำโดยใช้การแปลงแบบโคไซน์ไม่ต่อเนื่อง (DCT) ซึ่งขึ้นอยู่กับการแปลงฟูริเยร์ DCT นั้นไม่ได้หมายความว่าเป็นเอกสิทธิ์ของ MPEG แต่ใช้ในการเข้ารหัสในรูปแบบการบีบอัดหลายรูปแบบรวมถึงการบีบอัดภาพนิ่ง (JPEG ที่รู้จักกันดีที่พัฒนาขึ้นสำหรับการถ่ายภาพดิจิตอลโดยกลุ่มผู้เชี่ยวชาญถ่ายภาพร่วม)

ทุกอย่างขึ้นอยู่กับความจริงที่ว่าคน ๆ หนึ่งสามารถแยกรูปร่างของวัตถุได้ดีแม้ในขอบเขตที่คลุมเครือ ดังนั้นหากคุณทำให้รูปทรงมีความคมชัดน้อยลงผู้ดูจะไม่สังเกตเห็นอะไรเลย แต่ปริมาณของข้อมูลที่ส่งจะลดลงอย่างมาก ในสัญญาณดิจิทัลแต่ละองค์ประกอบในบล็อกเป็นค่าตัวอย่างและแต่ละบล็อกจะเป็นเมทริกซ์ของค่าตัวอย่าง การประยุกต์ใช้ DCT กับเมทริกซ์ตัวอย่างทำให้สามารถเลือกข้อมูลเกี่ยวกับการเปลี่ยนแปลงอย่างกะทันหันและทิ้งมันได้ เล็กน้อยที่ยังคงถูกเข้ารหัสตามอัลกอริธึมการปรับให้เหมาะสมพิเศษซึ่งใช้เทคนิคที่รู้จักในเทคนิคการเข้ารหัส (และโดยเฉพาะอย่างยิ่งมีวิธีแก้ไขข้อผิดพลาดระหว่างการถ่ายโอนข้อมูล)

มันจะน่าสนใจที่จะเรียนรู้ว่าตัวกรองเกือบทั้งหมดในโปรแกรมแก้ไขกราฟิกนั้นขึ้นอยู่กับการทำงานของเมทริกซ์ตัวอย่าง ใช้ตัวกรองการเบลอขอบใน Photoshop - คุณจะเห็น DCT ทำงาน และโดยวิธีการที่คุณสามารถมั่นใจได้ว่าภาพที่แม้จะมีเส้นขอบที่เบลอเล็กน้อยจะถูกบีบอัดด้วย JPEG อย่างมีประสิทธิภาพยิ่งขึ้น

จำเป็นต้องใช้พลังการประมวลผลอย่างมหาศาลในการบีบอัดภาพเคลื่อนไหวดังนั้นบอร์ดและโปรเซสเซอร์ที่มีวัตถุประสงค์พิเศษมักใช้สำหรับการบีบอัดตามเวลาจริงนั่นคือการบีบอัดจะดำเนินการในระดับฮาร์ดแวร์

โปรไฟล์และระดับ

ผู้สร้าง MPEG-2 พยายามที่จะขยายขอบเขตของมาตรฐานให้มากที่สุดและสิ่งนี้ทำได้โดยใช้ระบบโปรไฟล์และระดับ ระดับกำหนดพารามิเตอร์ของสัญญาณดิจิตอล: จำนวนตัวอย่างต่อบรรทัดจำนวนเฟรมต่อวินาทีขนาดสตรีม ฯลฯ พารามิเตอร์การเข้ารหัสถูกตั้งค่าในโปรไฟล์: ประเภทเฟรมรูปแบบสีชุดการดำเนินการบีบอัดข้อมูลที่ใช้นั่นคือคุณภาพการเข้ารหัสที่กำหนด ดังนั้นมาตรฐานจึงเปิดโอกาสให้ผู้ใช้งานเลือกการบีบอัดที่เหมาะสมสำหรับการแก้ปัญหาเฉพาะเช่นวิดีโอโฮมหรือวิดีโอระดับมืออาชีพ

แนวคิดของโปรไฟล์และระดับกลายเป็นสิ่งที่มีประโยชน์มากโดยการเพิ่มระดับมันเป็นไปได้ที่จะขยายมาตรฐานสำหรับการเข้ารหัสสัญญาณโทรทัศน์ความละเอียดสูง (HDTV) แต่เดิม MPEG-3 ได้รับการพัฒนาสำหรับ HDTV ซึ่งถูกลืมได้อย่างปลอดภัยทันทีที่ความสามารถที่เกี่ยวข้องถูกนำมาใช้ใน MPEG-2

รูปแบบวิดีโอ

มาตรฐาน MPEG ไม่ได้กำหนดวิธีการเข้ารหัสโดยตรงทุกที่มันอธิบายเฉพาะสิ่งที่สตรีมข้อมูลที่เป็นผลลัพธ์ควรมีลักษณะเช่นนี้เพราะนี่คือสิ่งที่สำคัญสำหรับตัวถอดรหัส

การเข้ารหัสสามารถทำได้ทั้งฮาร์ดแวร์และซอฟต์แวร์และแต่ละ บริษัท สร้างอัลกอริธึมของตัวเอง (สิ่งสำคัญพื้นฐานเช่นอัลกอริทึมสำหรับการค้นหา macroblocks ที่ถูกเลื่อน) ในเวลาเดียวกันนักพัฒนาเลือกโปรไฟล์ระดับการดำเนินการบีบอัดข้อมูลที่ต้องการและซึ่งเป็นสิ่งสำคัญมากสำหรับการเข้ารหัสฮาร์ดแวร์ฐานที่ใช้อัลกอริทึม (บอร์ดพิเศษตัวประมวลผล ฯลฯ ) ตัวอย่างเช่น Sony ได้สร้างรูปแบบวิดีโอสองรูปแบบที่ใช้ MPEG-2 แล้ว ได้แก่ Betacam SX และ MPEG IMX ทั้งคู่ใช้โปรไฟล์ 422P เดียวกัน แต่มีการตั้งค่าขนาดการไหลของข้อมูลที่แตกต่างกันและใช้ฮาร์ดแวร์ที่แตกต่างกันในการเข้ารหัส

บทความนี้ตีพิมพ์ในวารสาร Popular Mechanics (ฉบับที่ 10, ตุลาคม 2003)

แนะนำ

เคมีเคมีทุกจานสีน้ำเงิน: รีเอเจนต์
2019
10 โรคที่แปลกที่สุด
2019
หัวเว่ย Mate 30 Pro ทดสอบใน AnTuTu
2019