ความตายของ MP3: ประวัติโดยย่อของรูปแบบเสียงที่ชื่นชอบของโลก

ความตายของ MP3: ประวัติโดยย่อของรูปแบบเสียงที่ชื่นชอบของโลก

มูลนิธิสัญชาติเยอรมันซึ่งเป็นเจ้าของสิทธิบัตรเพลงรูปแบบ MP3 ที่ 'เก่า' ได้ประกาศเมื่อเร็ว ๆ นี้ว่าพวกเขาจะปล่อยให้สิทธิบัตรของพวกเขาหมดลง MP3 ทำให้การแชร์ไฟล์เสียงเปิดกว้างตลอดช่วงปี 1990 และต้นปี 2000 การผสมผสานระหว่างการบีบอัดข้อมูล ขนาดไฟล์ และคุณภาพเสียงที่คงไว้ ทำให้มั่นใจได้ว่ารูปแบบเสียงที่มีชื่อเสียงโด่งดังในด้านใดด้านหนึ่งของการโต้แย้งการละเมิดลิขสิทธิ์





พาดหัวข่าวว่า 'MP3 Is Dead' แต่นักฟังเพลงตัวจริงทุกคนรู้ว่าความตายที่แท้จริงนั้นไม่น่าเป็นไปได้อย่างมาก อย่างไรก็ตาม ถึงเวลาต้องดูประวัติของรูปแบบเสียงที่มีชื่อเสียงระดับโลก และสิ่งที่อาจเกิดขึ้นในอนาคตอันใกล้นี้





MP3 ทำงานอย่างไร?

ขึ้นอยู่กับอายุและการทำร้ายหูของคุณ ช่วงความถี่การได้ยินของคุณอยู่ระหว่าง 20 Hz ถึง 20,000 Hz นอกจากนี้ หูของเราไวต่อความถี่เสียงมากที่สุดระหว่าง 2 kHz ถึง 5 kHz การได้ยินของเรายังถูกจำกัดด้วยความสามารถของเราในการกรองและประมวลผลสัญญาณเสียงเมื่อมาถึง





เครดิตภาพ: flatvector ผ่าน Shutterstock

การกำบังความถี่ - กุญแจสำคัญในการบีบอัด MP3 - อาศัยความสามารถของสมองในการแยกแยะระหว่างสัญญาณบางอย่าง



ลองนึกภาพว่าเรามีเสียงสองเสียง มีความถี่ใกล้เคียงกันมาก (เช่น 200 Hz และ 210 Hz) แต่เล่นที่ระดับเสียงต่างกัน เสียงที่เบากว่านั้นสามารถได้ยินได้ด้วยตัวเอง แต่เสียงที่ดังกว่านั้นจะแยกออกได้ก็ต่อเมื่อเล่นพร้อมกันเท่านั้น กระบวนการครอบคลุมความถี่หนึ่งด้วยความถี่ใกล้เคียงอื่นเรียกว่า 'การกำบัง' การกำบังความถี่ทำงานอย่างมีประสิทธิภาพที่ด้านบนและด้านล่างของสเปกตรัมเสียง

ริปซีดี

สมมติว่าเรากำลังริพซีดีลงในคอมพิวเตอร์ของคุณ สุ่มเพลงในซีดี 44,100 ครั้งต่อวินาที (44.1 kHz) ตัวอย่างมีความยาว 2 ไบต์ (1 ไบต์คือ 16 บิต) MP3 รองรับหลายอัตรา แต่โดยทั่วไปจะใช้มาตรฐานซีดี 44.1 kHz





หาลูกสุนัขขายได้ที่ไหน

ไฟล์ MP3 แต่ละไฟล์ประกอบด้วยเฟรม MP3 ซึ่งมีส่วนหัวและบล็อกข้อมูล แต่ละเฟรมมี 1,152 ตัวอย่าง ในทางเทคนิคแล้ว มันคือ 'แกรนูล' สองตัวอย่างจาก 576 ตัวอย่าง ตัวอย่างจะดำเนินการผ่านตัวกรองที่แบ่งเสียงออกเป็นชุดเฉพาะของช่วงความถี่ 32 ช่วง จากนั้นอัลกอริธึม MP3 จะแบ่งคลื่นความถี่ 32 แถบนั้นออกด้วย 18 ปัจจัย ทำให้เกิดแถบความถี่ที่เล็กกว่าอีก 576 แถบ แต่ละย่านความถี่มีช่วงความถี่ 1/576 ของตัวอย่างต้นฉบับ (เมื่อเราเริ่มริปซีดีไปยังคอมพิวเตอร์ของคุณ)

เครดิตรูปภาพ: Kim Meyrick ผ่านวิกิมีเดีย





ในขั้นตอนนี้ อัลกอริธึมทางคณิตศาสตร์ที่ซับซ้อนสองขั้นตอนทำงาน: the ดัดแปลงการแปลงโคไซน์แบบไม่ต่อเนื่อง (MDCT) และการแปลงฟูเรียร์แบบเร็ว (FFT) แต่ละรายการดำเนินการตามกระบวนการที่แตกต่างกันในแหล่งข้อมูลที่แยกย่อย

FFT จะวิเคราะห์คลื่นความถี่แต่ละแถบเพื่อหาเสียงที่สามารถปิดบังได้ง่าย ตรวจสอบให้แน่ใจว่าการปิดบังความถี่จะคงเสียงที่สำคัญไว้ในแทร็ก

จากนั้นจึงคัดแยกตัวอย่างและส่งต่อไปยัง MDCT MDCT เปลี่ยนแต่ละแถบให้เป็นชุดของค่าสเปกตรัม ค่าสเปกตรัมแสดงถึงวิธีที่การได้ยินของเราตีความเสียงได้แม่นยำยิ่งขึ้น ดังนั้น ตัวเข้ารหัสเสียงที่ถูกบีบอัดจำนวนมากจึงใช้ค่าสเปกตรัมเพื่อลบข้อมูลเสียง เมื่อข้อมูลสเปกตรัมและการวิเคราะห์แกรนูลเสร็จสมบูรณ์ กระบวนการบีบอัดจริงจะเริ่มต้นขึ้น

ประวัติโดยย่อของ MP3

คุณจำเครื่องเล่น MP3 เครื่องแรกของคุณได้หรือไม่? ฉันโชคดีที่มีไอพอดดั้งเดิม จนกระทั่งชายถือมีดได้ปลดปล่อยมันจากการครอบครองของฉัน มินิดิสก์ เป็นวิธีที่เย็นกว่าอยู่ดี

ไม่ว่า iPod ดั้งเดิมจะเพิ่มความต้องการ MP3 อย่างรวดเร็ว (ในปี 2544) รูปแบบนี้ก็มีอายุแปดขวบแล้ว นอกจากนี้ MP3 ยังสร้างกระแสบนอินเทอร์เน็ตและอุปกรณ์เพลงดิจิตอลแบบพกพาอื่นๆ อีกด้วย

MP3 มาจากไหน?

MP3 เป็น NS หมดสิ้น NS ภาพ และ xperts NS การออกแบบ roup (MPEG) ซึ่งเป็นส่วนหนึ่งของมาตรฐานการบีบอัดเสียงและวิดีโอ MPEG-1 ดั้งเดิม MP3 เป็นตัวย่อของ MPEG-1 Audio Layer III ซึ่งได้รับการอนุมัติให้ใช้ในปี 1991 และเผยแพร่ในที่สุดในปี 1993

แนวคิดเบื้องหลัง MP3 นั้นค่อนข้างเจ๋ง

อัลกอริธึม MP3 ใช้ประโยชน์จากข้อจำกัดด้านการรับรู้ของการได้ยินของมนุษย์ ซึ่งเรียกว่าการปิดบังการได้ยิน การปิดบังการได้ยินเกิดขึ้นเมื่อการรับรู้เสียงหนึ่งได้รับผลกระทบจากการปรากฏตัวของอีกเสียงหนึ่ง นอกจากนี้ ทุกเพลงยังมีองค์ประกอบเสียงที่ไม่สามารถสัมผัสได้ถึงประสบการณ์การฟังโดยรวม Manfred R. Schroeder ได้เสนอตัวแปลงสัญญาณมาสก์สำหรับจิตอะคูสติกครั้งแรกในปี 1979 อย่างไรก็ตาม จนกระทั่งถึงการก่อตั้ง MPEG (ในฐานะคณะอนุกรรมการของ ISO/IEC) ในปี 1988 จึงมีความคิดริเริ่มร่วมกันสำหรับมาตรฐานระดับโลก

มีชื่อสำคัญอีกชื่อหนึ่งในประวัติศาสตร์ของ MP3: Karlheinz Brandenburg บรันเดนบูร์กเริ่มทำงานเกี่ยวกับการบีบอัดเพลงดิจิทัลในช่วงทศวรรษ 1980 โดยทำวิทยานิพนธ์ระดับปริญญาเอกสำเร็จในปี 1989 โหมดการบีบอัดต่างๆ ที่เขาเคยทำมา พบข้อจำกัดทั้งในด้านเทคโนโลยีที่มีอยู่ในขณะนั้น ตลอดจนการออกแบบกระบวนการเข้ารหัสในช่วงต้น เขาร่วมกับสมาชิกผู้ก่อตั้ง MPEG รายอื่นๆ ตระหนักว่ามีเพียงระบบใหม่เท่านั้นที่เพียงพอ

สถาบัน Fraunhofer

ในปี 1990 บรันเดนบูร์กเป็นผู้ช่วยศาสตราจารย์ที่มหาวิทยาลัยเออร์ลังเงิน-นูเรมเบิร์ก เขายังคงทำงานเกี่ยวกับการบีบอัดกับ Fraunhofer Society (ในที่สุดเขาก็จะเข้าร่วม Fraunhofer 1993)

'เรามีกลุ่มย่อยเสียงภายในกลุ่มภาพเคลื่อนไหว [MPEG]' Brandenburg อธิบายใน an สัมภาษณ์เอ็นพีอาร์ . 'ในท้ายที่สุด เราทุกคนต่างก็มีงานประนีประนอมซึ่งมีโหมดที่แตกต่างกัน เรียกว่า Layer I, Layer II, Layer III . . และแนวคิดส่วนใหญ่ของเราก็เข้าสู่โหมดการบีบอัดในไฟล์เสียง MPEG . . ซึ่งซับซ้อนที่สุดและให้คุณภาพดีที่สุดที่บิตเรตต่ำ ซึ่งเรียกว่า Layer III'

Brandenburg ใช้เพลง 'Tom's Diner' ของ Suzanne Vega เพื่อปรับแต่งอัลกอริธึมการบีบอัด ฟังซ้ำแล้วซ้ำอีก เพื่อให้แน่ใจว่าการซ่อมแซมของเขาจะไม่ส่งผลเสียต่อการบันทึกเสียงของ Vega

MP3 ระเบิด

MP3 อยู่ในภาวะซบเซาเป็นเวลาสองปีหลังจากการเปิดตัวอย่างเป็นทางการ ตัวแปลงสัญญาณถือว่า 'ซับซ้อนเกินไป' สำหรับการใช้งานอย่างแพร่หลาย

อย่างไรก็ตาม ในปี 1997 สิ่งต่างๆ เปลี่ยนไปอย่างรวดเร็ว

อย่างแรก 'นักเรียนชาวออสเตรเลีย' ซื้อซอฟต์แวร์เข้ารหัสระดับมืออาชีพ l3enc จากบริษัทเยอรมัน เขากลับด้านวิศวกรรมซอฟต์แวร์ คอมไพล์ใหม่ และอัปโหลดไปยัง FTP ของมหาวิทยาลัยในสหรัฐอเมริกาด้วย a README ไฟล์บอกว่า 'นี่เป็นฟรีแวร์ขอบคุณ Fraunhofer' การกระทำเล็กๆ น้อยๆ นี้เปลี่ยนการเข้าถึงการเข้ารหัสและถอดรหัส MP3 ทันที ทันใดนั้น การใส่ซีดีลงในคอมพิวเตอร์ของคุณทำให้เกิดเสียงคุณภาพสูงในขนาดไฟล์ที่เล็ก

ประการที่สอง Nullsoft ได้เปิดตัวเครื่องเล่นเสียง Winamp ที่เคารพนับถือ สามารถเล่น MP3 ที่ริพจากซีดีบนคอมพิวเตอร์ได้อย่างง่ายดาย

ในเวลาเดียวกัน อินเทอร์เน็ตได้แพร่กระจายไปยังบ้านหลายล้านหลังทั่วโลก HDD หลายล้านตัวเต็มไปด้วย MP3 และรูปแบบดังกล่าวก็กลายเป็นรูปแบบการแชร์ไฟล์เสียงที่ต้องการสำหรับบริการแชร์ไฟล์แบบเพียร์ทูเพียร์ในยุคแรกๆ เช่น Napster, Gnutella และ eDonkey (Gnutella เป็นโครงการ Nullsoft อีกโครงการหนึ่ง) การละเมิดลิขสิทธิ์ทางดนตรียังคงมีชีวิตและอาละวาด และไม่มีส่วนน้อยที่ได้รับความช่วยเหลือจาก MP3 ที่เพิ่มขึ้น

เครื่องเล่น MP3

เป็นประโยชน์ต่ออุตสาหกรรมเสียงที่เป็นที่ยอมรับ เครื่องเล่น MP3 แบบพกพาได้ปรากฏตัวขึ้น ในช่วงต้นทศวรรษ 1990 สถาบัน Fraunhofer ได้พยายามและล้มเหลวในการสร้างเครื่องเล่น MP3 ที่วางตลาดได้ มันเร็วเกินไปสำหรับการยอมรับอย่างกว้างขวาง จำเป็นต้องมีการผสมผสานระหว่างไฟล์ร่วมกัน การเพิ่มจำนวนอินเทอร์เน็ต และซอฟต์แวร์ริปเพื่อให้เครื่องเล่น MP3 แบบพกพามีโมเมนตัม

บริษัท Elger Labs ของเกาหลีใต้เปิดตัว MPMAN F10 มูลค่า 250 ดอลลาร์ พร้อมด้วยหน่วยความจำขนาด 32 MB มันไม่ได้จุดประกายให้อุตสาหกรรมอย่างที่เรารู้ รางวัลนั้นตกอยู่กับ Diamond Rio PMP300 ซึ่งมีขนาด 32 MB ด้วย

ความสำเร็จของ Diamond Rio ดึงดูดความสนใจที่ไม่ต้องการ สมาคมอุตสาหกรรมแผ่นเสียงแห่งอเมริกา (RIAA) ฟ้อง Diamond Multimedia Systems (ผู้ผลิต) และแพ้ อย่างไรก็ตาม RIAA สันนิษฐานอย่างถูกต้องว่านี่คือจุดเริ่มต้นของการละเมิดลิขสิทธิ์ดนตรีประจำถิ่น ที่ยังคงดำเนินต่อไปจนถึงทุกวันนี้

เกิดอะไรขึ้นต่อไปคุณถาม?

อุปกรณ์ที่รู้จักกันน้อยเรียกว่า iPod ออกสู่ตลาดโดยทำให้ MP3 ถูกต้องตามกฎหมายอย่างสมบูรณ์ว่าเป็นรูปแบบเสียงที่แท้จริงในสมัยนั้น และ RIAA ก็เริ่มรณรงค์ต่อต้านโจรสลัดทั่วโลก (อย่างต่อเนื่อง)

ส่วนที่เหลือตามที่เราพูดคือประวัติศาสตร์

ทำไม MP3 ถึงตายไปแล้ว?

สถาบัน Fraunhofer เป็นเจ้าของสิทธิบัตร MP3 เมื่อวันที่ 23 เมษายน 2017 สิทธิบัตรที่เหลืออยู่หมดอายุลง ดังนั้น Fraunhofer จึงไม่สามารถออกใบอนุญาต MP3 ใหม่ได้อีกต่อไป เราได้อธิบายอย่างชัดเจนแล้วว่าเกิดอะไรขึ้นกับพาดหัวข่าว 'สันทราย' เหล่านี้ รวมถึงผลกระทบที่มีต่อคุณด้วย

ต้องการ TL; DR หรือไม่ MP3 ยังไม่ตายและจะไม่ไปไหน

เหตุผลหลักประการหนึ่งที่ Fraunhofer ยอมปล่อย MP3 คืออายุ มันไม่สามารถแข่งขันกับลูกพี่ลูกน้องของตัวแปลงสัญญาณที่ใหม่กว่าและเงางามกว่าได้อีกต่อไป ข้อเสนอแนะของพวกเขา? ใช้การเข้ารหัสเสียงขั้นสูง (AAC) แทน บังเอิญ Fraunhofer ยังถือครองสิทธิบัตร (ต่อเนื่อง) สำหรับ AAC ดังนั้นเราจึงมีตัวเลือก MP3 สองสามรายการให้คุณเลือกด้านล่าง

ทางเลือก MP3

คอลเลคชัน MP3 ของคุณจะไม่ถูกเผาไหม้กะทันหัน เช่นเดียวกับตัวเข้ารหัสและตัวถอดรหัสที่มีอยู่จะยังคงผลิตไฟล์ MP3 ต่อไป ที่กล่าวว่า MP3 ล้าสมัยไปแล้ว มีหลายอย่าง รูปแบบเสียงทางเลือกฟรี คุณสามารถใช้เพื่อจัดเก็บเพลงดิจิทัลของคุณได้เลย

  • AAC -- Advanced Audio Coding ตามที่กล่าวไว้ข้างต้น เป็นตัวต่อจาก MP3 ปัญหาเดียวคือรูปแบบในตัวเองตอนนี้ดูเก่าไปหน่อย อย่างไรก็ตาม โดยทั่วไปแล้ว AAC จะให้คุณภาพเสียงที่ดีกว่า MP3 โดยมีบิตเรตและขนาดไฟล์ใกล้เคียงกัน AAC เป็นรูปแบบการสูญเสีย
  • Ogg Vorbis -- รูปแบบ Vorbis มักใช้ร่วมกับรูปแบบคอนเทนเนอร์ Ogg เป็นลูกพี่ลูกน้องโอเพ่นซอร์สที่ดีกว่าและอายุน้อยกว่าเล็กน้อยสำหรับ MP3 แม้ว่า Ogg จะมีการบีบอัดที่ดีกว่า อัตราบิตที่สูงกว่า และคุณภาพเสียงโดยทั่วไปที่ดีกว่า แต่ Ogg ก็ไม่เคยเปิดตัวในลักษณะเดียวกับ MP3 เนื่องจากขาดอุปกรณ์ที่รองรับ Ogg ยังเป็นรูปแบบที่สูญเสีย
  • FLAC -- The Free Lossless Audio Codec เป็นรูปแบบตัวแปลงสัญญาณเสียงแบบไม่สูญเสียที่ได้รับความนิยมมากที่สุด ทำไม? FLAC นำเสนอสำเนาเสียงที่ถูกต้องของเนื้อหาต้นฉบับ โดยมีขนาดเพียงครึ่งเดียวของซีดีแบบเดิม เสียงที่ได้รับผลกระทบจาก MP3 มากที่สุด (เช่น กีตาร์ ฉิ่ง รีเวิร์บ ฯลฯ) ยังคงคมชัดแม้จะถูกบีบอัดอย่างมากก็ตาม FLAC เป็นรูปแบบที่ไม่มีการสูญเสีย

MP3 ยังไม่ตาย

คุณไม่มีอะไรต้องกังวล คุณสามารถริปเป็น MP3 ต่อไปได้ และอุปกรณ์ของคุณจะเล่นเพลงของคุณต่อไป ในระยะยาว อย่างน้อยก็ควรค่าแก่การตรวจสอบรูปแบบเสียงใหม่สำหรับคอลเล็กชันของคุณ เทคนิคการบีบอัดจะก้าวหน้า และขนาดไฟล์ของสำเนาที่ถูกต้องจะลดลง

นอกจากนี้ยังควรพิจารณาความจุของการจัดเก็บ เมื่อเครื่องเล่น MP3 แบบพกพาเครื่องแรกมาพร้อมกับพื้นที่เก็บข้อมูล 32 MB มันคือ เย็น แต่เห็นได้ชัดว่าไม่เพียงพอ พื้นที่เก็บข้อมูลที่ใหญ่ที่สุดสำหรับ iPod Classic คือ 160 GB ที่ อาจถูกกระแทกด้วยการอัพเกรดพื้นที่เก็บข้อมูลแบบกำหนดเอง มากถึง 240 GB - มากกว่า 1,000,000 แทร็ก MP3 แต่ละรายการ ประเด็นคือเมื่อขนาดพื้นที่จัดเก็บเพิ่มขึ้นและขนาดจริงลดลง เราสามารถทำสิ่งต่างๆ ได้มากขึ้นโดยใช้น้อยลง

สุดท้าย อินเทอร์เน็ตยังคงเปลี่ยนวิธีการฟังเพลงของเรา ฉันเคยละเมิดลิขสิทธิ์เพลงเพราะฉันไม่สามารถจ่ายเงิน 12-20 เหรียญสำหรับอัลบั้มใหม่ทุกอัลบั้มที่ออกมา ตอนนี้ฉันมีบัญชีแผนครอบครัวของ Spotify ที่สามารถเข้าถึงแทร็กนับล้านและบัญชี Amazon Prime ที่มีอีกนับล้าน สิ่งเดียวที่จำกัดฉันคือการเชื่อมต่ออินเทอร์เน็ต และถึงกระนั้น ทั้งคู่ก็มีตัวเลือกสำหรับการดาวน์โหลดแบบออฟไลน์ในรูปแบบคุณภาพสูง

ไม่สำคัญเท่าเมื่อก่อน แต่ MP3 ยังไม่ตาย

รูปแบบเสียงที่คุณต้องการคืออะไร? คุณต้องการความจริงที่คมชัดของ lossless หรือไม่? หรือการบีบอัดรูปแบบที่สูญเสียมาก? การใช้เพลงของคุณเปลี่ยนไปหรือไม่เนื่องจากบริการสตรีมเริ่มแพร่หลาย? ทิ้งข้อความไว้ในความคิดเห็น แล้วฉันจะติดต่อกลับไป

เครดิตภาพ: Ti Santi ผ่าน Shutterstock.com

แบ่งปัน แบ่งปัน ทวีต อีเมล คู่มือสำหรับผู้เริ่มต้นในการพูดแบบเคลื่อนไหว

การพูดแบบเคลื่อนไหวอาจเป็นเรื่องท้าทาย หากคุณพร้อมที่จะเริ่มเพิ่มบทสนทนาในโครงการของคุณ เราจะแบ่งขั้นตอนให้คุณ

อ่านต่อไป
หัวข้อที่เกี่ยวข้อง
  • เทคโนโลยีอธิบาย
  • ความบันเทิง
  • MP3
  • การบีบอัดไฟล์
  • ตัวแปลงเสียง
เกี่ยวกับผู้เขียน Gavin Phillips(เผยแพร่บทความ 945 ฉบับ)

Gavin เป็นบรรณาธิการรุ่นเยาว์สำหรับ Windows และอธิบายเทคโนโลยี เป็นผู้มีส่วนร่วมประจำใน Podcast ที่มีประโยชน์จริงๆ และเป็นผู้ตรวจสอบผลิตภัณฑ์ประจำ เขามีศิลปศาสตรบัณฑิต (เกียรตินิยม) การเขียนร่วมสมัยพร้อมแนวทางปฏิบัติด้านศิลปะดิจิทัลที่ถูกปล้นจากเนินเขาของ Devon รวมถึงประสบการณ์การเขียนระดับมืออาชีพกว่าทศวรรษ เขาชอบดื่มชา บอร์ดเกม และฟุตบอลเป็นจำนวนมาก

เพิ่มเติมจาก Gavin Phillips

สมัครรับจดหมายข่าวของเรา

เข้าร่วมจดหมายข่าวของเราสำหรับเคล็ดลับทางเทคนิค บทวิจารณ์ eBook ฟรี และดีลพิเศษ!

คลิกที่นี่เพื่อสมัครสมาชิก