MP3の死:世界で人気のあるオーディオフォーマットの簡単な歴史

MP3の死:世界で人気のあるオーディオフォーマットの簡単な歴史

由緒ある「古い」音楽フォーマットMP3の特許を所有するドイツの財団は、最近、特許を失効させると発表しました。 MP3は、1990年代から2000年代初頭にかけて、オーディオファイル共有を広く公開しました。データ圧縮、ファイルサイズ、および保持されたオーディオ品質の組み合わせにより、著作権侵害の議論の両側で悪名高いオーディオ形式のショットが保証されました。





見出しには「MP3は死んでいる」と書かれていますが、本当のオーディオファンなら誰でも本当の死はありそうもないことを知っています。それでも、世界的に有名なオーディオ形式の歴史と、近い将来に何が起こるかを見る時が来ました。





正確にMP3はどのように機能しますか?

耳が受けた年齢と虐待に応じて、聴覚周波数範囲は20 Hz〜20,000Hzになります。さらに、私たちの耳は2 kHz〜5kHzの音の周波数に最も敏感です。私たちの聴覚は、音声信号が到着したときにそれをフィルタリングして処理する能力によっても制限されます。





画像クレジット:Shutterstock経由のflatvector

MP3圧縮の鍵である周波数マスキングは、脳が特定の信号を区別できないことに依存しています。



2つの音があると想像してください。それらは非常に類似した周波数(たとえば、200Hzと210Hz)を持っていますが、異なる音量で再生されます。弱い音はそれ自体で聞こえますが、強い音は同時に再生された場合にのみ区別できます。ある周波数を別の近い周波数でカバーするプロセスは、「マスキング」と呼ばれます。周波数マスキングは、オーディオスペクトルの上部と下部で効率的に機能します。

CDをリッピングする

私たちがあなたのコンピュータにCDをリッピングしていると仮定しましょう。 CDの音楽は、1秒間に44,100回(44.1 kHz)サンプリングされます。サンプルの長さは2バイトです(1バイトは16ビットです)。 MP3はいくつかのレートをサポートしますが、通常はCD標準の44.1kHzを使用します。





オンラインで友達と音楽を聴く

個々のMP3ファイルは、ヘッダーとデータブロックを備えたMP3フレームで構成されています。各フレームには1,152個のサンプルが含まれています。技術的には、576サンプルの2つの「グラニュール」です。サンプルは、サウンドを32の周波数範囲の特定のセットにさらに分割するフィルターを通過します。次に、MP3アルゴリズムは、これらの32の周波数帯域を18の係数でさらに分割し、576のさらに小さい帯域を作成します。各バンドには、元のサンプルの周波数範囲の1/576が含まれています(CDをコンピューターにリッピングし始めたとき)。

画像クレジット: キム・メイリック ウィキメディア経由





この段階で、2つの複雑な数学的アルゴリズムが機能します。 修正離散コサイン変換 (MDCT)および高速フーリエ変換(FFT)。それぞれが、分解されたソースマテリアルに対して異なるプロセスを実行します。

FFTは、簡単にマスキングできるサウンドについて各周波数帯域を分析し、周波数マスキングがトラック内の重要なサウンドを保持していることを確認します。

次に、サンプルがソートされ、MDCTに渡されます。 MDCTは、各バンドを一連のスペクトル値に変換します。スペクトル値は、聴覚が音声を解釈する方法をより正確に表します。したがって、多くの圧縮オーディオエンコーダは、スペクトル値を使用してオーディオデータを削除します。スペクトル情報と顆粒の分析が完了すると、実際の圧縮プロセスが始まります。

MP3の簡単な歴史

初めてのMP3プレーヤーを覚えていますか?私は幸運にもオリジナルのiPodを持っていた-ナイフを持った男が私の所持品からiPodを解放するまで。 ミニディスク とにかく、ずっと涼しかった。

とにかく、オリジナルのiPodがMP3への欲求を急速にエスカレートさせるまでに(2001年)、このフォーマットはすでに8年前のものでした。さらに、MP3はすでにインターネットやその他のポータブルデジタル音楽デバイスで波を起こしていました。

MP3はどこから来たのですか?

MP3は NS オービング NS icture xperts NS オリジナルのMPEG-1オーディオおよびビデオ圧縮規格の一部としてのroup(MPEG)デザイン。 MP3は、MPEG-1 Audio Layer IIIの略で、1991年に使用が承認され、1993年に最終的に公開されました。

MP3の背後にある考え方はかなりクールです。

MP3アルゴリズムは、聴覚マスキングと呼ばれる人間の聴覚の知覚的制限を利用します。聴覚マスキングは、ある音の知覚が別の音の存在によって影響を受ける場合に発生します。さらに、すべての曲には、全体的なリスニング体験では認識できないオーディオ要素が含まれています。 Manfred R. Schroederは、1979年に音響心理学的マスキングコーデックを最初に提案しました。しかし、1988年にMPEG(ISO / IECの小委員会として)が設立されて初めて、グローバルスタンダードの協調イニシアチブが始まりました。

MP3の歴史には、カールハインツブランデンブルクというもう1つの重要な名前があります。ブランデンブルクは1980年代にデジタル音楽の圧縮に取り組み始め、1989年に博士論文を完成させました。 彼が取り組んできたさまざまな圧縮モード 当時利用可能なテクノロジーと初期のエンコードプロセスの設計の両方に制限があることがわかりました。彼は、他の創設者であるMPEGメンバーとともに、新しいシステムだけで十分であることに気づきました。

フラウンホーファー研究所

1990年、ブランデンブルクはアーランゲンニュルンベルク大学の助教授になりました。彼はフラウンホーファー協会で圧縮に関する研究を続けました(彼は最終的にフラウンホーファー1993に参加することになりました)。

「私たちは映画グループ[MPEG]内にオーディオサブグループを持っていました」とブランデンブルクは NPRインタビュー 。 「結局、私たちは皆一緒に、いわゆるレイヤーI、レイヤーII、レイヤーIIIという異なるモードを持つ妥協案を見つけました。 。 。そして、私たちのアイデアのほとんどは、MPEGオーディオの圧縮モードに入りました。 。 。これは最も複雑なものであり、低ビットレートで最高の品質を提供するものでした。これはレイヤーIIIと呼ばれていました。

ブランデンブルクは、スザンヌ・ヴェガの曲「トムズ・ダイナー」を使用して圧縮アルゴリズムを改良し、何度も聴いて、彼のいじくり回しがベガの声の録音に悪影響を与えないようにしました。

MP3が爆発する

MP3は、公式リリース後2年間は低迷していましたが、コーデックは「複雑すぎて」広く使用できないと見なされていました。

しかし、1997年には、状況は急速に変化しました。

まず、「オーストラリアの学生」がプロのエンコーディングソフトウェアを購入しました l3enc ドイツの会社から。彼はソフトウェアをリバースエンジニアリングし、再コンパイルして、米国の大学のFTPにアップロードしました。 README 「これはFraunhoferのおかげでフリーウェアです。」というファイルこの小さな行為は、MP3エンコーディングとデコーディングへのアクセスを即座に変更しました。突然、CDをコンピューターに貼り付けると、小さなファイルサイズで高品質のオーディオがレンダリングされました。

次に、Nullsoftは由緒あるWinampオーディオプレーヤーをリリースしました。 CDからリッピングされたMP3は、コンピューターで簡単に再生できます。

同時に、インターネットは世界中の何百万もの家に広がりました。 何百万ものHDDがMP3でいっぱいになりました 、この形式は、Napster、Gnutella、eDonkeyなどの初期のピアツーピアファイル共有サービスで推奨されるオーディオファイル共有形式になりました(Gnutellaは別のNullsoftプロジェクトでした)。音楽の著作権侵害は生きており、横行しており、MP3の台頭によって少なからず助けられました。

MP3プレーヤー

確立されたオーディオ業界へのさらなる恩恵として、ポータブルMP3プレーヤーが登場しました。 1990年代初頭、フラウンホーファー研究所は市場性のあるMP3プレーヤーの作成を試みましたが失敗しました。広く採用するには時期尚早でした。ポータブルMP3プレーヤーに勢いを与えるには、前述のファイル共有、インターネットの普及、リッピングソフトウェアの組み合わせが必要でした。

韓国の会社ElgerLabsは、なんと32MBのメモリを備えた250ドルのMPMANF10を発表しました。私たちが知っているように、それは業界にとって驚異的な火花ではありませんでした。その称賛は、同じく32MBを搭載したDiamondRioPMP300にかかっています。

ダイアモンドリオの成功は、望まない注目を集めました。アメリカレコード協会(RIAA)は、Diamond Multimedia Systems(製造元)を提訴し、敗訴しました。しかし、RIAAは、これが風土病の音楽的海賊行為の始まりであり、今日まで続いていると正しく想定していました。

次に何が起こったのですか?

さて、あまり知られていないデバイスと呼ばれる iPod 市場に出回って、当時の事実上のオーディオ形式としてMP3を完全に正当化し、RIAAは世界中の海賊に対する(継続的な)十字軍を開始しました。

私たちが言うように、残りは歴史です。

なぜMP3は死にかけているのですか?

フラウンホーファー研究所がMP3特許を所有していました。 2017年4月23日、残りの特許は失効しました。したがって、フラウンホーファーは新しいMP3ライセンスを発行できなくなりました。これらの「黙示録的な」見出しで何が起こっているのか、そしてそれがあなたにどのように影響するのかを正確に説明しました。

TL; DRが必要ですか? MP3は死んでおらず、どこにも行きません。

フラウンホーファーがMP3を手放した主な理由の1つは、年齢でした。新しくて光沢のあるコーデックと競合することはできなくなりました。彼らの提案?代わりにAdvancedAudio Coding(AAC)を使用してください。偶然にも、フラウンホーファーはAACの(継続的な)特許も保持しているため、以下から選択できるMP3の選択肢がいくつかあります。

MP3の代替

既存のエンコーダーとデコーダーがMP3ファイルを生成し続けるように、MP3コレクションが突然燃焼することはありません。そうは言っても、MP3は少し古くなっています。いくつかあります 無料の代替オーディオ形式 今すぐデジタル音楽を保存するために使用できます。

  • AAC --Advanced Audio Codingは、前述のように、MP3の後継です。唯一の問題は、フォーマット自体が少し古くなっているように見えることです。それにもかかわらず、AACは一般に、同様のビットレートとファイルサイズで、MP3よりも優れたオーディオ忠実度を実現します。 AACも不可逆形式です。
  • Ogg Vorbis --Vorbis形式。一般的にOggコンテナ形式と組み合わせて使用​​されます。それはMP3のより良い、少し若い、オープンソースのいとこです。 Oggは、より優れた圧縮、より高いビットレート、および一般的に優れたオーディオ品質を備えていますが、サポートされているデバイスがないため、OggがMP3と同じように離陸することはありませんでした。 Oggも不可逆形式です。
  • FLAC --Free Lossless Audio Codecは、最も人気のあるロスレスオーディオコーデック形式です。どうして? FLACは、従来のCDの半分のサイズでソース素材の正確なオーディオコピーを提供します。 MP3の影響を最も受けやすいサウンド(ギター、シンバル、リバーブなど)は、大幅に圧縮されているにもかかわらず、鮮明なままです。 FLACはロスレスフォーマットです。

MP3は死んでいない

心配することは何もありません。 MP3へのリッピングを続けることができ、デバイスは引き続き音楽を再生します。長期的には、少なくともコレクションの新しいオーディオ形式を調査する価値があります。 圧縮技術が進歩します 正確なコピーのファイルサイズは減少します。

さらに、ストレージ容量を検討する価値があります。最初のポータブルMP3プレーヤーが32MBのストレージで到着したとき、それは いいね 、しかし明らかに十分ではありません。 iPodClassicの最大ストレージは160GBでした。それか カスタムストレージのアップグレードでぶつかる可能性があります なんと240GBに-1,000,000をはるかに超える個々のMP3トラック。重要なのは、ストレージサイズが大きくなり、物理サイズが小さくなると、少ないリソースでより多くのことができるということです。

最後に、インターネットは私たちが音楽を聴く方法を変え続けています。新しいアルバムが出るたびに12〜20ドル払う余裕がなかったので、以前は音楽を海賊版にしていました。今、私は何百万ものトラックにアクセスできるSpotifyファミリープランアカウントと、さらに何百万ものトラックにアクセスできるAmazonPrimeアカウントを持っています。私を制限しているのはインターネット接続だけです。それでも、どちらにも高品質の形式でオフラインでダウンロードするオプションがあります。

かつてほど重要ではありませんが、MP3は死んでいません。

あなたの好きなオーディオフォーマットは何ですか?ロスレスの鮮明な現実が必要ですか?または、不可逆形式の極端な圧縮ですか?ストリーミングサービスが普及してから、音楽の使い方は変わりましたか?コメント欄に一行残していただければ、折り返しご連絡いたします。

画像クレジット:Shutterstock.com経由のTi Santi

共有 共有 つぶやき Eメール スピーチをアニメーション化するためのビギナーズガイド

スピーチのアニメーション化は難しい場合があります。プロジェクトにダイアログを追加する準備ができたら、プロセスを分解します。

次を読む
関連トピック
  • テクノロジーの説明
  • エンターテイメント
  • MP3
  • ファイル圧縮
  • オーディオコンバータ
著者について ギャビンフィリップス(945件の記事が公開されました)

Gavinは、Windows and Technology Explainedのジュニアエディターであり、Really Useful Podcastの定期的な寄稿者であり、定期的な製品レビュー担当者です。彼は、デボンの丘から略奪されたデジタルアートプラクティスを備えたBA(Hons)現代ライティングと、10年以上のプロのライティング経験を持っています。彼はお茶、ボードゲーム、サッカーをたくさん楽しんでいます。

ギャビンフィリップスからもっと

ニュースレターを購読する

ニュースレターに参加して、技術的なヒント、レビュー、無料の電子書籍、限定セールを入手してください。

購読するにはここをクリックしてください