Google の MusicLM は誇大宣伝に応えられるでしょうか?

Google の MusicLM は誇大宣伝に応えられるでしょうか?
あなたのような読者が MUO をサポートします。当社サイトのリンクを使用して商品を購入すると、アフィリエイト手数料が発生する場合があります。 続きを読む。

2023 年 1 月、Google はテキストの説明に基づいて音楽を生成できる実験的な AI ツールである MusicLM を発表しました。このニュースと並行して、Google は MusicLM に関する驚くべき研究論文を発表し、多くの人を空中から音楽を呼び起こす能力に驚かせました。





bitmojiアカウントを作成する方法
その日のメイクアップビデオ スクロールしてコンテンツを続けてください

テキストプロンプトが与えられると、このモデルは、ジャンルから楽器、有名な芸術作品を説明する抽象的なキャプションまで、あらゆる種類の説明を伝える高忠実度の音楽を生成すると約束しました。 MusicLM が一般公開されたので、テストしてみることにしました。





AI音楽ジェネレーターを開発するGoogleの試み

  Google 向け Web アプリケーション's MusicLM AI music generator

「リラックスできるジャズ」のようなテキスト プロンプトをすぐに再生できるトラックに変えることは、おそらく AI 音楽の実験の聖杯です。 Dall-E や Midjourney などの有名な AI 画像ジェネレーターと同様に、メロディーとビートのあるトラックを作成するのに音楽のノウハウは少しも必要ありません。





2023 年 5 月に、Google の AI Test Kitchen にサインアップした人は初めてデモを試すことができました。ユーザーフレンドリーな Web ページといくつかの指針 (電子楽器とクラシック楽器が最適であり、「雰囲気」を指定することを忘れないでください) があれば、音楽の断片を作成するのは想像できないほど簡単です。

速度は、比較的忠実度の高いサンプルと並んで、MusicLM が真に実現できる数少ない機能の 1 つです。しかし、本当の試練はストップウォッチだけで測れるものではありませんでした。 MusicLM は、いくつかの単語に基づいて、本物の聴きやすい音楽を生成できますか?正確には違います (これについてはすぐに説明します)。



GoogleのAIテストキッチンでMusicLMを使用する方法

MusicLM の使用は簡単で、待機リストに登録できます。 GoogleのAIテストキッチン 試してみたいなら。

Web アプリには、聴きたい音楽の種類を説明するいくつかの単語から数文のプロンプトを作成できるテキスト ボックスが表示されます。最良の結果を得るには、Google は「非常に説明的であること」をアドバイスし、音楽の雰囲気や感情を含めるよう努めるべきだと付け加えています。





準備ができたら、Enter キーを押して処理を開始します。約 30 秒以内に、2 つの音声スニペットが試聴できるようになります。この 2 つのうち、プロンプトに一致する最良のサンプルにトロフィーを授与するオプションがあります。これは、Google がモデルをトレーニングして出力を改善するのに役立ちます。

MusicLM のサウンドとは

人類は少なくとも 40,000 年前から音楽を作り続けてきましたが、音楽が言語の発達の前、後、または同時に誕生したのかについては明確なアイデアはありません。したがって、ある意味では、MusicLM がこの古代の普遍的な芸術の暗号を完全に解読できなかったのは驚くべきことではありません。





GoogleのMusicLM研究論文 は、MusicLM が有名な芸術作品に属するキャプションから音楽を生成し、一連のさまざまなプロンプトに従ってスムーズにジャンルや雰囲気を変更するなどの指示に従うことができることを提案しました。

しかし、このような難しい注文に取り組む前に、MusicLM には最初に克服しなければならない根本的な問題がいくつかあることがわかりました。

テンポを守るのが難しい

ミュージシャンの最も基本的な仕事は、単に時間通りに演奏することです。言い換えれば、テンポを守るということです。驚くべきことに、それは MusicLM が 100% 実行できるわけではありません。

実際、同じプロンプトを 10 回使用すると、20 個の音楽トラックが生成されますが、間に合ったのは 3 個だけでした。残りの 17 個のサンプルは、音楽を説明するために広く使用されている用語「1 分あたりの拍数」で表される指定されたテンポよりも速いか遅いかです。

この例では、「毎分 80 ビートで演奏される、平和で瞑想的なソロ クラシック ピアノ」というプロンプトを使用しました。よく聞いてみると、短いサンプル長の中で音楽が速くなったり遅くなったりすることがよくありました。

また、音楽には強いビートがなく、誰かが曲の途中で再生ボタンを押したかのように聞こえました。これが意図的かどうかはわかりませんが、MusicLM がビートに忠実な上に、実際に音楽の適切な始まりや終わりを構成できるかどうかを判断するのは困難です。

楽器のランダム選択

おそらく、MusicLM は厳密なタイミングで演奏する方法をまだ学習していなかったので、別の一般的な音楽パラメータに移りました。私たちは、特定の楽器に対する私たちのリクエストがそれによって満たされるかどうかを確認したかったのです。

私たちは、「ソロ シンセサイザー」や「ソロ ベース ギター」などの説明を含む、いくつかの異なるプロンプトを作成しました。他には「弦楽四重奏団」や「ジャズバンド」のような大規模なアンサンブルもありました。全体として、あなたが求めたものを手に入れる可能性は 50:50 のように思えました。

1 つの理論は、このモデルが一部の楽器を人気のある音楽ジャンルに関連付けているというものです。たとえば、「ソロ シンセサイザー、コード進行。活気があり、陽気です。」というプロンプトを考えてみましょう。 MusicLM は、シンセサイザー サウンドを独自に取得するのではなく、ドラムとベースを備えた電子トラックを作成しました。

モデルには、機器に対する特定のリクエストを理解するための十分なデータと十分なトレーニングが不足している可能性があります。

ボーカルは方程式から外れています

当時の制限により、このモデルはボーカルを含む音楽を生成できませんでした。 MusicLM のやっかいな著作権問題とバグのあるボーカル これが、Google がこの制限を設定することで安全策を講じた理由である可能性があります。

しかし、MusicLM をしばらく試した後、モデルの出力に対する Google の制御が厳密なものではないことがわかりました。奇妙なことに、「アコースティック ギター」のようなプロンプトを使用すると、バックグラウンドで幽霊のようなボーカルが含まれ、くぐもって遠くに聞こえるトラックが生成されます。

これはよくあることではありませんが、そもそも説得力のあるボーカルを作成する MusicLM の能力について疑問に思うことはあります。

VOCALOID や Synthesizer V などのソフトウェアが業界をリードしています。 AIによる音声合成技術 、現在のモデルからボーカルが省略されているため、既存のテクノロジーに対抗するにはまだ十分ではないのではないかと疑問が残ります。 MusicLM をミュージシャンたちが称賛するようになるまでには、長い道のりがあるかもしれません。

AI音楽ジェネレーターの未来

  MusicLM でのさまざまなプロンプト提案's web application

MusicLM は生成 AI 音楽テクノロジーを前進させてきましたが、音楽業界で実際に仕事を始める前に、学校に戻ってさらにいくつかのことを学ぶ必要があります。

これまで、AI 音楽生成における最良の試みは、OpenAI による JukeboxAI と呼ばれるモデルでした。まったくすぐに使える状態ではなく、わずか 1 分の音楽をレンダリングするのになんと 9 時間もかかりました。

あなたの努力の甲斐あって、オーディオの歪みやアーティファクトが満載の、真に異質なサウンドのトラックが戻ってくる可能性がありました。逆に、退屈することはないだろう ジュークボックスが生み出す奇妙な作品を聴く

これを踏まえて、MusicLM はユーザーフレンドリーな AI 音楽ジェネレーターに向けていくつかの重要な進歩を遂げました。生のオーディオ形式で音楽を生成することがいかに非常に複雑であるかを立ち止まって考えると、このモデルのランダムな出力についてはほとんど許せるでしょう。

しかし、このモデルを機能させた後、Google が最初の研究論文で発表したものと比較すると、MusicLM は中途半端に感じられます。 AI 画像ジェネレーターが Apple のイメージを誤ることはほとんどありません。同様に、AI 音楽ジェネレーターはテンポや楽器などのいくつかの基本を正しく理解する必要があります。

GoogleのMusicLMは期待を下回る

テクノロジー企業が AI の分野で競い合う中、MusicLM は準備が整う前に公開トライアルに入ったかのように感じます。このモデルは、基本を正しく理解する代わりに、音楽制作に対してはるかに漠然とした主観的なアプローチを採用しているようです。

Google はプロンプトを具体的にするよう勧めるかもしれませんが、テンポをうまく処理できませんし、毎回要求した楽器が入手できるとは限りません。 MusicLM は興味深いかもしれませんし、強力な AI の優れたデモンストレーションが進んでいますが、音楽が最終目標である場合、その道のりはまだ長いです。