猫の音声翻訳アプリはどのように機能しますか?

猫の音声翻訳アプリはどのように機能しますか?

あなたはおそらくあなたの猫が言っていることを翻訳すると主張するアプリを見たことがあるでしょう。しかし、彼らは本当にあなたの猫のニャーを英語に翻訳することができますか?簡単な答えは「はい」です。それぞれの猫の「言語」がどれほどユニークであるかという理由で難しいですが、彼らは現代の技術にかなり近づくことができます。





MeowTalkのような猫の翻訳アプリは、機械学習を強調する音声認識の形式を使用します。よく見てみましょう。





音声認識と機械学習

メアリーテレサマクリーン/ Pinterest





音声認識は、音声を録音し、音声をデジタルデータファイルに変換することで機能します。ピッチやボリュームなどのデータを、アプリが分析して意味と一致させることができるデータポイントとしてエンコードします。 DPAマイク これらのデータポイントは、背景音や単語の話し方によって大きく異なる可能性があることを説明しています。

音声認識を当然のことと考えることもありますが、それはテクノロジーの驚くべき偉業です。特に人間の発話がいかに複雑かを考えると。 NS 科学者 説明すると、各単語には、互いにブレンドされたさまざまな音または「音素」が含まれます。コンピュータに音声を理解させることは非常に困難です。猫の音の新しいフロンティアはさらに難しくなります。



音声認識を使用するアプリは、データセットと呼ばれる単語の「語彙」でプログラムされています。次に、アプリはあなたのスピーチをそのデータ語彙の最も近いオプションに一致させます。

間違えた場合は修正し、次回のためにそのデータを保存します。これは機械学習の一部です。これは、プログラムが最初のデータセットと同一でなくても、音声を認識することを学習する方法です。





関連:機械学習アルゴリズムとは何ですか?仕組みは次のとおりです

音声認識には、特に音声障害やアクセントに関して、依然として問題があります。ただし、一部の企業は、これらの問題を克服するために機械学習を改善しています。時間の経過とともに、機械学習は音声認識を強力なツールに変えることができます。





レンタルしたKindle本からdrmを削除する

これが、人間にとって音声認識がどのように機能するかです。しかし、それは猫のために働きますか?

音声認識とニャー認識

アリアナ・スアレス/ スプラッシュを解除

まず、ある種のニャーを「お腹がすいた」と翻訳することが、人間の発話の分析と異なる理由を理解する必要があります。問題は主に、猫のコミュニケーションが姿勢のような非言語的手がかりに大きく依存していることです。もう1つの問題は、普遍的な「猫の言語」がないことです。

による ASPCA 、大人の野良猫はお互いにニャーと鳴くことはなく、人だけにニャーと鳴きます。その他の研究 ヒューメインソサエティ これらの音は「真空中では発生しない」と付け加えています。私たちはそれらをボディーランゲージや他の文脈と一緒に解釈しなければなりません。多くの場合、これらの無音の信号は、「お腹が空いた」という意味のニャーと「遊びたい」という意味のニャーの唯一の違いです。

この問題に加えて、2匹の猫が同じ言語を持っていることはありません。猫は飼い主のためにパーソナライズされた「言語」を開発します。これらは、一部は飼い主の声の模倣に基づいており、一部は猫の性格に基づいています。同じ欲求や必要性を伝えているときでさえ、2匹の猫が同じように聞こえることはありません。では、1つのアプリの音声語彙をそれらすべてにどのように翻訳できるでしょうか。

猫のための柔軟な機械学習

自由に使える音/ スプラッシュを解除

のようないくつかの仮想アシスタントが 自動 口調と感情を理解しようとしても、非言語的信号では音声認識はひどいものです。しかし、それはそれらを解釈することが不可能であるという意味ではありません。

YouTubeはどのくらいのインターネットを使用していますか

MeowTalkは、より柔軟な種類の機械学習を使用して、これらの問題を克服します。

ダウンロード: MeowTalk for アンドロイド | ios (無料)

Meowtalkは、Alexaチームでも働いていたJavierSanchezによって作成されました。彼はこのアプリをスマートカラーへの第一歩として想像しました。これらの首輪は猫の音を人間のスピーチに変換し、複雑な機械学習戦略を利用して、人間が猫をよりよく理解して世話をするのを助けます。

MeowTalkチームは、猫ごとにさらに具体的なプロファイルを作成することで、一意性の問題を補いました。アプリでは、各猫を個別に登録します。 科学ノルウェー 子猫の鳴き声は成猫とは異なると報告されているため、アプリは猫の誕生日も尋ねます。各プロファイルは、猫の固有のデータネットワークを生成し、機械学習に少しの深層学習を組み込みます。

関連:ディープラーニングvs.機械学習vs. AI:それらはどのように連携しますか?

語彙については、MeowTalkはデータセット内の10個のサウンドプロファイルから始まります。それぞれに、「幸せ」や「狩猟」など、異なる意味が付けられています。アプリが音を聞いて間違った場合は、修正するか、新しい解釈を作成できます。

から収集されたCATSOUNDSデータ Akvelon

修正すると、アプリは基本語彙を新しいサウンドに置き換えるように指示されます。

xboxoneコントローラーが機能しないのはなぜですか

たとえば、「ハンティング」を長いヨークではなく短いチャープに一致させるようにアプリに指示できます。この種の修正は、音声認識の方法を意味する1つと一致するように複数の音を追加するよりも便利です。これは、長いヨーと短いチャープをアプリに伝えるようなものです。 どちらも 「マザーコール」を意味します。

音声認識アプリの機械学習は通常、このタイプの上書きに抵抗します。 「テクノロジーブログ」と言うとき、あなたは本当に「梨」を意味することをSiriに教えようとしているようなものです。ただし、MeowTalkが使用するより柔軟な形式の機械学習では、この修正をより簡単に処理できます。

新しい解釈を作成すると、以前はエンコードされていなかった意味が追加されます。たとえば、猫がお気に入りのおもちゃを欲しがっているときに特定の電話をかけた場合、オプションとして「マウスが欲しい」を追加できます。これは、オートコレクト辞書に単語を追加するのと似ています。

関連している: Androidで独自のオートコレクト単語を定義する方法

時間の経過とともに、猫用に高度にパーソナライズされた音声プロファイルを作成できます。最終的には、ペットシッターや行動上の問題を解決するのに役立つほど洗練されているかもしれません。他に何もないとしても、それは猫の飼い主が彼らのペットにもっと注意を向けるようになるのを助けます。

評決:猫の翻訳アプリは機能しますか?

結局のところ、「猫の翻訳」は、ユーザーが猫の話し方をアプリに教えることに大きく依存しています。それぞれの猫のコミュニケーションがいかにユニークであるかという理由で、それはおそらく常に当てはまります。

しかし、機械学習がこれまでに行われ、開発者がこれで部分的にさえ成功できるという事実は信じられないほどです。機械学習とAIは驚異的なスピードで進歩しており、次にどこに行くのか楽しみです。

共有 共有 つぶやき Eメール 関連トピック
  • テクノロジーの説明
  • 言語学習
  • 機械学習
著者について ナタリー・スチュワート(47件の記事が公開されました)

ナタリー・スチュワートはMakeUseOfのライターです。彼女は最初に大学でテクノロジーに興味を持ち、大学でメディアライティングへの情熱を育みました。ナタリーは、アクセスしやすく使いやすいテクノロジーに重点を置いており、日常の人々の生活をよりシンプルにするアプリやデバイスが大好きです。

ナタリー・スチュワートのその他の作品

ニュースレターを購読する

ニュースレターに参加して、技術的なヒント、レビュー、無料の電子書籍、限定セールを入手してください。

購読するにはここをクリックしてください