AI画像ジェネレーターが手で苦労する理由

AI画像ジェネレーターが手で苦労する理由
あなたのような読者は、MUO のサポートを支援します。当サイトのリンクを使用して購入すると、アフィリエイト手数料が発生する場合があります。 続きを読む。

AI ジェネレーターは私たちの目の前で恐ろしいペースで進化していますが、それでもまだ欠陥があります。 AI 画像の奇妙な詳細を見つけるのは、実際には非常に面白いことです。そのため、多くのエンジンに共通の問題であるミッドジャーニー針が話題になりました。





手が AI 画像ジェネレーターにこれほどまでに挑戦する理由を分析してみましょう。彼らのプログラマーはすでにこのミームに値する問題を修正していますが、人工知能がどのように学習するかについて考えるのは興味深いことです。





今日のメイク動画 スクロールしてコンテンツを続ける

AI 生成の手が話題になった理由

AI エンジンを使用して画像を作成する人なら誰でも、手が正しく写ることはめったにないことに気付いたかもしれませんが、Twitter に大量の「写真」が登場したとき、この問題は注目を集めました。





よく調べてみると、人々の奇妙な手は、AI が生成した画像としてそれらを提供しました。これがミッドジャーニーの手による試みであったという事実は、状況をより興味深いものにしました。

最高の AI エンジンの 1 つは人間の手の複雑さに取り組むことができなかったため、Midjourney とその競合他社の機能がテストされました。確かに、DALL-E でさえ非現実的な指や爪になりがちです。



  DALL-Eで握手する人の数

AI によって生成された手が常に問題であったことを考えると、誇大宣伝は釣り合いが取れていませんでしたが、特別な注意により、 v4 を改善する中間 v5 .

ネットワークに接続しているがインターネットにアクセスできない

新しいバージョンでは、手のデザインを強化することが強調されており、AI エンジニアが陽気な騒ぎに注意を払い、ソフトウェアの機能をアップグレードすることを決定したことを明確に示しています。





他のエンジンは Midjourney の例に追従するのが遅いため、 Photoshop で AI アートを修正する 貴重なスキルとして残っています。プログラマーにとっての主なハードルは、説得力のある手を描くように人工知能を訓練することがどれほど複雑かということです。

AI 画像生成ツールはなぜ手で苦労するのか?

AI エンジンは、敵対的生成ネットワーク (GAN) または安定拡散を使用して画像を生成します。どちらのテクノロジーも、最も基本的なアートワークを作成するために、広範なソース マテリアル、トレーニング、および処理能力を必要とします。





既存の画像は AI のトレーニングの中心となるため、プログラマーはプロンプトと一緒に数百万とは言わないまでも数千の画像をソフトウェアに提供する必要があります。特定の単語が何を指しており、どのように表現するかをエンジンが理解するまで、このプロセスを何度も繰り返します。そのオブジェクト。

しかし、AI が学習するソース画像は主に 2D であり、手がさまざまな位置に描かれています。まっすぐでもカールでも、5 本または 3 本の指を示します。

結局のところ、機械は実際には手の概念を理解していません。機械が学習した画像には、手の特徴がはっきりと一貫して示されているとは限りません。そのため、ミッドジャーニーの手は非常に醜いものになる可能性があります。AI の混乱です。

として有効 AI開発に関するイーロン・マスクの懸念 かもしれませんが、テクノロジの一部にはまだ学ぶべきことがたくさんあります。そして、彼らの障害は手の不十分な例にとどまりません。

AI 画像ジェネレーターの改善が遅いその他の理由

  コンピューターでコーディングする女性

見つめている Midjourneyのモデル 、v5 は、テキスト プロンプトと生成された画像の間の高度な一貫性、およびより高い解像度と追加のツールを提供します。しかし、そのような成果は安くはありません。

AI を訓練して手でよりうまくやれるようにするには、特に 3D で、より良い画像を A​​I に与える必要があります。つまり、ソース マテリアルの取得からコーディングの改善、AI が正しく理解するまでのトレーニングの繰り返しまで、多くの時間と労力がプロセスに費やされます。

それでも、ソフトウェアは、そうでなければ見事な芸術作品で間違いを犯す可能性があります.巨大で複雑な仕事であることに加えて、費用がかかります。だから、期待しないでください 無料の AI テキストから画像へのジェネレーター まだミッドジャーニーの口径にステップアップする.

簡単に言えば、AI エンジンの問題は、これらのコンピューター プログラムが、手や足などの人間の特徴がどのように見え、どのように機能するかを完全に理解できないことだけにあるのではありません。それはまた、コスト、およびジェネレーターが周囲の世界をより現実的に把握するのに役立つ 3D 画像および機械学習技術へのテクノロジーのアクセスにも帰着します。

AI画像ジェネレーターは永遠に苦労しません

手は、人工知能がバイナリの頭を包み込むためのトリッキーな概念ですが、この問題の解決策はすでに機能しています。 Midjourney、DALL-E 2、およびその他のプラットフォームは、風変わりな指を完全に根絶しないまでも、最終的には最小限に抑えることができるようになります。

他の AI 分野の進歩により、テクノロジは常に進化しており、開発者はそれを適用して改善するための新しい方法を常に学んでいます。