ベスト 5 のオープンソース AI 画像ジェネレーター - |テクノロジーの説明|クリエイティブ|

クイックリンク

クレヨン

安定拡散1.5

ドリームシェイパー

InvokeAI

オープンジャーニー

AI ベースのテキストから画像への生成モデルはどこにでもあり、日々アクセスしやすくなっています。 Web サイトにアクセスして探している画像を生成するのは簡単ですが、生成プロセスをより詳細に制御したい場合は、オープンソースのテキストから画像へのジェネレーターを使用するのが最善の策です。

今日のメイクアップビデオ スクロールしてコンテンツを続けてください

特定の種類の画像に特化した、無料のオープンソース AI テキスト画像ジェネレーターがインターネット上で利用可能です。そこで、私たちは山を調べて、今すぐ試せる最高のオープンソース AI テキスト変換ジェネレーターを見つけました。

1 クレヨン

Craiyon は、最も簡単にアクセスできるオープンソース AI 画像ジェネレーターの 1 つです。これは DALL-E Mini をベースにしており、クローンを作成できますが、 Githubリポジトリモデルをコンピュータにローカルにインストールする場合、Craiyon はこのアプローチを廃止し、Web サイトを優先したようです。

公式 Github リポジトリは 2022 年 6 月以降更新されていませんが、最新モデルは依然として無料で入手できます。クレヨン公式サイト。 Android や iOS のアプリもありません。

機能の面では、AI 画像ジェネレーターに期待される通常のオプションがすべて表示されます。プロンプトを入力して画像を取得したら、アップスケール機能を使用して高解像度のコピーを取得できます。アート、写真、描画の 3 つのスタイルから選択できます。モデルに決定させたい場合は、「なし」オプションを選択することもできます。

さらに、「エキスパートモード」では、特定の項目を避けるようにモデルに指示する否定的な単語を含めることができます。また、ChatGPT を使用してユーザーが可能な限り最適かつ詳細なプロンプトを作成できるようにするプロンプト予測機能もあります。最後に、AI を活用した背景の削除機能は、画像から背景を切り取る時間と労力を節約するのに役立ちます。

それがCraiyonが行うすべてのことです。これは最も洗練された AI 画像生成モデルではありませんが、詳細や現実的なものを必要としない場合は、基本モデルとして十分に機能します。

このモデルは無料で使用できますが、無料ユーザーは 1 分以内に一度に 9 つの無料画像に制限されます。サポーターまたはプロフェッショナルレベル (価格はそれぞれ月額 5 ドルと 20 ドルで、毎年請求されます) に登録すると、広告や透かしが表示されなくなり、生成が高速化され、生成された画像を非公開にするオプションが利用できます。カスタムサブスクリプション層では、カスタムモデル、統合、専用サポート、プライベートサーバーも利用できます。

2 安定拡散1.5

Stable Diffusion は、おそらく最も人気のあるオープンソースのテキストから画像への生成モデルの 1 つです。また、以下で説明する 3 つの画像ジェネレーターを含む他のモデルにも使用されます。 2022 年にリリースされ、それ以来多くの実装が行われてきました。

hdtvアンテナの作り方

モデルがどのように機能するかについての過度に技術的な詳細については割愛します (詳細については、次のリンクを参照してください) 公式Githubリポジトリ）ですが、このモデルは完全な初心者でも簡単にインストールでき、少なくとも 4GB のメモリを備えた専用 GPU があれば問題なく動作します。アクセスすることもできます安定した拡散オンラインでご希望に応じて対応させていただきます Mac で安定した拡散を実行する。

安定した拡散に使用できるチェックポイント (バージョンと考えてください) がいくつかあります。バージョン 1.5 をテストしましたが、バージョン2.1 も積極的に開発中であり、より正確です。

ヤドゥラ・アビディ/MakeUseOf/DreamShaper

モデルの実行もかなり簡単です。私たちはそれを使ってテストしました AUTOMATIC1111 安定拡散 Web ユーザーインターフェイス、すべてのコントロールとパラメータが正常に機能します。また、モデルのトレーニングに使用した LAION-5B データベースのおかげで、非常に NSFW 耐性があります (ただし、完璧ではありません、念のため)。生成時間自体はハードウェアによって異なりますが、基本的なプロンプトを使用した場合でも、画像が詳細でリアルなものになることが期待できます。

3 ドリームシェイパー

DreamShaper は、Stable Diffusion に基づいた画像生成モデルです。これは、MidJourney のオープンソースの代替として意図されており、生成された画像のフォトリアリズムに重点を置いていますが、いくつかの調整を加えることでアニメや絵画スタイルも同様に処理できます。

このモデルは Stable Diffusion よりも優れた機能を備えており、ユーザーは、大幅な改善から NSFW 制限の緩和に至るまで、最終出力をより自由に設定できます。モデルの実行も簡単です。ダウンロード可能な事前トレーニング済みバージョンが利用可能ローカルアクセスおよびホストの Web サイトを含むオンラインシンキンアイ、ランダムシード、そしてメイジスペース (基本サブスクリプションが必要) を使用すると、GPU アクセラレーションを使用してモデルを実行できます。

もうおわかりかと思いますが、DreamShaper で生成された画像は、安定した拡散に比べてよりリアルに見える傾向があります。両方のモデルで同じプロンプトを実行した場合でも、DreamShaper モデルの方がより現実的で、詳細で、照明がより適切になる可能性があります。

これはポートレートやキャラクターに特に当てはまりますが、同じプロンプトと比較して安定した拡散には欠けていることがわかりました。画像がリアルになりすぎる場合は、次のことを行ってください。 AI が生成した画像を識別する 4 つの方法。

モデルを実行するのに巨大な PC も必要ありません。 4GB VRAM を搭載した私の GTX 1650Ti は、このモデルを完璧に実行しました。生成時間は少し長くなりましたが、実際の出力には影響しないようでした。ただし、Stable Diffusion XL モデルに基づく DreamShaper XL を実行するには、より多くの VRAM を備えた GPU が必要になる場合があります。

4 InvokeAI

Invoke AI は、Stable Diffusion に基づいた別の AI ベースの画像生成モデルであり、XL バージョンは Stable Diffusion XL に基づいています。また、独自の Web およびコマンドラインユーザーインターフェイスも備えているため、Stable Diffusion Web UI などで苦労する必要はありません。

このモデルは、ユーザーがカスタマイズされたワークフローを使用して知的財産に基づいてビジュアルを作成できるようにすることに重点を置いています。 InvokeAI は、カスタムモデルのトレーニングや知的財産の操作に最適なオープンソース AI 画像生成モデルの 1 つです。

その公式Githubリポジトリには、2 つのインストール方法がリストされています。InvokeAI のインストーラーを介してインストールするか、ターミナルと Python に慣れていて、モデルとともにインストールされるパッケージをより詳細に制御する必要がある場合は、PyPI を使用します。

ただし、追加の制御にはいくつかの制限があり、特にハードウェア要件が厳しくなります。 InvokeAI は、少なくとも 4 GB のメモリを備えた専用 GPU を推奨します。XL バリアントの実行には 6 ～ 8 GB のメモリが推奨されます。 VRAM 要件は、AMD GPU と Nvidia GPU の両方に適用されます。また、モデル、その依存関係、および Python 用に、少なくとも 12 GB の RAM と 12 GB の空きディスク領域も必要です。

ヤドゥラ・アビディ/MakeUseOf/InvokeAI

ドキュメントでは、ビデオメモリが不足しているため、Nvidia の GTX 10 シリーズおよび 16 シリーズ GPU を推奨していませんが、提供されたインストーラーは問題なく実行されました。使用頻度はさまざまですが、ローエンド GPU を使用している場合は、プロンプトが画像に変換されるのを確認するまでに長い時間がかかることが予想されます。最後に、Windows を使用している場合は、現在 AMD GPU がサポートされていないため、Nvidia GPU のみを使用できます。

画像生成部分では、モデルはフォトリアリズムよりも芸術的なスタイルに傾く傾向があります。もちろん、特に製品デザイン、建築、小売スペースで作業している場合は、データセット上でモデルをトレーニングし、フォトリアリスティックな画像が含まれる場合でも、希望に近い画像を生成させることができます。ただし、覚えておくべき重要な点は、InvokeAI は主に画像生成エンジンであるということです。つまり、最良の結果を得るには、独自のモデル (Web インターフェイスで提供されるモデルマネージャーを介して簡単に見つかります) をデフォルトとして使用する必要がある可能性があります。モデルは安定拡散自体と非常によく似ています。

5 オープンジャーニー

Openjourney は、やはり Stable Diffusion に基づいた、無料のオープンソース AI 画像生成モデルです。このモデルがなぜ Openjourney と呼ばれているのか疑問に思っている場合は、このモデルが Midjourney 画像でトレーニングされており、生成される画像でそのスタイルを模倣できるためです。

プロンプトヒーロー Openjourney の背後にある会社では、Stable Diffusion (バージョン 1.5 および 2)、DreamShaper、Realistic Vision などの他のモデルと並行してモデルをテストできます。サインアップすると、25 の無料クレジット (生成される画像ごとに 1 クレジット) を取得できます。その後、プロサブスクリプション層に登録する必要があります。これは月額 9 ドルで、他の限定機能を備えた毎月 300 クレジットにアクセスできます。

ただし、ローカルで無料で実行したい場合は、 HuggingFace からモデルファイルをダウンロードします。 Stable Diffusion Web UI を使用して実行します。 Openjourney は、HuggingFace 上で Stable Diffusion に次いで 2 番目にダウンロード数の多い AI 画像生成モデルでもあります。

Openjourney の Web サイトにはモデルをローカルで実行するための具体的なハードウェア要件が記載されていませんが、Stable Diffusion と同様のハードウェア要件が期待できます。これは、モデルとその依存関係を保存するために、4 GB VRAM、16 GB RAM、およびコンピューター上に約 12 ～ 15 GB の空き領域を備えた専用 GPU を意味します。

ヤドゥラ・アビディ/MakeUseOf/OpenJourney

Openjourney によって生成された画像は、特に指定がない限り、フォトリアリズムとアートの間でバランスが保たれる傾向があります。オールラウンドなモデルを探していて、サブスクリプションを支払わずに Midjourney のルックアンドフィールを好む場合は、Openjourney が最良の選択肢の 1 つです。

unmountable_boot_volume windows 10