皆様、お疲れ様です。私は相変わらず、心身ともに元気はないのです。が、何とか生きています。諸々、やりたいことは放置状態なのですが少しづつ興味や関心を取り戻していこうかと。今回はImageFXを今更ながら触ってみたのです。
Imagen3とは
Imagen 3は、Google AIによって開発された最先端のテキストから画像生成モデルです。その特徴と能力は、従来のモデルを大きく凌駕し、画像生成AIの新たな基準となっています。
Imagen 3の特徴
- 高品質な画像生成: Imagen 3は、写真のようなリアリティのある画像を生成することができます。細部まで緻密に描き込まれた画像、多様なスタイル、そして複雑なプロンプトにも対応できる能力が特徴です。
- 多様なスタイルの生成: 写真、絵画、イラストなど、様々なスタイルの画像を生成することができます。また、特定の画家のスタイルを模倣した画像生成も可能です。
- テキストプロンプトへの高い対応力: 長文の複雑なテキストプロンプトにも対応し、テキストの内容を正確に反映した画像を生成することができます。
- 高い創造性: 既存の画像を参考にしながら、全く新しい画像を生成することができます。
Imagen 3
Imagen 3 is our highest quality text-to-image model, capable of generating images with even better detail, richer lighti...
New generative media models and tools, built with and for creators
We introduced Veo for video generation, Imagen 3 for image generation, and released demos recordings from our AI music c...
Imagen 3の仕組み
Imagen 3は、テキストと画像をペアにした大規模なデータセットで学習されています。この学習によって、テキストから画像を生成するための複雑な関係性を学習し、高品質な画像を生成できるようになりました。
技術的には潜在拡散モデル(Latent Diffusion Model)を採用しています。これにより高精度な画像生成が可能になっています。DALL-E、Stable Diffsuionと基本は同じです。さらに、従来モデルで問題視されていた視覚的アーティファクト(ノイズや不自然な欠陥)を最小限に抑える設計となっており、生成された画像は細部まで丁寧に描写されています。
Google 利用規約 – ポリシーと規約 – Google
AIが考える“アイドル”がリアルすぎた グーグル「Imagen 3」なぜ高品質? (ASCII.jp)
グーグルが8月中旬、チャットAIサービス「Gemini」で使える画像生成AIモデルを「Imagen 3」に更新。グーグルの画像生成AIサービス「ImageFX」でImagen 3を試した人たちが驚き、「これはとんでもない」と騒ぎになりました...
使い方
以下サイトにアクセスしてGoogleアカウントでログインするだけです。無料で使用でき、スマホからも利用できます。
ImageFX
Googleでログインして使用します。プロンプトは英語が推奨されています。単純な英語で問題ありません。
適当につくってみた画像
かなり写実的な画像で、リアルと見間違う感じでフェイクの画像作成に利用されそう。。。最後のアニメ調なのは、アバター作成のイメージ用に出してみました。継続して色々と試してみたいと思います。オッケーな内容のプロンプトは何なのかも試行錯誤していきたいと思います。
コメント