AI画像の学習方法と注意点(シニア向け)

「本記事はアフィリエイトを利用しています」 リスキリング

AI画像生成の学習方法と注意点(シニア向け)

この記事では、AIの画像生成分野での進展状況やAIを利用して画像を生成する方法、画像学習の手順について、シニアの方でも理解しやすいように解説します。

AI画像学習の基本から応用、さらには最新のトレンドまで、幅広い内容を網羅しています。

これからAI画像生成に興味を持ち始めた方や、基礎知識を深めたい方にもおすすめの記事です。ぜひ、最後までご覧ください。

AI画像とは?

左イラストはMidjourneyの生成画像

何枚も失敗しながらトライすることで、少しずつ自分の思い描いたイメージ画像が作れるようになっていきます。

AI画像生成の基本

  • テキストの説明文(プロンプト)を入力するだけで、高品質な画像を生成することができる

    ただし、自分の思ったとおりの画像を生成するためには、試行錯誤をしながらプロンプトの習熟が必要。

    思い通りの画像に近づけるためには、何度も追加プロンプトを入力してやり直し生成をさせる(DALLーEの場合)か、複数枚生成された画像の中から選択する(Midjourneyの場合)方法、細かい設定を修整しながら再生成を繰り返す(Stable Diffusionローカル版の場合)方法があります。


    AI生成ツール(Midjourney、DALLーEStable Diffusion)の詳細説明はこちら




  • 同じテキスト説明(プロンプト)を入力しても、全く同様の画像は生成しない

    同じような画風やキャラクターを生成するためには工夫が必要ですが、あくまでも類似の画像となります。

    一度生成した画像seed値を用いて類似画像を再作成する方法(DALLーE、Midjourney)、またはプロンプトオプションであるSref、Cref機能を用いて(Midjourneyの場合)、類似の画像を再生成することができます。




  • AI機能を用いて画像編集やレイアウトの最適化が可能

    レイアウト(アスペクト比)の指定はほとんどの画像生成ツールで対応しています。

    画像編集(一部品の置換、合成、削除、変色など)が可能な画像生成ツール(Canvaプロ、adobe firefly など)を選択する必要があります。

    MidjourneyやStable Diffusionでも、画像編集の一部機能(一部品の置換、削除など)は対応可能です。




  • 使用するAI生成ツールに応じて、画像品質精度や編集可能内容等が異なる

    現時点(2024年3月)では、画像品質の面ではMidjourney、編集用としてはCanvaプロがおすすめです。

    ただし、どちらも有料であることと、AIツールの進化が速いため、常に最適なツール探しは怠らないようにしましょう。

簡単なAI画像作成方法

  • オンラインツールの利用

    ChatGPTやDALL-E などのオンラインサービスを使用して、テキストから画像を生成する。

    まずは無料版の「DesignerのImage Creator(旧名称 Bing Image Creator)」で、DALL-E3を使ってみましょう。
    これはMicrosoft社のCopilot(旧Bing)の画像生成ツールで、1日100回利用可能・商用使用不可です。

    次のステップでは、ChatGPT plus(月20$)に課金するとChatGPT4機能の一部としてDALL-E3が利用できます。
    3時間ごとに30回の使用制限がありますが、商用利用可能です。




  • ローカル環境での利用

    Stable Diffusionを自分の環境に構築すれば作成枚数も無限で無料使用可能。作成した画像の商用利用は可能です。

    ただし、高スペックのPCが必要なことと、事前準備としてpythonやgitのインストールが必要なため難度が高い。
    また、Stable DiffusionにはWeb上で利用可能なサイト(一部機能が有料、枚数制限あり)もあります。




  • デザインツールの利用

    Canvaなどのデザインツールを使用して、AIによる画像加工やデザインを行う。

    有料(無料トライアル期間あり)だが、AI画像編集機能は優秀、商用利用可能。


初心者向けAI画像学習のポイント

  • 基礎知識の習得

    AIや機械学習、画像処理に関する基本的な知識を身につける。

    最新のWeb記事やTouTube動画を見て、品質・操作性・コスト面の知識を得てください。また各画像生成ツールについても、最新の機能追加が順次行われているので、常に知識のアップデートが必要です。




  • ツールの使い方を学ぶ

    AI画像生成ツールやソフトウェアの操作方法を習得する。

    まずは無料版やトライアル期間を利用して、実際にツールを触ってみることです。

    有料課金を行う場合は、いきなり最初から年間プラン(割引になっているケースが多い)を申し込むのは避け、月課金プランを経験して翌月以降に継続か別ツール利用かの判断を行うことをおすすめします。




  • 身近で簡単な画像作成から始める

    簡単な画像・スタイル作成から始めて、プロンプトの入力内容に応じて画像イメージ・品質の比較を実際に経験する。

    次に、自分のブログのアイキャッチ画像など、作りたいイメージ目標を作成してみます。
    最初は、プロンプト内容を変更しても、なかなか思った通りの画像が出力されずに試行錯誤が続きます。
    何枚も画像生成を行い、早くコツを掴むことが大事です。

    MidjourneyのWeb版機能を利用すると、他の人が生成した画像のプロンプトが参照できます。
    同様のプロンプトをコピーして生成すると、全く同じものはできませんが類似イメージの画像が生成できます。
    (参考2024年3月時点:MidjourneyのWeb版は、有料課金メンバーは全員閲覧可能ですが、全機能は1000枚以上作成した場合のみ利用可能です。Web版は現在α版のため、そのうち全有料課金メンバーが利用可能となるかもしれません)




  • コミュニティへの参加:

    オンラインコミュニティサイトやSNSで情報交換を行い、他の学習者や専門家からアドバイスを受ける。

    私の参加しているAIコミュニティでも、画像生成関連のスレッドで画像生成に関するQ&Aやアドバイスを先輩の方々から得ることができて役に立っています。

AI画像学習は初心者にとって挑戦的かもしれませんが、基本からコツコツと学び進めることで、やがて独自の作品を生み出すことができるようになります。

AI画像学習の基本

Midjourneyの生成画像(水彩画風)

AI画像を商用利用する場合は、著作権を充分考慮した法的な順守が大切です。まずは著作権に関する知識を学びましょう。

AI画像学習の基本には、以下のようなポイントがあります。

一般的なイラスト作成、入手方法

  • イラスト素材サイトやフリー素材を利用する

    AI画像が出てくるまでは、必要な画像はイラスト素材サイトからの購入やプロのデザイナー・イラストレーターへ発注していました。



  • 自分で描く、またはプロのイラストレーターに依頼する

    自分でデジタルイラストを作成する場合、最初に機材(PC、ペンタブレット、ペイントソフト)を準備します。

    一般的には、iPad Pro+Apple Pencilか、または今持っているPC+WACOM(ワコム)社製ペンタブレット、ペイントソフトはCLIP STUDIO PAINT(有料約5000円・・まずは体験版からスタート)が一人気です。

    プロのイラストレーターに依頼すると当然お金がかかります。イラストを入手する手段としてはありですが、本ブログでは初心者がこれから収益化を目指すヒントを得る記事であるため詳細内容は割愛します。



  • AI画像生成ツールを使用して作成する

    習熟に少し時間を要しますが、画像生成スキルを身につけることができます。作成した画像を趣味で利用する分には問題ありませんが、収益化のために商用利用する場合は、画像の著作権の扱いについての知識が必要です。

AI学習の著作権の考え方

  • 「著作権」って何?

    著作権とは、写真や絵などの作品を作った人が、その作品をどう使うかを決める権利のことです。
    他の人が勝手に使ったり、変えたりすることはできません。



  • 著作権フリーの画像を使おう

    学習に使う画像は、著作権で守られていることがあります。
    つまり、勝手に使うと問題になることがあります。だから、誰でも自由に使える「著作権フリー」の画像を使いましょう。



  • パブリックドメインの画像って何?

    パブリックドメインとは、著作権がなくなった作品のことです。
    これらの作品は自由に使うことができますが、本当に著作権がないか確認する必要があります。



  • 肖像権の尊重

    人物の写真を使用する場合、その人物の肖像権を侵害しないように注意が必要です。
    特に、特定の個人を特定できるような画像を使用する場合は、その人物の同意が必要になることがあります。



  • 著作権表示とクレジットの表示

    画像の使用にあたっては、必要に応じて著作権表示やクレジットの表示を行うことが求められることがあります。
    画像の出典や著作権者を適切に表示することで、著作権侵害のリスクを減らすことができます。


このように、AIで画像を作る時には、他の人の作品を尊重して、ルールを守ることがとても大切です。もしわからないことがあれば、先生や大人に相談してみましょう。

著作権法は国によって異なるため、具体的な使用条件や規制は各国の法律に従って確認することが重要です。また、AI画像生成においては、生成された画像自体の著作権についても考慮する必要があります。

AI画像生成時のプロンプト内容に対する著作権上の注意事項

  • 特定の作品やキャラクターの名前を使わない

    特定の映画、アニメ、小説などの作品名やキャラクターの名前をプロンプトに含めると、著作権侵害の問題が生じる可能性があります。

    たとえば、「ハリーポッターのような魔法使い」という表現は避け、「魔法を使う少年」というように一般的な表現にすると良いでしょう。




  • 著名なアーティストのスタイルを模倣しない

    特定の画家やイラストレーターのスタイルを明確に指定することも、著作権や著作隣接権の侵害につながることがあります。

    たとえば、「ピカソのスタイルで」という指示は避け、代わりに「キュビズム風の」といった一般的な芸術様式を参照する方が安全です。




  • 商標やブランド名を避ける

    商標やブランド名(例:「コカ・コーラのロゴ」)をプロンプトに含めると、商標権の侵害になる可能性があります。
    一般的な表現を使うようにしましょう。




  • 具体的な著作物のシーンやイメージを避ける

    特定の映画や本の具体的なシーンやイメージをプロンプトに含めることは、その著作物の著作権を侵害する恐れがあります。
    抽象的で一般的な表現を心がけましょう。




  • AI画像の著作権に関する問い合わせ先


    1)著作権情報センター:著作権Q&A | 公益社団法人著作権情報センター CRIC 

    著作権に関する情報を提供している公的機関、「諸作兼Q&A 電話相談コーナー」



    2)クリエイティブ・コモンズ・ジャパン:FAQ よくある質問と回答 | クリエイティブ・コモンズ・ジャパン (creativecommons.jp) 

    ライセンスの種類や使い方に関する情報を提供


      
    3)弁護士・法律相談 :日本弁護士連合会:HOME (nichibenren.or.jp)

    著作権に詳しい弁護士に相談することも一つの方法です。日本弁護士連合会のウェブサイトなどで、地域や専門分野に応じた弁護士を探すことができます。初回相談は無料の場合も多いです。


プロンプトを作成する際は、著作権や商標権、著作隣接権を尊重し、オリジナルで一般的な表現を使用することが重要です。また、不確かな場合は法律の専門家に相談するか、安全な範囲での表現に留めることをお勧めします。

AI画像ツールの紹介

Midjourneyの生成画像(水墨画風)

特徴・操作性・コストを検討し、自分の目的に合った各AI生成ツールを選択しましょう。

AI画像生成ツールは、テキストやデータをもとに高品質な画像を生成することが可能なツールです。今回は、Midjourney、DALL-E、Stable Diffusionの3つのツールを紹介します。

Midjourney

  • 特徴

    高品質な画像生成が可能で、アーティスティックな作品に適している。



  • 利用方法

    1)まずは Discordをインストールして、ユーザー登録する。

    流れ:
    ⇒ Discord公式サイトにアクセス 
    ⇒「登録」をクリック
    ⇒ メールアドレス&希望のパスワードを入れてアカウントを作る
    ⇒ 電話番号を入力してアカウントを認証済みにする
    ⇒ アカウントの作成後ログインする



    2)次にMidjourneyと連携、料金プランを選ぶ

    流れ:
    ⇒ Midjourney公式サイトへアクセス
    ⇒ 「Sign in」を選択
    ⇒ 認証済みDiscordアカウントでサインイン
    ⇒ 「Manage Sub」を選択
    ⇒ 料金プランを選択
    ⇒ クレジットカード情報を入力



    3)Discordの画面でMidjourneyを使えるようにする

    流れ:
    ⇒ Discordにログインした状態で、左サイドバーの「+」をクリック
    ⇒ 「join a server」ボタンをクリック
    ⇒ 「http://discord.gg/midjourney」をペーストして「join」
    ⇒ 左サイドバーの「NEWCOMER ROOMS」もしくは「GENERAL IMAGE GEN」をクリック
    ⇒ 新人用「newbies-〇〇」or玄人用「general-〇〇」と書かれたチャットルームをクリック
    ⇒ 「Start Onboarding」をクリック
    ⇒ チャットルームに入室



  • 操作性

    1)コマンドベース: 画像生成はDiscordのチャット欄でコマンドを入力することによって行われます。


    2)直感的な操作: コマンドは比較的シンプルで、直感的に操作が可能です。


    3)プロンプトは英語で入力が必須です。「DeePl翻訳(無料)」などを使って日本語⇒英語変換をしながら入力します。




  • 料金体系

    1)無料プラン: 現在(2024年3月)はなし


    2)有料プラン: サブスクリプション制で、月額料金に応じて生成できる画像の数に制限がある。複数の有料プランが用意されています。




  • 生成画像品質

    1)高品質: AI技術を用いて超高品質な画像を生成することができます。


    2)スタイルの多様性: 様々なスタイルやテーマの画像生成が可能です。2~3ケ月おきに新たな新機能・高画質化が追加提供されている。


    3)画像の編集: 生成された画像の一部を編集したり、新たな要素を追加したりすることが可能です。



  • 商用利用: 可能

DALL-E

  • 特徴

    テキストから画像を生成する能力があり、創造的なアイデアを視覚化するのに適している。


  • 利用方法:

    1)Copilot(旧Bing)の画像生成ツール「DesignerのImage Creator(旧名称 Bing Image Creator)」(無料)経由でDALL-Eを利用する
    Microsoft Designer の Image Creator (bing.com)



    2)OpenAI社のChatGPTプラス(有料)経由でChatGPT4を選択しDALL-Eを利用する
    Introducing ChatGPT (openai.com)



  • 操作性

    1)チャットへのプロンプト入力のみで画像生成するため操作は簡単。


    2)画像は1枚のみ出力のため、チャットに修正プロンプトを追加しながら画像を修整していく。
    (例:「全体的に明るいイメージに変えて」⇒「人物は2人に増やして」など。ただし、思ったようには修正されないケースが多い)


    3)プロンプトは日本語・英語のどちらでも入力可能です。(ただし英語の方がエイドが高い・・との説あり)



  • 料金体系:

    1)「DesignerのImage Creator」経由の場合は無料

    2)ChatGPTプラス経由の場合は、ChatGPTプラス課金ありであればDALL-Eは無償



  • 生成画像品質

    1)高品質: DALL-Eは高品質な画像生成が可能で、細部までリアルな画像を作成することができます。

    2)スタイルの多様性:様々なスタイルやテーマの画像を生成することが可能です。



  • 商用利用

    1)「DesignerのImage Creator」経由の場合は商用利用不可

    2)ChatGPTプラス経由の場合は商用利用可

Stable Diffusion

  • 特徴

    オープンソースのAIモデルで、カスタマイズ性が高い。
    自PC環境にStable Diffusionを構築して利用する「ローカル版(仮称)」とWeb上で利用する「GUIツール版(仮称)」の2種類があります。この記事内では「ローカル版」を中心に説明します。


  • 利用方法

    1)ソフトウェアのダウンロード:  GitHubなどからStable Diffusionのソフトウェアをダウンロードします。


    2)環境構築:  必要なライブラリや依存関係をインストールし、実行環境を構築します。


    3)モデルのダウンロード:  Stable Diffusionの学習済みモデルをダウンロードします。


    4)画像生成:  コマンドラインやGUIツールを使用して、テキストプロンプトに基づいて画像を生成します。




  • 操作性

    1)技術的な知識が必要だが、自由度が高い。


    2)コマンドライン操作: 基本的な利用方法はコマンドラインを通じて行われます。


    3)GUIツール: 一部の配布版ではGUIツールが提供されており、より直感的な操作が可能です。




  • 生成画像品質

    1)高品質: Stable Diffusionは高品質な画像生成が可能で、リアルな画像やアートワークの生成に適しています。


    2)多様なスタイル: 様々なスタイルやテーマの画像を生成することが可能です。


    3)画像の編集: 生成された画像の一部を編集したり、新たな要素を追加したりすることが可能です。




  • 料金体系

    1)ローカル版:: Stable Diffusionはオープンソースソフトウェアであり、無料で利用できます。ただし高スペックのハードウェアリソースが必要。基本的にwindows11以上のみ対応可能です。


    2) GUIツール配布版:使用量に応じて料金が発生する場合があります。




  • 商用利用

    基本的には可能(ただし、オープンソースのためライセンス・著作権・クラウドサービスやWebサービスの利用規約の詳細確認が必要)




  • 「GUIツール版」(Stable Diffusionのモデルを利用できるWebサービス)の種類と特徴

    1)Hugging Face Spaces:: インストール不要、ブラウザで直接利用。豊富なモデルリソースを活用可能。使用量に応じて利用制限あり。

     
    2)DreamStudio by Stability AI: Stability AIが提供するStable Diffusionの公式Webサービス。高品質、直感的なインターフェース。使用量に応じて料金が発生する場合がある。


    3)fast-stable-diffusion: インストール不要で、Google Colab上で利用可能。クラウドサービス料金またはAPI料金が発生。

  • AI画像学習の基本を押さえ、生成プロンプトのに習熟により初心者でもAIを活用したイラスト作成に挑戦することができます。
リンク元の記事に戻る

AI画像学習の応用事例

DALL-Eの生成画像(抽象画風)

他の競争相手の作品や画像センスを参考にしよう。

AI画像学習を応用した事例には、以下のようなものがあります。

ブログ記事の作成にAI画像を利用する

  • アイキャッチ画像の生成

    アイキャッチ画像では記事テーマなどの文字文書が記載するのが一般的ですが、AI画像生成ツールは文字記載・・特に「日本語文字」
    が不得意です。

    そのため、Midjourneyなどで作成したAI画像にCanva(無料版で可)使って文字入れします。自分独自のアイキャッチ画像が簡単に作成できます。


  • 記事内の挿入画像

    記事の内容がイメージ化できるような画像を章ごとに作成し、章題の下に配置していきます。見る人の興味を引くような画像となるようにプロンプトを入力します。


YouTubeへアップする絵本動画の作成にAI画像を利用する

  • 自分の映像・声でナレーションを行う場合は、サムネイルや背景画像を作成するのみのため、ある程度簡単に作成できます。

    今までイラストレータに依頼していたものが自作できるようになるメリットがあります。Canva使って文字入れをします。


  • キャラクターや合成音声を使ってナレーションを行う場合は、VREW(動画作成ツール)を使用します。

    VREWは台本作成や音声合成機能は優秀ですが、画像・動画生成の品質はあまり高くありません。

    そのため、Midjourneyなど他AI画像生成ツールでの追加生成やCanvaプロによる画像編集が必要です。


  • 特に絵本などの場合は、絵本のキャラクター主人公のイメージ統一性が大事ですが、同じようなキャラクターを生成するのが難しい課題です。

    Midjourneyでは2024年3月に「キャラクターリファレンス」機能がリリースされ、一貫性を保ったキャラクターを生成できるようになりました。

販売目的の画像を作成する

  • 「イラストAC」他イラスト販売サイトで、自分で作ったAI画像を販売することができます。


  • 販売サイトではAI作成の表示が必要。画像ダウンロードの単価は安く、競争激しいため大きな収益は見込めない。

    ただし、他目的でAI画像生成ツールを使用する場合はイラスト作成費用は廉価のため、販売の工夫をしながら生成ツールの月額使用料くらいを稼ぐことを目標とする。


  • 人気のある画像と自作品の比較や、生成された画像の品質を評価し、改善点を見つける。

AI画像学習の成果と活用法

Midjourneyの生成画像(絵本風)

AI利用による大きな収益化は難しいが、小さな利益を積み上げる方法でいくつもの手段を考えていきましょう。

AI画像学習を通じて得られる成果とその活用法には、以下のようなものがあります。

AIで作った画像を公開するコツ

  • ソーシャルメディアやオンラインギャラリーで共有する

  • 自分のウェブサイトやブログで作品を展示する

  • コンテストや展示会への参加を検討する

AI画像生成の技術とプロンプト

  • プロンプトとは、AIに指示を与えるためのテキスト入力のこと。

  • 効果的なプロンプトの作成方法を学ぶ。

    生成技術・スキル自体を武器に、デザイナーやイラストレータのフリーランスとして活躍できるレベルまで修行しましょう。

  • AI技術の進化に合わせて、最新の生成手法を探求する。

AIを使った絵本動画コンテンツの作成例

  • AIで生成した画像を絵本の挿絵として使用する。

  • AI画像とテキストを組み合わせて動画コンテンツを制作する。

  • 子供向けの教育コンテンツとして活用する。

    参考です: AIたろう さん(AIで絵本、動画、ゲーム作成する方法をYouTub発信)

AI画像学習の成果を活用することで、創造性を発揮し、新たなアート作品やコンテンツを生み出すことができます。

AI画像学習の最新トレンド

DALL-Eの生成画像(「AIトレンド」のイメージ)

現時点では、「ChatGPT Pluse」+「Midjourney」+「Canvaプロ」の組み合わせがベスト!!

AI画像学習の分野は急速に進化しており、以下のような最新のトレンドがあります。

AI画像生成の可能性とChatGPT

  • ChatGPTなどの自然言語処理モデルと組み合わせることで、テキストから直接画像を生成する技術が進展しています。

  • この技術により、より複雑で独創的な画像生成が可能になっています。

  • 動画生成の世界でも、OpenAIからSORAのリリースが発表され、本格的な自動動画生成が可能な道筋が見えてきました。

GPTモデルの応用と現時点の位置

  • GPT(Generative Pre-trained Transformer)モデルは、AI画像生成だけでなく、文章生成や音声認識など幅広い分野で応用されています。


  • GPTモデルの進化により、AI画像生成の精度と多様性が向上しています。

AI画像の精度変遷状況

  • AI画像生成技術の精度は年々向上しており、人間が作ったと見分けがつかないほどの高品質な画像が生成できるようになっています。


  • 精度の向上に伴い、アートや広告、エンターテイメントなど、さまざまな分野での活用が期待されています。

AI画像学習の最新トレンドを把握することで、最先端の技術を活用した創作活動やビジネス展開が可能になります。

まとめ

DALL-Eの生成画像(「星団」イメージ)

AIの可能性をぜひ自分の手で探ってみてください

この記事では、「AI画像の学習方法と注意点」について、シニア向けにわかりやすく解説しました。

AI画像生成のやり方から、AI画像生成ツールの紹介、さらには応用例についても触れました。

AI技術は日々進化しており、私たちの生活にも大きな影響を与えています。

この記事を通じて、AI画像学習の基本的な知識を身につけ、さらに画像生成スキルアップへのきっかけになれば幸いです。

AIの可能性を通じて自分の手で収益化への道を作ってください。

-リスキリング