生成AIが出来ることと主なサービス

生成AI(ジェネレーティブAI)ができることは、チャットだけではありません。今や、プロ並みの絵を描いたり、作曲をしたり、映画のような動画を作ったりと、その活用範囲は爆発的に広がっています。

この記事では、生成AIによって作れるもの(成果物)の種類と、それぞれの分野を代表する主要なサービス、そしてそれらを支える技術キーワードについて解説します。

「テキスト生成」「画像生成」「音楽・音声生成」「動画生成」の4つのジャンルに分けて、試験に出るポイントを押さえていきましょう。

テキスト生成AI

最も身近な生成AIです。人間が書くような自然な文章を作成、要約、翻訳することができます。

主要サービス:ClaudeとGemini

  • Claude(クロード):Anthropic社が開発。非常に自然で人間らしい日本語を書くのが得意で、小説の執筆や長文の要約に向いています。
  • Gemini(ジェミニ):Googleが開発。検索エンジンと連携した最新情報の提供や、画像や動画も同時に理解するマルチモーダル機能が強みです。

技術キーワード:自己回帰モデル

テキスト生成AIの多くは、自己回帰モデルという仕組みで動いています。

これは、「これまでの単語の並びを見て、次に来る確率が最も高い単語を予測する」という処理を繰り返すことで文章を作るモデルです。

「昔々、あるところに」→「おじいさんと」→「おばあさんが」…と、前の言葉を振り返りながら(回帰)、次々と予測を繋げていくイメージです。

画像生成AI

テキストで指示(プロンプト)を出すだけで、写真やイラストを生成できるAIです。

ここでは、画像生成AIを活用する際によく出てくる「画像の加工・処理」に関する重要キーワードも合わせて解説します。

学習とデータ処理の技術

AIが画像を正しく認識したり生成したりするためには、データの「下準備」が欠かせません。

  • 画像のリサイズ:AIが処理しやすいように、画像の大きさを統一すること。
  • 正規化:画像の明るさや色のデータを、一定の範囲(0〜1など)に揃えて、AIが計算しやすくすること。

データの水増し(Augmentation)とデータ拡張技術

AIを賢くするには大量の学習データが必要ですが、データが足りないことがあります。そこで使われるのがデータの水増し(augmentation)データ拡張技術です。

これは、手持ちの画像を「回転させる」「反転させる」「一部を切り取る」などの加工をして、擬似的にデータを増やす技術です。

さらに最近では、生成AI自体を使って新しい画像を大量に生成し、それを学習データとして使う(AIで学習データを水増しする)という手法も注目されています。

リマスタリング

リマスタリングとは、古い映画や低画質の写真を、AIを使って高画質に修復する技術です。

生成AIが「本来はこう見えていたはずだ」と推測して画素を埋めることで、昔の映像を4K画質で蘇らせたり、ノイズを除去したりすることができます。

音楽生成AI

テキストで「悲しいピアノの曲を作って」と指示するだけで、オリジナルの楽曲を作曲してくれるAIです。

BGMの作成や、著作権フリーの音楽素材を作るのに適しています。歌詞を入力すると歌声付きの曲を作ってくれるサービス(Suno AIなど)も登場しており、クリエイターの創作活動を補助するツールとして普及しています。

音声生成AI

テキストを読み上げて「人間の声」を生成するAIです。

いわゆる「読み上げソフト」ですが、最新の生成AIは、感情(怒り、喜び)を込めたり、特定の人物の声色(声優や有名人など)をそっくりに再現したりすることができます。

コールセンターの自動応答や、動画のナレーション作成などで活用が進んでいます。

動画生成AI

現在、最も進化が激しい分野です。テキストや1枚の画像から、数秒〜数分の動画を生成します。

主要サービス:SoraとVeo3

  • Sora(ソラ):OpenAIが開発。発表当時、その映像のあまりのリアルさと、物理法則(光の反射や物の動き)の再現度の高さで世界に衝撃を与えました。
  • Veo3(ヴェオ3):Googleが開発した動画生成モデル。1080p以上の高画質生成が可能で、映画制作のようなカメラワークの指定や、長時間の動画生成にも対応しています。

これらの動画生成AIも、基本的にはテキスト生成と同じような仕組み(Transformerなど)を応用し、画像コマの連続を予測して生成しています。

まとめ

生成AIは、テキストだけでなく、視覚・聴覚に関わるあらゆるコンテンツを作り出せるようになっています。

  • テキスト:ClaudeやGeminiなどが活躍。仕組みは「次を予測する」自己回帰モデル。
  • 画像:リサイズや正規化などの前処理が重要。AIでデータを水増し(拡張)することも可能。リマスタリングで高画質化もできる。
  • 動画:SoraやVeo3などの高性能モデルが登場し、リアルな映像制作が可能に。

試験では、「データの水増し(Augmentation)とは何か?」「Soraは何を作るAIか?」といった用語の意味を問う問題が出やすいので、各キーワードとジャンルを正しく結びつけておきましょう!

コメント

タイトルとURLをコピーしました