生成AIとは?文章から音声、画像に動画もAIが創出できる時代がいよいよ到来

生成AIとは?文章から音声、画像に動画もAIが創出できる時代がいよいよ到来
最近、テレビでよく聞く ChatGPTって、何なのかな?
質問をすると、AIが質問者と会話するように回答してくれる“生成AIサービス”だよ
生成AIって、どういうものなの?
簡単に言うと、新しい文章や画像を生み出すことができるAIのことを生成AIって言うんだ

生成AIは膨大なデータから学習をし、それをベースにまるで人が作り出したかのような文脈で文章の返答や回答を得られたり、まったく新しい画像などを生成するものです。

ゼロの状況からものを生み出せるという点が、これまでにない機能として注目されています。

今回は、生成AIについて解説します!

生成AIとは

生成AIとは「Generative AI(ジェネレーティブエーアイ)」とも呼ばれるもので、AIを使ってクリエイティブな文章や画像、プログラム、動画、音声を創出するものです。

実は、生成AIの研究は1950年代からスタートしていました。
当時、イギリスのアラン・チューリングが「機械は考えることができるか?」という問いを提唱したのが、AIの起源とされています。
1956年には、ダートマス会議という科学者たちによる会議で、アメリカのジョン・マッカーシーが人間のように考える機械を「人工知能」と名付けました。

その後、実用化はなかなかできずにいましたが、2000年代に入るとAIは急速に発展します。
きっかけは、2006年にイギリス人のジェフリー・ヒントンがディープラーニングを提唱したことです。
ディープラーニングにより、AI自身が自ら知識を獲得することは、AI研究のブレイクスルーポイントとなりました。
2017年には、Googleがトランスフォーマー・モデルを導入します。
トランスフォーマー・モデルはディープラーニングのひとつであり、インプットされたデータの関係を追跡し、文脈や特徴、意味を学習する仕組みです。
現在広く使われているOpenAIの『GPT-3』や、Googleの『Bard』といった生成AIは、トランスフォーマー・モデルから開発されました。

生成AIはどうやってモノを生み出す?

先ほども触れた通り、生成AIはディープラーニングを用いて自ら学習を重ね、新しいデータを生成します。
ディープラーニングは、ニューラルネットワークという人間の脳にある神経回路を模した機械学習方法です。
外部からデータを受け取る「入力層」、入力層のデータを選別し、学習しやすい状態に変換する「中間層」、結果や結論を出す「出力層」から構成されています。
生成AIは、この中間層でデータの持つ背景など複雑な特徴を抽出し、新たなテキストや画像などを創出するのです。

従来型AIとの違い

「従来型AIはオリジナルコンテンツ創出ができない」のに対し、「生成AIはオリジナルコンテンツを生み出せる」というのが、大きな違いです。

従来型AIは、機械学習で人間が提示したデータをAIが獲得し、それをベースにさまざまな判断を行う場面で用いられます。
たとえば、メールのスパム検知や画像認識、紙に書かれた数字認識などの識別などが挙げられるでしょう。
新しいものを創出する機能はありませんでした。

AIって、凄い技術だね!でも、どういう意味なの?
AIはArtificial Intelligenceという英語が起源で、機械で人間の脳における認知や判断を模倣して、実現する技術っていう意味なんだ
これから、どんどんAIが進化するのかな?
実際にどんなふうにAIが僕たちの暮らしに関わっていくか、楽しみだね!

AIの種類

生成AIの種類としては、「画像生成」「テキスト生成」「音声生成」「動画生成」などがあります。

  • 画像生成AI

画像生成AIでは、テキストで最終的な仕上がりの雰囲気やイメージの指示を出すことで、その指示に沿った、イメージに近い画像を創出できます。
まるで写真のような画像やアニメ、3Dなど、さまざまなものを創出できるAIです。
代表的な画像生成AIにStability AI Japan株式会社の『Stable Diffusion』や、OpenAI社の『DELL-E-2』などがあります。

  • テキスト生成

テキスト生成AIでは、フォームにプロンプト(文章)を送信することで、自動的にテキストを生成するAIです。
OpenAI社が独自に開発した『ChatGPT』や、Google LLCの『Bard』(2023年12月時点試験運転中)などがあり、要約やプログラミングコード生成、キャッチコピーなど、さまざまな作業に活用できます。
Webやアプリのテキストボックスにプロンプト(要望)を入力すると、回答してくれるもので、コピーライティングや企画書作成などアイデア創出の助けにもなります。

  • 音声生成

音声生成AIは、音声やテキストを入力し、新たな音声を生成するAIです。
録音編集方式と規則合成方式があり、録音編集方式はあらかじめ人が発音した音声を蓄積しておき、合成したい内容を組み合わせるものです。
人の声がベースとなりますから、自然な仕上がりとなりますが、イントネーションがおかしくなってしまうこともあります。

もうひとつが、規則合成方式です。
規則合成方式のひとつであるコーパスベース合成方式は、ある人の声を大量に学習させることで、その人と同じ声でセリフを読ませることを実現しました。
本人不在時でも任意のセリフを読ませたり、アバターにも簡単に声をつけることができ、スマートフォンのAIアシスタントなどにも採用されています。
有名な音声生成AIではMurf.AIが運営する『Murf.AI』があります。

  • 動画生成

テキストで指示を出すことで、動画を生成するのが動画生成AIです。

生成AI技術のなかでは難しいとされている動画生成AIですが、2023年3月にRunway AI,Incから『Gen-2』が公開され、これから更なる技術向上に期待が集まっています。

AIはこれからも発展し続け、私たちの生活には欠かせない存在になることが予測されます。
AIとともに、私たち人間も時代の変化に対応していきましょう!

りみまるカテゴリの最新記事