2022年一番の流行は生成系AI(Generative AI)
2022年のIT業界の1番のトピックと言えば、生成系AI(Generative AI)だろう。
生成系AIとはその名の通り、何かを作り出して(生成して)くれるAIのことだ。
これまでのAIはデータをAIに食べさせて(学習させて)、そのデータをもとに予測したり、判別したりさせるものだった。
ところが、生成系AIは文章、画像、音、動画など人間にしか出来ないと思われていた「生み出す」ということを行ってくれる。
この「生み出す」という行為を、プログラミングの様な特別な知識がなくとも出来てしまうところが
大きな流行を生んだ要因だろう。
また、これまでのAIは予測や判別といったビジネス面での利用が主体であったが、
生成系AIは「お遊び」的な要素も強く、仕事に直接関係なくともとりあえず使ってみようという人も多かったようだ。
中でもChatGPTは大流行
生成系AIの中でも最も流行したと言って過言ではないのが、OpenAIのChatGPTだろう。
GPTとは、Generative Pre-trained Transformerの略である。
TransformerはAIの学習モデルのことで、Preとある様に学習済のAIである。
学習はOpenAI独自の情報ではなく、WEB上の情報を大量に学習させている。
深く知っていくと難解な技術だが、ごく簡単なイメージとしては、言葉の関連の近さを学習させている。
なので「日本の首都は?」というと「東京」という回答が得られる。
これは、学習データに「日本」という単語と「首都」という単語の両方から近い位置に「東京」があるので、
「東京」という回答が得られるという仕組みだ。
文章の生成も同じ仕組みで行われる。
急激に増えた画像生成AI
(midjourny,Stable Diffusion,DALL-E)
ChatGPTと共に大流行したのが、画像生成系AIだ。
midjoury(ミッドジャーニー)、Stable Diffusion(ステイブルディフュージョン)、DALL-E(ダリ)などが主流のAIだ。
midjouryは有料だが環境を構築する必要がなく、WEBブラウザのみで画像がすぐに作成できる手軽さがある。
プロンプトを英語で打ち込む必要はあるが、優秀な翻訳ツールは様々あるので苦にはならないだろう。
出力した画像の解像度も高く、優秀だ。イラストレーターでもない限り、
絶対に作成できないレベルの画像をものの数十秒で複数毎作成してしまう。
イラストだけでなく、カメラで撮影した写真の様な画像も作成でき、
言われなければ写真なのか画像なのか見分けがつかないほどだ。
DALL-EはMicrosoftが無料利用版を公開していたが、今年の秋以降、ChatGPTに同載され、
ChatgGPT上からの利用が可能になっている。
Stable Diffusionはオープンソースソフトウェアであり、一定以上のGPUがあるPCで、Pythonなどの導入に難が無い方
であれば、無料で画像作成環境が構築できる。
midjournyやDALL-Eは、暴力的、アウトサイダー、性的など公序良俗に反する様な画像は出力できない様に制御されている。
この辺りは、開発者の教示が見られる。
なぜこれほど生成系AIが流行ったか
ChatGPTは単純に言ってしまえば、質問者の文章(プロンプトと言われる入力情報)から一番確率的に高いものを
データに従って返しているだけという事になる。
簡単な様だか、これが複数の言語で行えていること、質問者の意図を読み取っているかのような返答をする上に、
回答の条件を絞ったり、GPTの役割を設定させたりすることができ、それにより大きく回答の精度が変わる
ことがメディア等でも大きく取り上げられた原因だろう。
プロンプトを呪文と呼び、プロンプトエンジニアと呼ばれるスキルが生まれたのも面白い動きであった。
忖度はしないが、不満も言わない、それでいて世の中の大量の情報を知っている有能な秘書を
月20ドルで雇える様な状態になったようなものだ。
また、画像生成AIについては、世界的に有名な写真家がAIで作成したものと言わずに写真のコンテストに提出し、賞を得た。
要するに写真のプロにも見分けがつかないということだ。画像生成に関してAIは既にその域に達している。
文章や動画についても、AIが作成したと言われなければ分からないレベルになるのはそう遠くないだろう。
これまでパソコンは操作する人が行ったこと以上の結果は得られなかったり、
プログラミング言語を覚える必要があったので、誰でも気軽にという訳にはいかなかった。
しかし、生成系AIの登場により、自分が入力した情報より明らかに多い情報がアウトプットされる。
使い方によっては、自分の仕事や趣味などに掛かる時間を相当量短縮できるし、
今まで1人で悩んでいた事も(確からしさは別にして)簡単にアドバイスや気付きが得られる。
これが現代の魔法でなくて何だろうか。
利用者を選ばない生成系AIが流行ったのは必然と言えるだろう。
生成系AIは一過性の流行で終わるのか
毎年の様に流行するサービスが登場するIT業界。
そのまま残るサービスもあるが、いつの間にか使われなくなるサービスも多い。
生成系AIはどうなるだろうか。
私は生成系AIは一過性の流行では終わらないと予想する。
ChatGPTやmidjournyなど単独のサービスを使うかどうかは利用者の意思によって分かれていくが、
現代の生活において、何らかのITサービスを使うことは避けて通れない。
これから先は一般的なサービスに生成系AIが普通に取り込まれていくことになるだろう。
利用者は意識せずに生成系AIを利用する環境になる。
2023年にどの様なITサービスが流行するか分からないが、「人間の能力の拡張」といった領域が引き続きポイントになるだろう。