生成AI (Generative AI)

生成AIはGenerative artificial intelligenceの訳であり、GenAIやGAIといった表記もあります。Generative artificial intelligence - Wikipedia

テキスト

開発 名称 特徴
OpenAI ChatGPT  
Google Gemini GoogleのチャットAIサービス。かつての呼称はBard グーグルBard、「Gemini」に生まれ変わる 最上位AIモデルは月2900円 - Impress Watch 西田宗千佳 (2024/02/08)
Microsoft Copilot in Windows  
GitHub (Microsoft)、OpenAI GitHub Copilot コーディング支援、コード補完
NVIDIA ChatRTX (Chat with RTX) NVIDIAのGeForce RTXを搭載したPC上でローカルに動作するAIチャットボットのデモアプリ NVIDIA、PC上でローカルに動作するAIチャットボット「Chat with RTX」を無料公開 - CNET Japan Maria Diaz (2024/02/15)

コーディング支援

プログラミング支援AIサービスが主要各社から出そろう 各サービスのまとめ GitHub/AWS/Google/GitLab/JetBrains - ITmedia NEWS 新野淳一 (2023/12/18)

画像

開発 名称 料金 特徴
Stability AI Stable Diffusion   オフラインで利用可能
OpenAI DALL·E 2 (ダリ・ツー) 3枚/日まで無料 商用利用可能 DALL·E 2(ダリ ツー)|分かりやすく解説|AI用語集|ソフトバンク
Adobe Adobe Firefly 25/月まで無料 商用利用可能。Adobe Stockから学習されているため、著作権の問題に抵触しない Adobeから画像生成AI「Firefly」登場。権利関係もクリア - PC Watch 笠原一輝 (2023/03/21) いまさら聞けないアドビの生成AI「Adobe Firefly」を解説しながら使ってみた!【特集・集中企画】 - 窓の杜 パパ (2023/10/02)
Google Imagen (イマジェン)   Google、文章から画像を生成するAI「Imagen」 「DALL-E 2より好まれる」 - ITmedia NEWS (2022/05/25)
Midjourney Midjourney (ミッドジャーニー) 有料 【初心者向け】今更聞けない画像生成AI『Midjourney』の基本操作と手書きから”理想の”画像を生成する方法|チャエン | 重要AIニュースを毎日発信⚡️ チャエン (2023/09/10) Discord - 楽しみ満載のグループチャットでゲームを

Microsoft Designer

Microsoft Designer - 素晴らしいデザインを瞬時に作成

個人的な非商用使用のライセンス。内部ではDALL-Eを使用しています。無料の AI 画像ジェネレーター、Microsoft Designer のテキストから画像へのアプリ | Microsoft Create

15枚/日に制限されています。

「DALL・E 2」採用の新デザインアプリ「Microsoft Designer」無料プレビュー開始 - ITmedia NEWS (2022/10/13)

動画

開発 名称 特徴
Stability AI Stable Video Diffusion オフラインでで利用できます。 Stability-AI/generative-models: Generative Models by Stability AI Stability AI、テキスト→動画の「Stable Video Diffusion」をGitHubで公開 - ITmedia NEWS (2023/11/22)
OpenAI Sora ASCII.jp:OpenAI、動画生成AI「Sora」使った短編ムービー公開 田口和裕 (2024/07/16)
Luma AI Dream Machine  
Runway AI Gen-3 Alpha  
Pika Labs Pika 世界を変えた画像生成AI、さらに進化「Stable Diffusion XL(SDXL)」いよいよ正式公開 - 週刊アスキー 新清士 (2023/07/17)

用語

プロンプト (Prompt)

助言、促進の意味で、ユーザーが生成AIなどに質問や指示をするテキストのことです。

プロンプトエンジニアリング (Prompt engineering)

生成AIにどのように指示するかを決める過程であり、意図した結果を得るためのテキストを考える技術のことです。たとえば、

  • テキストを生成するときには、文章の印象や必要とする内容
  • テキストを翻訳するときは、翻訳先の言語や文脈

を指定します。

プロンプトエンジニアリング(Prompt Engineering)とは?:AI・機械学習の用語辞典 - @IT 一色政彦 (2023/09/20)
思考の連鎖プロンプティング (Chain-of-Thought prompting)

問題を解くまでの手順をプロンプトに含める技術です。 Chain-of-Thought(CoT:思考の連鎖)Prompting(プロンプティング)とは?:AI・機械学習の用語辞典 - @IT 一色政彦 (2023/08/24) [2201.11903] Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

フューショット プロンプティング (Few-shot prompting)

回答の見本となる例文を提示することで、同じように回答させる技術です。Few-shot Learning(フューショット学習)とは?:AI・機械学習の用語辞典 - @IT 一色政彦 (2023/12/04)

ハルシネーション (Hallucination)

幻覚、妄想の意味で、事実と異なる、または文脈と無関係な内容である、誤情報を生成する現象です。

生成内容の正確さを向上させるのに、次のような方法があります。

RAG (Retrieval-Augmented Generation : 検索拡張生成)

独自の情報源を付与する仕組みで、生成内容の正確さを向上し、ハルシネーションを回避しやすくなります。

ファインチューニング (Fine-tuning : 微調整)

再学習させます。

LoRA (ローラ / Low-rank adaptation)

モデルを効率的に微調整するための技術です。

生成AIを特定の絵柄に特化させる「LoRA」 著作権の考え方は? 弁護士が解説(2/2 ページ) - ITmedia NEWS 前野孝太朗 (2024/04/02) 誤解の多い「AIと著作権の関係」 クリエイターが真に戦うべき相手、被害の実態からひもとく:小寺信良のIT大作戦(3/4 ページ) - ITmedia NEWS 小寺信良 (2023/06/29)