AI用語集 — 生成AI・ChatGPT関連の専門用語をわかりやすく解説 — AIツールナビ

全 30 用語

ア行カ行サ行タ行ハ行マ行ラ行英字

ア行

API エーピーアイ: Application Programming Interfaceの略。AIツールの機能を外部のアプリやサービスから利用するための接続方式。ChatGPTのAPI経由で自社サービスにAI機能を組み込む、などの使い方ができる。

RAG アールエージー: Retrieval-Augmented Generation（検索拡張生成）。AIが回答生成時に外部データベースから関連情報を検索して参照する技術。自社の社内文書をAIに参照させたい場合などに使われる。

エージェント Agent: AIが自律的にタスクを計画・実行するシステム。単なるQ&Aではなく、Web検索、ファイル操作、コード実行などの「行動」を自分で判断して行うAI。2026年のトレンド。

エンベディング Embedding: テキストや画像を数値のベクトル（配列）に変換する技術。意味が近い情報ほど近い数値になるため、類似検索やRAGの基盤技術として使われる。

カ行

画像生成AI Image Generation AI: テキストの指示（プロンプト）から画像を自動生成するAI。代表的なサービスにMidjourney、DALL-E 3、Stable Diffusionがある。写真風、イラスト風、アート風など様々なスタイルで生成可能。

強化学習 Reinforcement Learning: AIが試行錯誤を通じて「報酬」を最大化するよう学習する手法。ChatGPTではRLHF（人間のフィードバックによる強化学習）が使われており、より人間にとって有用な回答を生成できるようになっている。

サ行

生成AI Generative AI: テキスト、画像、音声、動画などの新しいコンテンツを自動生成できるAI技術の総称。ChatGPT（テキスト）、Midjourney（画像）、Suno（音楽）、Sora（動画）などが代表例。

推論 Inference: 学習済みのAIモデルが新しいデータに対して予測・生成を行うプロセス。ChatGPTにメッセージを送って回答を得るまでの処理が「推論」にあたる。

タ行

チャットボット Chatbot: 対話形式でユーザーの質問に自動応答するAIプログラム。ChatGPTはチャットボットの代表例で、自然な会話ができるのが特徴。

ディープラーニング Deep Learning: 人間の脳の神経回路を模した「ニューラルネットワーク」を多層構造にした機械学習手法。画像認識、自然言語処理、音声認識など現代AIの基盤技術。

トークン Token: AIがテキストを処理する際の最小単位。英語では1単語≒1トークン、日本語では1文字≒1〜3トークン。APIの料金や利用制限はトークン数で計算される。

トランスフォーマー Transformer: 2017年にGoogleが発表したAIアーキテクチャ。ChatGPT、Claude、Geminiなど現代の主要AIモデルはすべてTransformerが基盤。「Attention機構」により文脈の理解能力が飛躍的に向上した。

ハ行

ハルシネーション Hallucination: AIが事実でない情報をあたかも真実のように生成してしまう現象。「もっともらしい嘘」とも呼ばれる。重要な情報はAIの回答を鵜呑みにせず、必ず裏取りが必要。

パラメータ Parameters: AIモデルが学習で獲得する内部の数値。パラメータ数が多いほど複雑なタスクに対応可能とされる。GPT-4は推定1.8兆パラメータ、Llama 3は70Bパラメータなど。

ファインチューニング Fine-tuning: 学習済みのAIモデルを特定の用途に合わせて追加学習させること。例えば、GPTベースのモデルを医療用語に特化させたり、自社のトーンに合うよう調整したりする。

プロンプト Prompt: AIに対する指示文・入力文のこと。プロンプトの書き方次第でAIの出力品質が大きく変わるため、「プロンプトエンジニアリング」というスキルが重要視されている。

プロンプトエンジニアリング Prompt Engineering: AIから望む出力を得るための効果的なプロンプト（指示文）を設計する技術。「役割を与える」「段階的に指示する」「出力形式を指定する」などのテクニックがある。

マ行

マルチモーダル Multimodal: テキスト、画像、音声、動画など複数の形式のデータを同時に扱えるAIの能力。GPT-4oやGeminiは画像を見て内容を説明したり、音声で会話したりできるマルチモーダルモデル。

モデル Model: データから学習して予測・生成を行うAIプログラムの核。GPT-4o、Claude 3.5 Sonnet、Gemini Proなどが具体的なモデル名。同じツール（ChatGPT）でもモデルによって性能が異なる。

ラ行

LLM 大規模言語モデル: Large Language Modelの略。大量のテキストデータで学習した巨大なAIモデル。テキスト生成、翻訳、要約、コーディングなど幅広いタスクに対応。GPT-4、Claude、Gemini、Llamaなどが代表例。

LoRA ローラ: Low-Rank Adaptationの略。少ないデータと計算コストでAIモデルを効率的にファインチューニングする技術。Stable Diffusionで特定の画風を学ばせるためによく使われる。

英字・数字

ChatGPT チャットジーピーティー: OpenAIが開発した対話型AI。GPT-4をベースにした世界で最も利用されているAIツール。文章生成、翻訳、要約、コーディング、画像生成（DALL-E 3）など万能に使える。

Claude クロード: Anthropic社が開発した対話型AI。長文処理（20万トークン）と日本語の自然さが業界トップ。安全性を重視した設計が特徴。

Diffusionモデル拡散モデル: ノイズからデータを徐々に復元することで画像・動画を生成するAI技術。Stable Diffusion、DALL-E 3、Midjourneyなどで使用されている。

Gemini ジェミニ: Googleが開発した次世代AI。Google検索、Gmail、Docs、Mapsなどと深く統合されている。マルチモーダル対応で、テキスト・画像・動画を横断的に処理できる。

GPT ジーピーティー: Generative Pre-trained Transformerの略。OpenAIが開発した大規模言語モデルのシリーズ名。GPT-3→GPT-3.5→GPT-4→GPT-4oと進化を続けている。

GPTs ジーピーティーズ: ChatGPTの機能の一つで、特定の目的に特化したカスタムチャットボットを作成・共有できる仕組み。コーディング不要でオリジナルAIが作れる。

OCR 光学文字認識: 画像やPDF内のテキストを文字データに変換する技術。AIの進化により、手書き文字や複雑なレイアウトの認識精度が大幅に向上している。

RLHF 人間のフィードバックによる強化学習: AIの出力に対する人間の評価をフィードバックとして学習させる手法。ChatGPTがハルシネーションを減らし、より安全で有用な回答を生成できるようにするための重要な技術。