30 用語

ア行

API エーピーアイ
Application Programming Interfaceの略。AIツールの機能を外部のアプリやサービスから利用するための接続方式。ChatGPTのAPI経由で自社サービスにAI機能を組み込む、などの使い方ができる。
RAG アールエージー
Retrieval-Augmented Generation(検索拡張生成)。AIが回答生成時に外部データベースから関連情報を検索して参照する技術。自社の社内文書をAIに参照させたい場合などに使われる。
エージェント Agent
AIが自律的にタスクを計画・実行するシステム。単なるQ&Aではなく、Web検索、ファイル操作、コード実行などの「行動」を自分で判断して行うAI。2026年のトレンド。
エンベディング Embedding
テキストや画像を数値のベクトル(配列)に変換する技術。意味が近い情報ほど近い数値になるため、類似検索やRAGの基盤技術として使われる。

カ行

画像生成AI Image Generation AI
テキストの指示(プロンプト)から画像を自動生成するAI。代表的なサービスにMidjourney、DALL-E 3、Stable Diffusionがある。写真風、イラスト風、アート風など様々なスタイルで生成可能。
強化学習 Reinforcement Learning
AIが試行錯誤を通じて「報酬」を最大化するよう学習する手法。ChatGPTではRLHF(人間のフィードバックによる強化学習)が使われており、より人間にとって有用な回答を生成できるようになっている。

サ行

生成AI Generative AI
テキスト、画像、音声、動画などの新しいコンテンツを自動生成できるAI技術の総称。ChatGPT(テキスト)、Midjourney(画像)、Suno(音楽)、Sora(動画)などが代表例。
推論 Inference
学習済みのAIモデルが新しいデータに対して予測・生成を行うプロセス。ChatGPTにメッセージを送って回答を得るまでの処理が「推論」にあたる。

タ行

チャットボット Chatbot
対話形式でユーザーの質問に自動応答するAIプログラム。ChatGPTはチャットボットの代表例で、自然な会話ができるのが特徴。
ディープラーニング Deep Learning
人間の脳の神経回路を模した「ニューラルネットワーク」を多層構造にした機械学習手法。画像認識、自然言語処理、音声認識など現代AIの基盤技術。
トークン Token
AIがテキストを処理する際の最小単位。英語では1単語≒1トークン、日本語では1文字≒1〜3トークン。APIの料金や利用制限はトークン数で計算される。
トランスフォーマー Transformer
2017年にGoogleが発表したAIアーキテクチャ。ChatGPT、Claude、Geminiなど現代の主要AIモデルはすべてTransformerが基盤。「Attention機構」により文脈の理解能力が飛躍的に向上した。

ハ行

ハルシネーション Hallucination
AIが事実でない情報をあたかも真実のように生成してしまう現象。「もっともらしい嘘」とも呼ばれる。重要な情報はAIの回答を鵜呑みにせず、必ず裏取りが必要。
パラメータ Parameters
AIモデルが学習で獲得する内部の数値。パラメータ数が多いほど複雑なタスクに対応可能とされる。GPT-4は推定1.8兆パラメータ、Llama 3は70Bパラメータなど。
ファインチューニング Fine-tuning
学習済みのAIモデルを特定の用途に合わせて追加学習させること。例えば、GPTベースのモデルを医療用語に特化させたり、自社のトーンに合うよう調整したりする。
プロンプト Prompt
AIに対する指示文・入力文のこと。プロンプトの書き方次第でAIの出力品質が大きく変わるため、「プロンプトエンジニアリング」というスキルが重要視されている。
プロンプトエンジニアリング Prompt Engineering
AIから望む出力を得るための効果的なプロンプト(指示文)を設計する技術。「役割を与える」「段階的に指示する」「出力形式を指定する」などのテクニックがある。

マ行

マルチモーダル Multimodal
テキスト、画像、音声、動画など複数の形式のデータを同時に扱えるAIの能力。GPT-4oやGeminiは画像を見て内容を説明したり、音声で会話したりできるマルチモーダルモデル。
モデル Model
データから学習して予測・生成を行うAIプログラムの核。GPT-4o、Claude 3.5 Sonnet、Gemini Proなどが具体的なモデル名。同じツール(ChatGPT)でもモデルによって性能が異なる。

ラ行

LLM 大規模言語モデル
Large Language Modelの略。大量のテキストデータで学習した巨大なAIモデル。テキスト生成、翻訳、要約、コーディングなど幅広いタスクに対応。GPT-4、Claude、Gemini、Llamaなどが代表例。
LoRA ローラ
Low-Rank Adaptationの略。少ないデータと計算コストでAIモデルを効率的にファインチューニングする技術。Stable Diffusionで特定の画風を学ばせるためによく使われる。

英字・数字

ChatGPT チャットジーピーティー
OpenAIが開発した対話型AI。GPT-4をベースにした世界で最も利用されているAIツール。文章生成、翻訳、要約、コーディング、画像生成(DALL-E 3)など万能に使える。
Claude クロード
Anthropic社が開発した対話型AI。長文処理(20万トークン)と日本語の自然さが業界トップ。安全性を重視した設計が特徴。
Diffusionモデル 拡散モデル
ノイズからデータを徐々に復元することで画像・動画を生成するAI技術。Stable Diffusion、DALL-E 3、Midjourneyなどで使用されている。
Gemini ジェミニ
Googleが開発した次世代AI。Google検索、Gmail、Docs、Mapsなどと深く統合されている。マルチモーダル対応で、テキスト・画像・動画を横断的に処理できる。
GPT ジーピーティー
Generative Pre-trained Transformerの略。OpenAIが開発した大規模言語モデルのシリーズ名。GPT-3→GPT-3.5→GPT-4→GPT-4oと進化を続けている。
GPTs ジーピーティーズ
ChatGPTの機能の一つで、特定の目的に特化したカスタムチャットボットを作成・共有できる仕組み。コーディング不要でオリジナルAIが作れる。
OCR 光学文字認識
画像やPDF内のテキストを文字データに変換する技術。AIの進化により、手書き文字や複雑なレイアウトの認識精度が大幅に向上している。
RLHF 人間のフィードバックによる強化学習
AIの出力に対する人間の評価をフィードバックとして学習させる手法。ChatGPTがハルシネーションを減らし、より安全で有用な回答を生成できるようにするための重要な技術。

🎯 あなたに合ったAIを見つけよう

用語がわかったら、次は実際にAIを使ってみましょう!

🎯 AI診断を受ける 🔰 初心者ガイド