全 30 用語
ア行
- API エーピーアイ
- Application Programming
Interfaceの略。AIツールの機能を外部のアプリやサービスから利用するための接続方式。ChatGPTのAPI経由で自社サービスにAI機能を組み込む、などの使い方ができる。
- RAG アールエージー
- Retrieval-Augmented
Generation(検索拡張生成)。AIが回答生成時に外部データベースから関連情報を検索して参照する技術。自社の社内文書をAIに参照させたい場合などに使われる。
- エージェント Agent
- AIが自律的にタスクを計画・実行するシステム。単なるQ&Aではなく、Web検索、ファイル操作、コード実行などの「行動」を自分で判断して行うAI。2026年のトレンド。
- エンベディング Embedding
- テキストや画像を数値のベクトル(配列)に変換する技術。意味が近い情報ほど近い数値になるため、類似検索やRAGの基盤技術として使われる。
カ行
- 画像生成AI Image Generation AI
- テキストの指示(プロンプト)から画像を自動生成するAI。代表的なサービスにMidjourney、DALL-E 3、Stable
Diffusionがある。写真風、イラスト風、アート風など様々なスタイルで生成可能。
- 強化学習 Reinforcement Learning
- AIが試行錯誤を通じて「報酬」を最大化するよう学習する手法。ChatGPTではRLHF(人間のフィードバックによる強化学習)が使われており、より人間にとって有用な回答を生成できるようになっている。
サ行
- 生成AI Generative AI
- テキスト、画像、音声、動画などの新しいコンテンツを自動生成できるAI技術の総称。ChatGPT(テキスト)、Midjourney(画像)、Suno(音楽)、Sora(動画)などが代表例。
- 推論 Inference
- 学習済みのAIモデルが新しいデータに対して予測・生成を行うプロセス。ChatGPTにメッセージを送って回答を得るまでの処理が「推論」にあたる。
タ行
- チャットボット Chatbot
- 対話形式でユーザーの質問に自動応答するAIプログラム。ChatGPTはチャットボットの代表例で、自然な会話ができるのが特徴。
- ディープラーニング Deep Learning
- 人間の脳の神経回路を模した「ニューラルネットワーク」を多層構造にした機械学習手法。画像認識、自然言語処理、音声認識など現代AIの基盤技術。
- トークン Token
- AIがテキストを処理する際の最小単位。英語では1単語≒1トークン、日本語では1文字≒1〜3トークン。APIの料金や利用制限はトークン数で計算される。
- トランスフォーマー Transformer
- 2017年にGoogleが発表したAIアーキテクチャ。ChatGPT、Claude、Geminiなど現代の主要AIモデルはすべてTransformerが基盤。「Attention機構」により文脈の理解能力が飛躍的に向上した。
ハ行
- ハルシネーション Hallucination
- AIが事実でない情報をあたかも真実のように生成してしまう現象。「もっともらしい嘘」とも呼ばれる。重要な情報はAIの回答を鵜呑みにせず、必ず裏取りが必要。
- パラメータ Parameters
- AIモデルが学習で獲得する内部の数値。パラメータ数が多いほど複雑なタスクに対応可能とされる。GPT-4は推定1.8兆パラメータ、Llama 3は70Bパラメータなど。
- ファインチューニング Fine-tuning
- 学習済みのAIモデルを特定の用途に合わせて追加学習させること。例えば、GPTベースのモデルを医療用語に特化させたり、自社のトーンに合うよう調整したりする。
- プロンプト Prompt
- AIに対する指示文・入力文のこと。プロンプトの書き方次第でAIの出力品質が大きく変わるため、「プロンプトエンジニアリング」というスキルが重要視されている。
- プロンプトエンジニアリング Prompt Engineering
- AIから望む出力を得るための効果的なプロンプト(指示文)を設計する技術。「役割を与える」「段階的に指示する」「出力形式を指定する」などのテクニックがある。
マ行
- マルチモーダル Multimodal
- テキスト、画像、音声、動画など複数の形式のデータを同時に扱えるAIの能力。GPT-4oやGeminiは画像を見て内容を説明したり、音声で会話したりできるマルチモーダルモデル。
- モデル Model
- データから学習して予測・生成を行うAIプログラムの核。GPT-4o、Claude 3.5 Sonnet、Gemini
Proなどが具体的なモデル名。同じツール(ChatGPT)でもモデルによって性能が異なる。
ラ行
- LLM 大規模言語モデル
- Large Language
Modelの略。大量のテキストデータで学習した巨大なAIモデル。テキスト生成、翻訳、要約、コーディングなど幅広いタスクに対応。GPT-4、Claude、Gemini、Llamaなどが代表例。
- LoRA ローラ
- Low-Rank Adaptationの略。少ないデータと計算コストでAIモデルを効率的にファインチューニングする技術。Stable
Diffusionで特定の画風を学ばせるためによく使われる。
英字・数字
- ChatGPT チャットジーピーティー
- OpenAIが開発した対話型AI。GPT-4をベースにした世界で最も利用されているAIツール。文章生成、翻訳、要約、コーディング、画像生成(DALL-E 3)など万能に使える。
- Claude クロード
- Anthropic社が開発した対話型AI。長文処理(20万トークン)と日本語の自然さが業界トップ。安全性を重視した設計が特徴。
- Diffusionモデル 拡散モデル
- ノイズからデータを徐々に復元することで画像・動画を生成するAI技術。Stable Diffusion、DALL-E 3、Midjourneyなどで使用されている。
- Gemini ジェミニ
- Googleが開発した次世代AI。Google検索、Gmail、Docs、Mapsなどと深く統合されている。マルチモーダル対応で、テキスト・画像・動画を横断的に処理できる。
- GPT ジーピーティー
- Generative Pre-trained
Transformerの略。OpenAIが開発した大規模言語モデルのシリーズ名。GPT-3→GPT-3.5→GPT-4→GPT-4oと進化を続けている。
- GPTs ジーピーティーズ
- ChatGPTの機能の一つで、特定の目的に特化したカスタムチャットボットを作成・共有できる仕組み。コーディング不要でオリジナルAIが作れる。
- OCR 光学文字認識
- 画像やPDF内のテキストを文字データに変換する技術。AIの進化により、手書き文字や複雑なレイアウトの認識精度が大幅に向上している。
- RLHF 人間のフィードバックによる強化学習
- AIの出力に対する人間の評価をフィードバックとして学習させる手法。ChatGPTがハルシネーションを減らし、より安全で有用な回答を生成できるようにするための重要な技術。
🎯 あなたに合ったAIを見つけよう
用語がわかったら、次は実際にAIを使ってみましょう!