ナレッジ化 ステップバイステップガイド
まずはローカル上に保存するところから段階的にステップアップし、最終的にRAGを構築する流れです
全体の流れ
ローカル上にデータを集約させる
録画・議事録データを自分のパソコンに集める
Claude CodeにGoogle Drive MCPを接続する
Claude CodeからGoogleサービス(Drive, Calendar等)にアクセスできる状態にする設定を行います
Meetの録画がGoogle Driveに自動保存されていることを確認
Google Meetの録画は自動でGoogle Drive内の「Meet Recordings」フォルダに保存されます
MCP経由でDriveから録画・文字起こしデータを取得
Claude Codeに「Meetの録画をダウンロードして」と指示するだけでローカルに取得できます
Zoomの設定で「ローカルレコーディング」をONにする
設定 > レコーディング > ローカルレコーディング を有効化
ミーティング中に「レコーディング」ボタンを押す
録画データは自動的にパソコンの指定フォルダに保存されます(デフォルト: ドキュメント/Zoom)
クラウドレコーディングの場合はZoom管理画面からダウンロード
有料プランの場合、Zoomクラウドに保存された録画をローカルにダウンロードすることも可能です
Loomダッシュボードから録画をダウンロード
録画の「...」メニュー > Download でMP4ファイルとしてローカルに保存できます
完了時の状態
Meet / Zoom / Loom の録画ファイルがすべて自分のパソコン上にダウンロードされている
集約させたデータを整理する
ルールを決めてフォルダに分類する
ナレッジ/
01_打ち合わせ/
2026-03-31_〇〇様MTG.mp4
2026-03-31_〇〇様MTG_議事録.txt
02_勉強会/
2026-03-28_第10回勉強会.mp4
03_お客様共有/
2026-03-30_操作説明_Loom.mp4
日付を先頭に
YYYY-MM-DD形式で時系列順に並ぶ
種類で分ける
打ち合わせ・勉強会・共有で分類
テキスト化する
動画から文字起こしも一緒に保存
完了時の状態
録画と文字起こしが種類別・日付順に整理されたフォルダ構成ができている
集約させたデータを活用する
Claude Codeからフォルダを読み込んで業務に活かす
「先月の〇〇様との打ち合わせで決まったことをまとめて」
Claude Codeが該当フォルダの議事録を読み、要点をまとめてくれる
「過去の勉強会で〇〇について話した内容を教えて」
勉強会フォルダの文字起こしから関連する内容を探して要約してくれる
「〇〇様への提案書を、過去の打ち合わせ内容を踏まえて作って」
過去のやりとりを参照しながら、文脈に沿った提案書を生成してくれる
ポイント
Claude Codeは同じフォルダ内のファイルを自動で読めるため、整理されたフォルダをプロジェクトとして開くだけで、すぐにデータを活用できます。特別な設定は不要です。
完了時の状態
Claude Codeに質問するだけで、過去の打ち合わせ・勉強会の内容をすぐに引き出せる
応用編 - RAGで独自ナレッジを構築
ステップ1〜3が完了したら、さらに高度な活用へ
蓄積したデータをAIが高速に検索できる形(ベクトルデータベース)に変換する技術です。
大量のデータがあっても、必要な情報を瞬時に見つけ出してAIが回答してくれるようになります。
Step 3まで(フォルダ読み込み)
ファイルを1つずつ読むので、データが多いと時間がかかる
RAG化後
数百件のデータでも一瞬で関連情報を見つけ出せる
議事録・文字起こし
テキストデータ
Voyage AI
ベクトル変換
ベクトルDB
保存・検索
Claude Code
質問&回答
テキストを「ベクトル」という数値に変換してDBに保存。質問もベクトルに変換し、意味が近いデータを瞬時に検索してAIが回答します。
テキストを「意味を持った数値の列(ベクトル)」に変換するサービスです。
日本語の精度が非常に高く、議事録のような長文でも正確に意味を捉えます。
Voyage AIのアカウントを作成しAPIキーを取得
無料枠あり。サインアップ後、ダッシュボードからAPIキーを発行します
テキストデータをVoyage AIに送信してベクトル化
議事録テキストをAPIに渡すと、1024次元のベクトル(数値の列)に変換されます
変換されたベクトルをDBに保存
元のテキストとベクトルをセットでデータベースに格納します
なぜVoyage AI? OpenAIのEmbeddingより日本語精度が高く、コストも安い。Anthropic(Claude開発元)も推奨しているサービスです。
ベクトル化したデータを保存・検索するためのデータベースです。
用途や規模に合わせて選べます。
ファイル1つで動作。サーバー不要でパソコン上だけで完結するため、まず始めるならこれ。
クラウドで管理されるため、複数人で使ったり大量データを扱う場合に向いている。
自社サーバーで動かせるので、データを外部に出したくない場合に最適。Dockerで簡単起動。
既存のデータベースにベクトル検索を追加できる。Webアプリと組み合わせる場合に便利。
どれを選ぶ?
まず試したい → SQLite(インストール不要、すぐ始められる)
チームで使いたい → Pinecone or Supabase(クラウドで共有)
データを外に出したくない → Qdrant(自社サーバーで完結)
ステップ2で整理した文字起こしデータを用意
テキストファイルがあればOK。そのまま使えます
Voyage AIでテキストをベクトルに変換
APIキーを設定し、テキストを送信するだけで自動変換
ベクトルDBに保存する
まずはSQLiteがおすすめ。元テキスト + ベクトルをセットで保存
MCPサーバーとしてClaude Codeに接続
検索APIを作り、Claude Codeの拡張機能として接続。いつでも自然言語で検索可能に
RAG化するメリット
大量データでも高速検索
関連度の高い情報を正確に抽出
自社データだけの安全なAI活用
データが増えるほど賢くなる
完了時の状態
Claude Codeに「〇〇について過去の打ち合わせで何か話してた?」と聞くだけで、数百件の議事録から瞬時に関連情報を見つけて回答してくれる
RAGの種類と進化
RAGは「検索して貼り付けるだけ」の時代から、自律的に判断・最適化するシステムへ進化しています
RAGの進化の流れ
Naive RAG(基本RAG)
入門最もシンプルな「検索して生成する」パイプライン
質問する
ベクトル検索
上位K件取得
AIが回答生成
シンプルで導入が簡単
検索精度が低いことがある
ステップ1〜3 + 応用編で構築するのがこのレベル。まずはここから始めましょう。
Advanced RAG(改良版RAG)
実用検索の前後に工夫を加えて精度を大幅に向上
検索前の改良
クエリの書き換え・分解、仮想回答から検索する(HyDE)
検索の改良
キーワード検索 + ベクトル検索のハイブリッド、リランキング(結果の再順位付け)
検索後の改良
不要な情報の圧縮・除去、関連性フィルタリング
Naive RAGの精度に不満が出てきたら、このレベルにアップグレード。
Graph RAG(グラフRAG)
構造化データの「関係性」をグラフ構造で保持し、つながりを辿って検索する
文書
テキスト
エンティティ抽出
人・場所・概念
ナレッジグラフ
関係性のネットワーク
グラフ検索
関係を辿る
例: 「A社の担当者が関わったプロジェクトで、B社とも連携したものは?」
ベクトル検索だけでは難しい「関係を辿る検索」が得意
複雑な関係性の質問に強い
大規模文書の全体像を俯瞰
構築コストが高い
リアルタイム更新が難しい
Agentic RAG(エージェントRAG)
最先端AIエージェントがRAG全体を自律的にコントロールする
従来のRAGは「質問→検索→回答」の固定パイプラインですが、Agentic RAGではAIが自分で考えて行動します。
AIエージェントが自律的に判断すること
検索が必要かどうか判断
自分の知識で答えられるなら検索しない
どのデータソースを使うか選択
議事録DB、社内Wiki、Web検索など複数ソースから最適なものを選ぶ
検索結果を評価して追加検索
情報が足りなければ自動で別の角度から再検索(マルチホップ)
ツールも使う
計算、API呼び出し、コード実行など検索以外のアクションも実行
例: 「先月のA社との売上を集計して、過去の打ち合わせで話した目標と比較して」
議事録検索 → 売上データ取得 → 計算 → 比較レポート生成 を自律的に実行
Single Agent
1体が全て制御
Multi Agent
専門エージェントが協力
Hierarchical
指揮官+実行部隊
Self-RAG / CRAG(自己修正型RAG)
品質重視AIが自分の検索結果と回答を自己チェック・修正する
Self-RAG
検索が必要か自己判断
複数回答を生成して比較
「根拠があるか」を自己検証
CRAG(Corrective RAG)
検索結果の関連性を評価
関連なし → Web検索に切替
不要な情報を自動除去
ハルシネーション(でたらめ回答)を防ぎたい場合に有効。
Adaptive RAG(適応型RAG)
効率化質問の難易度に応じて、自動で検索戦略を切り替える
「Zoomのショートカットキーは?」
→ AI内部知識で回答。検索スキップ
「先月のMTGの決定事項は?」
→ 1回の検索で回答
「過去半年のA社案件の傾向を分析して」
→ 複数回検索+推論で回答
簡単な質問に余計なコストをかけず、難しい質問には全力を出す。
その他の注目手法
特定の課題を解決する専門的なアプローチ
Multi-Modal RAG
テキストだけでなく画像・表・グラフも検索対象にする
RAG Fusion
1つの質問から複数クエリを生成し、検索の網羅性を向上
Cache-Augmented (CAG)
データ量が少なければ全部AIに読ませる方が高精度な場合も
Contextual Retrieval
Anthropic提唱。チャンクに文脈説明を自動付与して精度向上
どれを選ぶ? ー 状況別おすすめ
まず始めたい
→ Naive RAG(ステップ1〜応用編の内容)で十分。シンプルに始めましょう。
精度を上げたい
→ Advanced RAG。リランキングやハイブリッド検索を追加。
複数データソースを横断したい
→ Agentic RAG。議事録・社内Wiki・メール等をAIが自律的に使い分ける。
人や案件の関係性を辿りたい
→ Graph RAG。「AさんとBさんが関わったプロジェクト」のような検索に強い。
使用ツール一覧
Google Meet
打ち合わせ録画
Zoom
勉強会・文字起こし
Loom
お客様共有