OSS Agents JP
オープンソース AI エージェント 日本語ガイド
← 一覧へ
LocalGPT
OTHER

LocalGPT

LocalGPT

ローカルデバイス上で動作するプライベートなドキュメント質問・要約プラットフォーム。データが外部に出ず 100% ローカル実行で、企業秘密や個人情報を安全に保護しながら LLM の力を活用できます。

#RAG#ローカル実行#プライベート
EDITOR'S TAKE

編集部メモ

クラウド一切不要、企業機密をローカルで問い合わせる RAG

LocalGPT は、ドキュメント処理と質問応答を PC 一台で完結させるプライベート RAG プラットフォームです。外部サービスにデータを送らないため、企業秘密や個人情報の扱いが厳格な組織に訴求力があります。モジュール設計で不要な機能を削ぎ落とせ、Python 環境があれば導入できる実用性も評価点。ただし UI は機能重視で、セットアップには技術知識が必要です。

USE CASES

こんな場面で使う

  • 企業秘密を含むドキュメント集を社内 AI アシスタントで検索・要約する
  • 個人の研究論文や契約書をローカルで一元管理し、自然言語で問い合わせる
  • オンプレミス環境での RAG サービス構築、クラウドコスト削減
DIFFERENTIATOR

類似ツールとの違い

LangChain は汎用フレームワーク、Ollama は単なるモデル実行ですが、LocalGPT は RAG パイプライン完備で即座に実装できます。ハイブリッド検索とスマートルーターで、キーワード検索と意味検索を自動使い分けるのも競争優位点です。
CAVEAT

注意点・向かない用途

⚠️ ローカル実行が前提なため、複数ユーザー間での共有には追加工夫が必要。また現状 PDF が主流で、Word や画像処理は未対応な点を確認しましょう。
BEST FOR

向いている読者

セキュリティ重視の企業開発チームプライバシー重視の個人開発者オンプレミス環境への LLM 導入を検討する組織

— OSS Agents JP 編集部による独自評価(LocalGPT に関する観察)

REPO STATS

リポジトリ統計

⭐ Stars
-
🍴 Forks
-
⚠️ Open Issues
-
🌿 Language
-
📄 License
-
🕒 最終更新
-
📅 公開日
-
🌿 Branch
-
REFERENCE

公式ドキュメント(README)

本ハブの独自評価は上記「編集部メモ」が一次情報です。以下は GitHub README の参考転載(折りたたみ)。

📖 GitHub README の日本語訳を読む(AI 自動翻訳 / 参考情報)

— AI による自動翻訳 (2026.05.18 更新)。正確な情報は GitHub の原文 をご確認ください。

LocalGPT - プライベートドキュメントインテリジェンスプラットフォーム

🚀 LocalGPT とは?

LocalGPT は、完全にプライベートなオンプレミス型ドキュメントインテリジェンスプラットフォームです。最先端の AI を活用して、ファイルから質問に答えたり、内容を要約したり、洞察を発見したりできます。データは一切ご自身のマシンから外に出ません。

従来の RAG(Retrieval-Augmented Generation)ツール以上の機能を備えた LocalGPT は、semantic similarity、keyword matching、および Late Chunking をブレンドしたハイブリッド検索エンジンを特徴としており、長文コンテキストの精度を実現します。スマートルーターは各クエリに対して RAG と直接的な LLM 応答を自動的に選択し、コンテキスト拡張と sentence-level Context Pruning により、最も関連性の高いコンテンツのみを表示します。独立した検証パスにより、精度に追加のレイヤーが加わります。

アーキテクチャはモジュール化され軽量です。必要なコンポーネントのみを有効にできます。純粋な Python コアと最小限の依存関係により、LocalGPT はあらゆるインフラストラクチャ上での展開、実行、保守が簡単です。このシステムはフレームワークとライブラリへの最小限の依存関係を備えており、展開と保守が容易です。RAG システムは pure Python であり、追加の依存関係を必要としません。

▶️ ビデオ

このビデオを見て LocalGPT を始めましょう

ホーム インデックス作成 チャット

✨ 機能

  • 最高のプライバシー: お使いのコンピュータにデータが保存され、100% のセキュリティが確保されます。
  • 多様なモデルサポート: Ollama を通じてさまざまなオープンソースモデルをシームレスに統合できます。
  • 多様な埋め込み: さまざまなオープンソース埋め込みから選択できます。
  • LLM の再利用: ダウンロード後、繰り返しダウンロードすることなく LLM を再利用できます。
  • チャット履歴: 以前の会話(セッション内)を記憶します。
  • API: LocalGPT は RAG アプリケーションを構築するために使用できる API を備えています。
  • GPU、CPU、HPU & MPS サポート: 複数のプラットフォームをサポートしており、CUDACPUHPU (Intel® Gaudi®) または MPS などを使用してデータとチャットできます!

📖 ドキュメント処理

  • マルチフォーマットサポート: PDF、DOCX、TXT、Markdown など(現在、PDF のみサポートされています)
  • 文脈的充実: Contextual Retrieval に着想を得た、AI 生成コンテキストによるドキュメント理解の強化
  • バッチ処理: 複数のドキュメントを同時に処理できます

🤖 AI 搭載チャット

  • 自然言語クエリ: 平文で質問できます
  • ソース属性: すべての回答にドキュメント参照が含まれます
  • スマートルーティング: RAG と直接 LLM 応答を自動的に選択します
  • クエリ分解: 複雑なクエリを部分質問に分解して、より良い回答を提供します
  • セマンティック キャッシング: TTL ベースのキャッシングと類似度マッチングで、より高速な応答を実現します
  • セッション認識履歴: インタラクション全体で会話コンテキストを維持します
  • 回答検証: 精度を確保するための独立した検証パスです
  • 複数の AI モデル: 推論用に Ollama、埋め込みとリランキング用に HuggingFace

🛠️ 開発者向け

  • RESTful API: 統合のための完全な API アクセス
  • リアルタイムプログレス: ドキュメント処理中のライブ更新
  • 柔軟な設定: モデル、チャンクサイズ、検索パラメータをカスタマイズできます
  • 拡張可能なアーキテクチャ: カスタムコンポーネント用のプラグインシステム

🎨 モダンインターフェース

  • 直感的な Web UI: クリーンでレスポンシブなデザイン
  • セッション管理: トピック別に会話を整理できます
  • インデックス管理: ドキュメント コレクションの簡単管理
  • リアルタイムチャット: 即座のフィードバックのためのストリーミング応答

🚀 クイックスタート

注: インストールは現在 macOS でのみテストされています。

前提条件

  • Python 3.8 以上(Python 3.11.5 でテスト済み)
  • Node.js 16 以上および npm(Node.js 23.10.0、npm 10.9.2 でテスト済み)
  • Docker(オプション、コンテナ化デプロイ用)
  • 8GB 以上の RAM(16GB 以上推奨)
  • Ollama(両方のデプロイアプローチに必須)

注意

このブランチが main ブランチに移動される前に、インストールのためにこのブランチをクローンしてください:

git clone -b localgpt-v2 https://github.com/PromtEngineer/localGPT.git
cd localGPT

オプション 1: Docker デプロイメント

# Clone the repository
git clone https://github.com/PromtEngineer/localGPT.git
cd localGPT

# Install Ollama locally (required even for Docker)
curl -fsSL https://ollama.ai/install.sh | sh
ollama pull qwen3:0.6b
ollama pull qwen3:8b

# Start Ollama
ollama serve

# Start with Docker (in a new terminal)
./start-docker.sh

# Access the application
open http://localhost:3000

Docker 管理コマンド:

# Check container status
docker compose ps

# View logs
docker compose logs -f

# Stop containers
./start-docker.sh stop

オプション 2: 直接開発(開発に推奨)

# Clone the repository
git clone https://github.com/PromtEngineer/localGPT.git
cd localGPT

# Install Python dependencies
pip install -r requirements.txt

# Key dependencies installed:
# - torch==2.4.1, transformers==4.51.0 (AI models)
# - lancedb (vector database)
# - rank_bm25, fuzzywuzzy (search algorithms)
# - sentence_transformers, rerankers (embedding/reranking)
# - docling (document processing)
# - colpali-engine (multimodal processing - support coming soon)

# Install Node.js dependencies
npm install

# Install and start Ollama
curl -fsSL https://ollama.ai/install.sh | sh
ollama pull qwen3:0.6b
ollama pull qwen3:8b
ollama serve

# Start the system (in a new terminal)
python run_system.py

# Access the application
open http://localhost:3000

システム管理:

# Check system health (comprehensive diagnostics)
python system_health_check.py

# Check service status and health
python run_system.py --health

# Start in production mode
python run_system.py --mode prod

# Skip frontend (backend + RAG API only)
python run_system.py --no-frontend

# View aggregated logs
python run_system.py --logs-only

# Stop all services
python run_system.py --stop
# Or press Ctrl+C in the terminal running python run_system.py

サービスアーキテクチャ: run_system.py ランチャーは 4 つの主要なサービスを管理します:

  • Ollama Server (port 11434): AI モデル提供
  • RAG API Server (port 8001): ドキュメント処理と取得
  • Backend Server (port 8000): セッション管理と API エンドポイント
  • Frontend Server (port 3000): React/Next.js ウェブインターフェース

オプション 3: 手動コンポーネント起動

# Terminal 1: Start Ollama
ollama serve

# Terminal 2: Start RAG API
python -m rag_system.api_server

# Terminal 3: Start Backend
cd backend && python server.py

# Terminal 4: Start Frontend
npm run dev

# Access at http://localhost:3000

詳細インストール

1. システム依存関係のインストール

Ubuntu/Debian:

sudo apt update
sudo apt install python3.8 python3-pip nodejs npm docker.io docker-compose

macOS:

brew install python@3.8 node npm docker docker-compose

Windows:

# Install Python 3.8+, Node.js, and Docker Desktop
# Then use PowerShell or WSL2

2. AI モデルのインストール

Ollama のインストール(推奨):

# Install Ollama
curl -fsSL https://ollama.ai/install.sh | sh

# Pull recommended models
ollama pull qwen3:0.6b          # Fast generation model
ollama pull qwen3:8b            # High-quality generation model

3. 環境設定

# Copy environment template
cp .env.example .env

# Edit configuration
nano .env

主要設定オプション:

# AI Models (referenced in rag_system/main.py)
OLLAMA_HOST=http://localhost:11434

# Database Paths (used by backend and RAG system)
DATABASE_PATH=./backend/chat_data.db
VECTOR_DB_PATH=./lancedb

# Server Settings (used by run_system.py)
BACKEND_PORT=8000
FRONTEND_PORT=3000
RAG_API_PORT=8001

# Optional: Override default models
GENERATION_MODEL=qwen3:8b
ENRICHMENT_MODEL=qwen3:0.6b
EMBEDDING_MODEL=Qwen/Qwen3-Embedding-0.6B
RERANKER_MODEL=answerdotai/answerai-colbert-small-v1
RELATED

同じカテゴリの他のツール