AI Agent Hub
AI エージェント / プラグイン情報メディア
← 一覧へ
Voice Mode
CLAUDE

Voice Mode

Voice Mode

Claude Code を音声で操作する MCP サーバー。Whisper で文字起こし、Kokoro / OpenAI TTS で読み上げを行い完全な音声駆動コーディングを実現する。

原文: Natural (2-way) voice conversations with Claude Code
#MCP#音声#Whisper#anthropic#asr#claude#claudecode#kokoro#livekit#mcp#mcp-server#tts
REPO STATS

リポジトリ統計

⭐ Stars
1.1k
🍴 Forks
159
⚠️ Open Issues
46
🌿 Language
Python
📄 License
MIT
🕒 最終更新
2026.05.06 (1日前)
📅 公開日
2025.06.09
🌿 Branch
master
README

ドキュメント

— AI による自動翻訳 (2026.05.07 更新)

VoiceMode

Claude Code(および他の MCP 対応エージェント)との自然な音声会話

PyPI ダウンロード PyPI 月間ダウンロード PyPI 週間ダウンロード

警告

既知の問題 (2026-04-13): Claude Code 2.1.105 以降では、音声会話をキャンセルするために ESC キーを押すと、VoiceMode の MCP サーバーが終了します。対処方法: Claude Code 2.1.104 にピン止めしてください。詳細はディスカッション #349 を参照してください。

VoiceMode を使うと、Claude Code との自然な音声会話が可能になります。音声入力は、タイピングに代わるものではなく、タイピングができないときに利用できるようにするためのものです。

以下の場面に最適です:

  • 次の会議に向かっている途中
  • デバッグ中に料理をしている
  • 長時間の画面作業で目を休めたいとき
  • コーヒー(または犬)を持っているとき
  • 手や目が塞がっているあらゆる瞬間

実行中の様子を見る

VoiceMode デモ

クイックスタート

要件: マイクとスピーカーが搭載されたコンピュータ

オプション 1: Claude Code プラグイン(推奨)

Claude Code ユーザーが最も速く始める方法です:

# Add the VoiceMode marketplace
claude plugin marketplace add mbailey/voicemode

# Install VoiceMode plugin
claude plugin install voicemode@voicemode

## Install dependencies (CLI, Local Voice Services)

/voicemode:install

# Start talking!
/voicemode:converse

オプション 2: Python インストーラパッケージ

依存関係をインストールし、VoiceMode Python パッケージをインストールします。

# Install UV package manager (if needed)
curl -LsSf https://astral.sh/uv/install.sh | sh

# Run the installer (sets up dependencies and local voice services)
uvx voice-mode-install

# Add to Claude Code
claude mcp add --scope user voicemode -- uvx --refresh voice-mode

# Optional: Add OpenAI API key as fallback for local services
export OPENAI_API_KEY=your-openai-key

# Start a conversation
claude converse

手動セットアップについては、スタートガイド を参照してください。

機能

  • 自然な会話 - 自然に話し、すぐに応答を聞く
  • オフラインで動作 - オプションのローカル音声サービス(Whisper STT、Kokoro TTS)
  • 低レイテンシ - 実際の会話のように感じるほど高速
  • スマートな無音検出 - 話を止めると自動的に録音を停止
  • プライバシーオプション - 完全にローカルで実行するか、クラウドサービスを使用

互換性

プラットフォーム: Linux、macOS、Windows (WSL)、NixOS Python: 3.10-3.14

設定

VoiceMode はそのまま動作します。カスタマイズするには以下を実行してください:

# Set OpenAI API key (if using cloud services)
export OPENAI_API_KEY="your-key"

# Or configure via file
voicemode config edit

詳細については設定ガイドを参照してください。

パーミッション設定(オプション)

VoiceMode をパーミッションプロンプトなしで使用するには、~/.claude/settings.json に以下を追加してください:

{
  "permissions": {
    "allow": [
      "mcp__voicemode__converse",
      "mcp__voicemode__service"
    ]
  }
}

詳細についてはパーミッション設定ガイドを参照してください。

ローカル音声サービス

プライバシーまたはオフライン使用のために、ローカル音声サービスをインストールしてください:

  • Whisper.cpp - ローカル音声文字変換
  • Kokoro - 複数音声対応のローカル文字音声変換

これらは OpenAI と同じ API を提供するため、VoiceMode はそれらの間でシームレスに切り替わります。

インストール詳細

プラットフォーム別システム依存関係

Ubuntu/Debian

sudo apt update
sudo apt install -y ffmpeg gcc libasound2-dev libasound2-plugins libportaudio2 portaudio19-dev pulseaudio pulseaudio-utils python3-dev

WSL2 ユーザー: 上記の pulseaudio パッケージはマイク アクセスに必要です。

Fedora/RHEL

sudo dnf install alsa-lib-devel ffmpeg gcc portaudio portaudio-devel python3-devel

macOS

brew install ffmpeg node portaudio

NixOS

# Use development shell
nix develop github:mbailey/voicemode

# Or install system-wide
nix profile install github:mbailey/voicemode
代替インストール方法

ソースからのインストール

git clone https://github.com/mbailey/voicemode.git
cd voicemode
uv tool install -e .

NixOS システム全体

# In /etc/nixos/configuration.nix
environment.systemPackages = [
  (builtins.getFlake "github:mbailey/voicemode").packages.${pkgs.system}.default
];

トラブルシューティング

問題 解決策
マイクへのアクセスなし ターミナル/アプリの権限を確認してください。WSL2 は pulseaudio パッケージが必要です。
UV が見つからない curl -LsSf https://astral.sh/uv/install.sh | sh を実行してください
OpenAI API エラー OPENAI_API_KEY が正しく設定されていることを確認してください
音声出力がない システムのオーディオ設定と利用可能なデバイスを確認してください

デバッグ用の音声を保存する

export VOICEMODE_SAVE_AUDIO=true
# ファイルは ~/.voicemode/audio/YYYY/MM/ に保存されます

ドキュメント

完全なドキュメント: voice-mode.readthedocs.io

リンク

ライセンス

MIT - Failmode プロジェクト


mcp-name: com.failmode/voicemode

— GitHub から取得した原文(一部省略の場合あり)

VoiceMode

Natural voice conversations with Claude Code (and other MCP capable agents)

PyPI Downloads PyPI Downloads PyPI Downloads

Warning

Known Issue (2026-04-13): Claude Code 2.1.105+ kills VoiceMode's MCP server when you press ESC to cancel a voice conversation. Workaround: Pin to Claude Code 2.1.104. See discussion #349 for details.

VoiceMode enables natural voice conversations with Claude Code. Voice isn't about replacing typing - it's about being available when typing isn't.

Perfect for:

  • Walking to your next meeting
  • Cooking while debugging
  • Giving your eyes a break after hours of screen time
  • Holding a coffee (or a dog)
  • Any moment when your hands or eyes are busy

See It In Action

VoiceMode Demo

Quick Start

Requirements: Computer with microphone and speakers

Option 1: Claude Code Plugin (Recommended)

The fastest way for Claude Code users to get started:

# Add the VoiceMode marketplace
claude plugin marketplace add mbailey/voicemode

# Install VoiceMode plugin
claude plugin install voicemode@voicemode

## Install dependencies (CLI, Local Voice Services)

/voicemode:install

# Start talking!
/voicemode:converse

Option 2: Python installer package

Installs dependencies and the VoiceMode Python package.

# Install UV package manager (if needed)
curl -LsSf https://astral.sh/uv/install.sh | sh

# Run the installer (sets up dependencies and local voice services)
uvx voice-mode-install

# Add to Claude Code
claude mcp add --scope user voicemode -- uvx --refresh voice-mode

# Optional: Add OpenAI API key as fallback for local services
export OPENAI_API_KEY=your-openai-key

# Start a conversation
claude converse

For manual setup, see the Getting Started Guide.

Features

  • Natural conversations - speak naturally, hear responses immediately
  • Works offline - optional local voice services (Whisper STT, Kokoro TTS)
  • Low latency - fast enough to feel like a real conversation
  • Smart silence detection - stops recording when you stop speaking
  • Privacy options - run entirely locally or use cloud services

Compatibility

Platforms: Linux, macOS, Windows (WSL), NixOS Python: 3.10-3.14

Configuration

VoiceMode works out of the box. For customization:

# Set OpenAI API key (if using cloud services)
export OPENAI_API_KEY="your-key"

# Or configure via file
voicemode config edit

See the Configuration Guide for all options.

Permissions Setup (Optional)

To use VoiceMode without permission prompts, add to ~/.claude/settings.json:

{
  "permissions": {
    "allow": [
      "mcp__voicemode__converse",
      "mcp__voicemode__service"
    ]
  }
}

See the Permissions Guide for more options.

Local Voice Services

For privacy or offline use, install local speech services:

  • Whisper.cpp - Local speech-to-text
  • Kokoro - Local text-to-speech with multiple voices

These provide the same API as OpenAI, so VoiceMode switches seamlessly between them.

Installation Details

System Dependencies by Platform

Ubuntu/Debian

sudo apt update
sudo apt install -y ffmpeg gcc libasound2-dev libasound2-plugins libportaudio2 portaudio19-dev pulseaudio pulseaudio-utils python3-dev

WSL2 users: The pulseaudio packages above are required for microphone access.

Fedora/RHEL

sudo dnf install alsa-lib-devel ffmpeg gcc portaudio portaudio-devel python3-devel

macOS

brew install ffmpeg node portaudio

NixOS

# Use development shell
nix develop github:mbailey/voicemode

# Or install system-wide
nix profile install github:mbailey/voicemode
Alternative Installation Methods

From source

git clone https://github.com/mbailey/voicemode.git
cd voicemode
uv tool install -e .

NixOS system-wide

# In /etc/nixos/configuration.nix
environment.systemPackages = [
  (builtins.getFlake "github:mbailey/voicemode").packages.${pkgs.system}.default
];

Troubleshooting

Problem Solution
No microphone access Check terminal/app permissions. WSL2 needs pulseaudio packages.
UV not found Run curl -LsSf https://astral.sh/uv/install.sh | sh
OpenAI API error Verify OPENAI_API_KEY is set correctly
No audio output Check system audio settings and available devices

Save Audio for Debugging

export VOICEMODE_SAVE_AUDIO=true
# Files saved to ~/.voicemode/audio/YYYY/MM/

Documentation

Full documentation: voice-mode.readthedocs.io

Links

License

MIT - A Failmode Project


mcp-name: com.failmode/voicemode

RELATED

同じカテゴリの他のツール