Claude Code(および他の MCP 対応エージェント)との自然な音声会話
警告
既知の問題 (2026-04-13): Claude Code 2.1.105 以降では、音声会話をキャンセルするために ESC キーを押すと、VoiceMode の MCP サーバーが終了します。対処方法: Claude Code 2.1.104 にピン止めしてください。詳細はディスカッション #349 を参照してください。
VoiceMode を使うと、Claude Code との自然な音声会話が可能になります。音声入力は、タイピングに代わるものではなく、タイピングができないときに利用できるようにするためのものです。
以下の場面に最適です:
- 次の会議に向かっている途中
- デバッグ中に料理をしている
- 長時間の画面作業で目を休めたいとき
- コーヒー(または犬)を持っているとき
- 手や目が塞がっているあらゆる瞬間
要件: マイクとスピーカーが搭載されたコンピュータ
Claude Code ユーザーが最も速く始める方法です:
# Add the VoiceMode marketplace
claude plugin marketplace add mbailey/voicemode
# Install VoiceMode plugin
claude plugin install voicemode@voicemode
## Install dependencies (CLI, Local Voice Services)
/voicemode:install
# Start talking!
/voicemode:converse依存関係をインストールし、VoiceMode Python パッケージをインストールします。
# Install UV package manager (if needed)
curl -LsSf https://astral.sh/uv/install.sh | sh
# Run the installer (sets up dependencies and local voice services)
uvx voice-mode-install
# Add to Claude Code
claude mcp add --scope user voicemode -- uvx --refresh voice-mode
# Optional: Add OpenAI API key as fallback for local services
export OPENAI_API_KEY=your-openai-key
# Start a conversation
claude converse手動セットアップについては、スタートガイド を参照してください。
- 自然な会話 - 自然に話し、すぐに応答を聞く
- オフラインで動作 - オプションのローカル音声サービス(Whisper STT、Kokoro TTS)
- 低レイテンシ - 実際の会話のように感じるほど高速
- スマートな無音検出 - 話を止めると自動的に録音を停止
- プライバシーオプション - 完全にローカルで実行するか、クラウドサービスを使用
プラットフォーム: Linux、macOS、Windows (WSL)、NixOS Python: 3.10-3.14
VoiceMode はそのまま動作します。カスタマイズするには以下を実行してください:
# Set OpenAI API key (if using cloud services)
export OPENAI_API_KEY="your-key"
# Or configure via file
voicemode config edit詳細については設定ガイドを参照してください。
VoiceMode をパーミッションプロンプトなしで使用するには、~/.claude/settings.json に以下を追加してください:
{
"permissions": {
"allow": [
"mcp__voicemode__converse",
"mcp__voicemode__service"
]
}
}詳細についてはパーミッション設定ガイドを参照してください。
プライバシーまたはオフライン使用のために、ローカル音声サービスをインストールしてください:
- Whisper.cpp - ローカル音声文字変換
- Kokoro - 複数音声対応のローカル文字音声変換
これらは OpenAI と同じ API を提供するため、VoiceMode はそれらの間でシームレスに切り替わります。
プラットフォーム別システム依存関係
sudo apt update
sudo apt install -y ffmpeg gcc libasound2-dev libasound2-plugins libportaudio2 portaudio19-dev pulseaudio pulseaudio-utils python3-devWSL2 ユーザー: 上記の pulseaudio パッケージはマイク アクセスに必要です。
sudo dnf install alsa-lib-devel ffmpeg gcc portaudio portaudio-devel python3-develbrew install ffmpeg node portaudio# Use development shell
nix develop github:mbailey/voicemode
# Or install system-wide
nix profile install github:mbailey/voicemode代替インストール方法
git clone https://github.com/mbailey/voicemode.git
cd voicemode
uv tool install -e .# In /etc/nixos/configuration.nix
environment.systemPackages = [
(builtins.getFlake "github:mbailey/voicemode").packages.${pkgs.system}.default
];
