重要
🚀 Gateway 2.0(プレリリース)Portkey のコアエンタープライズゲートウェイは、2.0 リリースでオープンソースにマージされます。プレリリースブランチは ここ で試すことができます。 Portkey の次のステップについては、Series A アナウンスメント をご覧ください。
🆕 Portkey Models - 40 以上のプロバイダーにおける 2,300 以上のモデルのオープンソース LLM 価格情報。詳細を見る →
ドキュメント | Enterprise | ホステッド ゲートウェイ | チェンジログ | API リファレンス
AI ゲートウェイ は、1,600 以上の言語、ビジョン、オーディオ、および画像モデルへの高速で信頼性の高い安全なルーティング用に設計されています。軽量でオープンソース、エンタープライズ対応のソリューションで、2 分以内に任意の言語モデルと統合できます。
- 超高速(<1ms のレイテンシ)で小さなフットプリント(122kb)
- 実績のある - 毎日 10B 以上のトークンを処理
- エンタープライズ対応 - セキュリティ、スケール、カスタム展開を強化
- 2分以内に任意のLLMと統合 - クイックスタート
- 自動リトライとフォールバックによるダウンタイム防止
- ロードバランシングと条件付きルーティングでAIアプリをスケール
- ガードレールでAIデプロイメントを保護
- マルチモーダル機能でテキストを超える
- エージェントワークフロー統合を探索
- MCP Gatewayを使用してエンタープライズ認証と可観測性でMCPサーバーを管理
# ゲートウェイをローカルで実行します(Node.jsとnpmが必要)
npx @portkey-ai/gatewayデプロイメントガイド:ゲートウェイは
http://localhost:8787/v1で実行中ですゲートウェイコンソールは
http://localhost:8787/public/で実行中です
# pip install -qU portkey-ai
from portkey_ai import Portkey
# OpenAI compatible client
client = Portkey(
provider="openai", # or 'anthropic', 'bedrock', 'groq', etc
Authorization="sk-***" # the provider API key
)
# Make a request through your AI Gateway
client.chat.completions.create(
messages=[{"role": "user", "content": "What's the weather like?"}],
model="gpt-4o-mini"
)サポートされているライブラリ:
JS
Python
REST
OpenAI SDKs
Langchain
LlamaIndex
Autogen
CrewAI
その他..
ゲートウェイコンソール(http://localhost:8787/public/)では、すべてのローカルログを1つの場所で確認できます。
LLM ゲートウェイの Configs を使用すると、ルーティングルールの作成、信頼性の向上、ガードレールの設定ができます。
config = {
"retry": {"attempts": 5},
"output_guardrails": [{
"default.contains": {"operator": "none", "words": ["Apple"]},
"deny": True
}]
}
# 設定をクライアントに関連付ける
client = client.with_options(config=config)
client.chat.completions.create(
model="gpt-4o-mini",
messages=[{"role": "user", "content": "Reply randomly with Apple or Bat"}]
)
# "Apple" を含むすべてのレスポンスをガードレールが拒否するため、これは常に "Bat" で応答します。リトライ設定は 5 回まで再試行してから諦めます。AI ゲートウェイの設定を使ってさらに多くのことができます。例を見る →
AWS
Azure
GCP
OpenShift
Kubernetes
LLM ゲートウェイのエンタープライズ版は、組織管理、ガバナンス、セキュリティなどの高度な機能を備えています。詳細はこちら。機能比較を見る →
サポートされているプラットフォーム向けのエンタープライズデプロイメントアーキテクチャは以下で利用可能です - エンタープライズプライベートクラウドデプロイメント
MCP ゲートウェイは、組織全体の MCP(Model Context Protocol)サーバーを管理するための一元化されたコントロールプレーンを提供します。
- 認証 — ゲートウェイでの単一の認証レイヤー。ユーザーが一度認証すると、MCP サーバーは検証済みリクエストを受け取ります
- アクセス制御 — どのチームとユーザーがどのサーバーとツールにアクセスできるかを制御します。アクセスを即座に取り消せます
- 可観測性 — すべてのツール呼び出しが完全なコンテキストで記録されます:誰が何を呼び出したか、パラメーター、レスポンス、レイテンシー
- アイデンティティ転送 — ユーザーアイデンティティ(メール、チーム、ロール)を MCP サーバーに自動的に転送します
Claude Desktop、Cursor、VS Code、およびあらゆる MCP 互換クライアントで動作します。開始する →
- Fallbacks: LLM ゲートウェイを使用してリクエスト失敗時に別のプロバイダーまたはモデルにフォールバックします。フォールバックをトリガーするエラーを指定することができます。アプリケーションの信頼性が向上します。
- Automatic Retries: Automatically retry fa


