Scrapi MCP Server

Scrapi AIのMCPサーバーは、ウェブページのURLをきれいなMarkdown/テキスト形式に変換し、AIエージェントがウェブページの内容を読み取り、分析できるようにします。JavaScriptレンダリングとバッチ処理に対応しています。

研究とデータ開発者ツール #ウェブページの取得 #コンテンツの変換 #AIツール #MCPサービス .TypeScript

スコア : 2.5ポイント

ダウンロード数 : 5.8K

更新時間 : 2026-03-13

サイトを開く

Scrapi MCPサーバーとは？

Scrapi MCPサーバーは、Model Context Protocol（MCP）に基づくサーバーで、AIアシスタント（Claude、Cursorなど）にウェブページの内容を読み取る機能を提供するために特別に設計されています。任意のウェブページのURLをきれいで構造化されたMarkdownまたは純テキスト形式に変換し、広告、ナビゲーションバー、スクリプトなどの邪魔な要素を削除して、AIがウェブページの内容を直接理解して処理できるようにします。

Scrapi MCPサーバーの使い方は？

Scrapi MCPサーバーの使用方法は非常に簡単です。1) Scrapiアカウントを登録してAPIキーを取得します。2) あなたのAIクライアント（Claude Desktop、Cursorなど）でMCPサーバーを設定します。3) クライアントを再起動すると使用できます。設定が完了すると、AIアシスタントが直接ウェブページの取得機能を呼び出すことができ、あなたが手動で内容をコピーして貼り付ける必要はありません。

適用シーン

Scrapi MCPサーバーは、以下のシーンに特に適しています。ニュース記事の要約、技術文書の閲読、製品価格の比較、競合他社の分析、調査報告書の整理、API文書の検索、ブログ内容の抽出など、AIがウェブページの情報を処理する必要があるすべてのシーンです。

主要機能

ウェブページ内容の抽出

ウェブページのURLをきれいなMarkdownまたは純テキスト形式に変換し、タイトル、リスト、リンクなどの重要な構造を保持し、関係のない要素を削除します。

JavaScriptレンダリングのサポート

シングルページアプリケーション（SPA）や動的に読み込まれる内容を処理することができ、完全なウェブページの内容を取得できるようにします。

メタデータの抽出

ウェブページのタイトル、作者、公開日、画像などのメタデータを自動的に抽出し、より豊富なコンテキスト情報を提供します。

バッチ処理

複数のURL（最大10個）を同時に処理することができ、処理効率を向上させ、調査や比較のシーンに適しています。

双方向伝送モード

Stdio（ローカル実行）とStreamable HTTP（リモート接続）の2つの伝送モードをサポートし、さまざまなデプロイメント要件に対応します。

使用量の監視

使用量の統計と請求管理機能が組み込まれており、残りのクォータ、サブスクリプション情報、および毎日の使用状況をリアルタイムで確認できます。

利点

⚡ 高速かつ信頼性が高い：8年間のウェブページ取得の経験と1900以上の本番環境用クローラーに基づいており、処理速度が速いです。

🧹 内容がきれい：広告、ナビゲーションバー、スクリプトなどの邪魔な内容を自動的にフィルタリングします。

🌐 幅広い互換性：JavaScriptレンダリングの現代的なウェブページとシングルページアプリケーションをサポートします。

🔧 統合が簡単：主流のAIクライアント（Claude Desktop、Cursor、Clineなど）をサポートします。

💳 無料クォータ：毎月500回の無料呼び出しクォータを提供します。

🔄 自動リトライ：制限に遭遇した場合、自動的にリトライして成功率を向上させます。

制限

📊 クォータの制限：無料版は毎月500回の呼び出し制限があり、超過する場合はプランをアップグレードする必要があります。

🔒 ログイン制限：ログインが必要なウェブページの内容を処理することはできません。

⏱️ 応答時間：複雑なウェブページの場合、数秒の処理時間が必要になることがあります。

📱 モバイル端末：主にデスクトップ端末のウェブページに最適化されており、モバイル端末での適合性は完全ではない場合があります。

使い方

APIキーの取得

Scrapiの公式ウェブサイトにアクセスしてアカウントを登録し、コンソールであなたのMCP APIキー（hsmcp_で始まる）を取得します。

AIクライアントの設定

使用しているAIクライアントに応じて、対応する設定ファイルを編集し、Scrapi MCPサーバーの設定を追加します。

クライアントの再起動

AIクライアントを完全に終了して再起動し、設定が反映されるようにします。

使用開始

設定が完了すると、あなたのAIアシスタントが直接ウェブページの内容を読み取ることができます。

使用例

ニュース記事の要約

AIアシスタントに長いニュース記事をすばやく読んで核心内容を要約させます。

製品価格の比較

さまざまな電子商取引ウェブサイト間で製品の価格と仕様を比較します。

技術文書の検索

AIにAPI文書を読ませてサンプルコードを生成させます。

競合他社の分析

競合他社の製品機能と価格設定戦略をすばやく把握します。

よくある質問

Scrapi MCPサーバーは無料ですか？

どのAIクライアントをサポートしていますか？

Node.jsをインストールする必要がありますか？

ログインが必要なウェブページはどのように処理しますか？

取得速度はどの程度ですか？

使用量をどのように確認しますか？

"API key is required"エラーが発生した場合はどうすればいいですか？

中国語のウェブページをサポートしていますか？

🚀 URLをクリーンなMarkdown/テキストに変換するMCPサーバー

このMCP (Model Context Protocol) サーバーは、AIエージェントがウェブページを取得して読み取ることを可能にします。URLを渡すだけで、LLMに最適なクリーンなコンテンツを迅速に返します。

한국어 · ウェブサイト · ダッシュボード

⚡ 高速かつ信頼性高い — 8年以上のウェブスクレイピングの専門知識、1,900以上の本番用クローラー、そして実戦で検証された反ボット対策に基づいて構築されています。

🚀 クイックスタート

このMCPサーバーは、AIエージェントがウェブページを取得して読み取ることを可能にします。URLを渡すだけで、LLMに最適なクリーンなコンテンツを迅速に返します。

以前: AIはウェブページを直接読み取ることができません
以降: "この記事を要約して" がそのまま機能します ✨

✨ 主な機能

🌐 URL → Markdown: 見出し、リスト、リンクを保持します。
📄 URL → テキスト: プレーンテキストを抽出します。
🏷️ メタデータ: タイトル、著者、日付、画像を取得します。
🧹 クリーンな出力: 広告、ナビゲーション、スクリプトを含まない出力を提供します。
⚡ JavaScriptレンダリング: SPA (シングルページアプリケーション) でも動作します。
💳 組み込みの課金機能: クレジットトラッキング、サブスクリプション管理、使用状況分析 (MCPキー) を提供します。
🔄 自動リトライ: 429レート制限レスポンスを自動的にリトライします。
🌍 デュアルトランスポート: Stdio (npx) + ストリーム可能なHTTPをサポートし、柔軟なデプロイを可能にします。

📦 インストール

オプションA: npx (推奨)

インストールは必要ありません。MCPクライアントを npx を使用するように設定するだけです。

{
  "mcpServers": {
    "scrapi": {
      "command": "npx",
      "args": ["-y", "@scrapi.ai/mcp-server"],
      "env": {
        "SCRAPI_API_KEY": "your-api-key"
      }
    }
  }
}

ヒント: 環境変数の代わりにCLI引数でAPIキーを渡すこともできます。
"args": ["-y", "@scrapi.ai/mcp-server", "--api-key", "your-api-key"]

この設定を配置する場所については、ステップ2: MCPサーバーを構成するを参照してください。

オプションB: ソースからインストール

# リポジトリをクローンする
git clone https://github.com/bamchi/scrapi-mcp-server.git
cd scrapi-mcp-server

# 依存関係をインストールしてビルドする
npm install && npm run build

ステップ1: APIキーを取得する

https://scrapi.ai にアクセスします。
サインアップまたはログインします。
MCPダッシュボードにアクセスします。無料プラン (月500クレジット) とAPIキーが自動的に作成されます。
hsmcp_ で始まるAPIキーをコピーします。

ステップ2: MCPサーバーを構成する

Claude Desktop

オプションA: 設定を通じて (推奨)

Claude Desktopを開きます。
左下の設定アイコン (歯車) をクリックします。
開発者タブを選択します。
"設定を編集" ボタンをクリックします。
mcpServersの設定を追加します (下記を参照)。
Claude Desktopを保存して再起動します (macOSではCmd+Q、WindowsではAlt+F4で完全に終了し、再度開きます)。

オプションB: 設定ファイルを直接編集する

macOS: ~/Library/Application Support/Claude/claude_desktop_config.json
Windows: %APPDATA%\Claude\claude_desktop_config.json

設定 (npx):

{
  "mcpServers": {
    "scrapi": {
      "command": "npx",
      "args": ["-y", "@scrapi.ai/mcp-server"],
      "env": {
        "SCRAPI_API_KEY": "your-api-key"
      }
    }
  }
}

設定 (ソースから):

{
  "mcpServers": {
    "scrapi": {
      "command": "node",
      "args": ["/absolute/path/to/scrapi-mcp-server/dist/index.js"],
      "env": {
        "SCRAPI_API_KEY": "your-api-key"
      }
    }
  }
}

注: /absolute/path/to/ を実際にクローンしたリポジトリのパスに置き換えてください。

Cline

設定ファイルの場所:

macOS: ~/Library/Application Support/Code/User/globalStorage/saoudrizwan.claude-dev/settings/cline_mcp_settings.json
Windows: %APPDATA%\Code\User\globalStorage\saoudrizwan.claude-dev\settings\cline_mcp_settings.json

設定 (npx):

{
  "mcpServers": {
    "scrapi": {
      "command": "npx",
      "args": ["-y", "@scrapi.ai/mcp-server"],
      "env": {
        "SCRAPI_API_KEY": "your-api-key"
      }
    }
  }
}

設定 (ソースから):

{
  "mcpServers": {
    "scrapi": {
      "command": "node",
      "args": ["/absolute/path/to/scrapi-mcp-server/dist/index.js"],
      "env": {
        "SCRAPI_API_KEY": "your-api-key"
      }
    }
  }
}

Cursor

プロジェクトのルートディレクトリに .cursor/mcp.json を作成または編集します。

設定 (npx):

{
  "mcpServers": {
    "scrapi": {
      "command": "npx",
      "args": ["-y", "@scrapi.ai/mcp-server"],
      "env": {
        "SCRAPI_API_KEY": "your-api-key"
      }
    }
  }
}

設定 (ソースから):

{
  "mcpServers": {
    "scrapi": {
      "command": "node",
      "args": ["/absolute/path/to/scrapi-mcp-server/dist/index.js"],
      "env": {
        "SCRAPI_API_KEY": "your-api-key"
      }
    }
  }
}

Claude Code

オプション1: CLIコマンド (推奨)

claude mcp add scrapi-ai -s user -e SCRAPI_API_KEY=your-api-key -- npx -y @scrapi.ai/mcp-server

または --api-key を使用する場合:

claude mcp add scrapi-ai -s user -- npx -y @scrapi.ai/mcp-server --api-key your-api-key

オプション2: 設定ファイルを編集する ~/.claude.json またはプロジェクトの .mcp.json を編集します。

{
  "mcpServers": {
    "scrapi": {
      "command": "npx",
      "args": ["-y", "@scrapi.ai/mcp-server", "--api-key", "your-api-key"]
    }
  }
}

Streamable HTTP

Streamable HTTPを介して接続します。クライアント側でNode.jsのインストールは必要ありません。

エンドポイント: https://scrapi.ai/mcp

Cursor (.cursor/mcp.json):

{
  "mcpServers": {
    "scrapi": {
      "url": "https://scrapi.ai/mcp",
      "headers": {
        "Authorization": "Bearer your-api-key"
      }
    }
  }
}

Claude Code (CLI):

claude mcp add --transport http scrapi https://scrapi.ai/mcp \
  --header "Authorization: Bearer your-api-key"

Cline (cline_mcp_settings.json):

{
  "mcpServers": {
    "scrapi": {
      "type": "streamableHttp",
      "url": "https://scrapi.ai/mcp",
      "headers": {
        "Authorization": "Bearer your-api-key"
      }
    }
  }
}

Claude Desktop (claude_desktop_config.json):

{
  "mcpServers": {
    "scrapi": {
      "command": "npx",
      "args": [
        "mcp-remote",
        "https://scrapi.ai/mcp",
        "--header",
        "Authorization: Bearer your-api-key"
      ]
    }
  }
}

注: Claude DesktopはHTTP接続に mcp-remote プロキシが必要です。

HTTPサーバーを自前でホストする (上級者向け)

ホストされたエンドポイントの代わりに自前のインスタンスを実行します。

SCRAPI_API_KEY=your-api-key npx -y -p @scrapi.ai/mcp-server scrapi-http
# またはソースから:
SCRAPI_API_KEY=your-api-key node dist/http.js

サーバーは http://localhost:3000 で起動し、MCPエンドポイントは /mcp です。PORT と HOST 環境変数で設定できます。上記のクライアント設定のURLを自前でホストしたURL (例: http://localhost:3000/mcp) に置き換えてください。

ヘルスチェック: GET http://localhost:3000/health

ステップ3: AIクライアントを再起動する

Claude Desktop: 完全に終了し (macOSではCmd+Q、WindowsではAlt+F4)、再度開きます。
Claude Code: セッションを再起動します。
Cline: VS Codeを再起動します。
Cursor: エディターを再起動します。

MCPサーバーの接続インジケーターが表示されるはずです。

💻 使用例

例1: ニュース記事を要約する

ユーザー: この記事を要約してください: https://news.example.com/article/12345

Claude: [scrape_urlを呼び出す]

この記事の要約は次の通りです:

## 要点
- 要点1: ...
- 要点2: ...
- 要点3: ...

例2: ページのコンテンツを取得する

ユーザー: https://example.com/data のコンテンツを取得してください。

Claude: [scrape_urlを呼び出す]

# ページのタイトル
> ソース: https://example.com/data

ページのコンテンツはクリーンなMarkdown形式で返されます...

例3: 競合他社の価格を調査する

ユーザー: https://competitor.com/product/abc の価格はいくらですか？

Claude: [scrape_urlを呼び出す]

こちらが価格情報です:
- **商品**: ABC Premium
- **通常価格**: $99.00
- **販売価格**: $79.00 (20%割引)

例4: APIドキュメントを読む

ユーザー: https://docs.example.com/api/v2 を読んで、統合コードを書いてください。

Claude: [scrape_urlを呼び出す]

APIドキュメントを分析しました。こちらが統合コードです:

// api-client.ts
export class ExampleApiClient {
  private baseUrl = 'https://api.example.com/v2';
  
  async getData(): Promise<Response> {
    // ...
  }
}

📚 詳細ドキュメント

利用可能なツール

`scrape_url`

ウェブページをスクレイピングし、AIが読めるコンテンツを返します。

パラメーター:

名前	タイプ	必須	説明
`url`	文字列	✅	スクレイピングするURL
`format`	文字列		`markdown` (デフォルト) または `text`

例:

{
  "url": "https://example.com/article",
  "format": "markdown"
}

Markdown出力:

# 記事のタイトル

> 著者: John Doe | 公開日: 2024-01-15

## はじめに

これは記事のメインコンテンツで、クリーンなMarkdownに変換されました...

## 要点

- 要点1: 重要な詳細
- 要点2: 別の洞察
- [関連リンク](https://example.com/related)

テキスト出力:

記事のタイトル

著者: John Doe | 公開日: 2024-01-15

はじめに

これは記事のメインコンテンツで、プレーンテキストに変換されました...

要点

- 要点1: 重要な詳細
- 要点2: 別の洞察

`scrape_urls`

複数のウェブページを並列にスクレイピングし、AIが読めるコンテンツを返します。

パラメーター:

名前	タイプ	必須	説明
`urls`	文字列配列	✅	スクレイピングするURL (最大10個)
`format`	文字列		`markdown` (デフォルト) または `text`

例:

{
  "urls": ["https://example.com/page1", "https://example.com/page2"],
  "format": "text"
}

出力:

[
  {
    "url": "https://example.com/page1",
    "content": "ページ1のタイトル\n\nこれはページ1のコンテンツです..."
  },
  {
    "url": "https://example.com/page2",
    "content": "ページ2のタイトル\n\nこれはページ2のコンテンツです..."
  }
]

`scraper_server_status`

すべてのScraperServerインスタンスの状態を確認します。サーバーの健全性、サーキットブレーカーの状態、失敗回数、タイミング情報を表示します。

パラメーター: なし

例:

{}

出力:

## ScraperServerの状態

合計: 3 | 利用可能: 2

| 名前 | OS | 状態 | 失敗回数 | 最後の成功 | 最後の失敗 |
|------|----|--------|----------|--------------|--------------|
| pluto | linux | OK | 0 | 01/30 14:23:05 | - |
| mars | mac | FAIL | 2 | 01/29 10:00:00 | 01/30 13:55:12 |
| venus | linux | OPEN | 3 | 01/28 09:00:00 | 01/30 12:00:00 |

### 問題点
- **mars**: 接続拒否 - connect(2)
- **venus**: サーキットブレーカーが開いています - 01/30 12:30:00まで
- **venus**: Net::ReadTimeout

状態値:

状態	説明
`OK`	サーバーが正常です
`FAIL`	サーバーが異常です
`OPEN`	サーキットブレーカーが開いています (30分間隔離)
`N/A`	まだチェックされていません

`get_usage`

APIの使用状況と残りのクレジットを確認します。

パラメーター: なし

例:

{}

出力:

## MCPクレジット

| 項目 | 値 |
|------|-------|
| プラン | starter |
| サブスクリプションクレジット | 1,500 |
| 購入したクレジット | 200 |
| 残りの合計 | 1,700 |
| 期間終了日 | 2026-03-01 |

`get_billing`

サブスクリプション、プラン、日次使用状況、支出制限を含む詳細な請求情報を取得します。

パラメーター:

名前	タイプ	必須	説明
`action`	文字列	はい	`subscription`, `plans`, `daily_usage`, または `spending_limits`
`start_date`	文字列		`daily_usage` の開始日 (YYYY-MM-DD, デフォルト: 30日前)
`end_date`	文字列		`daily_usage` の終了日 (YYYY-MM-DD, デフォルト: 今日)

例 — 現在のサブスクリプション:

{ "action": "subscription" }

## MCPサブスクリプション

| 項目 | 値 |
|------|-------|
| プラン | starter (Starter) |
| 状態 | アクティブ |
| 月次クレジット | 2,000 |
| 価格 | $19.00/月 |
| レート制限 | 30 RPM |
| バースト制限 | 5 同時接続 |
| 期間終了日 | 2026-03-01 |

例 — 利用可能なプラン:

{ "action": "plans" }

## 利用可能なMCPプラン

| プラン | クレジット/月 | 価格 | RPM | バースト |
|------|-----------|-------|-----|-------|
| Free (free) | 500 | 無料 | 10 | 2 |
| Starter (starter) | 2,000 | $19.00/月 | 30 | 5 |
| Pro (pro) | 10,000 | $49.00/月 | 60 | 10 |
| Business (business) | 50,000 | $149.00/月 | 120 | 20 |

例 — 日次使用履歴:

{ "action": "daily_usage", "start_date": "2026-02-01", "end_date": "2026-02-07" }

## 日次使用状況 (2026-02-01 ~ 2026-02-07)

| 日付 | リクエスト数 | クレジット | トップツール |
|------|----------|---------|----------|
| 2026-02-07 | 45 | 45 | scrape#scrape (45) |
| 2026-02-06 | 120 | 120 | scrape#scrape (100) |

**合計**: 165リクエスト, 165クレジット

例 — 支出制限:

{ "action": "spending_limits" }

## 支出制限

| 項目 | 値 |
|------|-------|
| 日次制限 | 500クレジット |
| 今日の使用量 | 120クレジット |
| 使用割合 | 24.0% |

🔧 技術詳細

┌─────────────────┐
│     ユーザー        │
│ "このURLを要約して" │
│   というリクエスト   │
└────────┬────────┘
         │
         ▼
┌─────────────────┐
│  Claude Desktop │
│    / Cursor     │
└────────┬────────┘
         │
         ▼
┌─────────────────┐     ┌─────────────────┐
│   MCPサーバー    │────►│   Scrapi API    │
│  (scrape_url)   │     │ (formatパラメータ)  │
└────────┬────────┘     └────────┬────────┘
         │                       │
         │◄──────────────────────┘
         │   Markdown/テキスト応答
         ▼
┌─────────────────┐
│   AI応答   │
│ (要約など) │
└─────────────────┘