MCP Web Extractor
M

MCP Web Extractor

Readability.jsに基づくウェブページ内容抽出ツールで、MCPプロトコルサービスを通じてウェブページの本文内容を純粋に抽出し、広告などの邪魔な要素を取り除き、Obsidianノートソフトとの統合をサポートします。
2ポイント
10.0K

MCP Web Extractorとは?

MCP Web Extractorはサーバーツールで、任意のウェブページから記事の主要な内容をスマートに抽出し、広告やサイドバーなどの邪魔な要素を取り除き、きれいなテキスト内容を残します。特にウェブページの記事をノートソフト(Obsidianなど)に保存する必要があるユーザーに適しています。

MCP Web Extractorの使い方は?

このツールは簡単なAPI呼び出しまたはObsidianプラグインを通じて使用できます。ウェブページのURLを提供するだけで、ツールは整理された記事内容を返します。

適用シーン

ウェブページの記事を保存したいが、乱雑な形式を残したくない場合;研究資料を大量に収集する必要がある場合;ノートをきれいで統一されたスタイルに保ちたい場合。

主要機能

スマートな内容抽出
Readability.jsアルゴリズムを使用して、ウェブページ内の主要な内容領域を正確に識別します。
きれいな出力
広告、ナビゲーションバー、フッターなどの関係のない内容を自動的に削除します。
メタデータ抽出
記事のタイトル、概要、ウェブサイト名などの情報も同時に抽出します。
Obsidian統合
すでに用意されたObsidianプラグインのサンプルコードを提供します。
利点
抽出結果がきれいで、長期保存に適しています。
原文の構造を維持しながら、乱雑な形式を取り除きます。
使いやすいAPIインターフェースです。
Obsidianなどのノートソフトとシームレスに統合できます。
制限
一部の特殊なウェブページのレイアウトでは、抽出が完璧でない場合があります。
サーバーを自分でデプロイするか、既存のサービスを使用する必要があります。
ログインが必要な内容は処理できません。

使い方

サービスのインストール
コードリポジトリをクローンし、依存関係をインストールします。
サーバーの起動
プロジェクトをビルドし、サービスを起動します。
APIの使用
HTTPリクエストを通じて内容抽出機能を呼び出します。

使用例

技術記事の保存
Medium上の技術記事をObsidianの知識ベースに保存します。
研究資料の収集
複数のニュースサイトの記事内容を一括で抽出し、比較研究を行います。

よくある質問

このツールは無料ですか?
ログインが必要なウェブページを処理できますか?
抽出される内容の形式は何ですか?
Obsidianと統合するにはどうすればいいですか?

関連リソース

GitHubリポジトリ
プロジェクトのソースコードと最新の更新情報
Readability.jsドキュメント
Mozillaの内容抽出アルゴリズムのドキュメント
Obsidianプラグイン開発ガイド
Obsidianプラグインの開発方法
MCPプロトコルの説明
Model Context Protocolの公式ドキュメント

インストール

以下のコマンドをクライアントにコピーして設定
注意:あなたのキーは機密情報です。誰とも共有しないでください。

代替品

A
Airweave
Airweaveは、オープンソースの人工知能エージェントとRAGシステムのコンテキスト検索層です。さまざまなアプリケーション、ツール、データベースのデータを接続して同期し、統一された検索インターフェースを通じてAIエージェントに関連する、リアルタイムの、複数のデータソースからのコンテキスト情報を提供します。
Python
6.9K
5ポイント
V
Vestige
Vestigeは認知科学に基づくAI記憶エンジンで、予測誤差ゲート、FSRS - 6間隔反復、記憶の夢など29の神経科学モジュールを実装することで、AIに長期記憶能力を提供します。3D可視化ダッシュボードと21のMCPツールを備え、完全にローカルで動作し、クラウドは必要ありません。
Rust
6.5K
4.5ポイント
M
Moltbrain
MoltBrainは、OpenClaw、MoltBook、Claude Code用に設計された長期記憶層プラグインで、自動的にプロジェクトのコンテキストを学習し、思い出すことができます。スマートな検索、観察記録、分析統計、永続的なストレージ機能を提供します。
TypeScript
6.4K
4.5ポイント
B
Bm.md
機能豊富なMarkdown排版ツールで、様々なスタイルテーマとプラットフォーム対応をサポートし、リアルタイム編集プレビュー、画像エクスポート、API統合機能を提供します
TypeScript
4.6K
5ポイント
H
Haiku.rag
Haiku RAGは、LanceDB、Pydantic AI、Doclingを基盤とした高度な検索強化生成システムです。ハイブリッド検索、再ランキング、質問応答エージェント、多エージェント研究プロセスをサポートし、ローカルファーストのドキュメント処理とMCPサーバー統合を提供します。
Python
10.5K
5ポイント
C
Cipher
Cipherは、プログラミングAIエージェント向けに設計されたオープンソースのメモリ層フレームワークです。MCPプロトコルを通じてさまざまなIDEとAIコーディングアシスタントと統合し、自動記憶生成、チーム記憶共有、デュアルシステム記憶管理などの核心機能を提供します。
TypeScript
0
5ポイント
A
Apple Notes MCP
Claudeデスクトップ版に対して、ローカルのApple Notesデータベースへのアクセスを提供するサーバーで、ノート内容の読み取りと検索をサポートします。
Python
13.1K
4.3ポイント
M
MCP Server Weread
微信読書MCPサーバーは、微信読書のデータとAIクライアントをつなぐ軽量なサービスで、読書ノートとAIの深い対話を実現します。
TypeScript
13.2K
4ポイント
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
18.7K
4.5ポイント
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
80.1K
4.7ポイント
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
23.2K
4.8ポイント
B
Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
36.5K
4.5ポイント
G
Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
22.5K
4.3ポイント
U
Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
26.8K
5ポイント
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
19.8K
5ポイント
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
31.3K
4.5ポイント
AIBase
智啓未来、あなたの人工知能ソリューションシンクタンク
© 2026AIBase