M

MCP Web Extractor

Readability.jsに基づくウェブページ内容抽出ツールで、MCPプロトコルサービスを通じてウェブページの本文内容を純粋に抽出し、広告などの邪魔な要素を取り除き、Obsidianノートソフトとの統合をサポートします。
2ポイント
11

MCP Web Extractorとは?

MCP Web Extractorはサーバーツールで、任意のウェブページから記事の主要な内容をスマートに抽出し、広告やサイドバーなどの邪魔な要素を取り除き、きれいなテキスト内容を残します。特にウェブページの記事をノートソフト(Obsidianなど)に保存する必要があるユーザーに適しています。

MCP Web Extractorの使い方は?

このツールは簡単なAPI呼び出しまたはObsidianプラグインを通じて使用できます。ウェブページのURLを提供するだけで、ツールは整理された記事内容を返します。

適用シーン

ウェブページの記事を保存したいが、乱雑な形式を残したくない場合;研究資料を大量に収集する必要がある場合;ノートをきれいで統一されたスタイルに保ちたい場合。

主要機能

スマートな内容抽出Readability.jsアルゴリズムを使用して、ウェブページ内の主要な内容領域を正確に識別します。
きれいな出力広告、ナビゲーションバー、フッターなどの関係のない内容を自動的に削除します。
メタデータ抽出記事のタイトル、概要、ウェブサイト名などの情報も同時に抽出します。
Obsidian統合すでに用意されたObsidianプラグインのサンプルコードを提供します。

利点と制限

利点
抽出結果がきれいで、長期保存に適しています。
原文の構造を維持しながら、乱雑な形式を取り除きます。
使いやすいAPIインターフェースです。
Obsidianなどのノートソフトとシームレスに統合できます。
制限
一部の特殊なウェブページのレイアウトでは、抽出が完璧でない場合があります。
サーバーを自分でデプロイするか、既存のサービスを使用する必要があります。
ログインが必要な内容は処理できません。

使い方

サービスのインストール
コードリポジトリをクローンし、依存関係をインストールします。
サーバーの起動
プロジェクトをビルドし、サービスを起動します。
APIの使用
HTTPリクエストを通じて内容抽出機能を呼び出します。

使用例

技術記事の保存Medium上の技術記事をObsidianの知識ベースに保存します。
研究資料の収集複数のニュースサイトの記事内容を一括で抽出し、比較研究を行います。

よくある質問

このツールは無料ですか?
ログインが必要なウェブページを処理できますか?
抽出される内容の形式は何ですか?
Obsidianと統合するにはどうすればいいですか?

関連リソース

GitHubリポジトリ
プロジェクトのソースコードと最新の更新情報
Readability.jsドキュメント
Mozillaの内容抽出アルゴリズムのドキュメント
Obsidianプラグイン開発ガイド
Obsidianプラグインの開発方法
MCPプロトコルの説明
Model Context Protocolの公式ドキュメント
インストール
以下のコマンドをクライアントにコピーして設定
注意:あなたのキーは機密情報です。誰とも共有しないでください。
A
Apple Notes MCP
Claudeデスクトップ版に対して、ローカルのApple Notesデータベースへのアクセスを提供するサーバーで、ノート内容の読み取りと検索をサポートします。
Python
190
4.3ポイント
M
MCP Server Weread
微信読書MCPサーバーは、微信読書のデータとAIクライアントをつなぐ軽量なサービスで、読書ノートとAIの深い対話を実現します。
TypeScript
359
4ポイント
M
MCP Obsidian
このプロジェクトは、ObsidianのLocal REST APIプラグインを通じてObsidianノートアプリとやり取りするMCPサーバーです。Obsidian内のファイルを操作および管理するためのさまざまなツールを提供し、ファイルのリスト表示、内容の取得、検索、内容の変更、ファイルの削除などが可能です。
Python
863
5ポイント
M
MCP Notion Server
認証済み
Notion MCPサーバーは、Notion APIとLLMを接続するミドルウェアサービスで、Markdown変換によりやり取りの効率を最適化します。
TypeScript
729
5ポイント
M
MCP Atlassian
MCPアトラシアンは、アトラシアンの製品(ConfluenceとJira)用に設計されたモデルコンテキストプロトコルサーバーで、クラウドとオンプレミスの両方のデプロイをサポートし、AIアシスタントの統合機能を提供します。
Python
1.2K
5ポイント
M
MCP Logseq Server
LogSeqノートアプリとのインタラクションに使用されるMCPサーバーで、ノートコンテンツを操作するためのさまざまなAPIツールを提供します。
Python
163
4.1ポイント
S
Solana Docs MCP Server
TypeScriptベースのMCPサーバーで、シンプルなノートシステムを実装し、ノートの作成と要約機能をサポートします。
TypeScript
99
4.2ポイント
U
UI TARS Desktop
認証済み
Changesetsは、マルチパッケージまたはシングルパッケージのコードベースのバージョン管理とリリースプロセスを管理するのに役立つ自動化ツールです。
TypeScript
13.0K
5ポイント
厳選MCPサービス
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
274
4.5ポイント
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
252
4.8ポイント
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
5.2K
4.7ポイント
B
Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
704
4.5ポイント
G
Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
68
4.3ポイント
U
Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
540
5ポイント
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
1.7K
5ポイント
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
258
4.5ポイント
AIbase
智啓未来、あなたの人工知能ソリューションシンクタンク
© 2025AIbase