MCP Web Extractor
M

MCP Web Extractor

Readability.jsに基づくウェブページ内容抽出ツールで、MCPプロトコルサービスを通じてウェブページの本文内容を純粋に抽出し、広告などの邪魔な要素を取り除き、Obsidianノートソフトとの統合をサポートします。
2ポイント
6.6K

MCP Web Extractorとは?

MCP Web Extractorはサーバーツールで、任意のウェブページから記事の主要な内容をスマートに抽出し、広告やサイドバーなどの邪魔な要素を取り除き、きれいなテキスト内容を残します。特にウェブページの記事をノートソフト(Obsidianなど)に保存する必要があるユーザーに適しています。

MCP Web Extractorの使い方は?

このツールは簡単なAPI呼び出しまたはObsidianプラグインを通じて使用できます。ウェブページのURLを提供するだけで、ツールは整理された記事内容を返します。

適用シーン

ウェブページの記事を保存したいが、乱雑な形式を残したくない場合;研究資料を大量に収集する必要がある場合;ノートをきれいで統一されたスタイルに保ちたい場合。

主要機能

スマートな内容抽出
Readability.jsアルゴリズムを使用して、ウェブページ内の主要な内容領域を正確に識別します。
きれいな出力
広告、ナビゲーションバー、フッターなどの関係のない内容を自動的に削除します。
メタデータ抽出
記事のタイトル、概要、ウェブサイト名などの情報も同時に抽出します。
Obsidian統合
すでに用意されたObsidianプラグインのサンプルコードを提供します。
利点
抽出結果がきれいで、長期保存に適しています。
原文の構造を維持しながら、乱雑な形式を取り除きます。
使いやすいAPIインターフェースです。
Obsidianなどのノートソフトとシームレスに統合できます。
制限
一部の特殊なウェブページのレイアウトでは、抽出が完璧でない場合があります。
サーバーを自分でデプロイするか、既存のサービスを使用する必要があります。
ログインが必要な内容は処理できません。

使い方

サービスのインストール
コードリポジトリをクローンし、依存関係をインストールします。
サーバーの起動
プロジェクトをビルドし、サービスを起動します。
APIの使用
HTTPリクエストを通じて内容抽出機能を呼び出します。

使用例

技術記事の保存
Medium上の技術記事をObsidianの知識ベースに保存します。
研究資料の収集
複数のニュースサイトの記事内容を一括で抽出し、比較研究を行います。

よくある質問

このツールは無料ですか?
ログインが必要なウェブページを処理できますか?
抽出される内容の形式は何ですか?
Obsidianと統合するにはどうすればいいですか?

関連リソース

GitHubリポジトリ
プロジェクトのソースコードと最新の更新情報
Readability.jsドキュメント
Mozillaの内容抽出アルゴリズムのドキュメント
Obsidianプラグイン開発ガイド
Obsidianプラグインの開発方法
MCPプロトコルの説明
Model Context Protocolの公式ドキュメント

インストール

以下のコマンドをクライアントにコピーして設定
注意:あなたのキーは機密情報です。誰とも共有しないでください。

代替品

C
Cipher
Cipherは、プログラミングAIエージェント向けに設計されたオープンソースのメモリ層フレームワークです。MCPプロトコルを通じてさまざまなIDEとAIコーディングアシスタントと統合し、自動記憶生成、チーム記憶共有、デュアルシステム記憶管理などの核心機能を提供します。
TypeScript
0
5ポイント
A
Apple Notes MCP
Claudeデスクトップ版に対して、ローカルのApple Notesデータベースへのアクセスを提供するサーバーで、ノート内容の読み取りと検索をサポートします。
Python
10.0K
4.3ポイント
M
MCP Server Weread
微信読書MCPサーバーは、微信読書のデータとAIクライアントをつなぐ軽量なサービスで、読書ノートとAIの深い対話を実現します。
TypeScript
10.1K
4ポイント
M
MCP Obsidian
このプロジェクトは、ObsidianのLocal REST APIプラグインを通じてObsidianノートアプリとやり取りするMCPサーバーです。Obsidian内のファイルを操作および管理するためのさまざまなツールを提供し、ファイルのリスト表示、内容の取得、検索、内容の変更、ファイルの削除などが可能です。
Python
13.5K
5ポイント
M
MCP Notion Server
認証済み
Notion MCPサーバーは、Notion APIとLLMを接続するミドルウェアサービスで、Markdown変換によりやり取りの効率を最適化します。
TypeScript
10.2K
5ポイント
M
MCP Atlassian
MCPアトラシアンは、アトラシアンの製品(ConfluenceとJira)用に設計されたモデルコンテキストプロトコルサーバーで、クラウドとオンプレミスの両方のデプロイをサポートし、AIアシスタントの統合機能を提供します。
Python
10.6K
5ポイント
M
MCP Logseq Server
LogSeqノートアプリとのインタラクションに使用されるMCPサーバーで、ノートコンテンツを操作するためのさまざまなAPIツールを提供します。
Python
11.0K
4.1ポイント
S
Solana Docs MCP Server
TypeScriptベースのMCPサーバーで、シンプルなノートシステムを実装し、ノートの作成と要約機能をサポートします。
TypeScript
9.2K
4.2ポイント
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
12.4K
4.5ポイント
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
15.2K
4.8ポイント
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
44.7K
4.7ポイント
B
Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
23.7K
4.5ポイント
G
Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
13.1K
4.3ポイント
U
Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
16.0K
5ポイント
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
15.7K
5ポイント
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
20.5K
4.5ポイント
AIBase
智啓未来、あなたの人工知能ソリューションシンクタンク
© 2025AIBase