Mozilla Readability Parser MCP Server
Mozilla Readability Parser MCPサーバーとは?
これはPythonベースのMCPサーバーで、ウェブページから主要な内容を抽出し、構造化されたMarkdown形式に変換するために特別に設計されています。MozillaのReadabilityアルゴリズムを使用して、広告やナビゲーションバーなどの関係のない内容を削除し、核心となる記事内容を残します。Mozilla Readability Parserの使い方は?
簡単なAPIリクエストでウェブページのURLをサーバーに送信すると、サーバーは処理後のMarkdown内容を返します。HTMLを手動で解析したり、複雑なウェブページ構造を処理したりする必要はありません。適用シーン
コンテンツの集約、知識ベースの構築、AI学習データの処理など、ウェブページからクリーンな内容を取得する必要があるシーンに適しています。特にLLM(大規模言語モデル)との連携に適しています。主要機能
スマートなコンテンツ抽出ウェブページ内の主要な内容を自動的に識別して抽出し、広告やナビゲーションなどの邪魔な要素を削除します。
Markdown変換抽出したHTML内容を構造的に良好なMarkdown形式に変換し、後続の処理を容易にします。
LLM最適化出力形式は特に最適化されており、大型言語モデルに直接入力するのに適しています。
堅牢なエラー処理無効なURLやアクセスできないウェブページに対して、十分なエラー処理メカニズムが備わっています。
利点と制限
利点
単純なスクレイピングと比較して、よりクリーンで関連性の高い内容を抽出できます。
LLMで処理するトークン数を大幅に削減します。
一貫したMarkdown形式を提供し、後続の処理を容易にします。
動的な内容や複雑なウェブページ構造を処理する能力が強いです。
制限
一部の特殊な設計のウェブページでは、抽出の結果が理想的でない場合があります。
サーバーの実行環境が必要です。
直接スクレイピングするよりも処理速度が少し遅いです。
使い方
依存関係のインストール
仮想環境を作成し、必要な依存パッケージをインストールします。
サーバーの起動
FastMCPを使用してサーバーを実行します。
リクエストの送信
HTTPリクエストまたはMCPプロトコルを介してサービスを呼び出します。
使用例
ニュース記事の抽出ニュースサイトからクリーンなニュース内容を抽出し、広告やコメントを削除します。
知識ベースの構築技術文書サイトから核心となる内容を抽出して知識ベースを構築します。
よくある質問
このサービスは直接ウェブページをスクレイピングするのと何が違いますか?
処理速度はどの程度ですか?
どのようなタイプのウェブページをサポートしていますか?
関連リソース
オリジナルプロジェクトのコードリポジトリ
このプロジェクトのオリジナルJavaScript実装
FastMCPプロジェクト
このプロジェクトで使用されているMCPサーバーフレームワーク
Readabilityアルゴリズムのドキュメント
Mozilla Readabilityアルゴリズムの公式ドキュメント
厳選MCPサービス

Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
5.2K
4.7ポイント

Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
249
4.8ポイント

Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
270
4.5ポイント

Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
701
4.5ポイント

Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
65
4.3ポイント

Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
536
5ポイント

Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
1.7K
5ポイント

Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
249
4.5ポイント