W

Website To Markdown Converter

ウェブページのスクレイピングとHTMLからMarkdownへの変換を行うコマンドラインツールおよびMCPサービス
2.5 points
30

ウェブサイトのスクレイピングとHTMLからMarkdownへの変換MCPサーバーとは?

このMCPサーバーは、MozillaのReadabilityエンジンを使用してウェブページの核心コンテンツを抽出し、読みやすいMarkdown形式に変換します。HTMLを安全に処理し、ローカルのHTMLファイルの変換もサポートしています。

このサーバーをどのように使用するか?

コマンドラインで直接ウェブページをスクレイピングしたり、ローカルのHTMLファイルをMarkdownに変換することができます。また、より複雑なインタラクションを実現するためにMCPサーバーとして実行することもサポートしています。

適用シーン

ウェブページの核心コンテンツを迅速に取得し、Markdownドキュメントを生成する必要があるユーザー、例えばブロガー、コンテンツ整理者、または開発者に適しています。

主要機能

ウェブページのスクレイピングとコンテンツの抽出Mozilla Readabilityエンジンを利用して、ウェブページの核心コンテンツを抽出し、広告やその他の邪魔な情報を無視します。
HTMLからMarkdownへの変換TurndownServiceを使用して、クリーンアップされたHTMLを使いやすいMarkdown形式に変換します。
セキュリティ保障潜在的に有害なスクリプトタグを自動的に削除し、データの安全性を確保します。
多モードサポートコマンドラインツールとして使用することも、MCPサーバーとして実行することもできます。

利点と制限

利点
ウェブページの核心コンテンツを効率的に抽出する
複数の入力方法(URLまたはローカルファイル)をサポートする
高いセキュリティ保障
オープンソースで使いやすく柔軟性がある
制限
複雑なページに対しては手動での調整が必要な場合がある
ウェブページのスクレイピングにはネットワーク接続が必要である

使い方

サーバーのインストール
まず、Node.js環境がインストールされていることを確認し、以下のコマンドを実行してツールをインストールします。 ```bash npm install -g . ```
MCPサーバーの起動
以下のコマンドを実行してサーバーを起動します。 ```bash npm start ```
スクレイピングタスクの実行
コマンドラインでウェブページをスクレイピングし、Markdownファイルとして保存します。 ```bash scrape https://example.com output.md ```

使用例

例1:ウェブページのコンテンツをスクレイピングするニュースウェブサイトのコンテンツをスクレイピングし、Markdownファイルとして保存します。
例2:ローカルのHTMLファイルを変換するローカルのHTMLファイルをMarkdownファイルに変換します。

よくある質問

このツールをどのようにインストールするか?
ローカルのHTMLファイルの変換はサポートされていますか?
MCPサーバーをどのように起動するか?

関連リソース

プロジェクトのGitHubリポジトリ
プロジェクトのソースコードとドキュメントを参照する。
Mozilla Readabilityエンジン
Readabilityエンジンに関する詳細情報を取得する。
TurndownService公式サイト
Markdown変換ツールの動作原理を理解する。
Installation
Copy the following command to your Client for configuration
Note: Your key is sensitive information, do not share it with anyone.
S
Search1api
Search1API MCPサーバーは、Model Context Protocol (MCP)に基づくサーバーで、検索とクローリング機能を提供し、複数の検索サービスとツールをサポートします。
TypeScript
328
4 points
D
Duckduckgo MCP Server
Certified
DuckDuckGo検索MCPサーバーは、ClaudeなどのLLMにウェブ検索とコンテンツ取得サービスを提供します。
Python
808
4.3 points
M
MCP Server Airbnb
Certified
Airbnbの宿泊施設検索と詳細照会のMCPサービス
TypeScript
243
4 points
M
MCP Alchemy
Certified
MCPアルケミーは、Claude Desktopと複数のデータベースを接続するツールで、SQLクエリ、データベース構造分析、データレポート生成をサポートします。
Python
314
4.2 points
P
Postgresql MCP
FastMCPライブラリに基づくPostgreSQLデータベースのMCPサービスで、指定されたテーブルのCRUD操作、スキーマ検査、およびカスタムSQLクエリ機能を提供します。
Python
97
4 points
M
MCP Scan
MCP-Scanは、MCPサーバー用のセキュリティスキャンツールで、提示注入、ツール汚染、クロスドメインアップグレードなどの一般的なセキュリティホールを検出します。
Python
609
5 points
A
Agentic Radar
エージェンティックレーダーは、エージェントシステムを分析・評価するセキュリティスキャナーで、開発者、研究者、セキュリティ専門家がエージェントシステムのワークフローを理解し、潜在的なホールを特定するのに役立ちます。
Python
544
5 points
C
Cloudflare
Changesetsは、マルチパッケージまたはシングルパッケージのリポジトリのバージョン管理とリリースを管理するためのビルドツールです。
TypeScript
1.5K
5 points
Featured MCP Services
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
260
4.8 points
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
288
4.5 points
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
5.2K
4.7 points
B
Baidu Map
Certified
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
714
4.5 points
G
Gitlab MCP Server
Certified
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
79
4.3 points
U
Unity
Certified
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
551
5 points
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
1.7K
5 points
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
273
4.5 points
AIbase
Zhiqi Future, Your AI Solution Think Tank
© 2025AIbase