Website To Markdown Converter
ウェブページのスクレイピングとHTMLからMarkdownへの変換を行うコマンドラインツールおよびMCPサービス
rating : 2.5 points
downloads : 30
ウェブサイトのスクレイピングとHTMLからMarkdownへの変換MCPサーバーとは?
このMCPサーバーは、MozillaのReadabilityエンジンを使用してウェブページの核心コンテンツを抽出し、読みやすいMarkdown形式に変換します。HTMLを安全に処理し、ローカルのHTMLファイルの変換もサポートしています。このサーバーをどのように使用するか?
コマンドラインで直接ウェブページをスクレイピングしたり、ローカルのHTMLファイルをMarkdownに変換することができます。また、より複雑なインタラクションを実現するためにMCPサーバーとして実行することもサポートしています。適用シーン
ウェブページの核心コンテンツを迅速に取得し、Markdownドキュメントを生成する必要があるユーザー、例えばブロガー、コンテンツ整理者、または開発者に適しています。主要機能
ウェブページのスクレイピングとコンテンツの抽出Mozilla Readabilityエンジンを利用して、ウェブページの核心コンテンツを抽出し、広告やその他の邪魔な情報を無視します。
HTMLからMarkdownへの変換TurndownServiceを使用して、クリーンアップされたHTMLを使いやすいMarkdown形式に変換します。
セキュリティ保障潜在的に有害なスクリプトタグを自動的に削除し、データの安全性を確保します。
多モードサポートコマンドラインツールとして使用することも、MCPサーバーとして実行することもできます。
利点と制限
利点
ウェブページの核心コンテンツを効率的に抽出する
複数の入力方法(URLまたはローカルファイル)をサポートする
高いセキュリティ保障
オープンソースで使いやすく柔軟性がある
制限
複雑なページに対しては手動での調整が必要な場合がある
ウェブページのスクレイピングにはネットワーク接続が必要である
使い方
サーバーのインストール
まず、Node.js環境がインストールされていることを確認し、以下のコマンドを実行してツールをインストールします。
```bash
npm install -g .
```
MCPサーバーの起動
以下のコマンドを実行してサーバーを起動します。
```bash
npm start
```
スクレイピングタスクの実行
コマンドラインでウェブページをスクレイピングし、Markdownファイルとして保存します。
```bash
scrape https://example.com output.md
```
使用例
例1:ウェブページのコンテンツをスクレイピングするニュースウェブサイトのコンテンツをスクレイピングし、Markdownファイルとして保存します。
例2:ローカルのHTMLファイルを変換するローカルのHTMLファイルをMarkdownファイルに変換します。
よくある質問
このツールをどのようにインストールするか?
ローカルのHTMLファイルの変換はサポートされていますか?
MCPサーバーをどのように起動するか?
関連リソース
プロジェクトのGitHubリポジトリ
プロジェクトのソースコードとドキュメントを参照する。
Mozilla Readabilityエンジン
Readabilityエンジンに関する詳細情報を取得する。
TurndownService公式サイト
Markdown変換ツールの動作原理を理解する。
Featured MCP Services

Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
260
4.8 points

Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
288
4.5 points

Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
5.2K
4.7 points

Baidu Map
Certified
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
714
4.5 points

Gitlab MCP Server
Certified
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
79
4.3 points

Unity
Certified
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
551
5 points

Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
1.7K
5 points

Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
273
4.5 points