Mcpdocsearch
什麼是文檔爬取與MCP搜索服務器?
這是一個智能工具包,能夠自動抓取網站文檔內容,將其轉換為結構化格式,並通過語義搜索技術幫助您快速找到所需信息。它特別適合開發文檔、API參考等技術內容的檢索。如何使用這個服務?
只需提供目標文檔網站的URL,工具會自動抓取內容並建立搜索索引。之後您可以通過自然語言查詢來查找相關內容,就像使用智能助手一樣簡單。適用場景
特別適合需要頻繁查閱大型技術文檔的開發者、技術支持團隊和技術寫作者。能顯著提高在複雜文檔中查找信息的效率。主要功能
智能網頁抓取自動遍歷網站結構,抓取文檔內容,可配置抓取深度和範圍
內容智能處理自動清理無關內容(導航欄、頁腳等),保留核心文檔內容
語義搜索使用AI技術理解查詢意圖,找到最相關的內容片段,而非簡單關鍵詞匹配
Cursor集成無縫集成到Cursor IDE中,開發時可直接查詢文檔
智能緩存系統自動緩存處理結果,後續使用加載更快
優勢與侷限性
優勢
節省手動查找文檔的時間
理解自然語言查詢,不依賴精確關鍵詞
可定製抓取範圍和深度
自動保持文檔更新
支持複雜技術文檔的深度檢索
侷限性
首次處理大型文檔集需要較長時間
對JavaScript渲染的重度動態頁面支持有限
需要合理配置抓取參數以獲得最佳效果
暫不支持圖片內容識別
如何使用
安裝準備
確保已安裝Python和uv工具,克隆項目倉庫
抓取文檔
運行抓取命令,指定目標文檔網站URL
配置Cursor集成
在項目根目錄創建.cursor/mcp.json配置文件
開始搜索
在Cursor中使用@doc-query-server命令查詢文檔內容
使用案例
抓取API文檔只抓取網站中的API參考部分
排除特定內容抓取文檔但排除博客和示例部分
處理SPA網站抓取JavaScript渲染的單頁應用文檔
常見問題
為什麼首次啟動服務器很慢?
如何更新已抓取的文檔?
支持哪些類型的網站?
抓取深度設置多少合適?
為什麼有些頁面內容缺失?
相關資源
項目代碼庫
源代碼和最新更新
Cursor IDE官網
瞭解如何與Cursor集成
Model Context Protocol
MCP協議官方文檔
安裝uv工具
項目依賴管理工具
精選MCP服務推薦

Baidu Map
已認證
百度地圖MCP Server是國內首個兼容MCP協議的地圖服務,提供地理編碼、路線規劃等10個標準化API接口,支持Python和Typescript快速接入,賦能智能體實現地圖相關功能。
Python
695
4.5分

Markdownify MCP
Markdownify是一個多功能文件轉換服務,支持將PDF、圖片、音頻等多種格式及網頁內容轉換為Markdown格式。
TypeScript
1.7K
5分

Firecrawl MCP Server
Firecrawl MCP Server是一個集成Firecrawl網頁抓取能力的模型上下文協議服務器,提供豐富的網頁抓取、搜索和內容提取功能。
TypeScript
3.8K
5分

Sequential Thinking MCP Server
一個基於MCP協議的結構化思維服務器,通過定義思考階段幫助分解複雜問題並生成總結
Python
245
4.5分

Notion Api MCP
已認證
一個基於Python的MCP服務器,通過Notion API提供高級待辦事項管理和內容組織功能,實現AI模型與Notion的無縫集成。
Python
111
4.5分

Context7
Context7 MCP是一個為AI編程助手提供即時、版本特定文檔和代碼示例的服務,通過Model Context Protocol直接集成到提示中,解決LLM使用過時信息的問題。
TypeScript
5.2K
4.7分

Magic MCP
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述幫助開發者快速創建現代化UI組件,支持多種IDE集成。
JavaScript
1.7K
5分

Edgeone Pages MCP Server
EdgeOne Pages MCP是一個通過MCP協議快速部署HTML內容到EdgeOne Pages並獲取公開URL的服務
TypeScript
244
4.8分