Docret MCP Server
🚀 文檔檢索 MCP 服務器(DOCRET)
該項目實現了一個模型上下文協議(MCP)服務器,能讓 AI 助手訪問各類 Python 庫的最新文檔,如 LangChain、LlamaIndex 和 OpenAI。藉助此服務器,AI 助手可動態獲取並提供來自官方文檔源的相關信息,確保 AI 應用始終能訪問到最新的官方文檔。
🚀 快速開始
DOCRET 是基於模型上下文協議(MCP)的 Python 項目,能助力 AI 助手動態獲取和處理各類庫的官方文檔。開發者可藉助 DOCRET 輕鬆將文檔信息集成到應用中。
✨ 主要特性
- 動態文檔檢索:獲取指定 Python 庫的最新文檔內容。
- 異步網絡搜索:利用 SERPER API 在目標文檔站點上執行高效網絡搜索。
- HTML 解析:使用 BeautifulSoup 從 HTML 內容中提取可讀文本。
- 擴展設計:輕鬆添加對更多庫的支持,只需更新配置。
📦 安裝指南
先決條件
- Python 3.8 或更高版本
- UV Python 包(用於 MCP 支持)
- 安裝指南:https://github.com/modelcontextprotocol/python-sdk
安裝步驟
- 安裝 Python 和 pip。
- 使用以下命令安裝項目:
pip install dorect-mcp
💻 使用示例
基礎用法
from dorect import Dorect
# 初始化 DOCRET 實例
dorect = Dorect(api_key="your_serper_api_key")
# 獲取文檔內容
result = dorect.get_documentation("langchain")
print(result)
高級用法
網絡搜索與爬取
from dorect import Dorect, SearchConfig
# 配置搜索參數
config = SearchConfig(
query="langchain documentation",
num_results=5,
gl="us"
)
# 獲取搜索結果
results = dorect.search(config)
HTML 解析與內容提取
from dorect import Dorect, DocumentParser
# 初始化解析器
parser = DocumentParser()
# 解析指定 URL
content = parser.parse_url("https://langchain.com/docs/")
print(content)
文檔緩存
from dorect import Dorect, CacheConfig
# 配置緩存
cache_config = CacheConfig(enabled=True, expiry=3600)
# 初始化 DOCRET 實例
dorect = Dorect(api_key="your_serper_api_key", cache_config=cache_config)
📚 詳細文檔
查閱 DOCRET 文檔 獲取更多信息。
🔧 技術細節
什麼是 MCP 服務器?
模型上下文協議是一個開源標準,使開發者能夠構建安全的雙向連接,將他們的數據源與 AI 工具(如 Claude、ChatGPT 等)相連。架構非常簡單:開發者可以使用 MCP 服務器暴露其數據,或使用 MCP 客戶端構建 AI 應用程序以連接到這些服務器。
擴展性設計
DOCRET 的架構允許您輕鬆添加新的文檔來源。您可以通過創建自定義解析器來支持更多庫:
from dorect import BaseParser
class CustomParser(BaseParser):
def parse(self, content):
# 自定義解析邏輯
pass
# 註冊自定義解析器
parser = ParserRegistry.register("custom", CustomParser)
測試與調試
為了確保 DOCRET 的可靠性,建議為關鍵功能編寫單元測試:
import pytest
from dorect import Dorect
def test_get_documentation():
dorect = Dorect(api_key="test_api_key")
result = dorect.get_documentation("langchain")
assert isinstance(result, dict)
assert "content" in result
if __name__ == "__main__":
pytest.main()
優化建議
💡 使用建議
- 緩存機制:在高併發場景下,啟用緩存可以顯著提高性能。
- 錯誤處理:建議為網絡請求和解析步驟添加完善的錯誤處理邏輯。
- 日誌記錄:通過添加日誌記錄功能,方便排查問題。
📄 許可證
該項目遵循 MIT 許可證。查看 LICENSE 文件以獲取更多詳細信息。
參考資料
項目貢獻
DOCRET 歡迎社區的貢獻。您可以通過以下方式參與:
- 提交 bug 報告
- 創建功能請求
- 提交代碼 PR
如需更多信息,請訪問 DORET 貢獻指南。
聯繫我們
如有任何問題或建議,請聯繫我們的團隊:
- 郵件:contact@dorect.com
- GitHub:https://github.com/doret-com/dorect-mcp
DORET 開源項目由 Doret 團隊 維護,旨在為開發者提供高效、可靠的文檔檢索解決方案。

Markdownify MCP
Markdownify是一個多功能文件轉換服務,支持將PDF、圖片、音頻等多種格式及網頁內容轉換為Markdown格式。
TypeScript
27.8K
5分

Baidu Map
已認證
百度地圖MCP Server是國內首個兼容MCP協議的地圖服務,提供地理編碼、路線規劃等10個標準化API接口,支持Python和Typescript快速接入,賦能智能體實現地圖相關功能。
Python
35.7K
4.5分

Firecrawl MCP Server
Firecrawl MCP Server是一個集成Firecrawl網頁抓取能力的模型上下文協議服務器,提供豐富的網頁抓取、搜索和內容提取功能。
TypeScript
104.8K
5分

Sequential Thinking MCP Server
一個基於MCP協議的結構化思維服務器,通過定義思考階段幫助分解複雜問題並生成總結
Python
28.3K
4.5分

Edgeone Pages MCP Server
EdgeOne Pages MCP是一個通過MCP協議快速部署HTML內容到EdgeOne Pages並獲取公開URL的服務
TypeScript
20.8K
4.8分

Magic MCP
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述幫助開發者快速創建現代化UI組件,支持多種IDE集成。
JavaScript
19.6K
5分

Notion Api MCP
已認證
一個基於Python的MCP服務器,通過Notion API提供高級待辦事項管理和內容組織功能,實現AI模型與Notion的無縫集成。
Python
15.3K
4.5分

Context7
Context7 MCP是一個為AI編程助手提供即時、版本特定文檔和代碼示例的服務,通過Model Context Protocol直接集成到提示中,解決LLM使用過時信息的問題。
TypeScript
68.4K
4.7分

