MCP Jina Supabase Rag
什麼是MCP Jina Supabase RAG?
這是一個專門為文檔檢索設計的智能工具。它能夠自動發現和爬取文檔網站(如技術文檔、產品手冊等),提取其中的文本內容,然後進行智能分割並生成向量表示,最後存儲到Supabase數據庫中。當您需要查找特定信息時,它可以通過語義搜索快速找到相關內容。如何使用MCP Jina Supabase RAG?
使用過程分為三個主要步驟:首先配置必要的API密鑰和數據庫連接;然後通過簡單的命令或工具界面指定要爬取的文檔網站;最後就可以通過自然語言查詢來搜索文檔內容。整個過程自動化程度高,無需編寫複雜代碼。適用場景
最適合需要快速建立文檔知識庫的場景,比如:技術團隊需要索引多個產品的文檔、教育機構要整理教學資料、企業需要建立內部知識庫、或者個人想要整理自己的學習筆記和參考資料。主要功能
智能URL發現
優先使用網站的sitemap.xml文件快速發現所有頁面,如果沒有sitemap則自動進行遞歸爬取,確保不遺漏重要內容。
混合內容提取
結合Jina AI的高速API和Crawl4AI的瀏覽器自動化技術,既能快速處理大量頁面,又能應對複雜的動態網頁。
多項目管理
支持同時管理多個文檔項目,每個項目的索引完全隔離,便於組織不同類型的文檔資源。
智能文本分割
自動將長文檔分割成適合檢索的片段,保持語義完整性,提高搜索準確率。
向量語義搜索
使用OpenAI的嵌入技術將文本轉換為向量,實現基於語義相似度的智能搜索,而不僅僅是關鍵詞匹配。
優勢
速度快:優先使用sitemap和Jina AI API,大幅提升索引速度
成本低:開源免費,只需要基礎的API密鑰費用
易用性好:簡單的命令行界面,無需複雜配置
質量高:智能內容提取和分割,保證檢索質量
擴展性強:基於Supabase,易於集成到現有系統
侷限性
需要API密鑰:依賴OpenAI和Jina AI的API服務
網絡依賴:需要穩定的網絡連接進行爬取
動態內容限制:對JavaScript渲染的複雜頁面支持有限
存儲成本:大量文檔需要足夠的Supabase存儲空間
學習曲線:需要基本的命令行操作知識
如何使用
環境準備
安裝Python 3.12+,註冊Supabase、OpenAI和Jina AI賬號並獲取API密鑰。
數據庫設置
在Supabase中運行提供的SQL腳本創建必要的表和向量擴展。
啟動MCP服務器
啟動MCP服務器以便Claude或其他客戶端連接使用。
配置客戶端
在Claude Desktop或Cursor中配置MCP服務器連接。
開始使用
通過命令行工具或客戶端界面開始爬取和搜索文檔。
使用案例
建立技術文檔知識庫
為開發團隊建立統一的技術文檔搜索系統,包含多個開源項目的文檔。
產品文檔整理
為公司產品文檔建立智能搜索系統,方便客戶支持團隊快速查找解決方案。
個人學習資料庫
整理個人學習過程中收集的各種教程和參考資料,建立個人知識庫。
常見問題
我需要付費使用這個工具嗎?
可以爬取需要登錄的網站嗎?
數據存儲在哪裡?安全嗎?
支持哪些類型的文檔網站?
如何更新已索引的文檔?
可以導出索引的數據嗎?
相關資源
GitHub倉庫
源代碼和最新版本
Supabase官方文檔
學習如何使用Supabase數據庫
OpenAI API文檔
瞭解OpenAI嵌入API的使用
Jina AI官網
獲取Jina AI API密鑰和學習使用方法
MCP協議文檔
瞭解Model Context Protocol的工作原理

Baidu Map
已認證
百度地圖MCP Server是國內首個兼容MCP協議的地圖服務,提供地理編碼、路線規劃等10個標準化API接口,支持Python和Typescript快速接入,賦能智能體實現地圖相關功能。
Python
29.9K
4.5分

Markdownify MCP
Markdownify是一個多功能文件轉換服務,支持將PDF、圖片、音頻等多種格式及網頁內容轉換為Markdown格式。
TypeScript
24.3K
5分

Firecrawl MCP Server
Firecrawl MCP Server是一個集成Firecrawl網頁抓取能力的模型上下文協議服務器,提供豐富的網頁抓取、搜索和內容提取功能。
TypeScript
84.7K
5分

Sequential Thinking MCP Server
一個基於MCP協議的結構化思維服務器,通過定義思考階段幫助分解複雜問題並生成總結
Python
24.9K
4.5分

Notion Api MCP
已認證
一個基於Python的MCP服務器,通過Notion API提供高級待辦事項管理和內容組織功能,實現AI模型與Notion的無縫集成。
Python
14.1K
4.5分

Edgeone Pages MCP Server
EdgeOne Pages MCP是一個通過MCP協議快速部署HTML內容到EdgeOne Pages並獲取公開URL的服務
TypeScript
17.8K
4.8分

Context7
Context7 MCP是一個為AI編程助手提供即時、版本特定文檔和代碼示例的服務,通過Model Context Protocol直接集成到提示中,解決LLM使用過時信息的問題。
TypeScript
57.7K
4.7分

Magic MCP
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述幫助開發者快速創建現代化UI組件,支持多種IDE集成。
JavaScript
17.1K
5分





