🚀 azure-data-lake-storage-mcp-server-by-cdata
CData 為 Azure 數據湖存儲打造的模型上下文協議(MCP)服務器。該項目構建了一個只讀的 MCP 服務器,允許大語言模型(LLMs)通過自然語言查詢 Azure 數據湖存儲中的實時數據。
🚀 快速開始
用途
我們創建這個只讀 MCP 服務器,是為了讓大語言模型(如 Claude Desktop)能夠查詢由 CData JDBC 驅動程序 for Azure 數據湖存儲 支持的 Azure 數據湖存儲中的實時數據。
CData JDBC 驅動程序通過將 Azure 數據湖存儲暴露為關係型 SQL 模型來與之建立連接。此服務器對該驅動程序進行封裝,通過簡單的 MCP 接口使 Azure 數據湖存儲的數據變得可用,這樣大語言模型就可以通過自然語言問題來檢索實時信息,無需使用 SQL。
安裝指南
- 克隆倉庫:
git clone https://github.com/cdatasoftware/azure-data-lake-storage-mcp-server-by-cdata.git
cd azure-data-lake-storage-mcp-server-by-cdata
- 構建服務器:
mvn clean install
此操作會創建 JAR 文件:CDataMCP-jar-with-dependencies.jar。
3. 下載並安裝 CData JDBC 驅動程序:https://www.cdata.com/drivers/azuredatalake/download/jdbc
4. 為 CData JDBC 驅動程序授權:
- 導航到安裝目錄下的 lib
文件夾,通常位置如下:
- (Windows)C:\Program Files\CData\CData JDBC Driver for Azure Data Lake Storage\
- (Mac/Linux)/Applications/CData JDBC Driver for Azure Data Lake Storage/
- 運行命令 java -jar cdata.jdbc.adls.jar --license
- 輸入您的姓名、電子郵件和 “TRIAL”(或您的許可證密鑰)。
5. 配置與數據源的連接(以 Salesforce 為例):
- 運行命令 java -jar cdata.jdbc.adls.jar
打開連接字符串實用程序。
- 配置連接字符串並點擊 “測試連接”。
> ⚠️ 重要提示:
>
> 如果數據源使用 OAuth,您需要在瀏覽器中進行身份驗證。
- 連接成功後,複製連接字符串以備後續使用。
6. 創建 JDBC 連接的 .prp
文件(例如 azure-data-lake-storage.prp
),使用以下屬性和格式:
- Prefix - 用於公開工具的前綴
- ServerName - 服務器的名稱
- ServerVersion - 服務器的版本
- DriverPath - JDBC 驅動程序 JAR 文件的完整路徑
- DriverClass - JDBC 驅動程序類的名稱(例如 cdata.jdbc.adls.ADLSDriver)
- JdbcUrl - 用於與 CData JDBC 驅動程序連接到數據的 JDBC 連接字符串(從上面複製)
- Tables - 留空以訪問所有數據,否則可以明確聲明要創建訪問權限的表
Prefix=adls
ServerName=CDataADLS
ServerVersion=1.0
DriverPath=PATH\TO\cdata.jdbc.adls.jar
DriverClass=cdata.jdbc.adls.ADLSDriver
JdbcUrl=jdbc:adls:InitiateOAuth=GETANDREFRESH;
Tables=
使用服務器與 Claude Desktop
- 創建 Claude Desktop 的配置文件(claude_desktop_config.json),以添加新的 MCP 服務器,使用以下格式。如果文件已存在,將條目添加到配置文件的
mcpServers
中。
Windows
{
"mcpServers": {
"{classname_dash}": {
"command": "PATH\\TO\\java.exe",
"args": [
"-jar",
"PATH\\TO\\CDataMCP-jar-with-dependencies.jar",
"PATH\\TO\\azure-data-lake-storage.prp"
]
},
...
}
}
Linux/Mac
{
"mcpServers": {
"{classname_dash}": {
"command": "/PATH/TO/java",
"args": [
"-jar",
"/PATH/TO/CDataMCP-jar-with-dependencies.jar",
"/PATH/TO/azure-data-lake-storage.prp"
]
},
...
}
}
如有需要,將配置文件複製到相應目錄(以 Claude Desktop 為例)。
Windows
cp C:\PATH\TO\claude_desktop_config.json %APPDATA%\Claude\claude_desktop_config.json
Linux/Mac
cp /PATH/TO/claude_desktop_config.json /Users/{user}/Library/Application\ Support/Claude/claude_desktop_config.json
- 運行或刷新您的客戶端(Claude Desktop)。
⚠️ 重要提示:
您可能需要完全退出或關閉 Claude Desktop 客戶端,然後重新打開,MCP 服務器才會顯示。
運行服務器
運行以下命令以獨立運行 MCP 服務器:
java -jar /PATH/TO/CDataMCP-jar-with-dependencies.jar /PATH/TO/Salesforce.prp
⚠️ 重要提示:
服務器使用 stdio
,因此只能與和服務器運行在同一臺機器上的客戶端一起使用。
使用詳情
MCP 服務器配置完成後,AI 客戶端將能夠使用內置工具來讀取、寫入、更新和刪除底層數據。一般來說,您無需顯式調用這些工具。只需讓客戶端回答有關底層數據系統的問題即可。例如:
- “我已成交的機會與客戶行業之間的相關性是什麼?”
- “我在 SUPPORT 項目中有多少未解決的工單?”
- “你能告訴我今天有哪些日曆事件嗎?”
可用工具及其描述如下:
工具與描述
在以下定義中,{servername}
指的是配置文件中 MCP 服務器的名稱(例如上面的 {classname_dash}
)。
{servername}_get_tables
- 檢索數據源中可用表的列表。使用 {servername}_get_columns
工具列出表上可用的列。該工具的輸出將以 CSV 格式返回,第一行包含列標題。
{servername}_get_columns
- 檢索表的列列表。使用 {servername}_get_tables
工具獲取可用表的列表。該工具的輸出將以 CSV 格式返回,第一行包含列標題。
{servername}_run_query
- 執行 SQL SELECT 查詢
JSON-RPC 請求示例
如果您不使用 AI 客戶端(如 Claude),而是通過腳本向 MCP 服務器發送請求,那麼在調用可用工具時,可以參考以下遵循 JSON-RPC 2.0 規範的 JSON 有效負載示例。
azure_data_lake_storage_get_tables
{
"jsonrpc": "2.0",
"id": 1,
"method": "tools/call",
"params": {
"name": "azure_data_lake_storage_get_tables",
"arguments": {}
}
}
azure_data_lake_storage_get_columns
{
"jsonrpc": "2.0",
"id": 2,
"method": "tools/call",
"params": {
"name": "azure_data_lake_storage_get_columns",
"arguments": {
"table": "Account"
}
}
}
azure_data_lake_storage_run_query
{
"jsonrpc": "2.0",
"id": 3,
"method": "tools/call",
"params": {
"name": "azure_data_lake_storage_run_query",
"arguments": {
"sql": "SELECT * FROM [Account] WHERE [IsDeleted] = true"
}
}
}
故障排除
- 如果在 Claude Desktop 中看不到您的 CData MCP 服務器,請確保您已完全退出 Claude Desktop(Windows:使用任務管理器,Mac:使用活動監視器)。
- 如果 Claude Desktop 無法檢索數據,請確保您已正確配置連接。使用連接字符串構建器創建連接字符串(見上文),並將連接字符串複製到屬性(.prp)文件中。
- 如果在連接數據源時遇到問題,請聯繫 CData 支持團隊。
- 如果在使用 MCP 服務器時遇到問題,或有任何其他反饋,請加入 CData 社區。
許可證
此 MCP 服務器根據 MIT 許可證授權。這意味著您可以自由使用、修改和分發該軟件,但需遵守 MIT 許可證的條款和條件。有關更多詳細信息,請參閱項目倉庫中的 LICENSE 文件。
所有支持的數據源
數據源 |
數據源 |
數據源 |
數據源 |
Access |
Act CRM |
Act-On |
Active Directory |
ActiveCampaign |
Acumatica |
Adobe Analytics |
Adobe Commerce |
ADP |
Airtable |
AlloyDB |
Amazon Athena |
Amazon DynamoDB |
Amazon Marketplace |
Amazon S3 |
Asana |
Authorize.Net |
Avalara AvaTax |
Avro |
Azure Active Directory |
Azure Analysis Services |
Azure Data Catalog |
Azure Data Lake Storage |
Azure DevOps |
Azure Synapse |
Azure Table |
Basecamp |
BigCommerce |
BigQuery |
Bing Ads |
Bing Search |
Bitbucket |
Blackbaud FE NXT |
Box |
Bullhorn CRM |
Cassandra |
Certinia |
Cloudant |
CockroachDB |
Confluence |
Cosmos DB |
Couchbase |
CouchDB |
CSV |
Cvent |
Databricks |
DB2 |
DocuSign |
Dropbox |
Dynamics 365 |
Dynamics 365 Business Central |
Dynamics CRM |
Dynamics GP |
Dynamics NAV |
eBay |
eBay Analytics |
Elasticsearch |
Email |
EnterpriseDB |
Epicor Kinetic |
Exact Online |
Excel |
Excel Online |
Facebook |
Facebook Ads |
FHIR |
Freshdesk |
FTP |
GitHub |
Gmail |
Google Ad Manager |
Google Ads |
Google Analytics |
Google Calendar |
Google Campaign Manager 360 |
Google Cloud Storage |
Google Contacts |
Google Data Catalog |
Google Directory |
Google Drive |
Google Search |
Google Sheets |
Google Spanner |
GraphQL |
Greenhouse |
Greenplum |
HarperDB |
HBase |
HCL Domino |
HDFS |
Highrise |
Hive |
HubDB |
HubSpot |
IBM Cloud Data Engine |
IBM Cloud Object Storage |
IBM Informix |
Impala |
Instagram |
JDBC - ODBC Bridge |
Jira |
Jira Assets |
Jira Service Management |
JSON |
Kafka |
Kintone |
LDAP |
LinkedIn |
LinkedIn Ads |
MailChimp |
MariaDB |
Marketo |
MarkLogic |
Microsoft Dataverse |
Microsoft Entra ID |
Microsoft Exchange |
Microsoft OneDrive |
Microsoft Planner |
Microsoft Project |
Microsoft Teams |
Monday.com |
MongoDB |
MYOB AccountRight |
MySQL |
nCino |
Neo4J |
NetSuite |
OData |
Odoo |
Office 365 |
Okta |
OneNote |
Oracle |
Oracle Eloqua |
Oracle Financials Cloud |
Oracle HCM Cloud |
Oracle Sales |
Oracle SCM |
Oracle Service Cloud |
Outreach.io |
Parquet |
Paylocity |
PayPal |
Phoenix |
PingOne |
Pinterest |
Pipedrive |
PostgreSQL |
Power BI XMLA |
Presto |
Quickbase |
QuickBooks |
QuickBooks Online |
QuickBooks Time |
Raisers Edge NXT |
Reckon |
Reckon Accounts Hosted |
Redis |
Redshift |
REST |
RSS |
Sage 200 |
Sage 300 |
Sage 50 UK |
Sage Cloud Accounting |
Sage Intacct |
Salesforce |
Salesforce Data Cloud |
Salesforce Financial Service Cloud |
Salesforce Marketing |
Salesforce Marketing Cloud Account Engagement |
Salesforce Pardot |
Salesloft |
SAP |
SAP Ariba Procurement |
SAP Ariba Source |
SAP Business One |
SAP BusinessObjects BI |
SAP ByDesign |
SAP Concur |
SAP Fieldglass |
SAP HANA |
SAP HANA XS Advanced |
SAP Hybris C4C |
SAP Netweaver Gateway |
SAP SuccessFactors |
SAS Data Sets |
SAS xpt |
SendGrid |
ServiceNow |
SFTP |
SharePoint |
SharePoint Excel Services |
ShipStation |
Shopify |
SingleStore |
Slack |
Smartsheet |
Snapchat Ads |
Snowflake |
Spark |
Splunk |
SQL Analysis Services |
SQL Server |
Square |
Stripe |
Sugar CRM |
SuiteCRM |
SurveyMonkey |
Sybase |
Sybase IQ |
Tableau CRM Analytics |
Tally |
TaxJar |
Teradata |
Tier1 |
TigerGraph |
Trello |
Trino |
Twilio |
Twitter |
Twitter Ads |
Veeva CRM |
Veeva Vault |
Wave Financial |
WooCommerce |
WordPress |
Workday |
xBase |
Xero |
XML |
YouTube Analytics |
Zendesk |
Zoho Books |
Zoho Creator |
Zoho CRM |
Zoho Inventory |
Zoho Projects |
Zuora |
更多... |