Forge MCP Server
F

Forge MCP Server

Forge MCP服務器是一個通過32個並行AI代理將PyTorch模型自動優化為高性能CUDA/Triton內核的工具,可將推理速度提升高達14倍,支持多種MCP兼容的AI編程助手。
2.5分
6.2K

什麼是Forge MCP Server?

Forge MCP Server是一個連接AI編程助手與GPU優化服務的橋樑。它允許您通過Claude、Cursor、VS Code等AI助手,將PyTorch代碼自動轉換為經過優化的高性能GPU內核。服務使用32個並行AI代理在真實數據中心GPU上測試和優化代碼,確保獲得最佳性能。

如何使用Forge MCP Server?

使用Forge非常簡單:1) 在您的AI助手中安裝Forge MCP Server;2) 通過瀏覽器一鍵登錄認證;3) 提交PyTorch代碼或描述您需要的操作;4) 等待Forge優化並返回高性能內核代碼。整個過程完全自動化,無需手動編寫CUDA代碼。

適用場景

Forge最適合以下場景:需要加速自定義PyTorch操作、優化現有GPU內核性能、從零生成新的高性能內核、將研究代碼轉換為生產級性能、在多種GPU架構上獲得最佳性能。特別適合深度學習研究人員、AI工程師和需要高性能推理的開發者。

主要功能

自動代碼優化
提交PyTorch代碼,自動轉換為優化的Triton或CUDA內核,與torch.compile(max-autotune)基準對比,確保性能提升。
智能內核生成
通過自然語言描述操作需求,自動生成高性能GPU內核代碼,支持多種數據格式和GPU架構。
32並行AI代理優化
使用32個Coder+Judge代理對並行探索不同優化策略,包括張量核心利用、內存合併、共享內存平鋪和內核融合。
真實GPU基準測試
所有內核都在真實數據中心GPU上編譯、測試正確性並分析性能,支持B200、H200、H100、A100等多種GPU。
智能檢測與建議
自動識別代碼中的優化機會,如自定義操作、注意力機制、融合操作等,並提供優化建議。
一鍵瀏覽器認證
無需管理API密鑰,通過OAuth 2.0 PKCE流程在瀏覽器中安全登錄,令牌自動刷新。
優勢
高達14倍性能提升,超越torch.compile(max-autotune)
支持多種主流AI編程助手(Claude、Cursor、VS Code等)
在真實數據中心GPU上測試,結果可靠
100%數值正確性保證
快速結果返回(分鐘級別而非小時)
無需CUDA編程經驗即可獲得高性能內核
按使用量付費,成本透明
免費試用1個內核優化
侷限性
需要網絡連接訪問優化服務
每個優化消耗1個積分(成功優化才收費)
最大代碼輸入限制為500KB
僅支持PyTorch代碼優化
需要現代GPU支持(T4及以上)

如何使用

安裝Forge MCP Server
根據您使用的AI助手,在配置文件中添加Forge MCP Server。例如在Claude Desktop中編輯claude_desktop_config.json文件。
認證登錄
在AI助手中調用forge_auth工具,系統會自動打開瀏覽器完成登錄。只需登錄一次,令牌會自動刷新。
提交代碼優化
當AI助手檢測到可優化的PyTorch代碼時,會自動調用forge_optimize工具。您也可以手動描述需要優化的操作。
獲取優化結果
等待優化完成(通常幾分鐘),系統會返回優化後的內核代碼、性能提升數據和集成建議。
集成優化代碼
將返回的優化內核代碼集成到您的項目中,替換原有的PyTorch實現,享受性能提升。

使用案例

優化自定義注意力機制
研究人員開發了新的注意力變體,但PyTorch實現速度較慢。使用Forge自動優化為高性能Triton內核。
生成融合歸一化層
需要將LayerNorm、GELU激活和Dropout融合為單個高效內核以減少內存訪問。
加速現有模型推理
生產環境中的模型推理速度不達標,需要優化關鍵計算瓶頸。

常見問題

Forge優化需要多長時間?
優化失敗會收費嗎?
支持哪些GPU?
如何保證優化後代碼的正確性?
可以優化多大的代碼?
如何購買積分?
支持本地部署嗎?
優化後的代碼有授權限制嗎?

相關資源

官方文檔
Forge服務的詳細技術文檔和基準測試結果
GitHub倉庫
Forge MCP Server的源代碼和問題跟蹤
MCP協議官網
Model Context Protocol官方文檔和規範
RightNow AI控制檯
購買積分、查看使用統計和管理賬戶
NVIDIA Inception項目
RightNow AI是NVIDIA Inception項目成員

安裝

複製以下命令到你的Client進行配置
{
  "mcpServers": {
    "forge": {
      "command": "npx",
      "args": ["-y", "@rightnow/forge-mcp-server"]
    }
  }
}

{
  "mcpServers": {
    "forge": {
      "command": "cmd",
      "args": ["/c", "npx", "-y", "@rightnow/forge-mcp-server"]
    }
  }
}
注意:您的密鑰屬於敏感信息,請勿與任何人分享。

替代品

V
Vestige
Vestige是一個基於認知科學的AI記憶引擎,通過實現預測誤差門控、FSRS-6間隔重複、記憶夢境等29個神經科學模塊,為AI提供長期記憶能力。包含3D可視化儀表板和21個MCP工具,完全本地運行,無需雲端。
Rust
5.0K
4.5分
M
Moltbrain
MoltBrain是一個為OpenClaw、MoltBook和Claude Code設計的長期記憶層插件,能夠自動學習和回憶項目上下文,提供智能搜索、觀察記錄、分析統計和持久化存儲功能。
TypeScript
5.5K
4.5分
B
Bm.md
一個功能豐富的Markdown排版工具,支持多種樣式主題和平臺適配,提供即時編輯預覽、圖片導出和API集成能力
TypeScript
3.9K
5分
S
Security Detections MCP
Security Detections MCP 是一個基於Model Context Protocol的服務器,允許LLM查詢統一的安全檢測規則數據庫,涵蓋Sigma、Splunk ESCU、Elastic和KQL格式。最新3.0版本升級為自主檢測工程平臺,可自動從威脅情報中提取TTPs、分析覆蓋差距、生成SIEM原生格式檢測規則、運行測試並驗證。項目包含71+工具、11個預構建工作流提示和知識圖譜系統,支持多SIEM平臺。
TypeScript
5.3K
4分
P
Paperbanana
PaperBanana是一個自動化生成學術圖表和統計圖的智能框架,支持從文本描述生成高質量的論文插圖,採用多智能體管道和迭代優化,提供CLI、Python API和MCP服務器等多種使用方式。
Python
7.5K
5分
B
Better Icons
一個提供超過20萬圖標搜索和檢索的MCP服務器和CLI工具,支持150多個圖標庫,幫助AI助手和開發者快速獲取和使用圖標。
TypeScript
6.1K
4.5分
A
Assistant Ui
assistant-ui是一個開源TypeScript/React庫,用於快速構建生產級AI聊天界面,提供可組合的UI組件、流式響應、無障礙訪問等功能,支持多種AI後端和模型。
TypeScript
7.6K
5分
A
Apify MCP Server
Apify MCP服務器是一個基於模型上下文協議(MCP)的工具,允許AI助手通過數千個現成的爬蟲、抓取器和自動化工具(Apify Actor)從社交媒體、搜索引擎、電商等網站提取數據。它支持OAuth和Skyfire代理支付,可通過HTTPS端點或本地stdio方式集成到Claude、VS Code等MCP客戶端中。
TypeScript
7.4K
5分
M
Markdownify MCP
Markdownify是一個多功能文件轉換服務,支持將PDF、圖片、音頻等多種格式及網頁內容轉換為Markdown格式。
TypeScript
31.7K
5分
B
Baidu Map
已認證
百度地圖MCP Server是國內首個兼容MCP協議的地圖服務,提供地理編碼、路線規劃等10個標準化API接口,支持Python和Typescript快速接入,賦能智能體實現地圖相關功能。
Python
38.1K
4.5分
F
Firecrawl MCP Server
Firecrawl MCP Server是一個集成Firecrawl網頁抓取能力的模型上下文協議服務器,提供豐富的網頁抓取、搜索和內容提取功能。
TypeScript
120.7K
5分
S
Sequential Thinking MCP Server
一個基於MCP協議的結構化思維服務器,通過定義思考階段幫助分解複雜問題並生成總結
Python
30.4K
4.5分
M
Magic MCP
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述幫助開發者快速創建現代化UI組件,支持多種IDE集成。
JavaScript
19.4K
5分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一個通過MCP協議快速部署HTML內容到EdgeOne Pages並獲取公開URL的服務
TypeScript
23.2K
4.8分
N
Notion Api MCP
已認證
一個基於Python的MCP服務器,通過Notion API提供高級待辦事項管理和內容組織功能,實現AI模型與Notion的無縫集成。
Python
19.2K
4.5分
C
Context7
Context7 MCP是一個為AI編程助手提供即時、版本特定文檔和代碼示例的服務,通過Model Context Protocol直接集成到提示中,解決LLM使用過時信息的問題。
TypeScript
80.5K
4.7分
AIBase
智啟未來,您的人工智慧解決方案智庫
© 2026AIBase