Massive Context MCP

一个基于递归语言模型模式的MCP服务器，通过分块、子查询和本地推理处理超大规模上下文（1000万+令牌），支持自动分析、代码执行和安全过滤。

人工智能聊天机器人研究与数据 #大规模上下文 #本地推理 #分块查询 #代码防火墙 .Python

评分 : 2分

下载量 : 5.4K

更新时间 : 2026-03-12

打开站点

什么是Massive Context MCP?

Massive Context MCP是一个专门处理超长文本内容的智能工具。传统的AI模型有输入长度限制，无法一次性分析很长的文档。这个工具通过'分而治之'的策略：先将大文档分成小块，然后对每块进行智能分析，最后汇总结果，让AI能够处理书籍、大型代码库、数据集等海量内容。

如何使用Massive Context MCP?

使用非常简单：1) 安装工具到Claude Desktop或Claude Code；2) 加载你的大文档；3) 选择分析目标（如总结、找bug、提取结构等）；4) 工具会自动分块并分析；5) 获取汇总结果。整个过程可以完全自动化，也可以手动控制每个步骤。

适用场景

适合需要分析长文档的各种场景：分析整本书籍的内容和主题、审查大型代码库的安全漏洞、处理数万行的日志文件、分析法律文档或合同、研究长篇学术论文、处理大型数据集等。

主要功能

一键智能分析

只需指定分析目标（总结、找bug、安全审计等），工具会自动检测内容类型、选择最佳分块策略、并行处理并汇总结果。

免费本地推理

支持通过Ollama在本地运行AI模型，完全免费处理海量文本。工具会自动检测并优先使用本地推理。

智能分块策略

根据内容类型自动选择分块方式：代码按函数/类分块、文本按段落分块、日志按行分块，确保语义完整性。

并行处理加速

支持同时处理多个分块，大幅提升分析速度，充分利用计算资源。

安全代码执行

可以在沙箱中运行Python代码直接分析内容，用于模式匹配、数据提取等确定性任务。

自动服务切换

智能检测可用服务：优先使用免费本地Ollama，不可用时自动切换到Claude云端服务，确保始终可用。

优势

💰 成本极低：本地推理完全免费，云端成本约$0.80/百万令牌

🚀 处理海量：可处理1000万+令牌的超长文档，远超普通AI限制

⚡ 智能分块：自动选择最佳分块策略，保持语义连贯

🔒 隐私保护：本地处理时数据不出设备，保护敏感信息

🔄 自动切换：智能选择最优服务，无需手动配置

📊 结果聚合：自动汇总分块分析结果，提供完整洞察

局限性

🖥️ 硬件要求：本地推理需要16GB+ RAM和Apple Silicon芯片

⏱️ 处理时间：海量文档分析需要较长时间

🔗 上下文关联：分块处理可能丢失跨块的上下文联系

📱 平台限制：自动安装目前仅支持macOS

🧠 模型限制：本地使用较小模型，复杂推理能力有限

如何使用

安装工具

通过PyPI安装或下载.mcpb文件一键安装到Claude Desktop。

配置Claude

在Claude配置文件中添加MCP服务器设置。

设置本地推理（可选）

如需免费本地处理，安装并启动Ollama服务。

加载文档

将需要分析的大文档加载到工具中。

开始分析

使用一键分析功能，指定分析目标。

获取结果

查看分析结果，工具会自动分块处理并汇总。

使用案例

分析长篇小说

分析《战争与和平》整本书（3.3MB），提取人物关系和主题发展。

代码安全审计

审查大型Python代码库，查找安全漏洞和潜在bug。

法律文档分析

分析长篇法律合同，提取关键条款和义务。

日志文件分析

处理数GB的服务器日志，找出错误模式和系统问题。

常见问题

这个工具是免费的吗？

需要什么样的电脑配置？

能处理多大的文件？

分析结果准确吗？

数据隐私如何保护？

如何选择分析目标（goal）？

处理时间要多久？

支持哪些文件格式？

🚀 Massive Context MCP

Massive Context MCP 能够通过分块、子查询和借助 Ollama 进行免费本地推理，来处理大规模上下文（1000 万个以上的标记）。

🚀 快速开始

📦 安装指南

选项 1：通过 PyPI 安装（推荐）

uvx massive-context-mcp
# 或者
pip install massive-context-mcp

安装可选扩展

# 集成代码防火墙（rlm_exec 的安全过滤器）
pip install massive-context-mcp[firewall]

# 集成 Claude 代理 SDK（用于以编程方式访问 Claude API）
pip install massive-context-mcp[claude]

# 安装所有扩展
pip install massive-context-mcp[firewall,claude]

选项 2：Claude 桌面版一键安装

从 Releases 下载 .mcpb 文件，然后双击安装。

选项 3：从源代码安装

git clone https://github.com/egoughnour/massive-context-mcp.git
cd massive-context-mcp
uv sync

连接到 Claude Code / Claude 桌面版

将以下内容添加到 ~/.claude/.mcp.json（Claude Code）或 claude_desktop_config.json（Claude 桌面版）中：

{
  "mcpServers": {
    "massive-context": {
      "command": "uvx",
      "args": ["massive-context-mcp"],
      "env": {
        "RLM_DATA_DIR": "~/.rlm-data",
        "OLLAMA_URL": "http://localhost:11434"
      }
    }
  }
}

✨ 主要特性

核心思想

不直接将大规模上下文输入到大语言模型（LLM）中，而是采用以下步骤：

加载：将上下文作为外部变量加载（不包含在提示中）。
检查：以编程方式检查结构。
分块：采用策略性的分块方式（按行、字符或段落）。
子查询：对分块进行递归子查询。
聚合：聚合结果以进行最终合成。

自动检测和选择最佳可用的提供者

RLM 会自动检测并使用最佳可用的提供者：

提供者	默认模型	成本	使用场景
`auto`	（最佳可用）	$0 或约 $0.80/100 万个标记	默认 — 如果 Ollama 可用，则优先使用
`ollama`	gemma3:12b	$0	本地推理，需要安装 Ollama
`claude-sdk`	claude-haiku-4-5	约 $0.80/100 万个输入标记	云推理，始终可用

支持多种工具进行上下文分析和处理

设置与状态工具

工具	用途
`rlm_system_check`	检查系统要求 — 验证是否为 macOS、Apple Silicon 芯片、16GB 以上内存以及是否安装了 Homebrew
`rlm_setup_ollama`	通过 Homebrew 安装 — 托管服务，自动更新，需要安装 Homebrew
`rlm_setup_ollama_direct`	通过直接下载安装 — 无需 sudo 权限，完全无头模式，适用于受限机器
`rlm_ollama_status`	检查 Ollama 可用性 — 检测是否可以进行免费本地推理

分析工具

工具	用途
`rlm_auto_analyze`	一步分析 — 自动检测类型、分块并进行查询
`rlm_load_context`	将上下文作为外部变量加载
`rlm_inspect_context`	获取结构信息，而不将其加载到提示中
`rlm_chunk_context`	按行、字符或段落进行分块
`rlm_get_chunk`	检索特定分块
`rlm_filter_context`	使用正则表达式进行过滤（保留或移除匹配的行）
`rlm_exec`	针对加载的上下文执行 Python 代码（沙盒环境）
`rlm_sub_query`	对分块进行子 LLM 调用
`rlm_sub_query_batch`	并行处理多个分块
`rlm_store_result`	存储子调用结果以进行聚合
`rlm_get_results`	检索存储的结果
`rlm_list_contexts`	列出所有加载的上下文

💻 使用示例

基础用法

# 0. （可选）在 macOS 上进行首次设置 - 选择一种方法：

# 选项 A：使用 Homebrew（如果已安装）
rlm_system_check()
rlm_setup_ollama(install=True, start_service=True, pull_model=True)

# 选项 B：直接下载（无需 sudo 权限，完全无头模式）
rlm_system_check()
rlm_setup_ollama_direct(install=True, start_service=True, pull_model=True)

# 0b. （可选）检查 Ollama 是否可用于免费推理
rlm_ollama_status()

# 1. 加载大型文档
rlm_load_context(name="report", content=<large document>)

# 2. 检查结构
rlm_inspect_context(name="report", preview_chars=500)

# 3. 将文档分块为可管理的部分
rlm_chunk_context(name="report", strategy="paragraphs", size=1)

# 4. 并行对子分块进行查询（如果 Ollama 可用，则自动使用）
rlm_sub_query_batch(
    query="What is the main topic? Reply in one sentence.",
    context_name="report",
    chunk_indices=[0, 1, 2, 3],
    concurrency=4
)

# 5. 存储结果以进行聚合
rlm_store_result(name="topics", result=<response>)

# 6. 检索所有结果
rlm_get_results(name="topics")

高级用法

处理 2MB 的文档

# 加载
rlm_load_context(name="bill", content=<2MB XML>)

# 分块为 40 个部分（每个部分 50000 个字符）
rlm_chunk_context(name="bill", strategy="chars", size=50000)

# 对 8 个分块（20%）进行采样并并行查询
# （如果 Ollama 正在运行，则自动使用；否则使用 Claude SDK）
rlm_sub_query_batch(
    query="What topics does this section cover?",
    context_name="bill",
    chunk_indices=[0, 5, 10, 15, 20, 25, 30, 35],
    concurrency=4
)

结果：以 $0 成本（使用 Ollama）或约 $0.02（使用 Claude）进行全面的主题提取。

分析《战争与和平》（3.3MB）

# 下载文本
curl -o war_and_peace.txt https://www.gutenberg.org/files/2600/2600-0.txt

# 加载到 RLM 中（3.3MB，66000 行）
rlm_load_context(name="war_and_peace", content=open("war_and_peace.txt").read())

# 按行分块（每个分块 1000 行 = 67 个分块）
rlm_chunk_context(name="war_and_peace", strategy="lines", size=1000)

# 从整本书中均匀采样 10 个分块（覆盖率 15%）
sample_indices = [0, 7, 14, 21, 28, 35, 42, 49, 56, 63]

# 从每个采样部分提取角色信息
rlm_sub_query_batch(
    query="List major characters in this section with brief descriptions.",
    context_name="war_and_peace",
    chunk_indices=sample_indices,
    provider="claude-sdk",  # Haiku 4.5
    concurrency=8
)

结果：完整呈现小说中的角色弧线 — 皮埃尔从理想主义者到囚犯再到丈夫的旅程、娜塔莎的成长、尼古拉·罗斯托夫从士兵到地主的转变 — 全部成本约为 $0.03。

指标	值
文件大小	3.35 MB
行数	66033
分块数	67
采样数	10（15%）
成本	约 $0.03

📚 详细文档

使用 `rlm_auto_analyze` 进行快速分析

对于大多数用例，只需使用 rlm_auto_analyze，它会自动处理所有事情：

rlm_auto_analyze(
    name="my_file",
    content=file_content,
    goal="find_bugs"  # 或者: summarize, extract_structure, security_audit, answer:<question>
)

自动执行的操作：

检测内容类型（Python、JSON、Markdown、日志、散文、代码）。
选择最佳的分块策略。
根据内容类型调整查询。
运行并行子查询。
返回聚合结果。

支持的目标：

目标	描述
`summarize`	总结内容的目的和关键点
`find_bugs`	识别错误、问题和潜在风险
`extract_structure`	列出函数、类、模式、标题
`security_audit`	查找漏洞和安全问题
`answer:<question>`	回答关于内容的自定义问题

使用 `rlm_exec` 进行编程式分析

对于确定性的模式匹配和数据提取，可以使用 rlm_exec 直接针对加载的上下文运行 Python 代码。这更接近论文中的 REPL 方法，并且可以完全控制分析逻辑。

工具：rlm_exec

用途：在沙盒子进程中针对加载的上下文执行任意 Python 代码。

参数：

code（必需）：要执行的 Python 代码。设置 result 变量以捕获输出。
context_name（必需）：之前加载的上下文的名称。
timeout（可选，默认 30）：最大执行时间（秒）。

特性：

上下文作为只读 context 变量可用。
预导入模块：re、json、collections。
子进程隔离（不会使服务器崩溃）。
超时强制机制。
适用于任何安装了 Python 的系统（无需 Docker）。

示例 — 在加载的上下文中查找模式：

# 加载上下文后
rlm_exec(
    code="""
import re
amounts = re.findall(r'\$[\d,]+', context)
result = {'count': len(amounts), 'sample': amounts[:5]}
""",
    context_name="bill"
)

示例响应：

{
  "result": {
    "count": 1247,
    "sample": ["$500", "$1,000", "$250,000", "$100,000", "$50"]
  },
  "stdout": "",
  "stderr": "",
  "return_code": 0,
  "timed_out": false
}

示例 — 提取结构化数据：

rlm_exec(
    code="""
import re
import json

# 查找所有电子邮件地址
emails = re.findall(r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b', context)

# 按域名统计
from collections import Counter
domains = [e.split('@')[1] for e in emails]
domain_counts = Counter(domains)

result = {
    'total_emails': len(emails),
    'unique_domains': len(domain_counts),
    'top_domains': domain_counts.most_common(5)
}
""",
    context_name="dataset",
    timeout=60
)

何时使用 rlm_exec 与 rlm_sub_query：

使用场景	工具	原因
提取所有日期、ID、金额	`rlm_exec`	正则表达式具有确定性且速度快
查找安全漏洞	`rlm_sub_query`	需要推理和上下文理解
解析 JSON/XML 结构	`rlm_exec`	标准库可以完美工作
总结主题或语气	`rlm_sub_query`	需要自然语言理解
统计单词频率	`rlm_exec`	简单计算，无需 AI
回答 “为什么 X 会发生？”	`rlm_sub_query`	需要推理和推断

提示：对于大型上下文，可以结合使用两者 — 使用 rlm_exec 进行过滤/提取，然后使用 rlm_sub_query 对过滤后的结果进行语义分析。

代码防火墙集成（可选）

为了增强安全性，可以集成 code-firewall-mcp，在执行前过滤危险的代码模式：

pip install massive-context-mcp[firewall]

安装后，rlm_exec 可以自动检查代码是否符合已知危险模式的黑名单（例如，os.system()、eval()、subprocess 且 shell=True）。防火墙使用结构相似性匹配 — 将代码规范化为骨架，并通过嵌入与黑名单模式进行比较。

工作原理：

将代码解析为语法树并进行规范化（标识符 → _，字符串 → "S"）。
通过 Ollama 对规范化结构进行嵌入。
在 ChromaDB 中检查与黑名单模式的相似性。
如果相似度超过阈值（默认：0.85），则阻止代码执行。

配置（环境变量）：

RLM_FIREWALL_ENABLED=true — 启用防火墙检查（安装包时自动启用）
RLM_FIREWALL_MODE=warn|block — 匹配时警告或阻止（默认：warn）

示例被阻止的模式：

os.system(user_input) — 命令注入
eval(untrusted_data) — 代码注入
subprocess.Popen(..., shell=True) — shell 注入

使用 rlm_firewall_status 检查防火墙的可用性和配置。

自动检测提供者的工作原理

当使用 provider="auto"（默认设置）时，RLM 会执行以下操作：

检查 Ollama 是否正在运行：在 OLLAMA_URL（默认：http://localhost:11434）上进行检查。
检查 gemma3:12b 是否可用：（或任何 gemma3 变体）。
如果可用，则使用 Ollama：否则，回退到 Claude SDK。

状态会缓存 60 秒，以避免重复的网络检查。

检查 Ollama 状态

使用 rlm_ollama_status 查看可用情况：

rlm_ollama_status()

当 Ollama 准备就绪时的响应：

{
  "running": true,
  "models": ["gemma3:12b", "llama3:8b"],
  "default_model_available": true,
  "best_provider": "ollama",
  "recommendation": "Ollama is ready! Sub-queries will use free local inference by default."
}

当 Ollama 不可用时的响应：

{
  "running": false,
  "error": "connection_refused",
  "best_provider": "claude-sdk",
  "recommendation": "Ollama not available. Sub-queries will use Claude API. To enable free local inference, install Ollama and run: ollama serve"
}

透明的提供者选择

所有子查询响应都会包含实际使用的提供者信息：

{
  "provider": "ollama",
  "model": "gemma3:12b",
  "requested_provider": "auto",
  "response": "..."
}

自主使用

让 Claude 自动使用 RLM 工具，无需手动调用：

集成 CLAUDE.md：将 CLAUDE.md.example 的内容复制到项目的 CLAUDE.md（或全局的 ~/.claude/CLAUDE.md）中，以教导 Claude 何时自动使用 RLM 工具。
安装钩子：将 .claude/hooks/ 目录复制到项目中，以便在读取大于 10KB 的文件时自动建议使用 RLM：

cp -r .claude/hooks/ /Users/your_username/your-project/.claude/hooks/

钩子提供指导，但不会阻止文件读取。 3. 技能参考：复制 .claude/skills/ 目录以获取全面的 RLM 指导：

cp -r .claude/skills/ /Users/your_username/your-project/.claude/skills/

完成上述步骤后，Claude 将自动检测何时使用 RLM，而不是直接将大文件读取到上下文中。

设置 Ollama（免费本地推理）

RLM 可以在配备 Apple Silicon 的 macOS 上自动安装和配置 Ollama。有 两种安装方法，各有优缺点：

选择安装方法

方面	`rlm_setup_ollama`（Homebrew）	`rlm_setup_ollama_direct`（直接下载）
是否需要 sudo 权限	仅在未安装 Homebrew 时需要	❌ 从不
是否需要 Homebrew	✅ 是	❌ 否
自动更新	✅ 是（`brew upgrade`）	❌ 手动
服务管理	✅ `brew services`（launchd）	⚠️ `ollama serve`（前台）
安装位置	`/opt/homebrew/`	`~/Applications/`
受限机器	⚠️ 可能失败	✅ 可用
完全无头模式	⚠️ 可能会提示输入 sudo 密码	✅ 是

建议：

如果已安装 Homebrew 并希望进行托管更新，请使用 Homebrew 方法。
如果需要自动化、在受限机器上使用或没有管理员权限，请使用 直接下载方法。

方法 1：使用 Homebrew 安装（如果已安装 Homebrew，推荐使用）

# 1. 检查系统是否满足要求
rlm_system_check()

# 2. 通过 Homebrew 安装
rlm_setup_ollama(install=True, start_service=True, pull_model=True)

执行的操作：

通过 Homebrew 安装 Ollama（brew install ollama）。
将 Ollama 作为托管后台服务启动（brew services start ollama）。
拉取 gemma3:12b 模型（约 8GB 下载量）。

要求：

配备 Apple Silicon（M1/M2/M3/M4）的 macOS。
16GB 以上内存（gemma3:12b 需要约 8GB 内存才能运行）。
已安装 Homebrew。

方法 2：直接下载（完全无头模式，无需 sudo 权限）

# 1. 检查系统（此方法不需要 Homebrew）
rlm_system_check()

# 2. 通过直接下载安装 - 无需 sudo 权限，无需 Homebrew
rlm_setup_ollama_direct(install=True, start_service=True, pull_model=True)

执行的操作：

从 https://ollama.com/download/Ollama-darwin.zip 下载 Ollama。
解压到 ~/Applications/Ollama.app（用户目录，无需管理员权限）。
通过 ollama serve 启动 Ollama（后台进程）。
拉取 gemma3:12b 模型。

要求：

配备 Apple Silicon（M1/M2/M3/M4）的 macOS。
16GB 以上内存。
无需特殊权限！

关于 PATH 的说明：直接安装后，CLI 位于：

~/Applications/Ollama.app/Contents/Resources/ollama

如果需要，可将其添加到 shell 配置中：

export PATH="$HOME/Applications/Ollama.app/Contents/Resources:$PATH"

对于内存较少的系统

在任何一种安装方法中，都可以使用较小的模型：

rlm_setup_ollama(install=True, start_service=True, pull_model=True, model="gemma3:4b")
# 或者
rlm_setup_ollama_direct(install=True, start_service=True, pull_model=True, model="gemma3:4b")

手动设置

如果您更喜欢手动安装或使用不同的平台：

安装 Ollama：从 https://ollama.ai 或通过 Homebrew 安装：

brew install ollama

启动服务：

brew services start ollama
# 或者: ollama serve

拉取模型：

ollama pull gemma3:12b

验证是否正常工作：

rlm_ollama_status()

提供者选择

RLM 在可用时会自动使用 Ollama。您也可以强制使用特定的提供者：

# 自动检测（默认） - 如果 Ollama 可用，则使用
rlm_sub_query(query="Summarize", context_name="doc")

# 显式使用 Ollama
rlm_sub_query(query="Summarize", context_name="doc", provider="ollama")

# 显式使用 Claude SDK
rlm_sub_query(query="Summarize", context_name="doc", provider="claude-sdk")

学习提示

使用以下提示与 Claude Code 一起探索代码库并学习 RLM 模式。代码是唯一的事实来源。

理解工具

Read src/rlm_mcp_server.py and list all RLM tools with their parameters and purpose.

Explain the chunking strategies available in rlm_chunk_context.
When would I use each one?

What's the difference between rlm_sub_query and rlm_sub_query_batch?
Show me the implementation.

理解架构

Read src/rlm_mcp_server.py and explain how contexts are stored and persisted.
Where does the data live?

How does the claude-sdk provider extract text from responses?
Walk me through _call_claude_sdk.

What happens when I call rlm_load_context? Trace the full flow.

实践学习

Load the README as a context, chunk it by paragraphs,
and run a sub-query on the first chunk to summarize it.

Show me how to process a large file in parallel using rlm_sub_query_batch.
Use a real example.

I have a 1MB log file. Walk me through the RLM pattern to extract all errors.

扩展 RLM

Read the test file and explain what scenarios are covered.
What edge cases should I be aware of?

How would I add a new chunking strategy (e.g., by regex delimiter)?
Show me where to modify the code.

How would I add a new provider (e.g., OpenAI)?
What functions need to change?

🔧 技术细节

数据存储

graph TD
    A[("$RLM_DATA_DIR")] --> B["📁 contexts/"]
    A --> C["📁 chunks/"]
    A --> D["📁 results/"]

    B --> B1[".txt files"]
    B --> B2[".meta.json"]
    C --> C1["by context name"]
    D --> D1[".jsonl files"]

    style A fill:#339af0,color:#fff
    style B fill:#51cf66,color:#fff
    style C fill:#51cf66,color:#fff
    style D fill:#51cf66,color:#fff

上下文会在会话之间持久化。分块后的上下文会被缓存以便重用。

📄 许可证

本项目采用 MIT 许可证。

rlm_system_check

检查系统是否满足Ollama与gemma3:12b的要求。验证：macOS、Apple Silicon（M1/M2/M3/M4）、16GB+ RAM、Homebrew安装。在尝试Ollama设置前使用。

rlm_setup_ollama

通过Homebrew安装Ollama（macOS）。需要预先安装Homebrew。使用'brew install'和'brew services'。优点：自动更新、预构建二进制文件、托管服务。缺点：需要Homebrew，首次安装Homebrew时可能需要sudo。

参数

install : bool*

描述

通过Homebrew安装Ollama（需要Homebrew）

参数

start_service : bool*

描述

通过brew services将Ollama作为后台服务启动

参数

pull_model : bool*

描述

拉取默认模型（gemma3:12b）

参数

model : str*

描述

要拉取的模型（默认：gemma3:12b）。对于RAM较低的系统，使用gemma3:4b或gemma3:1b。

rlm_setup_ollama_direct

通过直接下载安装Ollama（macOS）。从ollama.com下载到~/Applications。优点：无需Homebrew、无需sudo、完全无头、适用于锁定/受管机器。缺点：手动PATH设置、无自动更新、服务作为前台进程运行。

参数

install : bool*

描述

下载并安装Ollama到~/Applications（无需sudo）

参数

start_service : bool*

描述

在后台启动Ollama服务器（ollama serve）

参数

pull_model : bool*

描述

拉取默认模型（gemma3:12b）

参数

model : str*

描述

要拉取的模型（默认：gemma3:12b）。对于RAM较低的系统，使用gemma3:4b或gemma3:1b。

rlm_ollama_status

检查Ollama服务器状态和可用模型。返回Ollama是否运行、可用模型列表以及默认模型（gemma3:12b）是否可用。用于确定是否有免费的本地推理可用。

参数

force_refresh : bool*

描述

强制刷新缓存状态（默认：false）

rlm_load_context

将大型上下文作为外部变量加载。返回元数据，不包含内容本身。

参数

name : str*

描述

此上下文的标识符

参数

content : str*

描述

完整的上下文内容

rlm_inspect_context

检查已加载的上下文 - 获取结构信息，无需将完整内容加载到提示中。

参数

name : str*

描述

上下文标识符

参数

preview_chars : int*

描述

预览字符数（默认500）

rlm_chunk_context

按策略对已加载的上下文进行分块。返回分块元数据，而非完整内容。

参数

name : str*

描述

上下文标识符

参数

strategy : str*

描述

分块策略 - 'lines'、'chars' 或 'paragraphs'

参数

size : int*

描述

分块大小（根据策略为行数/字符数）

rlm_get_chunk

按索引获取特定分块。分块后用于检索单个片段。

参数

name : str*

描述

上下文标识符

参数

chunk_index : int*

描述

要检索的分块索引

rlm_filter_context

使用正则表达式/字符串操作过滤上下文。创建新的过滤上下文。

参数

name : str*

描述

源上下文标识符

参数

output_name : str*

描述

过滤后上下文的名称

参数

pattern : str*

描述

匹配的正则表达式模式

参数

mode : str*

描述

'keep' 或 'remove' 匹配行

rlm_sub_query

在分块或过滤的上下文上进行子LLM调用。递归模式的核心。

参数

query : str*

描述

子调用的问题/指令

参数

context_name : str*

描述

要查询的上下文标识符

参数

chunk_index : int*

描述

可选：特定分块索引

参数

provider : str*

描述

LLM提供者 - 'auto'、'ollama' 或 'claude-sdk'。'auto' 优先使用Ollama（如果可用，免费本地推理）

参数

model : str*

描述

要使用的模型（应用提供者特定的默认值）

rlm_store_result

存储子调用结果以供后续聚合。

参数

name : str*

描述

结果集标识符

参数

result : str*

描述

要存储的结果内容

参数

metadata : dict*

描述

关于此结果的可选元数据

rlm_get_results

检索存储的结果以进行聚合。

参数

name : str*

描述

结果集标识符

rlm_list_contexts

列出所有已加载的上下文及其元数据。

rlm_sub_query_batch

并行处理多个分块。遵守并发限制以管理系统资源。

参数

query : str*

描述

每个子调用的问题/指令

参数

context_name : str*

描述

上下文标识符

参数

chunk_indices : list[int]*

描述

要处理的分块索引列表

参数

provider : str*

描述

LLM提供者 - 'auto'、'ollama' 或 'claude-sdk'

参数

model : str*

描述

要使用的模型（应用提供者特定的默认值）

参数

concurrency : int*

描述

最大并行请求数（默认4，最大8）

rlm_auto_analyze

自动检测内容类型并使用最优分块策略进行分析。常见任务的一步分析。

参数

name : str*

描述

上下文标识符

参数

content : str*

描述

要分析的内容

参数

goal : str*

描述

分析目标：'summarize'、'find_bugs'、'extract_structure'、'security_audit' 或 'answer:<your question>'

参数

provider : str*

描述

LLM提供者 - 'auto' 优先使用Ollama（如果可用）

参数

concurrency : int*

描述

最大并行请求数（默认4，最大8）

rlm_firewall_status

检查代码执行防火墙的状态。返回防火墙是否启用、使用的Ollama端点以及是否会阻止危险代码模式的信息。当安装code-firewall-mcp时防火墙自动启用：pip install massive-context-mcp[firewall]。

rlm_exec

在沙箱子进程中针对已加载的上下文执行Python代码。设置结果变量以输出。

参数

code : str*

描述

要执行的Python代码。用户设置结果变量以输出。

参数

context_name : str*

描述

先前加载的上下文的名称

参数

timeout : int*

描述

最大执行时间（秒，默认30）

Firecrawl MCP Server

Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器，提供丰富的网页抓取、搜索和内容提取功能。

Framelink Figma MCP Server是一个为AI编程工具（如Cursor）提供Figma设计数据访问的服务器，通过简化Figma API响应，帮助AI更准确地实现设计到代码的一键转换。

TypeScript

84.0K

4.5分

Duckduckgo MCP Server

已认证

DuckDuckGo搜索MCP服务器，为Claude等LLM提供网页搜索和内容抓取服务

Python

98.7K

4.3分

Edgeone Pages MCP Server

EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务

Exa MCP Server是一个为AI助手（如Claude）提供网络搜索功能的服务器，通过Exa AI搜索API实现实时、安全的网络信息获取。

MiniMax Model Context Protocol (MCP) 是一个官方服务器，支持与强大的文本转语音、视频/图像生成API交互，适用于多种客户端工具如Claude Desktop、Cursor等。

Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务，通过Model Context Protocol直接集成到提示中，解决LLM使用过时信息的问题。

百度地图MCP Server是国内首个兼容MCP协议的地图服务，提供地理编码、路线规划等10个标准化API接口，支持Python和Typescript快速接入，赋能智能体实现地图相关功能。

智启未来，您的人工智能解决方案智库

Massive Context MCP

概述

安装

工具列表

内容详情

替代品

什么是Massive Context MCP?

如何使用Massive Context MCP?

适用场景

主要功能

如何使用

使用案例

常见问题

相关资源

安装

🚀 Massive Context MCP

🚀 快速开始

📦 安装指南

选项 1：通过 PyPI 安装（推荐）

选项 2：Claude 桌面版一键安装

选项 3：从源代码安装

连接到 Claude Code / Claude 桌面版

✨ 主要特性

核心思想

自动检测和选择最佳可用的提供者

支持多种工具进行上下文分析和处理

设置与状态工具

分析工具

💻 使用示例

基础用法

高级用法

处理 2MB 的文档

分析《战争与和平》（3.3MB）

📚 详细文档

使用 rlm_auto_analyze 进行快速分析

使用 rlm_exec 进行编程式分析

代码防火墙集成（可选）

自动检测提供者的工作原理

检查 Ollama 状态

透明的提供者选择

自主使用

设置 Ollama（免费本地推理）

选择安装方法

方法 1：使用 Homebrew 安装（如果已安装 Homebrew，推荐使用）

方法 2：直接下载（完全无头模式，无需 sudo 权限）

对于内存较少的系统

手动设置

提供者选择

学习提示

理解工具

理解架构

实践学习

扩展 RLM

🔧 技术细节

数据存储

📄 许可证

替代品

使用 `rlm_auto_analyze` 进行快速分析

使用 `rlm_exec` 进行编程式分析