Linkedin Spider

LinkedIn數據爬蟲工具，支持個人資料、公司信息、帖子搜索等多種數據提取，提供Python庫、命令行和MCP服務器三種使用方式，內置反檢測機制。

社交媒體研究與數據 #LinkedIn爬蟲 #數據提取 #MCP服務 #自動化工具 .Python

評分 : 2.5分

下載量 : 5.9K

更新時間 : 2025-12-12

打開站點

什麼是LinkedIn Spider MCP Server?

LinkedIn Spider MCP Server是一個基於Model Context Protocol的服務器，它將LinkedIn數據提取功能封裝成AI助手可以理解和使用的能力。通過這個服務器，您可以直接在Claude等AI助手對話中搜索LinkedIn用戶資料、查看職位信息、獲取公司詳情，而無需離開對話界面或編寫任何代碼。

如何使用LinkedIn Spider MCP Server?

使用LinkedIn Spider MCP Server非常簡單：首先配置您的LinkedIn登錄憑證，然後啟動MCP服務器，最後將服務器連接到您的AI助手（如Claude Desktop）。連接成功後，您就可以在對話中直接請求LinkedIn數據，例如搜索特定行業的專業人士或查看公司信息。

適用場景

LinkedIn Spider MCP Server特別適合以下場景： • 招聘人員快速查找候選人 • 銷售人員尋找潛在客戶 • 市場研究人員分析行業趨勢 • 創業者尋找合作伙伴或投資者 • 求職者瞭解目標公司和職位 • 商業分析師收集競爭情報

主要功能

智能用戶資料搜索

支持按職位、地點、公司、連接類型等多種條件搜索LinkedIn用戶資料，返回詳細的個人信息和職業背景。

公司信息提取

獲取公司的完整信息，包括行業、規模、總部地點、成立時間、專業領域和公司描述等關鍵數據。

內容帖子搜索

按關鍵詞搜索LinkedIn帖子，獲取完整的帖子內容、作者信息、互動數據和相關評論。

連接管理

查看和管理您的LinkedIn連接請求，包括待處理的入站和出站連接邀請。

多種傳輸協議

支持SSE、HTTP和STDIO三種傳輸協議，可根據使用場景選擇最合適的連接方式。

反檢測機制

內置智能反檢測技術，模擬人類瀏覽行為，降低被LinkedIn識別為機器人的風險。

優勢

無需編程知識即可訪問LinkedIn數據

直接在AI對話中獲取即時信息

支持多種搜索條件和過濾器

提供詳細的結構化數據輸出

內置會話管理，減少重複登錄

支持Docker容器化部署，易於管理

侷限性

需要有效的LinkedIn賬戶進行認證

受LinkedIn服務條款限制，需合理使用

數據提取速度受網絡和LinkedIn限制

高級功能可能需要LinkedIn Premium賬戶

大規模數據提取可能觸發安全機制

如何使用

安裝MCP服務器

通過pip安裝LinkedIn Spider MCP服務器組件，確保您的Python環境已準備就緒。

配置環境變量

創建.env文件或在系統環境變量中設置LinkedIn登錄憑證和服務器配置。

啟動MCP服務器

根據您的需求選擇合適的傳輸協議啟動服務器。SSE適合Claude Desktop集成，HTTP適合Web應用。

連接到AI助手

在Claude Desktop配置文件中添加MCP服務器配置，或通過Claude Code命令行添加連接。

開始使用

在AI助手對話中直接請求LinkedIn數據，例如搜索特定行業的專業人士或查看公司信息。

使用案例

招聘候選人搜索

HR經理需要尋找具有特定技能和經驗的候選人，通過MCP服務器快速搜索符合條件的LinkedIn用戶。

市場競品分析

市場分析師需要了解競爭對手的公司信息和關鍵人員，通過MCP服務器獲取結構化公司數據。

行業趨勢研究

研究人員需要了解特定領域的最新動態和專家觀點，通過MCP服務器搜索相關帖子和內容。

銷售線索開發

銷售人員需要尋找潛在客戶的關鍵決策者，通過MCP服務器定位特定公司和職位的聯繫人。

常見問題

我需要LinkedIn Premium賬戶才能使用這個MCP服務器嗎？

MCP服務器安全嗎？我的LinkedIn憑證會被存儲在哪裡？

我可以同時運行多個MCP服務器實例嗎？

數據提取有頻率限制嗎？

支持哪些AI助手？

如果遇到認證失敗怎麼辦？

🚀 LinkedIn 爬蟲

輕鬆抓取 LinkedIn 數據，零檢測風險。提取、導出並自動化處理你的 LinkedIn 數據。

🚀 快速開始

安裝

選擇你偏好的安裝方式：

選項 1：使用 pip（推薦用於常規使用）

# 僅安裝 Python 庫
pip install linkedin-spider

# 安裝用於命令行界面 (CLI) 的版本
pip install linkedin-spider[cli]

# 安裝用於 MCP 服務器的版本
pip install linkedin-spider[mcp]

# 安裝包含所有功能的版本（CLI + MCP + 庫）
pip install linkedin-spider[all]

選項 2：使用 uv 進行開發設置

# 克隆倉庫
git clone https://github.com/vertexcover-io/linkedin-spider
cd linkedin-spider
# 使用 uv 進行安裝
uv sync

⚠️ 重要提示

認證方式更新：LinkedIn 加強了反爬蟲機制，暫時影響了基於 Cookie 的認證方式。建議使用電子郵件/密碼認證方式以確保可靠訪問。我們正在積極恢復完整的 Cookie 認證支持。

✨ 主要特性

使用高級過濾器（地理位置、人脈類型、當前公司、職位）搜索 LinkedIn 個人資料。
根據關鍵詞搜索並提取 LinkedIn 帖子，同時獲取全面的元數據。
提取完整的個人資料信息（工作經歷、教育背景、技能、聯繫方式）。
獲取公司詳細信息。
檢索收到和發出的人脈請求。
向個人資料發送人脈請求。
獲取對話列表和詳細的對話歷史記錄。
內置反檢測和會話管理功能。

💻 使用示例

1. Python 庫

非常適合集成到你現有的 Python 應用程序中：

from linkedin_spider import LinkedinSpider, ScraperConfig

config = ScraperConfig(headless=True, page_load_timeout=30)

# 進行認證（使用電子郵件/密碼或 Cookie）。
# 認證通常只需進行一次，會話會保存在 Chrome 配置文件中
scraper = LinkedinSpider(
    email="your_email@example.com",
    password="your_password",
    config=config
)

# 搜索個人資料
results = scraper.search_profiles("software engineer", max_results=10)

輸出示例：

[
  {
    "name": "John Doe",
    "title": "Senior Software Engineer at Google",
    "location": "San Francisco, CA",
    "profile_url": "https://linkedin.com/in/johndoe",
    "connections": "500+"
  },
  {
    "name": "Jane Smith",
    "title": "Software Engineer at Microsoft",
    "location": "Seattle, WA",
    "profile_url": "https://linkedin.com/in/janesmith",
    "connections": "200+"
  }
]

# 根據關鍵詞搜索帖子
posts = scraper.search_posts("artificial intelligence", max_results=10, scroll_pause=2.0)

輸出示例：

[
  {
    "author_name": "John Doe",
    "author_headline": "AI Research Scientist at OpenAI",
    "author_profile_url": "https://linkedin.com/in/johndoe",
    "connection_degree": "2nd",
    "post_time": "2024-01-15T14:30:00+00:00",
    "post_text": "Excited to share our latest research on [large language models](https://example.com/paper)...",
    "hashtags": ["#AI", "#MachineLearning", "#Research"],
    "links": ["https://example.com/paper"],
    "post_url": "https://linkedin.com/feed/update/urn:li:activity:123456789",
    "media_urls": ["https://media.licdn.com/dms/image/..."],
    "likes_count": 1247,
    "comments_count": 89,
    "reposts_count": 234,
    "comments": [
      {
        "author_name": "Jane Smith",
        "author_profile_url": "https://linkedin.com/in/janesmith",
        "comment_text": "Great insights! Looking forward to reading the full paper.",
        "comment_time": "2024-01-15T15:45:00+00:00",
        "reactions_count": 12
      }
    ]
  }
]

# 抓取單個個人資料
profile = scraper.scrape_profile("https://linkedin.com/in/someone")

輸出示例：

{
  "name": "John Doe",
  "title": "Senior Software Engineer",
  "location": "San Francisco, CA",
  "about": "Passionate software engineer with 8+ years of experience...",
  "experience": [
    {
      "title": "Senior Software Engineer",
      "company": "Google",
      "duration": "2021 - Present",
      "description": "Leading backend development for search infrastructure..."
    }
  ],
  "education": [
    {
      "school": "Stanford University",
      "degree": "BS Computer Science",
      "years": "2013 - 2017"
    }
  ],
  "skills": ["Python", "Java", "Kubernetes", "AWS"]
}

# 抓取公司信息
company = scraper.scrape_company("https://linkedin.com/company/tech-corp")

輸出示例：

{
  "name": "TechCorp Inc",
  "industry": "Software Development",
  "company_size": "1,001-5,000 employees",
  "headquarters": "San Francisco, CA",
  "founded": "2010",
  "specialties": ["Cloud Computing", "AI/ML", "Data Analytics"],
  "description": "Leading technology company focused on enterprise solutions...",
  "website": "https://techcorp.com",
  "follower_count": "45,230"
}

# 別忘了清理資源
scraper.close()

更多示例請參考：examples

2. 命令行界面 (CLI)

非常適合快速提取數據和編寫腳本：

# 如果通過 pip 安裝
# 搜索個人資料
linkedin-spider-cli search -q "product manager" -n 10 -o results.json --email your@email.com --password yourpassword

# 搜索帖子
linkedin-spider-cli search-posts -k "artificial intelligence" -n 10 -s 2.0 -o posts.json --email your@email.com --password yourpassword

# 抓取單個個人資料
linkedin-spider-cli profile -u "https://linkedin.com/in/johndoe" -o profile.json --email your@email.com --password yourpassword

# 抓取公司信息
linkedin-spider-cli company -u "https://linkedin.com/company/openai" -o company.json --email your@email.com --password yourpassword

# 獲取人脈請求
linkedin-spider-cli connections -n 20 -o connections.json --email your@email.com --password yourpassword

# 如果使用開發設置
# 搜索個人資料
uv run linkedin-spider-cli search -q "product manager" -n 10 -o results.json --email your@email.com --password yourpassword

# 搜索帖子
uv run linkedin-spider-cli search-posts -k "artificial intelligence" -n 10 -s 2.0 -o posts.json --email your@email.com --password yourpassword

# 抓取單個個人資料
uv run linkedin-spider-cli profile -u "https://linkedin.com/in/johndoe" -o profile.json --email your@email.com --password yourpassword

# 抓取公司信息
uv run linkedin-spider-cli company -u "https://linkedin.com/company/openai" -o company.json --email your@email.com --password yourpassword

# 獲取人脈請求
uv run linkedin-spider-cli connections -n 20 -o connections.json --email your@email.com --password yourpassword

💡 使用建議

通常你只需提供一次 --email 和 --password。CLI 會保存你的認證會話，並在後續命令中重複使用，直到會話過期（通常為幾小時或幾天）。你也可以設置 LINKEDIN_EMAIL 和 LINKEDIN_PASSWORD 環境變量，以避免重複輸入。

3. MCP 服務器

在 .env 文件中設置環境變量：

# 認證（選擇一種方式）
LINKEDIN_EMAIL=your_email@example.com
LINKEDIN_PASSWORD=your_password
# 或者
LINKEDIN_COOKIE=your_li_at_cookie_value

# 配置
HEADLESS=true

# 傳輸方式（可選，默認為 stdio）
TRANSPORT=sse
HOST=127.0.0.1
PORT=8000

啟動 MCP 服務器：

# 如果通過 pip 安裝
# 顯示可用的傳輸選項
linkedin-spider-mcp

# 使用特定的傳輸方式啟動
linkedin-spider-mcp serve sse --email your@email.com --password yourpassword
linkedin-spider-mcp serve http --host 0.0.0.0 --port 9000 --email your@email.com --password yourpassword
linkedin-spider-mcp serve stdio --email your@email.com --password yourpassword

# 或者使用環境變量
TRANSPORT=sse linkedin-spider-mcp serve

# 如果使用開發設置
# 顯示可用的傳輸選項
uv run linkedin-spider-mcp

# 使用特定的傳輸方式啟動
uv run linkedin-spider-mcp serve sse --email your@email.com --password yourpassword
uv run linkedin-spider-mcp serve http --host 0.0.0.0 --port 9000 --email your@email.com --password yourpassword
uv run linkedin-spider-mcp serve stdio --email your@email.com --password yourpassword

# 或者使用環境變量
TRANSPORT=sse uv run linkedin-spider-mcp serve

與 Claude Code 集成

# 添加到 Claude Code
claude mcp add linkedin-spider --transport sse <server-url>
# 示例服務器 URL 格式：http://localhost:8080/sse

與 Claude Desktop 集成

將以下內容添加到你的 Claude Desktop 配置文件中：

Windows：%APPDATA%\Claude\claude_desktop_config.json
macOS：~/Library/Application Support/Claude/claude_desktop_config.json
Linux：~/.config/Claude/claude_desktop_config.json

選項 1：使用 Docker（推薦）

Docker 方式提供了可靠的、隔離的執行環境，包含所有依賴項。首先，構建 Docker 鏡像：

# 構建 stdio 服務器鏡像
docker build -f Dockerfile.stdio -t linkedin-mcp-stdio .

然後將以下內容添加到你的 Claude Desktop 配置文件中：

{
  "mcpServers": {
    "linkedin-spider": {
      "command": "docker",
      "args": [
        "run",
        "--rm",
        "-i",
        "-e",
        "LINKEDIN_EMAIL=your_email@example.com",
        "-e",
        "LINKEDIN_PASSWORD=your_password",
        "-e",
        "HEADLESS=true",
        "-e",
        "TRANSPORT=stdio",
        "linkedin-mcp-stdio"
      ]
    }
  }
}

Docker 開發與測試

在使用 Docker 進行開發和測試時，你可以使用一個鏡像並配置不同的傳輸方式：

構建 Docker 鏡像

# 一次性構建適用於所有傳輸類型的鏡像
docker build -t linkedin-mcp .

使用不同的傳輸方式運行

SSE 服務器

docker run -p 8000:8000 -e TRANSPORT=sse --env-file .env linkedin-mcp

HTTP 服務器

docker run -p 8000:8000 -e TRANSPORT=http --env-file .env linkedin-mcp

STDIO 服務器

docker run --rm -i -e TRANSPORT=stdio --env-file .env linkedin-mcp

認證方式

方式 1：使用 LinkedIn Cookie

在瀏覽器中登錄 LinkedIn。
打開開發者工具（F12）。
轉到“應用程序/存儲” → “Cookies” → “linkedin.com”。
複製 li_at Cookie 的值。
在代碼中使用它：

scraper = LinkedinSpider(li_at_cookie="your_cookie_value")

方式 2：使用電子郵件和密碼（推薦）

scraper = LinkedinSpider(
    email="your_email@example.com",
    password="your_password"
)

🤝 貢獻

我們歡迎貢獻！請參考 CONTRIBUTING.md 獲取貢獻指南。

📄 許可證

本項目採用 MIT 許可證 - 詳情請參閱 LICENSE 文件。

⚠️ 免責聲明

本工具僅供個人使用。請遵守以下規則：

遵守 LinkedIn 的服務條款。
使用合理的請求速率限制。
不要對用戶進行垃圾郵件或騷擾行為。
對收集的數據負責。

準備好像專業人士一樣提取 LinkedIn 數據了嗎？ 給這個倉庫點個星，開始抓取吧！

Baidu Map

已認證

百度地圖MCP Server是國內首個兼容MCP協議的地圖服務，提供地理編碼、路線規劃等10個標準化API接口，支持Python和Typescript快速接入，賦能智能體實現地圖相關功能。

Markdownify是一個多功能文件轉換服務，支持將PDF、圖片、音頻等多種格式及網頁內容轉換為Markdown格式。

Firecrawl MCP Server是一個集成Firecrawl網頁抓取能力的模型上下文協議服務器，提供豐富的網頁抓取、搜索和內容提取功能。

TypeScript

109.5K

5分

Sequential Thinking MCP Server

一個基於MCP協議的結構化思維服務器，通過定義思考階段幫助分解複雜問題並生成總結

Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具，通過自然語言描述幫助開發者快速創建現代化UI組件，支持多種IDE集成。

JavaScript

19.2K

5分

Edgeone Pages MCP Server

EdgeOne Pages MCP是一個通過MCP協議快速部署HTML內容到EdgeOne Pages並獲取公開URL的服務

Context7 MCP是一個為AI編程助手提供即時、版本特定文檔和代碼示例的服務，通過Model Context Protocol直接集成到提示中，解決LLM使用過時信息的問題。

一個基於Python的MCP服務器，通過Notion API提供高級待辦事項管理和內容組織功能，實現AI模型與Notion的無縫集成。

智啟未來，您的人工智慧解決方案智庫

Linkedin Spider

概述

安裝

工具列表

內容詳情

替代品

什麼是LinkedIn Spider MCP Server?

如何使用LinkedIn Spider MCP Server?

適用場景

主要功能

如何使用

使用案例

常見問題

相關資源

安裝

🚀 LinkedIn 爬蟲

🚀 快速開始

安裝

選項 1：使用 pip（推薦用於常規使用）

選項 2：使用 uv 進行開發設置

✨ 主要特性

💻 使用示例

1. Python 庫

2. 命令行界面 (CLI)

3. MCP 服務器

與 Claude Code 集成

與 Claude Desktop 集成

選項 1：使用 Docker（推薦）

Docker 開發與測試

構建 Docker 鏡像

使用不同的傳輸方式運行

SSE 服務器

HTTP 服務器

STDIO 服務器

認證方式

方式 1：使用 LinkedIn Cookie

方式 2：使用電子郵件和密碼（推薦）

🤝 貢獻

📄 許可證

⚠️ 免責聲明

替代品