🚀 CSV Editor - MCPによるAI駆動のCSV処理
AIアシスタントがCSVデータを扱う方法を革新します。 CSV Editorは高性能なMCPサーバーで、Claude、ChatGPT、その他のAIアシスタントに、シンプルなコマンドを通じて強力なデータ操作機能を提供します。

🚀 クイックスタート
なぜCSV Editorなのか?
問題点
AIアシスタントは複雑なデータ操作に苦労します。ファイルを読み取ることはできますが、CSVデータのフィルタリング、変換、分析、検証を効率的に行うためのツールが不足しています。
解決策
CSV Editorは、AIアシスタントに40種類以上のCSV操作専用ツールを提供することで、このギャップを埋めます。これにより、AIアシスタントは以下のことができる強力なデータアナリストに変身します。
- 数秒で乱雑なデータセットをクリーニングする
- 複雑な統計分析を実行する
- データ品質を自動的に検証する
- 自然言語コマンドでデータを変換する
- アンドゥ/リドゥ機能ですべての変更を追跡する
主要な差別化要素
| 機能 |
CSV Editor |
従来のツール |
| AI統合 |
ネイティブMCPプロトコル |
手動操作 |
| 自動保存 |
戦略を持った自動保存 |
手動保存が必要 |
| 履歴追跡 |
スナップショット付きの完全なアンドゥ/リドゥ |
限定的またはなし |
| セッション管理 |
マルチユーザー分離セッション |
単一ユーザー |
| データ検証 |
組み込みの品質スコアリング |
別のツールが必要 |
| パフォーマンス |
チャンク化でGB以上のファイルを処理 |
メモリ制限 |
クイックデモ
"Load the sales data and remove duplicates"
"Filter for Q4 2024 transactions over $10,000"
"Calculate correlation between price and quantity"
"Fill missing values with the median"
"Export as Excel with the analysis"
インストール方法
Smitheryを通じたインストール
Smitheryを通じてClaude Desktop用のcsv-editorを自動的にインストールするには、以下のコマンドを実行します。
npx -y @smithery/cli install @santoshray02/csv-editor --client claude
最速のインストール(推奨)
curl -LsSf https://astral.sh/uv/install.sh | sh
git clone https://github.com/santoshray02/csv-editor.git
cd csv-editor
uv sync
uv run csv-editor
AIアシスタントの設定
Claude Desktop (クリックして展開)
macOSの場合は、~/Library/Application Support/Claude/claude_desktop_config.jsonに以下を追加します。
{
"mcpServers": {
"csv-editor": {
"command": "uv",
"args": ["tool", "run", "csv-editor"],
"env": {
"CSV_MAX_FILE_SIZE": "1073741824"
}
}
}
}
その他のクライアント (Continue, Cline, Windsurf, Zed)
詳細な設定については、MCP_CONFIG.mdを参照してください。
💻 使用例
基本的な使用法
"Load the sales data and remove duplicates"
"Filter for Q4 2024 transactions over $10,000"
"Calculate correlation between price and quantity"
"Fill missing values with the median"
"Export as Excel with the analysis"
高度な使用法
データアナリストのワークフロー
session = load_csv("daily_sales.csv")
remove_duplicates(session_id)
change_column_type("date", "datetime")
fill_missing_values(strategy="median", columns=["revenue"])
get_statistics(columns=["revenue", "quantity"])
detect_outliers(method="iqr", threshold=1.5)
get_correlation_matrix(min_correlation=0.5)
export_csv(format="excel", file_path="clean_sales.xlsx")
ETLパイプライン
load_csv_from_url("https://api.example.com/data.csv")
filter_rows(conditions=[
{"column": "status", "operator": "==", "value": "active"},
{"column": "amount", "operator": ">", "value": 1000}
])
add_column(name="quarter", formula="Q{(month-1)//3 + 1}")
group_by_aggregate(group_by=["quarter"], aggregations={
"amount": ["sum", "mean"],
"customer_id": "count"
})
export_csv(format="parquet")
export_csv(format="json")
データ品質保証
validate_schema(schema={
"customer_id": {"type": "integer", "required": True},
"email": {"type": "string", "pattern": r"^[^@]+@[^@]+\.[^@]+$"},
"age": {"type": "integer", "min": 0, "max": 120}
})
quality_report = check_data_quality()
anomalies = find_anomalies(methods=["statistical", "pattern"])
✨ 主な機能
データ操作
- ロードとエクスポート: CSV、JSON、Excel、Parquet、HTML、Markdown
- 変換: フィルタリング、ソート、グループ化、ピボット、結合
- クリーニング: 重複の削除、欠損値の処理、型の修正
- 計算: 計算列の追加、集計
分析ツール
- 統計: 記述統計、相関、分布
- 外れ値: IQR、Zスコア、カスタム閾値
- プロファイリング: 完全なデータ品質レポート
- 検証: スキーマチェック、品質スコアリング
生産性機能
- 自動保存: 設定可能な戦略で作業を失うことがない
- 履歴: 操作追跡付きの完全なアンドゥ/リドゥ
- セッション: 分離されたマルチユーザーサポート
- パフォーマンス: 大きなファイルのストリーム処理
📚 利用可能なツール
完全なツールリスト (40種類以上のツール)
I/O操作
load_csv - ファイルからロード
load_csv_from_url - URLからロード
load_csv_from_content - 文字列からロード
export_csv - 様々な形式にエクスポート
get_session_info - セッション詳細
list_sessions - アクティブなセッション
close_session - クリーンアップ
データ操作
filter_rows - 複雑なフィルタリング
sort_data - 多列ソート
select_columns - 列選択
rename_columns - 列名の変更
add_column - 計算列の追加
remove_columns - 列の削除
update_column - 値の更新
change_column_type - 型変換
fill_missing_values - 欠損値の処理
remove_duplicates - 重複削除
分析
get_statistics - 統計要約
get_column_statistics - 列統計
get_correlation_matrix - 相関行列
group_by_aggregate - グループ操作
get_value_counts - 頻度カウント
detect_outliers - 外れ値の検出
profile_data - データプロファイリング
検証
validate_schema - スキーマ検証
check_data_quality - 品質メトリクス
find_anomalies - 異常検出
自動保存と履歴
configure_auto_save - 自動保存の設定
get_auto_save_status - 状態の確認
undo / redo - 履歴のナビゲート
get_history - 操作の表示
restore_to_operation - タイムトラベル
🔧 技術詳細
環境変数
| 変数 |
デフォルト |
説明 |
CSV_MAX_FILE_SIZE |
1GB |
最大ファイルサイズ |
CSV_SESSION_TIMEOUT |
3600s |
セッションタイムアウト |
CSV_CHUNK_SIZE |
10000 |
処理チャンクサイズ |
CSV_AUTO_SAVE |
true |
自動保存を有効にする |
自動保存戦略
CSV Editorは、設定可能な戦略で自動的に作業を保存します。
- 上書き (デフォルト) - 元のファイルを更新する
- バックアップ - タイムスタンプ付きのバックアップを作成する
- バージョン管理 - バージョン履歴を維持する
- カスタム - 指定された場所に保存する
configure_auto_save(
strategy="backup",
backup_dir="/backups",
max_backups=10
)
高度なインストールオプション
代替インストール方法
pipを使用する
git clone https://github.com/santoshray02/csv-editor.git
cd csv-editor
pip install -e .
pipxを使用する (グローバル)
pipx install git+https://github.com/santoshray02/csv-editor.git
GitHubから (推奨)
pip install git+https://github.com/santoshray02/csv-editor.git
uv pip install git+https://github.com/santoshray02/csv-editor.git
pip install git+https://github.com/santoshray02/csv-editor.git@v1.0.1
開発
テストの実行
uv run test
uv run test-cov
uv run all-checks
プロジェクト構造
csv-editor/
├── src/csv_editor/ # コア実装
│ ├── tools/ # MCPツールの実装
│ ├── models/ # データモデル
│ └── server.py # MCPサーバー
├── tests/ # テストスイート
├── examples/ # 使用例
└── docs/ # ドキュメント
🤝 コントリビューション
コントリビューションを歓迎します!ガイドラインについては、CONTRIBUTING.mdを参照してください。
簡単なコントリビューションガイド
- リポジトリをフォークする
- 機能ブランチを作成する
- テストを含めて変更を加える
uv run all-checksを実行する
- プルリクエストを送信する
📈 ロードマップ
- [ ] SQLクエリインターフェイス
- [ ] リアルタイムコラボレーション
- [ ] 高度なビジュアライゼーション
- [ ] 機械学習の統合
- [ ] クラウドストレージのサポート
- [ ] 10GB以上のファイルのパフォーマンス最適化
💬 サポート
📄 ライセンス
MITライセンス - LICENSEファイルを参照してください。
🙏 謝辞
以下のツールを使用して構築されています。
あなたのAIのデータ機能を強化しませんか? 2分で始める →