MCPサーバーデータベース構成サービスとは？

このサービスにより、MCPクライアントは手動で提供する必要なく、自動的にデータベース構成情報を取得できます。これにより、分析スクリプトの生成プロセスが簡素化され、作業効率が向上します。

MCPサーバーデータベース構成サービスの使い方は？

データベース接続情報を含むdatabase.jsonファイルを作成するだけで、MCPクライアントは自動的に構成を読み取り、関連するクエリを実行できます。

適用シナリオ

頻繁にクロスデータベースクエリとデータ分析を実行する必要があるシナリオ、特に分析スクリプトを自動生成する必要がある場合に適しています。

🚀 Pythonスクリプトによるデータ分析

このPythonスクリプトは、データベースからデータを取得し、そのデータを分析してグラフ化するためのものです。具体的には、サーバーデバイスのIDと所属グループ番号を取得し、それを元に各サーバーの地域分布を分析し、グラフ化します。

🚀 クイックスタート

データ取得

まず、db_alpha データベースからサーバーデバイスのIDと所属グループ番号を取得します。

select ex.device_id as id, ex.group_no
from service_config_alpha ex
where ex.is_active = 1
  and ex.status = 1
union all
select dv.id, dv.group_no
from device_config_beta dv
where dv.is_active = 1
  and dv.status = 1

このクエリで取得したサーバーIDを使って、db_beta データベースから各サーバーの地域分布を取得します。

select loc.region,
       count(1)
from connection_log cnt
         left join device_location loc on loc.id = cnt.client_id
where server_id in (
    -- ここに単体のサーバーIDを入力
)
group by loc.region

ただし、取得した結果には region が空の場合があります。これは connection_log テーブルの client_id が db_beta の device_location テーブルに存在しないためです。そのため、これらの client_id を db_alpha の device_location テーブルで再検索し、結果を結合します。

select loc.region,
       count(1)
from device_location loc
where loc.id in (
    -- ここに単体のサーバーの地域分布結果で空の client_id を入力
)
group by loc.region

結果の結合と分析

最後に、上記の2つの結果を結合して、単体のサーバーの地域分布を得ます。そして、地域分布のパーセンテージを計算し、変動係数を算出します。これらの結果を pyecharts を使ってグラフ化します。

# ここにPythonコードを記述
# 例えば、データベース接続、クエリ実行、結果の結合、パーセンテージと変動係数の計算、グラフ化など
import pymysql
import pandas as pd
from pyecharts.charts import Bar
from pyecharts import options as opts

# db_alpha からサーバーIDとグループ番号を取得
conn_alpha = pymysql.connect(host='localhost', user='user', password='password', database='db_alpha')
query1 = """
select ex.device_id as id, ex.group_no
from service_config_alpha ex
where ex.is_active = 1
  and ex.status = 1
union all
select dv.id, dv.group_no
from device_config_beta dv
where dv.is_active = 1
  and dv.status = 1
"""
servers = pd.read_sql(query1, conn_alpha)
conn_alpha.close()

# 各サーバーの地域分布を取得
for server_id in servers['id']:
    conn_beta = pymysql.connect(host='localhost', user='user', password='password', database='db_beta')
    query2 = f"""
    select loc.region,
           count(1)
    from connection_log cnt
             left join device_location loc on loc.id = cnt.client_id
    where server_id = {server_id}
    group by loc.region
    """
    result_beta = pd.read_sql(query2, conn_beta)
    conn_beta.close()

    # region が空の client_id を取得
    null_client_ids = result_beta[result_beta['region'].isnull()]['client_id'].tolist()

    # db_alpha の device_location テーブルで再検索
    conn_alpha = pymysql.connect(host='localhost', user='user', password='password', database='db_alpha')
    query3 = f"""
    select loc.region,
           count(1)
    from device_location loc
    where loc.id in ({','.join(map(str, null_client_ids))})
    group by loc.region
    """
    result_alpha = pd.read_sql(query3, conn_alpha)
    conn_alpha.close()

    # 結果を結合
    combined_result = pd.concat([result_beta, result_alpha])

    # 地域分布のパーセンテージを計算
    combined_result['percentage'] = combined_result['count(1)'] / combined_result['count(1)'].sum()

    # 変動係数を計算
    cv = combined_result['count(1)'].std() / combined_result['count(1)'].mean()

    # グラフ化
    bar = (
        Bar()
        .add_xaxis(combined_result['region'].tolist())
        .add_yaxis("地域分布パーセンテージ", combined_result['percentage'].tolist())
        .set_global_opts(title_opts=opts.TitleOpts(title=f"サーバー {server_id} の地域分布パーセンテージ"))
    )
    bar.render(f"server_{server_id}_region_distribution.html")

# 各グループの地域分布を分析
grouped_servers = servers.groupby('group_no')
for group_no, group_servers in grouped_servers:
    # 各グループの地域分布を取得
    group_result = pd.DataFrame()
    for server_id in group_servers['id']:
        # 上記のコードを再利用して各サーバーの地域分布を取得
        pass

    # 各グループの地域分布のパーセンテージを計算
    group_result['percentage'] = group_result['count(1)'] / group_result['count(1)'].sum()

    # 各グループの変動係数を計算
    group_cv = group_result['count(1)'].std() / group_result['count(1)'].mean()

    # 各グループの平均変動係数を計算
    average_group_cv = grouped_servers['count(1)'].std() / grouped_servers['count(1)'].mean()

    # グラフ化
    bar = (
        Bar()
        .add_xaxis(group_result['region'].tolist())
        .add_yaxis("地域分布パーセンテージ", group_result['percentage'].tolist())
        .set_global_opts(title_opts=opts.TitleOpts(title=f"グループ {group_no} の地域分布パーセンテージ"))
    )
    bar.render(f"group_{group_no}_region_distribution.html")

    # 各グループの平均変動係数の柱状図を作成
    bar_cv = (
        Bar()
        .add_xaxis(grouped_servers.groups.keys())
        .add_yaxis("平均変動係数", average_group_cv.tolist())
        .set_global_opts(title_opts=opts.TitleOpts(title="各グループの平均変動係数"))
    )
    bar_cv.render("group_average_cv.html")