MindsDB 为 Google 的 MCP Toolbox 超级加速,支持非结构化数据

发布: (2025年12月30日 GMT+8 04:46)
6 min read
原文: Dev.to

Source: Dev.to

MindsDB 集成概览

MindsDB 是专为 AI 应用设计的联邦查询引擎。它充当通用翻译器,让您能够使用熟悉的 SQL 查询数百种数据源(结构化、半结构化、非结构化)。我们已将此功能作为新连接器贡献到 MCP Toolbox,使开发者和 AI 代理能够通过 MindsDB 无缝地与更广泛的企业数据交互。

现在,借助 MindsDB,MCP Toolbox 可以连接到 hundreds of data sources,包括 Salesforce、Jira、GitHub 等流行业务应用,以及 Gmail、Slack 等非结构化数据源。这意味着您可以打破数据孤岛,通过单一 API 将所有数据连接到 AI 应用中。典型使用场景包括 AI 驱动的搜索、分析以及面向代理应用的实时数据。

MindsDB + Google MCP Toolbox

Source:

关键特性:连接结构化与非结构化世界

  • 数据源扩展 – 即时获取海量新数据源目录。可在统一界面中同时查询 Salesforce 商机与 GitHub 活动,或分析电子邮件模式与 Slack 对话。
  • 面向任何数据的 SQL 接口 – 编写标准 SQL 查询,系统会自动转换为各种 API 协议(REST、GraphQL、本地协议)。这降低了访问多样化数据的复杂性和学习曲线。
  • 跨数据源 AI 分析 – 在不同来源之间执行连接和分析。例如,将 Salesforce 销售数据与 GitHub 开发活动关联,获得业务运营的全局视图。MindsDB 将每个来源(结构化或非结构化)视为虚拟表,支持在所有来源上进行复杂的 SQL 操作。
  • 访问非结构化数据 – 超过 200 个连接器可让您对文本数据建立索引并使用 SQL 进行查询。
  • 非结构化数据的知识库 – 创建自主的检索增强生成(RAG)系统。将电子邮件(Gmail/Outlook)、消息(Slack、Microsoft Teams、Discord)以及文件(S3、本地文件)导入知识库。导入后,数据即可被 AI 应用或模型查询。自动生成的数据目录提供所有来源的元数据和关系模型,而混合搜索(向量相似度 + 关键字)则为 AI 搜索和分析场景呈现最相关的结果。

技术实现更新

  • 新 MindsDB 源实现 – Toolbox 现在包含一个利用 MySQL wire 协议实现稳健连接的 MindsDB 源。
  • 全面的测试覆盖 – 大量的单元测试和集成测试确保可靠性,并与现有的 SQL 功能保持向后兼容。
  • 专用 MindsDB 工具mindsdb-execute-sql 用于直接执行 SQL,mindsdb-sql 用于参数化查询,提供更强的灵活性。

快速入门指南

  1. 设置 MCP Toolbox
    确保 MCP Toolbox 服务正在运行。详细说明请参阅官方文档

  2. 安装 MindsDB
    通过 Docker 启动 MindsDB 是最快的方式:

    docker run --name mindsdb_container \
      -e MINDSDB_APIS=http,mysql \
      -p 47334:47334 -p 47335:47335 \
      mindsdb/mindsdb

    如需其他安装方式(例如 PyPI),请参考MindsDB 文档

  3. 在 MindsDB 中连接数据源
    在 MindsDB 中创建“数据库”,以连接外部数据源,例如:

    按照相应的集成指南配置每个连接器。

在 MindsDB 中连接数据源

典型用法是使用 CREATE DATABASE 语句。例如:

-- 连接到 Salesforce
CREATE DATABASE salesforce_datasource
WITH
    ENGINE = 'salesforce',
    PARAMETERS = {
        "username": "your-username@email.com",
        "password": "your-password",
        "client_id": "your-client-id",
        "client_secret": "your-client-secret"
    };

-- 连接到 PostgreSQL
CREATE DATABASE postgresql_datasource 
WITH
    ENGINE = 'postgres',
    PARAMETERS = {
        "host": "postgres.sample.com",
        "port": 5432,
        "database": "postgres",
        "user": "postgres",
        "schema": "data",
        "password": "password"
    };

有关特定连接器细节,请参阅 MindsDB 文档。

4. 在 MCP Toolbox 中使用 MindsDB 工具

MCP Toolbox 中的 MindsDB 集成允许您对已连接的 MindsDB 数据源执行 SQL 查询。您可以使用 mindsdb-execute-sql 等工具直接查询。

-- 运行联邦查询
SELECT *
FROM salesforce_datasource.account a
JOIN postgresql_datasource.customer_int c
  ON a.`Id` = c.`AccountId`;

5. 将数据统一到知识库

将数据加载到 MindsDB 知识库,这对于对大规模非结构化数据集进行语义搜索非常有用。

CREATE KNOWLEDGE_BASE my_kb
USING
    embedding_model = {
        "provider": "openai",
        "model_name": "text-embedding-3-large",
        "api_key": "sk-..."
    },
    reranking_model = {
        "provider": "openai",
        "model_name": "gpt-4o",
        "api_key": "sk-..."
    },
    storage = my_vector_store.storage_table,
    metadata_columns = ['AccountId', 'Created_At', ...],
    content_columns = ['Description', 'Notes', ...],
    id_column = 'Id';

INSERT INTO my_kb
SELECT *
FROM salesforce_datasource.account a
JOIN postgresql_datasource.customer_int c
  ON a.`Id` = c.`AccountId`;

了解更多关于知识库的内容

资源

  • MCP Toolbox GitHub 仓库:
  • MindsDB 在 MCP Toolbox 中:
  • MindsDB 文档:
  • MindsDB GitHub:
Back to Blog

相关文章

阅读更多 »