Claude-Gemini 集成工具 'CGMB' v1.1.0:实现 Windows 支持

发布: (2026年1月13日 GMT+8 00:00)
3 分钟阅读
原文: Dev.to

Source: Dev.to

概览

CGMB(Claude‑Gemini 多模态桥)1.1.0 版新增完整的 Windows 支持、对扫描版 PDF 的 OCR、URL 自动路由,以及对最新 Gemini 模型(gemini-3-flashgemini-2.5-flash)的支持。

v1.1.0 中的新特性

功能描述状态
🪟 Windows 支持路径规范化与盘符处理✅ 完全支持
📝 OCR 功能支持扫描版 PDF✅ 新增
🔄 URL 自动路由根据 URL 类型选择层✅ 新增
🚀 最新模型gemini-3-flashgemini-2.5-flash✅ 已支持

Windows 路径规范化

背景

  • v1.0 只处理 Unix 风格的路径。
  • Windows 路径:
    • 以盘符开头(C:D: …)
    • 使用反斜杠(\)作为分隔符
    • 可能包含混合的正斜杠(C:/Users/...

实现(CGMBServer.ts

// Detect Windows absolute path pattern (case‑insensitive)
const isWindowsAbsolutePath = /^[A-Za-z]:[\/\\]/.test(filePath);

if (isWindows && isWindowsAbsolutePath) {
  // Normalize forward slashes to backslashes
  preprocessedPath = filePath.replace(/\//g, '\\');
}

const normalizedPath = path.normalize(preprocessedPath);

// Absolute path detection (considering Windows pattern)
const isAbsolute = path.isAbsolute(normalizedPath) || isWindowsAbsolutePath;
const resolvedPath = isAbsolute
  ? normalizedPath
  : path.resolve(baseDir, normalizedPath);

关键点

  • 正则 /^[A-Za-z]:[\/\\]/ 用于检测盘符。
  • 在调用 path.normalize() 之前统一斜杠。
  • path.isAbsolute() 的结果与 Windows 模式检测相结合。

基于 Prompt 的路径检测

// Regex to detect both Windows and Unix paths
const filePathRegex = /(?:[A-Za-z]:\\[^\s"'<>|]+\.[a-zA-Z0-9]+|\/(?!https?:)[^\s"'<>|]+\.[a-zA-Z0-9]+|\.\.?\/[^\s"'<>|]+\.[a-zA-Z0-9]+)/gi;

const localPathsInPrompt = prompt.match(filePathRegex) || [];

使用示例

CGMB analyze C:\Users\name\Documents\report.pdf
CGMB analyze /home/user/documents/report.pdf

URL 自动路由

工具现在能够判断 URL 类型并将请求路由到最合适的 AI 层。

private detectUrlType(url: string): 'pdf' | 'image' | 'audio' | 'web' {
  const lower = url.toLowerCase();
  const urlPath = lower.split('?')[0] ?? lower;

  if (urlPath.endsWith('.pdf') || lower.includes('/pdf')) {
    return 'pdf';
  }

  if (/\.(png|jpg|jpeg|gif|webp|bmp|svg)$/.test(urlPath)) {
    return 'image';
  }

  if (/\.(mp3|wav|m4a|ogg|flac|aac)$/.test(urlPath)) {
    return 'audio';
  }

  return 'web';
}

路由表

URL 类型目标原因
PDFAI Studio通过 Gemini File API 进行 OCR 处理
图片 / 音频AI Studio多模态处理
网页Gemini CLI实时信息检索

安装与升级

# 新安装
npm install -g claude-gemini-multimodal-bridge

# 升级
npm update -g claude-gemini-multimodal-bridge

版本对比

项目v1.0.0v1.1.0
Windows 支持❌ 仅 Unix✅ 完全支持
OCR 功能❌ 无✅ 支持扫描版 PDF
URL 路由基础版✅ 基于类型的自动选择
Gemini 模型gemini-2.0-flashgemini-3-flashgemini-2.5-flash

未来计划

  • 更高级的路由算法
  • 快速支持新 Gemini 模型
  • 性能优化

链接

  • GitHub:
  • README:
  • NPM:

欢迎提供反馈和提交问题!

Back to Blog

相关文章

阅读更多 »

你好,我是新人。

嗨!我又回到 STEM 的领域了。我也喜欢学习能源系统、科学、技术、工程和数学。其中一个项目是…