Claude-Gemini 集成工具 'CGMB' v1.1.0:实现 Windows 支持
发布: (2026年1月13日 GMT+8 00:00)
3 分钟阅读
原文: Dev.to
Source: Dev.to
概览
CGMB(Claude‑Gemini 多模态桥)1.1.0 版新增完整的 Windows 支持、对扫描版 PDF 的 OCR、URL 自动路由,以及对最新 Gemini 模型(gemini-3-flash、gemini-2.5-flash)的支持。
v1.1.0 中的新特性
| 功能 | 描述 | 状态 |
|---|---|---|
| 🪟 Windows 支持 | 路径规范化与盘符处理 | ✅ 完全支持 |
| 📝 OCR 功能 | 支持扫描版 PDF | ✅ 新增 |
| 🔄 URL 自动路由 | 根据 URL 类型选择层 | ✅ 新增 |
| 🚀 最新模型 | gemini-3-flash、gemini-2.5-flash | ✅ 已支持 |
Windows 路径规范化
背景
- v1.0 只处理 Unix 风格的路径。
- Windows 路径:
- 以盘符开头(
C:、D:…) - 使用反斜杠(
\)作为分隔符 - 可能包含混合的正斜杠(
C:/Users/...)
- 以盘符开头(
实现(CGMBServer.ts)
// Detect Windows absolute path pattern (case‑insensitive)
const isWindowsAbsolutePath = /^[A-Za-z]:[\/\\]/.test(filePath);
if (isWindows && isWindowsAbsolutePath) {
// Normalize forward slashes to backslashes
preprocessedPath = filePath.replace(/\//g, '\\');
}
const normalizedPath = path.normalize(preprocessedPath);
// Absolute path detection (considering Windows pattern)
const isAbsolute = path.isAbsolute(normalizedPath) || isWindowsAbsolutePath;
const resolvedPath = isAbsolute
? normalizedPath
: path.resolve(baseDir, normalizedPath);
关键点
- 正则
/^[A-Za-z]:[\/\\]/用于检测盘符。 - 在调用
path.normalize()之前统一斜杠。 path.isAbsolute()的结果与 Windows 模式检测相结合。
基于 Prompt 的路径检测
// Regex to detect both Windows and Unix paths
const filePathRegex = /(?:[A-Za-z]:\\[^\s"'<>|]+\.[a-zA-Z0-9]+|\/(?!https?:)[^\s"'<>|]+\.[a-zA-Z0-9]+|\.\.?\/[^\s"'<>|]+\.[a-zA-Z0-9]+)/gi;
const localPathsInPrompt = prompt.match(filePathRegex) || [];
使用示例
CGMB analyze C:\Users\name\Documents\report.pdf
CGMB analyze /home/user/documents/report.pdf
URL 自动路由
工具现在能够判断 URL 类型并将请求路由到最合适的 AI 层。
private detectUrlType(url: string): 'pdf' | 'image' | 'audio' | 'web' {
const lower = url.toLowerCase();
const urlPath = lower.split('?')[0] ?? lower;
if (urlPath.endsWith('.pdf') || lower.includes('/pdf')) {
return 'pdf';
}
if (/\.(png|jpg|jpeg|gif|webp|bmp|svg)$/.test(urlPath)) {
return 'image';
}
if (/\.(mp3|wav|m4a|ogg|flac|aac)$/.test(urlPath)) {
return 'audio';
}
return 'web';
}
路由表
| URL 类型 | 目标 | 原因 |
|---|---|---|
| AI Studio | 通过 Gemini File API 进行 OCR 处理 | |
| 图片 / 音频 | AI Studio | 多模态处理 |
| 网页 | Gemini CLI | 实时信息检索 |
安装与升级
# 新安装
npm install -g claude-gemini-multimodal-bridge
# 升级
npm update -g claude-gemini-multimodal-bridge
版本对比
| 项目 | v1.0.0 | v1.1.0 |
|---|---|---|
| Windows 支持 | ❌ 仅 Unix | ✅ 完全支持 |
| OCR 功能 | ❌ 无 | ✅ 支持扫描版 PDF |
| URL 路由 | 基础版 | ✅ 基于类型的自动选择 |
| Gemini 模型 | gemini-2.0-flash | gemini-3-flash、gemini-2.5-flash |
未来计划
- 更高级的路由算法
- 快速支持新 Gemini 模型
- 性能优化
链接
- GitHub:
- README:
- NPM:
欢迎提供反馈和提交问题!