RAG的进化：超越搜索，进入理解我的“Personal Context”时代

发布: 3天前 (2026年2月10日 GMT+8 12:05)

4 分钟阅读

Source: Samsung Tech Blog

了解我朋友对话内容的 AI

当前 RAG 的局限性：上下文盲点

Data Silo（数据孤岛）
AI 无法访问用户的 KakaoTalk·消息应用，因此无法判断“철준”这个实体是谁、何时用什么文本提到过美食店。
Static Knowledge（静态知识）
即使知道美食店的名称，也没有“现在可以去（Open Now）”这种实时条件，因为它不在 LLM 的预训练数据中。

“철준님이 지난주 톡으로 극찬했던 ‘해운대 암소갈비’는 지금 대기 시간이 너무 길어 이용이 어렵습니다. 대신 추천했던 ‘금수복국’은 현재 영업 중이며, 택시로 15분 거리입니다。”

Local‑First Indexing
敏感的个人数据（聊天记录、生物信息、本地文件）不向设备外部传输，利用智能手机 NPU 进行嵌入后存入 SQLite‑VSS·Mobile‑optimized Vector Store 进行本地索引
SLM 基于的 Query Routing
轻量模型（SLM，例如 Gauss 3B、Gemma 1B、Phi‑3 等）首先分析查询
- “내 일정 확인해줘” → 本地处理
- “최신 기술 트렌드 알려줘” → 云端路由

GraphRAG 引入
为了处理向量搜索遗漏的关系型问题，将用户数据结构化为知识图谱
```
?User :met_with ?KimTeamLead .
?KimTeamLead :discussed ?ProjectA .
```
Episodic Memory 实现
应用时间戳·位置元数据过滤和时间衰减（Time‑Decay）重新排序算法

Cross‑Modal Embedding
需要轻量的多模态嵌入模型，将文本·图像·音频·传感器数据（GPS·心率等）映射到同一潜在空间
Contextual Resolution
将代词·模糊指代依据用户当前情境（应用启动记录·位置·时间）转换为具体查询的前处理管道，决定 RAG 性能的高低

最终，Personal Context RAG 的核心不是“知道多少知识”，而是“如何安全、准确地将用户本地上下文以图谱方式连接”。

[图3]