RAG的进化:超越搜索,进入理解我的“Personal Context”时代
Source: Samsung Tech Blog
了解我朋友对话内容的 AI
当前 RAG 的局限性:上下文盲点
-
Data Silo(数据孤岛)
AI 无法访问用户的 KakaoTalk·消息应用,因此无法判断“철준”这个实体是谁、何时用什么文本提到过美食店。 -
Static Knowledge(静态知识)
即使知道美食店的名称,也没有“现在可以去(Open Now)”这种实时条件,因为它不在 LLM 的预训练数据中。
Personal Context RAG 的解决方案:On‑Device Intelligence & Orchestration
STEP 1. Private Indexing & Retrieval(本地数据检索)
- 在智能手机内部构建轻量化 Vector Index
- 从聊天记录中搜索包含
철준(Sender)、부산、맛집、추천等关键词的会话,提取候选餐厅列表
STEP 2. Real‑world Grounding(实时信息落地)
- 基于候选列表调用外部地图 API(Naver / Google Maps)
- 将用户的 GPS 与 当前时间 作为参数,计算是否营业以及行程时间
STEP 3. Personalized Synthesis(个性化答案生成)
“철준님이 지난주 톡으로 극찬했던 ‘해운대 암소갈비’는 지금 대기 시간이 너무 길어 이용이 어렵습니다. 대신 추천했던 ‘금수복국’은 현재 영업 중이며, 택시로 15분 거리입니다。”
架构的演进:Hybrid Orchestration(云‑边协同)
-
Local‑First Indexing
敏感的个人数据(聊天记录、生物信息、本地文件)不向设备外部传输,利用智能手机 NPU 进行嵌入后存入 SQLite‑VSS·Mobile‑optimized Vector Store 进行本地索引 -
SLM 基于的 Query Routing
轻量模型(SLM,例如 Gauss 3B、Gemma 1B、Phi‑3 等)首先分析查询- “내 일정 확인해줘” → 本地处理
- “최신 기술 트렌드 알려줘” → 云端路由
数据表达的创新:Personal Knowledge Graph(PKG)
-
GraphRAG 引入
为了处理向量搜索遗漏的关系型问题,将用户数据结构化为知识图谱?User :met_with ?KimTeamLead . ?KimTeamLead :discussed ?ProjectA . -
Episodic Memory 实现
应用时间戳·位置元数据过滤和时间衰减(Time‑Decay)重新排序算法
多模态对齐(Multimodal Alignment)与上下文落地(Contextual Grounding)
-
Cross‑Modal Embedding
需要轻量的多模态嵌入模型,将文本·图像·音频·传感器数据(GPS·心率等)映射到同一潜在空间 -
Contextual Resolution
将代词·模糊指代依据用户当前情境(应用启动记录·位置·时间)转换为具体查询的前处理管道,决定 RAG 性能的高低
最终,Personal Context RAG 的核心不是“知道多少知识”,而是“如何安全、准确地将用户本地上下文以图谱方式连接”。
[图3]