RAG的进化:超越搜索,进入理解我的“Personal Context”时代

发布: (2026年2月10日 GMT+8 12:05)
4 分钟阅读

Source: Samsung Tech Blog

了解我朋友对话内容的 AI

当前 RAG 的局限性:上下文盲点

  • Data Silo(数据孤岛)
    AI 无法访问用户的 KakaoTalk·消息应用,因此无法判断“철준”这个实体是谁、何时用什么文本提到过美食店。

  • Static Knowledge(静态知识)
    即使知道美食店的名称,也没有“现在可以去(Open Now)”这种实时条件,因为它不在 LLM 的预训练数据中。

Personal Context RAG 的解决方案:On‑Device Intelligence & Orchestration

STEP 1. Private Indexing & Retrieval(本地数据检索)

  • 在智能手机内部构建轻量化 Vector Index
  • 从聊天记录中搜索包含 철준(Sender)부산맛집추천 等关键词的会话,提取候选餐厅列表

STEP 2. Real‑world Grounding(实时信息落地)

  • 基于候选列表调用外部地图 API(Naver / Google Maps)
  • 将用户的 GPS当前时间 作为参数,计算是否营业以及行程时间

STEP 3. Personalized Synthesis(个性化答案生成)

“철준님이 지난주 톡으로 극찬했던 ‘해운대 암소갈비’는 지금 대기 시간이 너무 길어 이용이 어렵습니다. 대신 추천했던 ‘금수복국’은 현재 영업 중이며, 택시로 15분 거리입니다。”

架构的演进:Hybrid Orchestration(云‑边协同)

  • Local‑First Indexing
    敏感的个人数据(聊天记录、生物信息、本地文件)不向设备外部传输,利用智能手机 NPU 进行嵌入后存入 SQLite‑VSS·Mobile‑optimized Vector Store 进行本地索引

  • SLM 基于的 Query Routing
    轻量模型(SLM,例如 Gauss 3B、Gemma 1B、Phi‑3 等)首先分析查询

    • “내 일정 확인해줘” → 本地处理
    • “최신 기술 트렌드 알려줘” → 云端路由

数据表达的创新:Personal Knowledge Graph(PKG)

  • GraphRAG 引入
    为了处理向量搜索遗漏的关系型问题,将用户数据结构化为知识图谱

    ?User :met_with ?KimTeamLead .
    ?KimTeamLead :discussed ?ProjectA .
  • Episodic Memory 实现
    应用时间戳·位置元数据过滤和时间衰减(Time‑Decay)重新排序算法

多模态对齐(Multimodal Alignment)与上下文落地(Contextual Grounding)

  • Cross‑Modal Embedding
    需要轻量的多模态嵌入模型,将文本·图像·音频·传感器数据(GPS·心率等)映射到同一潜在空间

  • Contextual Resolution
    将代词·模糊指代依据用户当前情境(应用启动记录·位置·时间)转换为具体查询的前处理管道,决定 RAG 性能的高低

最终,Personal Context RAG 的核心不是“知道多少知识”,而是“如何安全、准确地将用户本地上下文以图谱方式连接”。

[图3]

0 浏览
Back to Blog

相关文章

阅读更多 »

利用生成式 AI 技术将经典剧集画质提升至 4K 级别

前言 我是VD事业部画质Solution Lab的李贤胜。在本篇文章中,我将介绍通过AI技术将早期制作的经典电视剧自动remastering为4K水平画质的技术。我们将说明该技术的背景与发展趋势、在服务应用时遇到的问题以及实验结果。

外部审计师任命公告

外部审计人任命公告 2026年02月10日 根据《外部审计法》第12条第1款及同法实施令第18条第1款,特此公告本公司的外部审计人任命事项。 - 任命外部审计人:삼일회계법인 - 任命期间:2026会计年度 RIDI股份有限公司 首尔市 강…

新文章

您确定要隐藏此 comment 吗?它将在您的 post 中被隐藏,但仍可通过 comment 的 permalink 查看。Hide child comments 如我们……