为什么在 Claude 会话中失去上下文？Claude-Mem 解决方案

发布: 3天前 (2026年2月12日 GMT+8 04:16)

11 分钟阅读

Source: Dev.to

（请提供您希望翻译的完整文本内容，我将按照您的要求保留链接、格式和技术术语进行简体中文翻译。）

为什么会话不足

Claude 的会话功能在理论上很棒。你可以进行连续对话，逐步构建复杂逻辑，基本上把 Claude 当作协作编码伙伴。然而，实际情况往往不尽如人意：

Claude 的上下文窗口虽然很大，但并非无限。
随着对话的增长，信息会被裁剪，Claude 回忆早期指令的能力会下降。

这不仅仅是小小的烦恼。在我的测试自动化工作中，我试图让 Claude 根据不断演变的需求生成 Playwright 测试。最初的测试还不错，但后续的细化——添加数据验证、实现重试逻辑——常常被忽略。我不得不不断重新解释基本内容。这种 上下文滑移 直接影响了我的开发速度，并增加了错误的可能性。

“Claude 的会话功能很强大，但它并非万能钥匙。上下文丢失是一个真实的挑战，需要主动的解决方案。”

官方 Claude 文档暗示了这一限制，建议用户 对长对话进行总结。总结是一种权宜之计；它会带来自己的偏见，并有丢失关键细节的风险。我需要一种更好的方法。

介绍 Claude‑Mem

我的解决方案，我称之为 Claude‑Mem，涉及使用 Claude 本身在活动会话旁维护一个持久记忆存储。它本质上是一个系统，Claude 同时充当交互式协作者以及长期记忆保存者。

核心思路

记忆更新阶段 – 定期总结关键对话要点，并将其存储在专用于记忆的独立 Claude 会话中。
交互阶段 – 使用主会话进行代码生成和优化，始终将记忆会话中的相关片段重新注入提示中。

这种分层方法确保 Claude 即使在活跃会话不断扩展的情况下，也始终能够访问所需的上下文。它超越了单纯的摘要，而是专注于主动管理和注入上下文。

简化示例（Python + Anthropic API）

下面是 记忆更新阶段 的最小实现示例。它假设你已经可以使用 Anthropic API，并具备基本的 Python 编程技能。

import anthropic
import os

# Replace with your Anthropic API key
ANTHROPIC_API_KEY = os.environ.get("ANTHROPIC_API_KEY")
client = anthropic.Anthropic(api_key=ANTHROPIC_API_KEY)

MEMORY_SESSION_ID = "your_memory_session_id"  # Replace with your session ID

def update_memory(conversation_history):
    """
    Summarizes the conversation history and stores it in the memory session.
    """
    prompt = f"""
    You are a dedicated memory keeper for a software development project.
    Your task is to summarize the following conversation history, focusing on key decisions,
    requirements, and constraints. Be concise and accurate.

    Conversation History:
    {conversation_history}

    Summary:
    """

    try:
        response = client.messages.create(
            model="claude-3-opus",          # Or your preferred Claude model
            max_tokens=500,
            messages=[{"role": "user", "content": prompt}]
        )
        summary = response.content[0].text
        print(f"Memory updated: {summary}")

        # Store the summary in the memory session (implementation detail – depends on your storage)
        # This example assumes a simple variable for demonstration.
        global MEMORY_SESSION_ID
        MEMORY_SESSION_ID = summary   # Not suitable for production

    except Exception as e:
        print(f"Error updating memory: {e}")

def get_relevant_memory(prompt):
    """
    Retrieves relevant memory snippets based on the current prompt.
    This is a simplified example; a more sophisticated approach would use semantic search.
    """
    # In a real implementation, this would involve a more intelligent retrieval mechanism.
    # For now, we'll just return the entire memory.
    return MEMORY_SESSION_ID

# Example Usage
conversation_history = """
User: I want to generate Playwright tests for the login page.
Claude: Okay, here's a basic test structure...
User: Now add data validation to verify the username and password fields.
Claude: Here's the test with data validation...
"""

update_memory(conversation_history)

# When interacting with Claude, include the memory in the prompt:
current_prompt = "Add retry logic to the login test."
memory = get_relevant_memory(current_prompt)
full_prompt = f"Memory: {memory}\n\n{current_prompt}"

print(f"Sending to Claude: {full_prompt}")

说明

update_memory 接收对话历史，调用 Claude 对其进行摘要，并将摘要存入专用的记忆存储中。
get_relevant_memory 用于检索已存储的摘要（在生产系统中可能会返回更精细的片段）。
在向 Claude 发送新提示时，将检索到的记忆前置，以便 Claude 获得必要的上下文。

要点

会话窗口是有限的 – 主动管理 Claude 需要记住的内容。
Claude‑Mem 提供了一种系统化的方法来保留和注入上下文，而无需依赖临时的摘要。
该模式具有可扩展性：你可以用数据库、向量存储或任何持久层替代简单的全局变量，并通过语义搜索提升检索效果。

通过将 Claude 同时视为协作者和记忆保持者，你可以让长期、迭代的项目保持正轨，避免可怕的“上下文衰减”。祝编码愉快！

Claude‑Mem：通过持久记忆扩展 Claude 的上下文

问题

Claude（以及其他大语言模型）拥有有限的上下文窗口。当对话超出该窗口时，早期的对话内容会被丢弃，导致模型失去重要信息。这在长期运行的工作流（例如测试自动化）中尤为痛苦，因为模型必须记住：

项目特定的术语
之前的决策和设计理由
测试用例的需求和边缘情况

如果没有办法保留这些知识，用户就必须花大量时间重新解释上下文或纠正误解。

解决方案 – Claude‑Mem 架构

+-------------------+        +-------------------+        +-------------------+
|   User Prompt     |  --->  |   Retrieval       |  --->  |   Claude (LLM)    |
| (new request)    |        |   (fetch relevant |        |   (generates)      |
+-------------------+        |    memory)        |        +-------------------+
                               ^      |
                               |      v
                         +-------------------+
                         |   Persistent Store |
                         |   (vector DB,     |
                         |    SQL, etc.)    |
                         +-------------------+

持久化记忆存储 – 将所有相关片段（例如设计笔记、测试规范）保存到持久化数据库或向量存储中。
get_relevant_memory – 检索函数，根据新的用户提示返回最相关的记忆块。实际生产环境中会使用语义搜索（如嵌入 + 相似度），而不是简单的占位实现。
full_prompt – 将检索到的记忆与当前用户提示拼接，为 Claude 提供完整的上下文，以便准确回答。

实际影响

我将 Claude‑Mem 集成到测试自动化流水线后，观察到显著改进：

指标	引入 Claude‑Mem 前	引入 Claude‑Mem 后	Δ
重新解释上下文所花时间	大约占工作量的 30 %	“Claude‑Mem 方法不仅仅是为了便利，更是提升开发者生产力、降低错误风险的关键。”

局限性与缓解措施

摘要不准确 – 摘要可能引入偏差或错误。缓解：审查并优化摘要流水线；保留原始片段作为备选。
检索过载 – 过多无关片段会淹没模型。缓解：使用相关性评分阈值并限制检索项数量。
会话管理复杂度 – 多项目意味着多记忆命名空间。缓解：采用命名约定（例如 project_id:session_id）并自动清理陈旧数据。

更广泛的应用

虽然我最初是用于测试自动化，但 Claude‑Mem 可应用于任何受益于长期结构化上下文的领域：

技术文档 – 维护一个活的知识库，模型在回答支持工单时可以随时引用。
复杂设计对话 – 跟踪架构决策、权衡及其背后的理由，支持分布式团队协作。
法律合同谈判 – 记住之前的条款、修订和谈判历史，确保一致性。

入门指南

选择存储后端 – 向量数据库（如 Pinecone、Weaviate）用于语义搜索，或关系型数据库用于简单的键值存储。
实现检索函数 – 从基本的关键词匹配开始，根据需要升级为基于嵌入的相似度检索。
包装 LLM 调用 – 在将提示发送给 Claude 之前，将检索到的记忆拼接到输入中。
迭代 – 从小型试点项目起步，监控指标（节省时间、错误率），并不断调优检索阈值。

“Claude‑Mem 方法是释放 Claude 对话式 AI 能力全部潜力的强大手段。”

Jo

在对话中

您对 Claude 的上下文限制有什么经验？您是如何应对这一挑战的？请在下方评论分享您的想法和方法。

为什么在 Claude 会话中失去上下文？Claude-Mem 解决方案

为什么会话不足

介绍 Claude‑Mem

核心思路

简化示例（Python + Anthropic API）

要点

Claude‑Mem：通过持久记忆扩展 Claude 的上下文

问题

解决方案 – Claude‑Mem 架构

实际影响

局限性与缓解措施

更广泛的应用

入门指南

Jo

相关文章

我如何构建 MemCP：为 Claude 提供真实记忆

中间的迷失：为何更大的上下文窗口并不总能提升 LLM 性能

我构建了一个使用 NumPy 在运行时对 LLMs 进行教练的反馈回路

为什么“Smarter Prompts”无法解决 AI 推理