2026-04-02 04:10:58 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： OpenViking是一个专为AIAgent打造的开源长期记忆数据库，它采用虚拟文件系统范式，统一管理资源、记忆和技能三种核心上下文。其核心能力包括分层上下文按需加载、可视化检索轨迹和自动会话管理与记忆迭代。它通过文件系统+向量检索的混合架构解决了传统RAG系统上下文碎片化、Token成本高、检索不可解释等问题，并支持与LangChain等框架集成，以构建具备持续学习和自我进化能力的智能体。 综合评分： 90 文章分类： AI安全,安全开发,技术标准,解决方案,数据安全

cover_image

OpenViking：专为AI Agent打造的长期记忆数据库

原创

凌木LSJ 凌木LSJ

AI技术LSJ

2026年3月31日 22:50 浙江

一、OpenViking是什么？

OpenViking是一个开源的上下文数据库，专为AI Agent设计。简单来说OpenViking是一个面向 AI Agent 的长期记忆框架，它让 AI 可以像人一样：

记住用户偏好
积累知识
总结历史对话
持续进化

OpenViking采用虚拟文件系统范式来统一管理Agent所需的三种核心上下文：

资源：知识和规则（文档、代码、常见问题解答）【长期、相对静态】
记忆：代理的认知（用户偏好、学习经验）【长期、动态更新】
技能：可调用功能（工具、MCP）【长期、静态】

所有上下文都以 viking:// URI唯一标识，支持类似Unix文件系统的操作——ls、read、find，让Agent能通过确定性路径和语义搜索两种方式定位信息。

viking://├── resources/ &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;# Resources: project docs, code repos, web pages│ &nbsp; └── my_project/├── user/ &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;&nbsp;# User: preferences, habits│ &nbsp; └── memories/└── agent/ &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;# Agent: skills, instructions, task memories&nbsp; &nbsp; ├── skills/&nbsp; &nbsp; └── memories/

二、OpenViking 的核心能力

1. 分层上下文按需加载（L0/L1/L2）

2. 可视化检索轨迹

OpenViking的每一次检索都会完整记录浏览了哪些目录、定位了哪些文件。开发者可以清楚看到Agent的“思考路径”，从而优化检索策略或调试问题。

3. 自动会话管理与记忆迭代

这是OpenViking最令人兴奋的特性之一。在每个会话结束时，调用session.commit()，系统会自动记忆提取

Agent因此能够“越用越聪明”，实现真正的自我进化。

三、RAG检索能力实测

传统 RAG / 向量库有几个典型问题：

– 1️⃣ 上下文是碎片：检索回来是“片段”，没有结构

– 2️⃣ Token 成本高：塞满上下文窗口，截断丢信息

– 3️⃣ 检索不可解释：为什么召回这段？

– 4️⃣ 没有长期记忆： Agent 每次从零开始

OpenViking如何解决？

通过文件系统范式统一管理智能体所需的上下文（内存、资源和技能），从而实现分层上下文交付和自我迭代。

本质：不是单纯向量数据库，而是**“文件系统 + 向量检索”**的混合架构

1）创建配置文件ov.conf

{&nbsp; &nbsp;&nbsp;"embedding":&nbsp;{&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;"dense":&nbsp;{&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;&nbsp;"api_base":&nbsp;"",&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;&nbsp;"api_key":&nbsp;"",&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;&nbsp;"provider":&nbsp;"openai",&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;&nbsp;"dimension":&nbsp;3072,&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;&nbsp;"model":&nbsp;"text-embedding-3-large"&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;}&nbsp; &nbsp;&nbsp;},&nbsp; &nbsp;&nbsp;"vlm":&nbsp;{&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;"api_base":&nbsp;"",&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;"api_key":&nbsp;"",&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;"provider":&nbsp;"openai",&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;"model":&nbsp;"gpt-4o-mini"&nbsp; &nbsp;&nbsp;}}

export&nbsp;OPENVIKING_CONFIG_FILE=ov.conf

pip&nbsp;install&nbsp;openviking （Python 版本：3.9 或更高版本）

2）初始化数据库

import&nbsp;openviking&nbsp;as&nbsp;ovclient = ov.SyncOpenViking(path="./ovBase") &nbsp;client.initialize()result = client.add_resource(&nbsp; &nbsp; path="./data/修炼手册.pdf",&nbsp; &nbsp; target="viking://resources/修炼手册.pdf",&nbsp; &nbsp; wait=True, &nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp; &nbsp; timeout=30)client.wait_processed()

3）检索查阅

find() – 语义检索
search() – 会基于会话历史进行意图分析和查询扩展

四、与LangChain集成RAG检索实例

1）自定义检索器

from&nbsp;langchain_core.retrievers&nbsp;import&nbsp;BaseRetrieverfrom&nbsp;langchain_core.documents&nbsp;import&nbsp;Documentfrom&nbsp;typing&nbsp;import&nbsp;Any,&nbsp;List
class&nbsp;OpenVikingRetriever(BaseRetriever):&nbsp; &nbsp; client:&nbsp;Any&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;def&nbsp;__init__(self, client:&nbsp;Any, **kwargs):&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;super().__init__(client=client, **kwargs)&nbsp; &nbsp;&nbsp;def&nbsp;_get_relevant_documents(self, query:&nbsp;str) ->&nbsp;List[Document]:&nbsp; &nbsp; &nbsp; &nbsp; results =&nbsp;self.client.find(query=query, limit=5, score_threshold=0.2)&nbsp; &nbsp; &nbsp; &nbsp; docs = []&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;for&nbsp;ctx&nbsp;in&nbsp;results.resources:&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; content =&nbsp;self.client.read(ctx.uri)&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; docs.append(Document(&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; page_content=content,&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; metadata={"uri": ctx.uri,&nbsp;"score": ctx.score}&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; ))&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;return&nbsp;docs

2）RAG Chain

from&nbsp;langchain_openai&nbsp;import&nbsp;ChatOpenAIfrom&nbsp;langchain_classic.chains&nbsp;import&nbsp;RetrievalQA
retriever = OpenVikingRetriever(client)qa_chain = RetrievalQA.from_chain_type(&nbsp; &nbsp; llm=llm,&nbsp; &nbsp; retriever=retriever,&nbsp; &nbsp; return_source_documents=True,&nbsp; &nbsp; chain_type="stuff"&nbsp;&nbsp;)

3）RAG查询

五、与LangChain Agent集成实战

1）集成为工具

@tooldef&nbsp;viking_find(query:&nbsp;str, limit:&nbsp;int&nbsp;=&nbsp;5) ->&nbsp;str:&nbsp; &nbsp;&nbsp;"""&nbsp; &nbsp; 在知识库和用户记忆中语义搜索。可用于检索：&nbsp; &nbsp; - 用户偏好（如书籍、食物、风格）&nbsp; &nbsp; - 历史对话中提取的信息&nbsp; &nbsp; - 项目文档或知识库内容&nbsp; &nbsp; 输入：简短的查询字符串，例如“用户偏好”、“书籍推荐”、“哲学”&nbsp; &nbsp; 返回：最匹配的条目 URI、相关性分数和摘要。&nbsp; &nbsp; """&nbsp; &nbsp; results = client.find(query, limit=limit)&nbsp; &nbsp; output = []&nbsp; &nbsp;&nbsp;for&nbsp;ctx&nbsp;in&nbsp;results.resources + results.memories:&nbsp; &nbsp; &nbsp; &nbsp; output.append(&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;&nbsp;f"URI:&nbsp;{ctx.uri}\n"&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;&nbsp;f"Score:&nbsp;{ctx.score:.2f}\n"&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;&nbsp;f"摘要:&nbsp;{ctx.abstract[:200]}"&nbsp; &nbsp; &nbsp; &nbsp; )&nbsp; &nbsp;&nbsp;return&nbsp;"\n\n".join(output)&nbsp;if&nbsp;output&nbsp;else&nbsp;"没有找到相关内容"
@tooldef&nbsp;viking_read(uri:&nbsp;str) ->&nbsp;str:&nbsp; &nbsp;&nbsp;"""读取完整内容"""&nbsp; &nbsp;&nbsp;return&nbsp;client.read(uri)
@tooldef&nbsp;viking_overview(uri:&nbsp;str) ->&nbsp;str:&nbsp; &nbsp;&nbsp;"""获取文档概览"""&nbsp; &nbsp;&nbsp;return&nbsp;client.overview(uri)
@tooldef&nbsp;viking_ls(uri:&nbsp;str&nbsp;=&nbsp;"viking://") ->&nbsp;str:&nbsp; &nbsp;&nbsp;"""列出知识库目录"""&nbsp; &nbsp; entries = client.ls(uri)&nbsp; &nbsp;&nbsp;return&nbsp;"\n".join([e["name"]&nbsp;for&nbsp;e&nbsp;in&nbsp;entries])

2）创建智能体

agent = create_agent(&nbsp; &nbsp; model=llm,&nbsp; &nbsp; tools=tools,&nbsp; &nbsp; system_prompt=prompt)

3）记忆能力测试

async&nbsp;def&nbsp;main():&nbsp; &nbsp;&nbsp;# 第一轮&nbsp; &nbsp; reply1, sid =&nbsp;await&nbsp;chat("我喜欢哲学和人工智能的书",session_id="user001")&nbsp; &nbsp;&nbsp;print("AI:", reply1)&nbsp; &nbsp;&nbsp;# 第二轮&nbsp; &nbsp; reply2, _ =&nbsp;await&nbsp;chat("推荐几本书",session_id="user001")&nbsp; &nbsp;&nbsp;print("AI:", reply2)await&nbsp;main()

六、OpenViking数据库结构

最后，看一下ovBase本地基于虚拟文件系统的存储结构：

ovBase/&nbsp; └── vectordb/ &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp; └── viking/default/ &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; ├── agent/ &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;&nbsp;# Agent 相关记忆（案例、模式）&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; ├── resources/ &nbsp; &nbsp; &nbsp; &nbsp;&nbsp;# 资源文件（文档、代码等）&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; ├── session/ &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;&nbsp;# 会话归档历史&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; ├── temp/ &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;# 临时文件&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; └── user/ &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;# 用户相关数据&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;└──&nbsp;default/ &nbsp; &nbsp; &nbsp;# 用户命名空间（默认）&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; └── memories/ &nbsp; &nbsp; &nbsp; &nbsp;# 长期记忆目录&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;├── entities/ &nbsp;&nbsp;# 实体记忆（人物、项目等）&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;├── events/ &nbsp; &nbsp;&nbsp;# 事件记忆（决策、里程碑等）&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;├── preferences/# 用户偏好记忆（书籍、风格等）&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;│ &nbsp; &nbsp;├── .abstract.md &nbsp;&nbsp;# L0 摘要&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;│ &nbsp; &nbsp;├── .overview.md &nbsp;&nbsp;# L1 概览&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;│ &nbsp; &nbsp;└── mem_*.md &nbsp; &nbsp; &nbsp;&nbsp;# 具体记忆文件（L2）&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;├── .abstract.md &nbsp; &nbsp; &nbsp; &nbsp;# memories 目录摘要&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;└── .overview.md &nbsp; &nbsp; &nbsp; &nbsp;# memories 目录概览

整个结构分为向量索引（vectordb）和知识空间（viking）。

其中 resources 用于存储知识库文档，session 保存对话历史并用于自动提取记忆，agent 存储 Agent 的经验与模式，而 user/memories 则用于记录用户的长期记忆（如实体、事件和偏好）。每条记忆采用 L0 摘要、L1 概览、L2 原文的三层结构，使 AI 能先读取摘要再逐步深入，从而降低 Token 成本并提升检索效率。

相比传统只存向量的 RAG 系统，这种结构既支持语义检索，又支持可读的知识组织和长期记忆积累，使 AI 能够持续学习用户信息和知识内容，是构建长期记忆型 AI Agent 的重要基础设施。

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：AI技术LSJ 凌木LSJ 凌木LSJ《OpenViking：专为AI Agent打造的长期记忆数据库》