低代码Agent开发框架使用指南(八)—Coze 知识库详解

作者:大模型真好玩日期:2025/11/28

前言

上篇文章《低代码Agent开发框架使用指南(七)—Coze 数据库详解》中,笔者详细介绍了如何在Coze平台中创建和使用数据库,并结合可视化图表完成了一个数据分析任务。除了能够高效处理结构化数据之外,作为一款功能强大的低代码开发平台,Coze同样支持对文档、表格、图片等非结构化数据进行管理与调用——这正是Coze知识库功能的核心价值所在。

低代码Agent开发相关文章已全部收录于笔者专栏《AI应用工厂:低代码智能体开发使用指南》。本专栏致力于帮助零代码经验的朋友快速上手智能体搭建,学会该技能可以轻松实现如旅游助手、自动文档处理、自动视频生成等实用工具,让大模型技术真正赋能日常生活。

对于有编程基础、喜欢写代码的开发者也可以阅读笔者的LangChain/LangGraph系列教程专栏。该专栏融合了笔者在实战中积累的深度经验,系统讲解如何基于LangChain与LangGraph框架高效开发智能体,并通过众多实战项目助大家快速构建专业级应用。大家感兴趣可以关注笔者掘金账号和系列专栏,更可关注笔者同名微信公众号: 大模型真好玩, 每期分享涉及的代码均可在公众号私信: LangChain智能体开发获得。

一、什么是知识库?

1.1 知识库概念

在介绍Coze知识库的具体使用方法之前,笔者先分享什么是知识库。知识库是一种用于存储、管理和应用海量结构化、非结构化数据的系统。它通过对信息进行系统性的收集、组织、分类和索引,帮助用户高效地检索和利用相关知识。Coze的知识库功能正是基于这一理念,为用户提供了一套完整的知识管理解决方案。

为了让大家更直观地理解,笔者这里举一个简单的例子。假设上传的文档中包含这样两句话:“AAA是一个AI产品经理”和“BBB是一个AI程序员”。Coze知识库会先将文档切分为两个分段,分别对应这两句话。当用户提问“AAA是谁”时,知识库会通过语义相似度匹配到第一句话“AAA是一个AI产品经理”,然后将这段内容交给大模型。大模型基于这句话进行回答:“据我所知,AAA是一个AI产品经理。”

关于知识库背后更深入的技术原理,特别是RAG(检索增强生成)的核心机制,大家可以参考笔者的另一篇文章《一文带你了解RAG核心原理!不再只是文档的搬运工》,这里就不再详细展开。

1.2 Coze知识库核心功能

Coze知识库提供了一种简单易用的方式,帮助开发者存储、管理和应用外部数据,使智能体能够在特定领域进行专业、准确的对话交互。其主要特点包括:

  • 多样化数据源:支持上传本地文件(如.txt、.pdf、.docx、.csv、.xlsx等)、在线网页、API接口数据,并可集成Notion、飞书等多种来源的文本与结构化数据。
  • 智能内容分割:上传的文档内容会被自动切分为多个独立的信息片段进行存储(类似上一节中的示例),同时也支持自定义分段规则,如关键词、字符长度等,便于后续更精准地检索与应用。
  • 灵活的应用方式:将知识库关联到智能体后,开发者可选择自动调用或按需调用的方式,灵活使用知识库中的内容。

借助Coze知识库,开发者能够以低成本、高效率的方式,让智能体快速掌握各行各业的专业知识,打造个性化的智能服务体验,为客户提供准确的信息支持,为企业创造更多价值。

1.3 Coze知识库的适用场景

Coze知识库适用于多种专业场景,以下列举几个典型应用方向:

  1. 搭建行业知识专家
    针对特定行业构建涵盖各类细分知识点的知识库,使智能体迅速成为该领域的专家。例如,为汽车行业建立车型参数知识库,机器人即可详细解答每款车型的具体配置;为医疗行业上传疾病百科,智能体就能提供专业的医疗咨询服务。
  2. 构建企业产品/服务助手
    企业可将产品说明书、操作手册、服务条款等文档导入知识库。当客户咨询相关问题时,智能体能够快速给出权威、准确的回答,实现全天候在线的标准化服务,有效提升客户体验。
  3. 打造员工培训与知识问答系统
    将岗位手册、业务规范、操作流程等内容上传至知识库后,员工可随时通过对话机器人进行学习。智能体能够根据员工的提问,从知识库中检索最佳答案,在员工培训和知识管理方面发挥重要作用。

二、 Coze知识库使用指南

2.1 知识库的创建和管理

  1. 进入知识库管理页面: 访问 Coze 空间首页,依次点击左侧菜单栏中的「资源库」→「知识库」标签页,然后点击右上角的「添加资源」按钮,在下拉选项中选择「知识库」。
  2. 创建知识库并上传文件: 选择创建「扣子知识库」,本次演示将以文本格式上传笔者之前的笔记《DeepSeek高性能部署实战》文档。


  3. 配置内容解析方式: 上传完成后,由于文档包含文字与图片等多模态内容,需通过 Coze 知识库进行内容提取。系统能够准确识别图片、表格等元素。若为纯文本内容,可选择「快速解析」以加快处理速度。
  4. 设置分段策略: 开发者可选择系统提供的「自动分段与清洗」功能,或启用「自定义」分段。自动模式下,系统将依据内置规则进行内容切分与噪声清除;自定义模式下,可配置以下参数:
    • 分段标识符:设定分段依据的符号或关键词
    • 分段最大长度:控制每段包含的文本数量
    • 分段重叠:设置相邻段落间的重叠部分,确保内容连续性
    • 文本预处理:如去除空白字符、过滤链接等
      对于结构化文档,还可选用「按层级分段」模式,系统将依照文档的标题层级自动划分段落。配置完成后,点击「下一步」继续。

  5. 预览分段结果并完成创建: 系统将依据设定对内容进行自动分段,开发者可实时预览分段结果(此过程可能需要一定时间)。完成后点击「下一步」,Coze 知识库会将每个段落转化为向量形式存储,为后续语义匹配做好准备。

  6. 完成知识库创建: 确认无误后,点击「确认」按钮,即可成功创建知识库。

  1. 创建智能体并关联知识库:参考笔者之前的教程《低代码Agent开发框架使用指南(三)—小白5分钟利用Coze轻松构建智能体》创建一个智能体,并将其与刚创建的知识库关联。

  1. 配置提示词并启用知识库: 利用大模型自动优化提示词,并在编辑框中选择我们创建的知识库《DeepSeek高性能部署实战》。
    优化后的提示词案例:
1# 角色  
2你是一个专注于利用知识库信息进行精准回答的智能助手,专门用于测试知识库的功能与信息呈现效果,能够严谨地从知识库中提取相关内容并以清晰易懂的方式回复用户。  
3## 技能  
4### 技能 1: 知识库优先检索  
51. 当用户提问时,**优先调用知识库**中的相关信息进行回答,不主动使用外部工具或自行编造内容;  
62. 若知识库中存在直接匹配的信息,需提取核心内容,合并为简洁回答;  
73. 若知识库中信息零散或需关联多个知识点,自动进行结构化整合(如分点说明、逻辑串联)。  
8===回复示例===  
9   - 🔑 匹配知识点:<知识库中对应词条/模块>  
10   - 📌 核心内容:<用1-2句话总结关键信息>  
11   - 📊 详细分解:<若信息复杂,按逻辑分点说明,每个点对应知识库中的具体条目>  
12===示例结束===  
13### 技能 2: 知识准确性与完整性验证  
141. 对知识库中的信息进行严格校验,确保回复内容与知识库原文一致,不夸大、不删减;  
152. 若知识库存在信息冲突或缺失,需明确标注“知识库中存在不同解释”或“相关信息暂未完整收录”,不强行整合矛盾内容。  
16### 技能 3: 知识场景化解释  
171. 针对抽象或专业的知识库内容,使用用户熟悉的逻辑或场景进行类比解释(如生活实例、日常场景映射);  
182. 若用户问题涉及多个知识点,主动梳理知识关联逻辑,帮助用户理解知识点间的联系。  
19## 限制  
20- **严格限制知识库范围**:仅基于当前知识库内容回复,不引入外部信息或个性化观点;  
21- **明确边界提示**:当问题超出知识库覆盖范围时(如“我不知道”“这个概念不在知识库中”),直接回复“当前问题超出知识库支持范围,建议补充相关知识库内容后再次提问”;  
22- **拒绝无关话题**:不回应与知识库内容无关的问题(如个人经历、娱乐八卦、技术故障等);  
23- **格式规范**:所有回复需按示例中的结构分点,信息密度适中,避免冗长或简略过度。  


2. 测试知识库检索结果: 提出问题:“高性能部署 DeepSeek 有哪几种方式”,智能体将调用知识库并返回相应答案。点击运行完毕的下拉框,可查看知识库搜索的详细信息,包括:

  • 与问题相关联的内容块
  • 各内容块与问题的相似度评分
  • 按相似度从高到低排列的检索结果
    测试结果表明,智能体能够准确从知识库中获取相关内容并生成回答,有效扩展了大模型的知识边界,提升了回答的准确性和专业性。

2.2 知识库和变量、长期记忆、数据库的对比

在 Coze 平台中,知识库、变量、长期记忆和数据库都具备数据存储能力,但在使用场景和特性上存在显著差异。我们可以从数据的使用对象和内容性质两个维度进行区分:

  • 知识(主要指知识库) :作为供智能体或工作流调用的静态数据,可在空间内共享。这类数据由开发者创建和维护,终端用户仅可读取而无法修改。
  • 记忆(包括变量、数据库、长期记忆) :用于存储智能体在与终端用户交互过程中产生的动态数据。这类数据通常与具体用户相关联,不支持跨智能体共享。

以下以一个租房平台智能体为例,说明不同类型数据的存储方式与特点:

类别存储的数据特点
知识房源信息、房屋图片、房屋描述、房屋价格、房屋地址、房屋设施、房屋评价等由 智能体 开发者上传和维护、所有用户可见但不可修改、可跨 智能体 使用
记忆用户信息、用户历史租房信息、用户关注的小区/房屋等用户个人数据,不支持跨 智能体 使用

三、总结

Coze知识库作为一套集存储、管理、检索与应用于一体的知识管理解决方案,为智能体的能力提升提供了强有力的支持。然而,知识库的实际效果很大程度上取决于导入内容的质量与相关性。作为使用者,我们需要深入理解其功能特性,结合具体应用场景规划和构建知识体系,并持续优化更新内容,才能充分释放知识库的价值,打造真正懂行业、有深度、高效率的智能助手,为业务创新持续赋能。

本文介绍的内容已能满足基础使用需求,但要充分发挥知识库的潜力,仍需掌握更多构建技巧。本专栏将持续深入这一领域,下篇文章将重点解析Coze知识库的优化方法与高级实践,敬请期待!大家阅读后感兴趣可关注笔者掘金账号和专栏。 低代码Agent开发相关文章已全部收录于笔者专栏《AI应用工厂:低代码智能体开发使用指南》

对于有经验喜欢写代码的开发者也可以阅读笔者的LangChain/LangGraph系列教程专栏,目前已经更完28节。该专栏融合了笔者在实战中积累的深度经验,系统讲解如何基于LangChain与LangGraph框架高效开发智能体,助你快速构建专业级应用。大家可关注笔者同名微信公众号: 大模型真好玩, 每期分享涉及的代码均可在公众号私信: LangChain智能体开发获得。


低代码Agent开发框架使用指南(八)—Coze 知识库详解》 是转载文章,点击查看原文


相关推荐


【Leetcode】1930. 长度为 3 的不同回文子序列
专业抄代码选手2025/11/25

这一题题目不难理解,就是在字符串中寻找有多少个独一无二的回文,只不过这个回文可以不相邻,而且长度只有3。固定首尾,然后再确定中间的字符,加一个去重即可(Set)。 时间复杂度过大,n的3次方 这里的思路比较耿直,直接用3层循环来做 i来寻找首,j来寻找尾,k在中间进行累加即可 最后利用set来进行去重 只不过这里不能ac,时间复杂度过大。 var countPalindromicSubsequence = function (s) { let set = new Set(); f


C#/.NET/.NET Core技术前沿周刊 | 第 62 期(2025年11.17-11.23)
追逐时光者2025/11/23

前言 C#/.NET/.NET Core技术前沿周刊,你的每周技术指南针!记录、追踪C#/.NET/.NET Core领域、生态的每周最新、最实用、最有价值的技术文章、社区动态、优质项目和学习资源等。让你时刻站在技术前沿,助力技术成长与视野拓宽。 欢迎投稿、推荐或自荐优质文章、项目、学习资源等。 🏆技术前沿周刊Gitee开源地址: gitee.com/ysgdaydayup… 📰技术前沿周刊GitHub开源地址: github.com/YSGStudyHar… 👪DotNetGuid


工业通信必看:PIC 单片机波特率转换方案(含特殊波特率 + 抗干扰电路)
csg11072025/11/22

在工业控制现场,不同设备的串口(如 RS485、RS232)波特率不统一是常遇到的头疼问题 —— 主控板或 PLC 要统一控制这些设备,必须保证波特率一致。可有些设备能手动设置波特率,有些却固定死,没法调整。 基于这个痛点,我从 2018 年开始研发数据双向透传的波特率转换器,经过反复测试改进,第一代产品就稳定落地,至今已在几十个工业项目中应用。今天就把 PIC 单片机实现波特率转换的核心逻辑、特殊波特率实现技巧、抗干扰电路设计讲透,新手也能参考落地。 一、核心方案:PIC 单片机选型与硬


🎨 新来的外包,在大群分享了它的限流算法的实现
有态度的下等马2025/11/20

1. 令牌桶按用户维度限流 前文golang/x/time/rate演示了基于整体请求速率的令牌桶限流; 那基于用户id、ip、apikey请求速率的限流(更贴近生产的需求), 阁下又该如何应对? 那这个问题就从全局速率变成了按照用户维度(group by userid)来做限流,那么 早先的全局的rateLimiter就要变成人手一个令牌桶,也就是userid:rateLimiter的键值对集合,select count( * ) from table ---> select userid,


IIoT 数据接口契约化工具JSON、OPC UA和Sparkplug B 优缺点对比分析
RockHopper20252025/11/19

本文以IIoT(Industrial Internet of Things)的核心需求为背景,系统性论述“数据接口契约化”的必要性,并对 JSON、OPC UA、Sparkplug B 三者作为“契约化工具(Contract Enforcement Mechanisms)”的优缺点作对比分析。 一、为什么 IIoT 需要“数据接口契约化” IIoT 的本质是:跨设备、跨系统、跨生命周期的数据互操作。 没有契约,就没有稳定接口;没有稳定接口,就没有可维护的生态。 1. 设备异构性极高 各


【微服务】【Nacos 3】 ② 深度解析:AI模块介绍
小毅&Nora2025/11/17

📖目录 前言1. Nacos AI 模块概述2. 核心组件详解2.1 MCP (Model Control Plane)2.1.1 核心功能2.1.2 关键类分析McpServerOperationService索引机制 2.1.3 控制器层 2.2 A2A (Agent to Agent)2.2.1 核心功能2.2.2 关键类分析A2aServerOperationService请求处理器 3. 关键源码剖析3.1 模型服务注册流程3.2 代理通信处理流程


Python 的内置函数 print
IMPYLH2025/11/16

Python 内建函数列表 > Python 的内置函数 print Python 的内置函数 print() 是编程中最常用的输出函数之一,主要用于将指定的内容输出到标准输出设备(通常是控制台)。它的基本语法如下: print(*objects, sep=' ', end='\n', file=sys.stdout, flush=False) 参数详解: *objects:可接收多个对象参数,会依次打印这些对象。例如: print("Hello", "World") # 输出:H


C语言是什么编译? | 了解C语言编译过程及其重要性
cbarur_2892025/11/15

乐高编程机器人|探索创意与技术结合的无限可能乐高编程机器人结合了乐高积木的创造性和编程的逻辑性,是一种非常适合青少年学习的科技玩具。它不仅能够培养孩子们的动手能力,还能激发他们对编程的兴趣,从而提升解决问题的能力。乐高机器人通常配备了多种传感器和电动机,可以根据编程指令执行各种复杂的任务,例如行走、避障、抓取物体等。随着科技的不断进步,乐高编程机器人也不断更新换代,添加了更多高科技的功能。例如,最新版本的乐高机器人可以通过蓝牙连接到手机或电脑,进行远程控制和编程。通过这种方式,孩子们可以在编程的


Python 的内置函数 len
IMPYLH2025/11/14

Python 内建函数列表 > Python 的内置函数 len Python 的内置函数 len() 是一个常用的内置函数,主要用于返回对象的长度或项目数量。它可以应用于多种数据类型,包括但不限于以下几种: 字符串(str):返回字符串中的字符数量。例如: text = "Hello, World!" print(len(text)) # 输出:13 列表(list):返回列表中元素的数量。例如: numbers = [1, 2, 3, 4, 5] print(len(number


Android 修改项目包名,一键解决.
没有了遇见2025/11/13

需求: 项目需要 需要改变包名和签名. 版本 Windows 10 实现 1.修改设置 2:shift+F6 3: 确认修改

首页编辑器站点地图

本站内容在 CC BY-SA 4.0 协议下发布

Copyright © 2025 聚合阅读