理解PostgreSQL中的数据块

作者：WarriorTan日期：2025/11/7

PG的数据块大小，默认是8KB，可以调整为16K或者 32K吗？

PostgreSQL的数据块大小默认为8KB，可以将其调整为16KB或32KB。数据块大小需要在‌编译安装‌PostgreSQL时通过配置参数指定，例如使用configure.ac中的--with-blocksize选项进行设置。需要注意的是，一旦数据库初始化完成，数据块大小就无法再修改。

数据块的行指针都包括哪些信息？

具体来说，行指针是一个32位的数字，其结构被划分为三个部分：

行内容的偏移量‌：占用15位（bit），用于定位数据行在块内的具体存储位置。
指针的标记‌：占用2位。
行内容的长度‌：占用15位。

由于行内容的偏移量字段只有15位，根据二进制计算规则，它能表示的最大数值是 2 的 15 次方，即 32768。这个值定义了单个数据块内可以寻址的最大字节范围。因此，PostgreSQL的数据块大小被限制为最大32KB（因为32768字节等于32KB）。这意味着，即便在编译时尝试配置更大的块大小（如64KB），这个15位的偏移量字段也无法正确表示超出32768字节的地址，从而在物理上约束了块大小的上限。

行指针也会占用数据块的空间吗？

是的，行指针会占用数据块的空间。

在PostgreSQL的数据块（通常为8KB）中，除了存储实际的用户数据行，还有一个专门的结构叫做‌行指针数组（Line Pointer Array）‌，它位于数据块的起始部分。

可以这样理解：

空间占用‌：每个行指针固定占用4个字节。数据块中每新增一行数据，就会在这个数组里增加一个对应的行指针。
作用‌：行指针就像是数据块内部的“目录”或“索引”。它存储了对应数据行在块内的‌偏移量‌和‌长度‌。当需要访问某一行时，数据库首先通过行指针找到该行的位置，然后再去读取具体的数据内容。
总结‌：因此，数据块的总空间可以看作是由“行指针数组占用的元数据空间”和“实际数据行占用的空间”共同组成的。行指针是数据块内部管理机制的必要组成部分，必然会占用一部分存储空间。

《理解PostgreSQL中的数据块》是转载文章，点击查看原文。

上一篇：理解 LangChain 智能体：create_react_agent 与 create_tool_calling_agent

下一篇：程序员副业 | 2025年10月复盘

相关推荐

C#.NET Random 深入解析：随机数生成原理与最佳实践

唐青枫2025/11/4

简介 Random 是 .NET 中 System 命名空间提供的一个类，用于生成伪随机数。它广泛应用于需要随机化操作的场景，如生成随机数据、模拟、游戏开发或测试用例生成。伪随机数生成在计算机中，Random 类用于生成伪随机数，这些数值在一定程度上看起来是随机的，但它们实际上是通过数学公式从一个初始种子值计算得到的，因此称之为“伪随机数”。广泛应用 Random 类常用于游戏开发、模拟、加密等场景。在许多应用中，生成随机数或随机选择某个元素是常见的需求。注意： Random

设计模式的原则有哪些？

你的人类朋友2025/10/31

前言温馨提示对于原本不太熟悉设计模式的人来说（比如在下），这些内容是需要一定的时间消化的！慢慢来 😆 👋 你好啊，我是你的人类朋友！今天说说设计模式的原则有哪些！在开发用户权限系统时，你是否遇到过这样的问题：当创建新的管理员用户类型时，发现它无法兼容普通用户的所有方法，导致系统中到处需要判断用户类型？让我们了解设计模式的基本原则，构建更健壮的软件架构~ 健壮是啥意思？健壮是指软件系统在面对变化和复杂性时，能够保持稳定运行的能力。也就是耐造的能力。正文 SOLID 原则

Java的包装类

麦麦鸡腿堡2025/10/29

包装类(Wrapper)的分类: 1.针对八种基本数据类型相应的引用类型--包装类 2.有了类的特点,就可以调用类中的方法 *黄色框内都是number的子类,number是Ojbect子类,黑色框中的包装类是独立的,Ojbect子类 //boolean-Boolean-父类Object //char-Character-父类Object //byte-Byte-父类number-父类Object //int-Integer-父类number-父类Object //long-Long

17_AI智能体开发架构搭建之Flask集成swagger在线文档实践

腾飞开源2025/10/26

一、为什么需要Swagger集成？在微服务架构和前后端分离的现代开发模式中，API文档承担着关键角色：开发效率：前后端并行开发，减少沟通成本接口契约：明确的请求/响应规范，避免歧义测试便利：直接在文档界面测试API 团队协作：新成员快速理解接口设计客户端生成：自动生成多种语言客户端代码 AI智能体系统设计相关文章： 👉《01_AI智能体系统设计之系统架构设计》 👉《02_AI智能体系统设计之钉钉消息处理流程设计》 👉《03_AI智能体系统设计之Ag

C#.NET SqlKata 使用详解：优雅构建动态 SQL 查询

唐青枫2025/10/23

简介在复杂项目中，为了保持 SQL 灵活性与可读性，开发者往往需要手写大量拼接字符串或使用 ORMs 附带的 LINQ，但两者各有局限：手写拼接易出错、难以维护；LINQ 在某些场景下生成的 SQL 不够直观或性能不佳。 SqlKata 是一款轻量级、数据库无关的查询构建器（Query Builder），提供—— 流式 API，链式调用拼装 SQL 可切换编译器，支持多种数据库方言（SQL Server、PostgreSQL、MySQL、SQLite、Oracle 等）语

深度解析 DNS服务：从基础原理到自建 DNS 服务器完整指南

coder4_2025/10/22

目录一、DNS服务基础知识 1、DNS 2、域名 ①域名组成 ②域名管理与结构 3、DNS服务工作原理 ①主机中DNS客户端配置 ②DNS服务解析域名流程 4、DNS查询类型 ①递归查询 ②迭代查询 5、DNS解析类型 6、hosts文件 7、完整的域名查询请求流程二、DNS检测工具 1、dig命令 2、host命令 3、nslookup命令 4、rndc命令 5、whois命令三、自建DNS服务 1、ubuntu中的systemd-reso

Python爬虫入门：从零到数据采集

Moniane2025/10/21

Python爬虫基础指南 Python爬虫是自动化获取网络数据的技术，广泛应用于数据采集、市场分析等领域。以下是核心实现步骤： 1. 核心库选择 import requests # 发送HTTP请求 from bs4 import BeautifulSoup # HTML解析 import pandas as pd # 数据存储 2. 基础爬取流程 # 发送请求 response = requests.get("https://example.com/books") res

GPT-2 中的残差权重初始化

mwq301232025/10/19

GPT-2 中的残差权重初始化 1. 概述在深度残差网络中，每一层的输出都会被加到其输入上。如果不对这些层的权重进行特殊处理，随着网络深度的增加，残差路径上累加的信号方差可能会不断增大，导致数值不稳定和训练发散。为了解决这个问题，GPT-2 的作者在论文中提出了一种针对残差连接路径上的层进行特殊缩放的初始化方法。 2. 哪些是“残差权重”？在 GPT-2 的一个 Decoder Block 中，有两个子层的输出会直接被加到残差流（Residual Stream）上。因此，这两层的权重就是我

SpringBoot启动优化7板斧：砍掉70%启动时间的魔鬼实践

皮皮林5512025/10/18

1.延迟初始化：按需加载的智慧 2.组件扫描精准打击：告别无差别扫描 3.JVM参数调优：启动加速的隐藏开关 4.自动配置瘦身：砍掉Spring Boot的"赘肉" 5.类加载优化：让JVM轻装上阵 6.数据库连接优化：断开启动时的枷锁 7.编译优化：AOT与分层编译的威力综合优化案例：电商平台实战启动优化检查清单各优化手段效果对比图 1. 延迟初始化：按需加载的智慧实践方案： # application.properties spring.main.lazy-initializat

除了JSON/XML，你还应该了解的数据描述语言ASN.1 —— 附《SpringBoot实现ASN.1在线解析工具》

风象南2025/10/17

前言在日常开发中，我们经常接触JSON、XML等数据格式，但你是否听说过ASN.1？这种在通信、安全、物联网领域广泛使用的数据描述语言。可能对一部分开发者来说有些陌生，但在特定场景下却有着不可替代的作用。今天，我们就来深入了解一下ASN.1，并用SpringBoot实现一个在线解析工具。什么是ASN.1？基本概念 ASN.1（Abstract Syntax Notation One）是一种标准化的数据描述语言，由ITU-T（国际电信联盟）和ISO（国际标准化组织）共同制定。它提供了一种平

上一篇：理解 LangChain 智能体：create_react_agent 与 create_tool_calling_agent

下一篇：程序员副业 | 2025年10月复盘

首页编辑器站点地图

Copyright © 2025 聚合阅读

License: CC BY-SA 4.0