数据库

共 1083 篇文章

IT 2014-11-21 23:22:05 / 累计浏览 3,443

深入剖析 redis 数据结构 skiplist

这篇讲的是Redis有序集合ZSet背后的灵魂——跳表（skiplist）。作者从Redis源码出发，一层层拆解了这个经典数据结构。文章首先点明跳表的核心价值：它用空间换时间，通过预先在有序链表上建立多级“索引”，实现了类似二分查找的高效查询。Redis正是利用它来支撑ZSet的排序和范围查询操作。更精彩的部分在于对Redis具体实现的剖析。文章不仅给出了核心结构体`zskiplistNode`和`zskiplist`的定义，还深入到了插入和删除操作的算法细节。比如，插入时如何随机生成新节点的层数，以及如何通过`update`数组和`rank`数组来精确地调整每一层的前驱指针和`span`值。`span`这个设计很巧妙，它记录了两个节点之间跳过了多少元素，是实现按排名查询的关键。作者没有停留在理论，而是结合代码注释，把查找、插入、删除的完整流程都梳理了一遍。从概念到实现，从宏观到微观，清晰地展现了Redis是如何用这套机制来保障其高性能的。对于想理解Redis内部原理的开发者来说，这篇源码分析对数据结构的剖析很到位。

本机暂存

IT 2014-11-20 23:53:27 / 累计浏览 1,581

深入剖析 redis 数据结构 intset

这篇讲的是 Redis 中整数集合 intset 的底层实现细节。当 set 中所有元素都是整数时，Redis 会优先使用 intset 这种紧凑的数据结构，只有遇到非整数时才升级为更通用的 dict。作者深入源码，拆解了 intset 如何做到高效存储与操作。 intset 本质是一个有序、不重复的整型数组。它的精巧之处在于通过 `encoding` 字段动态记录当前数组中整数的位宽（16、32或64位），从而在保证功能的前提下极致节省内存。查找操作直接利用数组的有序特性，采用经典的二分查找算法，效率很高。文章的重点和亮点在于对插入过程的剖析。当插入的新整数超出了当前编码范围（例如向一个全是 16 位整数的集合插入一个 32 位整数），intset 不会简单拒绝，而是会触发一次“编码升级”（`intsetUpgradeAndAdd`）。升级过程非常巧妙：它会重新分配内存，将现有所有元素转换为新编码，并逆序移动元素以避免数据覆盖。由于新整数必然是最大或最小值，最终将其放置在数组头部或尾部即可。这种按需升级的设计，平衡了内存效率与灵活性。整体来看，intset 是一个为特定场景高度优化的微型数据结构。它通过有序数组+二分查找+动态编码升级，为 Redis 提供了一个内存极其友好且高效的整数集合实现，是理解 Redis 空间优化哲学的一个绝佳范例。

本机暂存

IT 2014-11-20 23:34:32 / 累计浏览 2,143

TokuMX使用小计

作者面对一个实际痛点：MongoDB存储运行日志时，三个月数据就占用近100G磁盘，急需更高效的存储方案。他最终选择了TokuMX——一款声称能节省90%空间并大幅提升性能的MongoDB分支。迁移过程非常直接，使用标准工具导出再导入即可。实际效果令人惊讶：原先102G的数据迁移到TokuMX后，仅占用2.2G，导入速度提升至少10倍，查询性能保持稳定。文章分析了TokuMX背后的关键技术：一是存储层的高效压缩，二是用分形树索引替代传统的B树，通过在节点内设置缓冲区并批量写入，来大幅提升写入效率。除了分享这次迁移实践与技术原理，作者还附上了官方介绍文档、第三方性能评测等参考资料，为想深入了解或尝试的读者提供了入口。

本机暂存

IT 2014-11-20 23:33:34 / 累计浏览 1,725

翻译文档：TokuMX的分形索引是什么？

这篇讲的是TokuMX如何通过一种叫“分形树索引”的数据结构，颠覆了数据库性能优化的传统认知。作者从数据库领域一条看似不可动摇的规则说起：要想写入快，索引必须能装进内存。因为传统B树索引在写数据时，几乎每次操作都需要访问磁盘上的叶子节点，一旦内存装不下，频繁的I/O就会让性能急剧下降。而分形树索引的解法很巧妙：它在B树内部节点里加入了缓冲区。写操作先快速存入根节点的缓冲区，满了再像瀑布一样向下“刷”到子节点的缓冲区。这样一来，许多小写入就被合并成一次磁盘I/O，效率大幅提升。文章通过对比清晰地指出：关键差异就在于这个缓冲设计，它让分形树索引在索引工作集远超内存时，依然能保持出色的写入性能。不过作者也补充，如果内存足够大，B树其实也很快，分形树的优势主要体现在应对重度I/O的场景。

本机暂存

IT 2014-11-19 23:19:17 / 累计浏览 2,041

RDS典型客户工单——空间问题

这篇直击RDS运维中让人头疼的磁盘空间问题，它并非泛泛而谈理论，而是直接从一个个真实的客户工单切入，抽丝剥茧地分析典型场景。文章系统梳理了七大类空间异常情况，从临时表与日志文件膨胀导致的“飙升”，到磁盘超限触发实例只读锁定，再到新手常遇到的“未用先满”疑惑，以及因大字段或本地迁移引入的隐形空间消耗。针对每个问题，都给出了明确的根因，比如使用临时表的低效SQL、未及时清理的binlog、SQL Server大字段对日志的放大效应，并提供了具体的排查与解决路径，例如创建索引避免临时表、清理binlog、调整字段大小或升级数据库版本以优化undo日志回收。文章特别提到了一个因binlog累积与排序操作叠加导致空间暴涨的综合案例，展现了问题排查的复杂性。对于开发者和运维人员来说，这篇文章像一份实用的故障排查手册，把那些看似突发的空间锁定问题拆解成了可诊断、可预防的具体技术点，能帮助大家快速定位并解决生产环境中的类似棘手问题。

本机暂存

IT 2014-06-10 12:25:34 / 累计浏览 2,502

redis 数据结构综述

这篇讲的是 Redis 存储键值对的核心底层数据结构，从源码层面剖析了其设计与巧妙的权衡。文章从全局视角出发，逐一介绍了 dict 哈希表、可变类型的 redisObject、高效插入删除的 zset（跳表+哈希表组合）、经典的 adlist 双链表，以及为优化 CPU 缓存和内存而生的压缩列表 ziplist 和整数集合 intset 等关键结构。不止于理论，作者更将这些结构与具体的 Redis 命令联系起来，清晰地展现了不同场景下的选择逻辑。比如，SET 命令对应最简单的 sds 或数值类型；HSET 和 LPUSH 在特定条件下会使用紧凑的 ziplist 而非链表；SADD 会根据元素是否全为整数，在 intset 和 dict 之间动态切换；而 ZADD 有序集合则综合运用了 skiplist 和 dict，或采用 ziplist，具体取决于配置阈值。这种从底层实现到命令行为的串联分析，揭示了 Redis 在性能与内存之间精妙平衡的设计哲学。作者提到这只是系列开篇，后续将逐一深挖每个结构，值得对 Redis 内部机制感兴趣的技术人持续关注。

本机暂存

IT 2014-05-27 22:56:54 / 累计浏览 2,720

Dynamo和Cassandra海量存储基础

这篇讲的是Dynamo和Cassandra这两个经典分布式存储系统，在核心设计哲学上的对比与剖析。文章从它们共享的基石概念入手，比如用W+R>N公式如何决定读写一致性级别，并用主备复制、Quorum机制等实例具体说明了N、W、R取值的影响。真正的分歧点在于处理数据冲突的策略。Dynamo选择了更复杂的向量时钟，它像Git一样记录数据版本的来源，当检测到并行的、可能冲突的写入时，会保留所有版本交由应用层合并，适合能处理合并逻辑的场景。而Cassandra则采取了更粗暴的简化——时间戳方案，它不检测冲突，直接以最新时间戳的数据为准。这极大降低了复杂度，适用于大多数对冲突不敏感的场景。文章还追溯了两者共同的基础——Gossip协议，并提及了它在去中心化通信中的优势与维持一致性的挑战。作者的对比最终导向了一个深刻的观点：在大多数写入冲突概率较低的场景下，这种最终一致性模型比强一致全局排序（如Paxos）更高效。两种不同的冲突解决路径，正体现了在工程化实现中对一致性权衡的不同哲学。

本机暂存

IT 2014-05-27 22:47:54 / 累计浏览 2,641

深入剖析 redis 数据淘汰策略

这篇讲的是 Redis 在内存紧张时如何选择“淘汰谁”的策略。当数据集大小超过 maxmemory 限制时，Redis 会启动数据淘汰机制，而策略的选择直接关系到服务的稳定性和数据的访问模式。文章梳理了 Redis 提供的六种策略。核心思路分为三类：针对设置了过期时间的键（volatile）进行 LRU（最近最少使用）、TTL（最快过期）或随机淘汰；针对所有键（allkeys）进行 LRU 或随机淘汰；以及完全禁止驱逐。作者重点剖析了 LRU 和 TTL 两种机制的实现细节。有趣的是，Redis 的 LRU 并非一个严格的全局算法。它维护了一个每分钟更新的服务器级 lruclock，在每次淘汰时，会从数据集中随机抽取一批键（由 maxmemory_samples 控制），然后只在这批“样本”中找出 LRU 值最大的那个进行淘汰。TTL 策略的实现方式也类似，是随机采样后淘汰剩余存活时间最长的键。这是一种在性能与效果之间做出权衡的巧妙设计，牺牲了绝对的精确性，换来了极低的计算开销。文章通过源码揭示了 freeMemoryIfNeeded() 这个核心函数的工作流程：每次执行命令后检查内存，若超标则根据配置的策略，遍历数据库，通过采样找出要驱逐的键值对并删除，同时将此操作同步到 AOF 和从库。理解这些机制，能帮助我们更好地配置 Redis，在缓存命中率、内存使用和性能之间找到最佳平衡点。

本机暂存

IT 2014-04-13 22:38:27 / 累计浏览 2,522

如何在Redis里按模式删除数据

这篇讲的是一个Redis内存突然暴增导致宕机的排查案例。作者从服务器异常消耗几十G内存、最终因SWAP宕机说起，一开始和DBA同事以为是有大键占用了空间，但用工具分析后排除了这个可能。问题随后转向了另一个方向：即使单个键不大，但大量相同模式的键累计起来，占用的空间也可能非常可观。作者最初想用 `KEYS` 配合 `DEL` 命令批量删除可疑键，结果因为数据量太大，`KEYS` 命令直接让服务器再次崩溃——这暴露了KEYS命令在生产环境中的巨大风险。最终，作者改用支持游标迭代的 `SCAN` 命令，通过PHP脚本分批扫描并删除目标键，同时监控内存变化，成功锁定了问题源头。整个过程也强调了一个运维要点：除了关注大键，监控Redis键总数的变化幅度同样重要，这能帮助及早发现类似批量写入导致的隐患。

本机暂存

IT 2014-04-07 22:56:02 / 累计浏览 4,765

Linux大棚版redis入门教程

这篇是面向初者的Redis全景指南，从安装启动讲起，一直深入到核心数据结构、持久化机制和生产配置。文章不止停留在“是什么”，更用大量实际命令演示了如何操作。作者将Redis的五种数据结构——字符串、列表、集合、有序集合与哈希——拆解开来，配合代码示例讲明各自的用法与底层特性。比如，他指出lists在底层是链表，因此头部尾部操作是常数时间，但随机定位较慢，并以此引出其在消息队列等场景的应用优势。在掌握基础后，教程进一步引导读者理解RDB与AOF两种持久化的原理与选择，主从同步的机制，乃至事务处理。最后对redis.conf配置文件的逐项解读，让初学者也能看懂并调整安全、性能与限制相关的参数。整个系列循序渐进，覆盖了从“跑起来”到“用得好”的关键知识点，对于希望快速上手并扎实理解Redis的新手来说，是一份非常友好的实战手册。

本机暂存

IT 2014-03-19 22:47:55 / 累计浏览 4,540

undo异常总结和恢复思路

这篇讲的是Oracle数据库UNDO表空间故障的实战总结。作者从一线工作出发，集中汇总了如ORA-00704（bootstrap process failure）、ORA-00600[4194]、ORA-00600[kcfrbd_3]等一系列让很多DBA头疼的UNDO相关报错。文章的核心价值在于其系统性。它不仅罗列了千奇百怪的错误现象，更关键的是揭示了背后的常见根源：大多数UNDO异常并非文件本身损坏，而是因为Redo日志未被正常前滚，导致回滚段状态异常，最终阻碍数据库打开。针对这类问题，作者提供了一套清晰的渐进式恢复思路：从尝试修改UNDO管理方式（M MANUAL）、设置特定事件（10513），到逐步使用参数屏蔽问题回滚段，最后才考虑使用bbed或dul等底层工具。这个思路为遇到类似困境的DBA指明了从软到硬、风险递增的排查路径。当然，作者也坦诚地指出数据库恢复千变万化，无法照搬，并提供了进一步获取专业技术支持的途径。

本机暂存

IT 2013-09-23 13:54:28 / 累计浏览 3,484

关于sqlite的事务的使用

SQLite以读性能出色著称，但写入性能有时会让开发者头疼。这篇来自作者实践经验的文章，就从一个具体问题切入：批量插入500条小记录居然需要20多秒，异常缓慢。问题的根源是什么呢？作者通过strace工具追踪系统调用发现，高达88.73%的耗时（超过27秒）都花在了`fdatasync`系统调用上，调用次数多达2064次。这正是因为SQLite默认的“每次写入都落盘”的安全策略所致，频繁的磁盘同步成为了性能瓶颈。文章给出的解法很直接：使用事务。将多次写入操作包裹在一个事务中，使得数据能够一次性批量提交。优化效果立竿见影：`fdatasync`调用从2064次骤降至12次，整体耗时从27.6秒猛降到209毫秒，性能提升了百倍以上。作者也进一步探讨了相关话题，比如无法批量操作时可选用的nosync版本，以及面对超大数据量时分批提交事务的考量。这篇文章的价值在于，它用非常实证的数据，清晰展示了SQLite写入慢的核心原因以及事务优化带来的巨大提升。

本机暂存

IT 2013-09-23 12:20:01 / 累计浏览 1,381

Oracle中的Low HWM与 High HWM 高水位

这篇讲的是Oracle数据库在ASSM存储管理下，如何通过引入Low HWM和High HWM两个高水位标记来优化存储空间利用与并发性能。作者从传统MSSM模式下单一高水位标记的局限性切入，指出了其可能引发的锁竞争与IO性能问题。文章核心聚焦于ASSM的解决方案：通过两个高水位将数据块区域划分为已格式化（Low HWM以下）、未格式化但可能被重用（Low HWM与High HWM之间）以及完全未格式化（High HWM以上）三个区域。这种设计精妙之处在于，它允许在HWM以下存在未格式化的“空洞”，从而在直接路径加载数据时，能更灵活地复用空间，避免因频繁提升高水位而导致的锁等待和不必要的格式化IO开销。作者进一步解释了这一机制的关键细节：只有当当前extent及之前extent中的所有块均被格式化后，Low HWM才会上升；而High HWM的提升则与一级位图块管理的范围相关。在顺序读取时，系统以High HWM为终点，同时忽略其间未格式化的块，保证了查询效率。整篇内容深入到底层实现原理，为理解Oracle复杂的存储管理提供了清晰的视角。

本机暂存

IT 2013-09-15 22:26:43 / 累计浏览 2,384

Oracle JDBC中的语句缓存

这篇讲的是如何在Java应用中，利用Oracle JDBC驱动提供的语句缓存机制，来优化数据库访问性能，核心目标是实现“一次解析，多次执行”的高效模式。文章首先清晰梳理了Oracle数据库中硬解析、软解析等不同SQL解析方式的特点与潜在性能瓶颈，指出过多解析会导致latch争用等问题。随后，作者通过一个对比实验，直观展示了开启JDBC语句缓存前后的巨大差异：未缓存时，一条SQL语句执行200次就产生了200次解析；而开启缓存后，同样执行200次，解析次数仅为1次，显著降低了数据库负载。实现的关键在于通过OracleConnection对象设置`setStatementCacheSize`和`setImplicitCachingEnabled`，这能为每个连接自动缓存使用过的PreparedStatement。文章还深入一层，介绍了如何通过`setExplicitCachingEnabled`及手工指定Key的方式，进行更精细的缓存控制，以避免缓存不常用语句造成的内存浪费。通过具体的代码示例与数据库监控结果验证，文章为Java开发者提供了一个实用且效果明确的Oracle性能优化方案。

本机暂存

IT 2013-09-07 15:23:36 / 累计浏览 2,002

数据的存储介质-磁盘的硬件特性

这篇技术文章深入剖析了机械硬盘的硬件特性，从基础构造讲到性能原理，非常适合需要理解存储底层机制的开发者。作者从磁带机讲起，解释了磁盘如何通过电机旋转盘片、磁头移动寻道来实现随机访问，这个演进过程讲得清晰易懂。文章重点剖析了几个关键点：硬盘如何以“块”（通常为512字节）为单位进行读写，以及在异常断电时，系统如何通过在启动时清理未完成的数据块来保证数据的原子性，这是单机存储保证一致性的经典思路。更硬核的部分在于对性能指标的辨析。文章厘清了 IOPS（每秒读写次数）、吞吐量（MB/s）和延迟之间的关系，并指出它们适用的不同场景：数据库更看重影响 IOPS 的寻道时间，而大文件存储则更追求吞吐量。作者还用“飞机运旅客”的比喻，巧妙地说明了适度增加延迟可以提升整体吞吐量的原理。最后，文章总结了机械硬盘技术成熟、顺序读写性能好的优势，以及因机械结构导致随机访问性能下降的固有劣势。

本机暂存

IT 2013-09-07 15:22:50 / 累计浏览 3,406

数据的存储介质-磁盘的RAID

RAID作为存储领域的基石技术，其“分而治之”与“冗余复制”的核心思想，至今仍深刻影响着分布式存储系统的设计。这篇文章从数据存储的两个基本要素——通信管道与介质出发，清晰地拆解了RAID技术诞生的根本动因：通过合理组织多块磁盘，来突破单盘在IOPS与数据安全性上的瓶颈。文章对几种经典RAID模式（RAID 0/1/5/1+0）的阐述并非简单罗列，而是抓住了它们的核心逻辑与权衡。例如，指出了RAID 0的并行读写优势、RAID 1的镜像成本，以及RAID 5通过XOR校验在冗余与空间效率间的折衷。特别值得玩味的是，作者点明了RAID 0+1与RAID 1+0在故障场景下的关键差异，解释了为何后者是更优的选择，并自然引申到GFS、HDFS等现代文件系统其实都采用了“先复制、再切分”的类似策略。更深入一层，文章探讨了在单机环境下实现RAID时所面临的、类似于CAP问题的原子性写入挑战。它揭示了RAID卡如何利用“内存缓存+电池/SSD备份”这一巧妙而务实的方案来打破数据一致性的逻辑循环，既保证了性能，也解决了可靠性难题。文中对盘柜及新网络协议（如FC、iSCSI）的提及，则拓宽了读者对RAID物理实现形式的认知。整体而言，这篇文章将RAID技术置于更广阔的存储演进史中，不仅讲清了“是什么”和“为什么”，更通过与分布式系统的类比，帮助读者理解了这一传统技术历久弥新的底层逻辑。

本机暂存

IT 2013-09-07 15:22:07 / 累计浏览 2,882

数据的存储介质-固态存储SSD

这篇讲的是SSD固态硬盘的性能内幕。作者抛开基础科普，直击几个核心痛点：为什么不同品牌的SSD读写速度差距巨大？为什么解决了磁盘寻道问题后，4K随机写仍是性能瓶颈？而所有问题的答案，最终都指向了一个关键角色——FLASH控制器。文章从NAND闪存的底层特性说起，解释了SLC/MLC的区别、以及闪存“必须整块擦除”的特殊操作。正是这些硬件限制，导致了“写入放大”现象。作者指出，各家控制器处理垃圾回收、磨损均衡和写入策略的算法差异，直接造就了性能上的天壤之别。对于随机写瓶颈，文章分析了块回收跟不上写入请求时，延迟会从250微秒陡增至2250微秒的残酷现实。最后，文章探讨了控制器放在专用芯片还是共享主机CPU上的不同路线之争，并展望了随着控制器算法优化和闪存成本下降，SSD将在高性能存储领域全面取代机械硬盘的趋势。读完能让人明白，SSD的水，远比“无机械结构所以快”要深得多。

本机暂存

IT 2013-09-04 23:17:06 / 累计浏览 2,642

如何提高Oracle进程的优先级 - 实现进程实时调度

这篇讲的是在繁忙的Oracle系统中，如何为关键后台进程争取更多的CPU资源。作者从Oracle 10gR2引入的一个隐含参数 **_high_priority_processes** 出发，介绍了实现进程实时调度的具体方法。文章核心是讲解这个参数的使用：通过在数据库中设置它（例如 `_high_priority_processes="LMS*|LGWR|PMON"`），可以提升指定进程的优先级。作者通过Linux下的实际测试展示了效果：设置前PMON进程为普通分时调度（TS），重启数据库后即转变为实时调度（RR），从而能优先获取CPU。文章还对比了不同操作系统下的差异，例如Solaris上会使用RT实时模式。最后，作者也提醒了实际应用中的细节，比如在RAC环境中，提升所有LMS进程的优先级可能并非必要，反而会抢占资源，需要根据业务负载审慎配置。整篇文章从原理、设置方法到实际效果和注意事项，提供了一套完整的技术思路。

本机暂存

IT 2013-09-02 13:31:54 / 累计浏览 4,184

从需求出发来看关系模型与非关系模型–关系模型与非关系模型概述

这篇讲的是关系模型与非关系模型的选择根源。作者从当前对 NoSQL 的盲目追捧现象切入，指出许多项目初创团队都在纠结如何选择 NoSQL，却忽略了模型本身的本质。文章的核心是帮读者理清 RDBMS、NoSQL、CAP、BASE 这些概念的本源，并用一个“车”的例子清晰地对比了层次模型和关系模型的差异。关键在于，关系模型通过集合运算抽象了数据“关系”，让用户无需像层次模型那样关心从“车”到“轮子集合”再到“具体轮子”的存取路径，只需关注查询逻辑本身，这使得它严谨且被广泛接受。然而，随着面向对象编程的普及，关系模型带来了“阻抗失配”问题——将对象中的继承、组合映射到关系表变得非常痛苦。为解决此问题，业界尝试了 ORM 工具、在数据库层支持对象，以及利用脚本语言的动态特性来简化映射。这些方案各有代价，ORM 学习成本高且易导致低效查询，而用 Map 则会破坏封装性。随着互联网发展，对高性能和灵活数据结构的需求，让层次模型的变种——NoSQL 重新受到关注。文章接下来将从具体应用场景出发，剖析关系模型在哪些地方力不从心，以及 NoSQL 为何又能满足新的需求。

本机暂存

IT 2013-09-02 13:30:54 / 累计浏览 1,604

Solr之缓存篇

这篇讲的是Solr搜索引擎中“看不见”却至关重要的性能支柱——缓存系统。作者没有停留在配置层面，而是直接钻进源码，剖析了Solr四种核心缓存（filterCache、documentCache等）的生命周期是如何被 `SolrIndexSearcher` 牢牢掌控的。文章清晰地展示了，一次索引提交（commit）如何像一个开关，触发 `getSearcher()` 方法关闭旧的 `IndexReader`，并构建新的 `SolrIndexSearcher`。而新的Searcher一旦构建，它所管理的所有缓存实例便会随之重建。这意味着缓存并非永久存在，其生命周期与底层的索引阅读器严格绑定。更巧妙的部分在于“预热”机制的设计。文章通过代码片段揭示，当新Searcher被构建时，系统会在后台线程中将老缓存中的热点数据预先加载到新缓存中。这个过程有效避免了缓存“冷启动”带来的性能断崖，确保了搜索服务在索引更新后的平滑过渡。这种从实现原理出发的解读，让读者不仅能配置缓存，更能理解其背后的运行逻辑与优化思想。

本机暂存