后端

共 1964 篇文章

IT 2014-03-19 22:40:30 / 累计浏览 4,405

域名DNS相关术语

这篇讲的是域名与DNS世界里那些让人头大的术语。作者把 Registrant、Registrar、Registry 和 Registry Operator 这四个核心角色及其相互关系梳理得很清楚：一个是所有者（注册人），一个是代理服务商（注册商），一个是权威数据库（注册局），还有一个是运营方（注册局运营商）。这个链条一明确，很多配置和管理上的困惑就能迎刃而解。文章接着把目光投向了域名层级本身，详细拆解了顶级域名（TLD）这个概念。它特别对比了通用顶级域名（如.com）和国家或地区顶级域名（如.cn）的根本区别：前者由 ICANN 全球协调，后者则与具体国家或地区的法律和管理体系紧密绑定。读下来，感觉像是跟着一张清晰的架构图，走了一遍域名系统的基本骨架。对于需要与海外服务商打交道，或者想弄明白“.com”和“.cn”背后管理逻辑不同的技术人来说，这篇文章提供的准确定义和对比，是厘清思路的好帮手。

本机暂存

IT 2014-03-19 22:26:07 / 累计浏览 3,222

Linux内核中通过文件描述符获取绝对路径

这篇深入探讨了一个内核开发中具体且实用的场景：当你只知道一个进程的pid和它持有的某个文件描述符fd时，如何在内核里一步步找回该文件在磁盘上的绝对路径。文章的核心思路是沿着内核的数据结构进行“导航”。它首先通过pid找到进程的task_struct，再从中取出进程打开的文件表files_struct。以fd为索引，就能定位到代表这个文件的内核结构体file。接下来是最关键的两步：从file中获取封装了dentry（目录项）和挂载点信息的path结构，并最终调用内核函数`d_path()`，将这一系列结构解析为人类可读的绝对路径字符串。整个实现过程清晰展示了Linux内核管理进程与文件系统的精巧层次。这种从进程到文件、再到路径的逆向追踪能力，对于调试内核模块、进行系统监控或编写特定内核功能来说，是一项非常基础且重要的技术。

本机暂存

IT 2014-02-18 23:30:35 / 累计浏览 1,423

稿酬模式

这篇文章讲的是内容平台支付作者报酬的模式演变。作者从“稿费”到“稿酬”的用词变化入手，指出2013年以来，在TMT领域出现了几种值得关注的新付费模式。文章核心分析了三种半新模式。PK模式常见于像虎嗅、钛媒体这样的平台，它们不定篇付费，而是通过访问量或投票竞赛来决定少量作者能获得的奖品或稿酬，本质是成本控制手段。土豪模式以百度百家和腾讯广点通为代表，平台拥有海量广告主，通过文章页广告收入与作者分成来实现盈利，但收入高度依赖平台的流量分配。高富帅模式则是腾讯大家这类平台的做法，以高额稿费（据称可达每字1-2元）直接买断优质内容，不追求即时商业化，目标在于塑造舆论影响力。最后半个是经纪人模式，平台作为中介为自媒体对接商业推广需求。文章指出了这些模式的适用场景与关键差异：PK模式适合起步期媒体，土豪模式依赖平台广告主规模，高富帅模式则需要雄厚资本支持。作者也预见了不同模式未来可能走向融合。

本机暂存

IT 2014-02-18 12:34:38 / 累计浏览 4,125

TCP网络协议以及其思想的应用

这篇深入探讨了TCP协议核心思想的文章，跳出了单纯的网络协议讲解，聚焦于如何将TCP在不可靠网络上构建可靠传输的智慧，活用到更广泛的系统设计中。作者从大多数程序员对TCP的熟悉但未必精通的状态切入，明确指出TCP的精髓是在IP层的不可靠传输之上建立可靠机制。其核心技术如滑动窗口、慢启动、指数退避等，目的都是优化传输。但更重要的，是它提供的设计范式。文章强调，TCP的“可靠”是相对自身协议栈而言的，一旦跨越不同系统边界（比如从一个应用到另一个应用），就需要重新审视可靠性。因此，任何涉及通信与交互的场景，都可以借鉴TCP的思想。作者提炼出了在任何通信系统之上构建可靠传输所必须的三要素：确认、重传和顺序。这为我们设计自定义可靠协议（例如在UDP之上）或解决复杂交互问题，提供了清晰且根本的思路。

本机暂存

IT 2013-11-21 23:08:20 / 累计浏览 11,024

浅谈TCP优化

这篇讲的是TCP性能优化背后的原理与可操作的调优方法。作者以《High Performance Browser Networking》一书为依托，将看似晦涩的流量控制、慢启动和拥塞避免机制，用通俗的比喻讲得清晰明白。例如，用“吃几碗饭”比喻接收窗口（rwnd）的限制，用拳击试探比喻拥塞窗口（cwnd）的增长。文章深入浅出地解释了网络吞吐量受限的核心逻辑：传输性能由rwnd和cwnd中较小的值决定。针对百兆网络却跑不满速的常见问题，作者给出了具体解决方案——根据带宽延迟乘积（BDP）来计算合理的rwnd大小，并介绍了Linux内核中的自动调优机制与关键参数。对于网页加载等短连接场景，文章通过生动的类比（博尔特百米起跑）和数据对比，揭示了cwnd初始值设置对效率的巨大影响，并引用了Google的研究结论，建议将其调整为10个MSS大小。从原理到实践，文章提供了一套可落地的优化思路。

本机暂存

IT 2013-11-01 13:52:54 / 累计浏览 24,425

Linux大棚版Thrift入门教程

这篇讲的是如何快速上手Thrift——这个最初由Facebook开发、现在由Apache维护的跨语言RPC框架。文章从“thrift”一词的节俭本意巧妙切入，指出在技术语境下，它代表的是一种高效解决跨语言服务通信的“节俭”之道。作者没有停留在概念介绍，而是通过一个具体的成绩查询系统案例，生动对比了传统“手工作坊”式开发与使用RPC框架的效率差异。他清晰地拆解了Thrift的四个使用步骤：定义接口文件、生成代码、实现服务端逻辑、编写客户端调用，让读者对工作流程一目了然。教程的详尽之处在于，它系统地讲解了Thrift接口描述文件（IDL）的编写规范，包括基础类型、容器、结构体、异常和服务等核心元素的定义方式，并辅以代码示例。特别是对required/optional字段、oneway异步调用等细节的说明，为初学者扫清了常见困惑。对于想了解如何在Linux环境下搭建并利用Thrift构建高效、跨语言服务的开发者，这是一份条理清晰、实例丰富的入门指南。

本机暂存

IT 2013-10-29 23:04:41 / 累计浏览 1,885

MooseFS之虚拟机惹的祸

这篇讲的是一个生产环境MooseFS集群的惊险故障复盘。国庆后，一台ChunkServer重启导致Master无响应几十分钟，整个集群瘫痪。排查日志发现，海量的“nonexistent chunk”错误日志打印是罪魁祸首。作者深入源码分析，发现处理逻辑本身多为内存操作，问题出在单线程的Master进程调用syslog写磁盘这个操作上。通过对比线上和测试环境的TPS数据，性能差异达到惊人的65倍。最终锁定根因：运维此前将Master从物理机迁移到了虚拟机，而虚拟机的系统盘直接挂载在性能较差的网络iSCSI设备上，导致磁盘I/O成为致命瓶颈。文章不仅给出了直接注释日志代码和迁移回物理机的解决方案，更提炼出关键经验：MooseFS Master的单线程架构对磁盘I/O极其敏感，一旦涉及磁盘写入就可能成为性能瓶颈，因此强烈不建议将其部署在虚拟机环境。作者还结合HDFS对比，指出了单线程设计在高并发场景下的局限性，为存储选型提供了直观参考。

本机暂存

IT 2013-10-29 23:04:06 / 累计浏览 1,563

解决HDFS磁盘扫描导致死亡结点的问题

这篇讲的是作者在升级Hadoop至2.0后，处理的一个棘手的生产故障：集群中磁盘数量多的DataNode会周期性地变为“死亡结点”，虽未立刻影响业务，但一次双副本DataNode同时死亡导致了数据丢失。问题排查的关键突破口在于“6小时”这个固定间隔。作者将它锁定为DataNode的周期性磁盘扫描任务，并通过jstack抓取堆栈发现了隐蔽的根因：在扫描过程中，数据块对比的步骤需要对核心的DataSet对象加锁，而该步骤中一个看似无害的`File.length()`方法调用，在底层会执行磁盘IO操作。在磁盘压力较大时，这个操作会耗时很长，导致DataSet锁被长时间持有，进而阻塞了心跳线程和所有数据传输线程，造成DataNode被NameNode误判为死亡。解决方法巧妙且高效：将引发IO操作的`getlength`提前到第二步异步的磁盘扫描任务中执行，从而将持锁时间从几十分钟大幅缩短至2秒左右。文章完整还原了从现象观察、假设推翻到利用工具（jstack）锁定真凶的全过程，对理解分布式系统中锁竞争、IO影响以及复杂故障排查思路很有启发。最终，他们将修复补丁提交至了Apache社区（HDFS-5341）。

本机暂存

IT 2013-10-29 23:02:33 / 累计浏览 3,942

Web 开发程序员谈网游服务器开发

这篇讲的是作者在参加一次网游开发团队交流后的思考。他敏锐地捕捉到，传统网游服务器开发因逻辑与存储高度绑定，往往忽视了动态扩展与容灾能力，而这些恰恰是Web开发领域的强项。作者的核心观点是，网游服务器可以借鉴Web架构的“服务无状态化”原则。关键在于将服务拆分为“逻辑（指令）”和“存储（状态）”两部分。一旦逻辑层本身无状态，就能像典型的Web应用（如PHP + MySQL）一样，实现服务器的弹性增减。即使面对“用户切换服务器后状态丢失”这类网游特有疑问，通过分离设计和将存储层集群化，同样能构建出高可扩展、高容灾的系统。这个视角为游戏后台架构提供了一条清晰的优化路径：用Web成熟的工程思想，去解耦游戏服务器的紧耦合状态。

本机暂存

IT 2013-10-29 12:23:14 / 累计浏览 23,525

一种常见的并发编程场景的处理

这篇讲的是并发编程中一个容易被忽略的典型场景：当一个“守护线程”提供共享资源，多个业务线程频繁读写，而主线程仅偶尔需要介入（比如统计数据、做快照）时，如何设计才能兼顾性能与数据安全？文章指出，如果主线程和业务线程使用同一把锁（如 `synchronized`），在绝大多数（99.9%）主线程不介入的时间里，业务线程之间会产生不必要的锁竞争，拖累性能。作者给出的方案是引入 `AtomicBoolean` 和 `AtomicInteger` 两个原子变量（volatile 变量的实现）来协调状态：一个标志主线程是否正在独占操作，另一个统计当前正在写入的业务线程数。这样，业务线程只需在主线程介入时等待，而彼此之间几乎无需竞争锁，从而在大多数时间里实现近乎无锁的并发写入。文章以 `ConcurrentHashMap` 为例给出了核心代码，并坦承在 Java 中这点性能差异或许可以忽略，且方案本身有一定复杂度。但作者认为，这种在“性能和数据保护之间寻求最大平衡”的设计思路，其实践意义是利大于弊的。

本机暂存

IT 2013-10-15 13:43:49 / 累计浏览 11,696

到底什么是MVC？

这篇讲的是MVC架构模式如何从桌面时代演化到Web时代。作者从经典MVC（Model-View-Controller）模型的三大组件及其依赖关系入手，解释了它为何在处理复杂业务逻辑时会陷入两难——比如音量调节时背景色变化的逻辑，既不适合放在Model也不适合放在View。为了解决这个问题，文章梳理了后续的演进路径：先是Smalltalk团队在80年代引入了“Application Model”层作为中继，试图分离复杂逻辑，但这又带来了新问题。接着，IBM在90年代提出了MVP（Model-View-Presenter）模式，通过让Presenter直接持有View的引用来处理复杂交互，解决了可观测性和可测试性之间的矛盾。文章最后将视角转向Web。由于HTTP无状态的特性，传统观察者模式无法适用，于是演化出了Web MVC（如Rails所采用的架构），其中Controller更多地承担了协调调度职责。整体来看，这就像一部微型架构思想史，清晰展示了技术模式是如何在实际问题的驱动下不断调整和迭代的。对于想理清MVC、MVP等概念区别与联系的开发者来说，这篇文章把演化脉络讲得挺明白。

本机暂存

IT 2013-10-08 12:31:35 / 累计浏览 2,481

CentOS 上的 LNMP 一键安装工具 Centmin Mod

这篇讲的是在CentOS系统上部署LNMP（Nginx, MySQL/MariaDB, PHP）环境时，可以使用的一键安装工具Centmin Mod。作者从观察到许多新手用户四处“求教程”出发，指出LNMP安装本身并不复杂，手动配置过程反而更有学习价值。但对已经熟悉Linux的用户而言，一个集成化的工具确实能提供很大便利。文章详细介绍了Centmin Mod这款工具。它由早期的Centmin脚本改良而来，一个显著特点是使用了MariaDB来替代传统的MySQL。文中也提到，这与Google、Red Hat等巨头的技术迁移方向是一致的。通过下载、解压并运行一个简单的Shell脚本，用户就能进入一个清晰的交互式菜单。这个菜单不仅提供了核心的“一键安装”选项（过程大约10-30分钟），还集成了大量运维管理功能，比如为新域名添加Nginx虚拟主机配置、安装或升级PHP加速器（如XCache、APC）、调整SSH端口、关闭SELinux，甚至安装FFMPEG。这使得它不仅仅是一个安装器，更像一个针对CentOS优化的LNMP环境管理套件。对于希望快速搭建环境并拥有后期维护便利性的CentOS用户，它提供了一个省时省力的选择。

本机暂存

IT 2013-10-08 12:24:52 / 累计浏览 2,481

PHP抽象静态方法

这篇文章分享了一个在PHP版本升级中遇到的典型兼容性问题。作者将程序从PHP 5.3升级到5.4后，遇到了“Static function Dataaccess::get() should not be abstract”的严格错误提示。经过排查，根本原因在于从PHP 5.2版本开始，官方已经不允许在抽象类中使用`abstract static`同时修饰一个方法了，这种写法会导致E_STRICT级别的错误。文章指出，虽然不能在抽象类中这样定义，但我们依然可以使用接口来达成强制子类实现特定静态方法的目的。作者随后给出了具体的解决方案：将原本定义在抽象类中的静态抽象方法，移至一个单独的接口（如`Iget`）中定义，然后让抽象类去实现该接口。通过这种方式，继承该抽象类的子类就依然必须实现接口中声明的静态方法，从而在语法规范的升级下，保证了原有的设计意图得以延续。

本机暂存

IT 2013-09-26 22:33:06 / 累计浏览 3,383

图片服务架构学习之ZIMG

这篇讲的是一个名为ZIMG的开源图片服务架构，作者从中小型网站面临的大流量、高并发和海量存储这三重压力出发，详细拆解了这套用C语言编写、追求极致性能的系统是如何设计的。它的核心思路在于将图片服务完全独立，并把处理逻辑（基于libevhtp）、图片操作（基于ImageMagick）与存储（memcached+硬盘）整合在一个轻量级进程里，以减少组件间的开销。文章深入到了代码实现层面，揭示了几个巧妙之处：用图片的MD5哈希值作为全局唯一标识，避免了复杂的数据库查询；采用两级子目录（根据MD5前六位哈希）来组织存储，单机理论容量可达200TB；并且内置了智能的多级缓存策略，能快速响应热点图片的裁剪、变换等请求。同时，系统通过自动压缩图片（宣称可减少约67%体积）、尽可能在内存中完成操作来削减I/O，体现了其“用CPU换I/O”的优化哲学。文章最后也指出，这种单机部署、高内聚的方案，在成本与性能之间做了务实权衡，特别适合需要快速搭建一个高效、自主可控图片服务的场景。

本机暂存

IT 2013-09-25 23:02:05 / 累计浏览 2,503

Go 语言简介（下）— 特性

这篇讲的是Go语言的核心并发特性。作者从通勤时间的利用切入，用一系列简洁的代码示例，带你快速上手Go中并发编程的四大金刚：goroutine、原子操作、Channel以及它们的安全性问题。文章首先展示了如何用`go`关键字轻松启动goroutine，就像给函数调用加了“并发”开关。但真正的并发需要配置`runtime.GOMAXPROCS`。作者特意用一个经典的“卖票程序”作为例子，直观地演示了当多个goroutine同时修改全局变量时，若无保护，票数竟会变成负数。随后，他引出了解决并发数据竞争的两种核心武器：使用`sync.Mutex`互斥锁进行显式加锁，以及对于简单计数器使用`sync/atomic`包进行无锁的原子操作，后者通过一个期望结果为200的累加实验说明了其效率与正确性。最后，文章聚焦于Go的通信哲学核心——Channel。通过示例代码，清晰地讲解了Channel如何充当goroutine间安全的通信管道，包括如何设置缓冲区大小，以及利用其默认的阻塞特性来协调收发双方的节奏，避免了直接共享内存带来的复杂锁问题。整篇文章用最简短的上下班时间，帮你建立起对Go并发模型从基础到实践的关键认知。

本机暂存

IT 2013-09-25 23:00:25 / 累计浏览 2,782

Go 语言简介（上）— 语法

这篇讲的是Go语言入门语法，作者在一个宅家的周末里，决定以“通勤时间也能轻松读完”为目标，用大量代码和注释搭建了一份极简指南。如果你有C、Python或Unix基础，大约半小时就能对Go建立初步印象。文章从经典的“Hello World”切入，迅速展示了Go运行与构建的两种方式。随后，核心语法点如静态类型变量声明（其 `:=` 简洁赋值借鉴了Pascal，却更现代）、常量、数组及其类似Python的切片操作被逐一铺陈。作者特别强调了Go控制流的“干净”：`if`/`switch`/`for` 语句均无需圆括号，且`switch`省略了`break`。这些设计让代码看起来更清爽。更深入一些，文章介绍了Go的内置`map`类型——相比传统语言的哈希表，它的创建、读写和遍历语法都显得异常直观。此外，也提及了Go保留了指针功能。最后，一个有趣的细节是：Go实际上使用分号终结语句，但其词法分析器能根据简单规则自动插入，因此源代码中几乎无需手动输入。这些对比C、Python等语言的语法差异点，正是文章希望帮你快速抓住的Go语言“性格”。对于想快速了解Go独特风格的读者，这是一本带你快速上手的迷你语法手册。

本机暂存

IT 2013-09-25 22:55:33 / 累计浏览 7,362

Storm：最火的流式处理框架

这篇讲的是Storm这个实时流处理框架为何能走红，以及它到底能解决什么问题。作者从Hadoop批处理延迟大的痛点切入，引出了Storm诞生的背景——专为低延迟的实时计算而生。文章拆解了Storm的核心卖点：它是一个分布式、高容错的系统，通过Topology（由Spout和Bolt构成）来处理数据流，并依赖Zookeeper进行状态管理，部署和横向扩展都相对简单。摘要还梳理了Storm的实际应用情况，比如被淘宝、百度、Twitter等大公司用于实时用户画像分析或网站性能监控，以及它如何在迭代中加入Trident等新特性来解决重复计数等实际问题。最后，文章将Storm与Spark Streaming、HStreaming等竞争对手做了简单对比，并指出Storm虽然不是一个“开箱即用”的完整方案，但一旦解决好消息队列和状态管理等前置问题，其简单可扩展的架构优势就会显现出来。

本机暂存

IT 2013-09-23 23:09:27 / 累计浏览 5,541

Netty和Jetty的Java NIO 网络框架模型分析

这篇深度对比了 Netty 与 Jetty 这两个流行 Java 网络框架的底层 NIO 模型。作者从两者处理新连接请求的入口设计切入，揭示了它们截然不同的实现思路。 Netty 采用了专门的 Acceptor Reactor（由 Boss 线程负责），它只专注于监听和接收新的连接。一旦连接建立，便会根据连接序号对事件分离器（默认数量为 CPU 核心数的两倍）取模，将其分配给对应的 NioWorker 线程进行后续的读写监听。这种模型将“接收”与“处理”显式分离，但要求耗时操作必须异步提交，否则会阻塞整个事件循环。相比之下，Jetty 的设计更接近经典的半同步/半异步模式。它在一个线程中通过同步的 `accept()` 方法阻塞等待新连接，就绪后生成变更事件注册到多路分离器，同样采用轮询策略分配负载。其代码结构往往被认为更直观。作者最后提出了一个值得深思的问题：Netty 这种为“接收”单独设立线程池的方式，是否更利于处理短连接场景；而 Jetty 同步等待的传统模式，是否对长连接（如 HTTP）更友好？这背后的性能差异，还需要更精细的并发测试来验证。

本机暂存

IT 2013-09-23 23:06:25 / 累计浏览 4,401

Jetty线程“互锁”导致数据传输性能降低问题分析

这篇讲的是在Jetty 7.2.1这个特定版本中，一个会导致数据传输性能降低的“互锁”问题。作者从Jetty经典的NIO异步反映器模型入手，分析了主线程（selector）与子线程（工作线程）之间的一种微妙配合失误。问题的核心在于，当子线程遭遇网络拥塞、缓冲区写满时，它会进入阻塞状态并向主线程注册一个内部事件，等待拥塞解除的通知。然而，主线程的select循环在等待selector的网络事件时，可能并未及时轮询和处理这些内部事件，导致子线程无法被唤醒，形成“互锁”，拖累了整体性能。文章通过拆解具体的代码逻辑，清晰地展示了这种线程间交互的瓶颈点。最终，作者指出了相应的解决或规避思路，比如合理设置超时参数，以帮助开发者在类似场景下优化配置，避免性能陷阱。

本机暂存

IT 2013-09-23 13:46:24 / 累计浏览 3,542

文本与二进制方式打开文件的区别

这篇讲的是编程中一个容易被忽略却至关重要的细节：以文本方式和二进制方式打开文件究竟有何不同。文章首先点明，在Windows系统下，这种差异直接体现在对换行符的处理上——文本模式会默默进行“/n”与“/r/n”的相互转换，而二进制模式则原样读写。在Unix/Linux下，两者则没有区别。作者进一步深入到底层，解释了差异的根源：文本文件是基于字符编码（如ASCII），而二进制文件是基于值的自定义编码。这也决定了文本文件通常有更好的通用可读性（记事本就能打开），而二进制文件则更节省空间且灵活。文章通过一个生动的例子说明，用记事本打开一个二进制文件（比如包含数字1的二进制表示），会因为解码方式不匹配而显示乱码。而在C语言编程层面，核心区别也仅仅在于换行符的转换，当数据不包含换行符时，两种模式的读写结果其实是一样的。最后，通过展示数字“5678”在两种模式下截然不同的存储形式（ASCII码占四字节，二进制仅占两字节），直观地揭示了它们的空间效率差异。理解这点，能帮助开发者在处理配置文件、日志或跨平台数据交换时，做出更合适的选择。

本机暂存