后端

共 1964 篇文章

IT 2016-05-15 23:55:49 / 累计浏览 4,440

缓存穿透、缓存并发、缓存失效之思路变迁

作者从缓存实战中最常遇到的三类“坑”出发，分别剖析了问题的成因与演进式的解决思路。缓存穿透源于无效请求击穿缓存层直击数据库，作者提出了用特殊值预占位的拦截技巧。缓存并发则针对高并发下缓存瞬间失效带来的数据库压力，给出了加锁串行化的方案。缓存失效问题本质是缓存集体过期导致的雪崩，通过引入随机因子分散过期时间是关键。文章后半部分通过问答，进一步探讨了缓存与数据库的一致性等更深层的实践困惑，整体展现了从发现问题、分析根因到提出并优化方案的完整思考过程。

本机暂存

IT 2016-05-15 23:51:54 / 累计浏览 5,545

低延时直播应用

这篇讲的是直播技术里一个很实际的问题：如何实现低延时？作者从RTMP和HLS这两种主流协议入手，直接点明了核心差异——HLS延时通常在10秒以上，而RTMP则能实现秒级甚至更低的延时。文章详细拆解了RTMP的“低延时”优势。在理想网络下，实测RTMP延时可以低至0.8秒左右，这对于互动直播、视频会议、监控等场景已经足够。但作者也坦诚地指出了RTMP的弱点，即基于TCP会导致“累积延迟”，在网络波动时缓冲区会像滚雪球一样增大。文中还深入探讨了一个关键技术点——GOP（关键帧间隔）缓存的影响：为了快速启动播放，服务器通常会缓存上一个GOP，这直接增加了延时；而通过调整编码器GOP长度或使用SRS关闭GOP缓存，则可以在这两者间进行权衡。更难得的是，文章没有停留在理论对比，而是提供了具体的延时测量方法（如使用手机秒表），并分析了影响延时的多个实际因素，比如服务器性能、客户端缓冲区设置（如flash的bufferTime设为10秒则延时至少10秒）、以及不同流媒体服务器实现（如Nginx-Rtmp）的差异。这些细节让结论非常扎实，对需要搭建或优化直播系统的工程师来说，是一份清晰的实践参考。

本机暂存

IT 2016-05-15 23:49:38 / 累计浏览 1,523

代理服务和过载保护

这篇讲的是如何在skynet框架中，通过前置代理服务来解决热点服务的过载问题。作者指出，服务过载是并发环境下最常见也最棘手的问题之一，而代理服务能在不增加功能服务复杂度的前提下，提供有效的保护。核心方案是为热点服务增加一个代理层。这个代理可以智能地调度请求：当检测到某服务请求过于频繁时，会优先处理其他请求以保证公平；同时能自动丢弃那些来自已退出服务的无效请求。更重要的是，它能感知后端功能服务的负载情况，当服务过忙时缓存新请求。这带来一个实际好处：线上排障时，通过调试控制台直接发送的控制指令能绕过拥堵的请求队列，得到更快的响应。文章不仅给出了概念，还深入了实现细节。作者展示了如何利用 `skynet.forward_type` 编写高效的代理服务，通过直接传递消息指针来避免不必要的内存拷贝。此外，还介绍了两种关键的运维能力：如何通过 `debug ping` 协议快速检测目标服务的响应延迟以判断是否过载，以及如何利用 `debug link` 指令来感知服务退出，从而清理无效请求。整套方案从架构设计到代码实现，为处理并发环境下的服务保护问题提供了清晰的思路。

本机暂存

IT 2016-05-05 22:56:44 / 累计浏览 3,585

Maven依赖机制简介

这篇讲的是Maven作为构建工具，其核心且强大的依赖管理机制。作者从依赖如何被自动传递和解析讲起，详细拆解了传递性依赖背后的关键规则：当出现版本冲突时，Maven遵循“短路径优先”，在路径长度一致时则看POM声明顺序（第一声明原则）。文章清晰地对比了六种不同的依赖范围（如compile、provided、runtime等），用表格明确了它们在编译、测试、运行时对classpath的影响以及如何相互传递，这是实际开发中配置依赖必须厘清的差异。此外，文中还介绍了通过在父POM中集中管理依赖版本与排除项的方法，这对于维护大型多模块项目、保持依赖一致性非常实用。整体而言，文章从基础概念到复杂场景，系统梳理了Maven处理依赖的逻辑，能帮助开发者更好地掌控项目构建。

本机暂存

IT 2016-05-05 22:55:23 / 累计浏览 1,581

过去六年在小米搞(wa)错(keng)的几个技术细节

这篇来自小米早期技术团队的复盘文章，诚实地回顾了在搭建米聊及后续服务时，因经验不足和快速迭代而埋下的六个关键技术“坑”。它并非聚焦单一故障，而是从架构选型和工程实践的层面，剖析了那些当时看似合理、事后却带来长期困扰的决策。文章逐一拆解了具体问题：比如早期使用 Nginx 代理 Java 服务时缺乏平滑发布机制，导致上线必然有损；监控体系只关注单个模块指标，无法有效定位跨模块交互的问题；以及在移动端网络环境下，选择 HTTP 协议框架在当时可能存在更优的 TCP 方案。在语言与存储选型上，作者反思了在缺乏深度专家的情况下选择 Java 带来的稳定性挑战，以及过度依赖 MySQL 为后期多机房容灾设下了障碍。最后，对 RabbitMQ 的泛滥使用提出了警示，指出了服务间调用关系不透明带来的运维灾难。作者的核心观点在于：一些技术细节上的“将就”，会在业务规模增长后演变为系统性的瓶颈。这些来自实战的教训——无论是关于发布流程、监控哲学、通信协议还是存储设计——都揭示了前瞻性架构思考与技术深度对于构建大规模、可持续系统的重要性。

本机暂存

IT 2016-05-05 22:54:10 / 累计浏览 3,321

java enum枚举类型用法小结

这篇讲的是Java枚举（enum）的核心特性与实用技巧。文章从枚举的本质出发，指出它实际上是一种特殊的final类，继承自`java.lang.Enum`，所有枚举值都是`public static final`的常量。作者通过示例代码，拆解了枚举的关键设计：其构造器必须私有，以确保外部无法实例化，这符合枚举作为常量集的初衷。接着，文章梳理了枚举类继承自Enum的常用方法，例如`ordinal()`用于获取声明顺序，`values()`能返回所有枚举值的数组，`valueOf()`则可根据字符串名称反向获取实例。除了基础API，文章还着重展示了枚举的几种实战用法：用作类型安全的常量定义、在switch语句中提升代码可读性，以及如何向枚举中添加自定义字段和方法，使其承载更丰富的信息。这些内容覆盖了从入门到进阶的常见场景，能帮助开发者理解枚举不仅仅是一组常量，更是一个功能完备、封装良好的类型。

本机暂存

IT 2016-05-05 22:43:15 / 累计浏览 1,646

记录一种工作流心跳机制的设计

这篇讲的是在基于Amazon SWF的工作流中，如何设计一个可靠的心跳机制来维持长时间任务的存活。作者从实际开发踩坑出发，分享了应对SWF 5分钟超时限制的解决方案。核心方案是采用两个双端队列（main queue和backup queue）来统一管理所有需要心跳的任务。每秒从主队列取出一个任务发送心跳，完成后放入备份队列；每两分钟（一个周期）再将备份队列的任务批量移回主队列，开始新一轮循环。这个设计巧妙地解决了并发下的任务状态跟踪问题，比单队列加计数器的方案更简单高效。文章深入探讨了几个关键设计考量：心跳频率并非越快越好，需要在及时性和避免服务端限流之间做权衡；周期长度（如120秒）的设置要能覆盖超时时间并提供重试余地。更重要的是，作者详细剖析了心跳失败时的分级处理策略：对于资源已取消等常规异常直接移除任务；对于限流错误立即重试；对于其他未知异常则放入当前周期队尾重试并计数，避免影响其他任务。最后，通过一个EMR集群因心跳超时和检查逻辑缺陷被误回收的实例，说明了在真实分布式环境中，看似简单的心跳机制与任务超时、资源监控等环节环环相扣，设计时需要全局考量，用绝对时间而非操作次数来判断状态才更可靠。

本机暂存

IT 2016-05-05 22:36:20 / 累计浏览 2,284

《Effective java》—–读书笔记

读完《Effective Java》后，作者结合自己的面试反思与年度学习计划，写下这篇笔记，摘录并梳理了书中多条核心原则。笔记从创建对象讲起，强调了静态工厂方法的优势、避免创建不必要对象以及如何通过私有构造器或枚举强化单例。接着，重点讨论了类与接口设计：最小化可访问性、为不可变性努力、优先使用组合而非继承、以及如何用接口定义类型和用骨架实现类弥补抽象类的不足。在方法层面，笔记总结了慎用重载和可变参数、返回零长度数组而非null等实用建议。通用编程部分则归纳了最小化局部变量作用域、优先使用for-each循环和基本类型等性能与可读性并重的技巧。最后，笔记也提到了异常处理的原则——异常应只用于异常情况。这些笔记摘录不仅保留了原著的精华论点，还结合了博主自己的理解，如通过WeakHashMap管理缓存、继承判断的“is-a”原则等，将“四大圣经”之一的实践智慧转化为开发者可直接参考的要点清单。

本机暂存

IT 2016-04-21 13:34:05 / 累计浏览 1,343

APP创业项目后端语言选择

这篇讲的是初创团队在后端语言选择上的务实考量。作者跳出了语言优劣的争论，专注于如何为资源有限的创业项目匹配合适的技术栈。文章从JAVA、PHP、Python三种主流选择切入，细致分析了它们的实战特点。JAVA生态完善、适合复杂项目，但编译调试流程对小团队可能偏重；PHP作为老牌选择，框架成熟且开发效率高，特别是Phalcon框架在保护源码和提升性能上给出了新思路；Python则凭借其灵活性和在全栈开发上的潜力，通过Django等框架也能胜任后端工作，并且对小型项目尤为友好。最终，作者给出了清晰的选型建议：如果项目规模较大、需要稳定扩展，PHP（推荐Laravel或Phalcon）是更稳妥的选择；若项目较小、追求快速迭代，Python（配合Django框架）则显得更为轻便灵活。整篇文章没有鼓吹任何一种语言，而是帮助团队根据自身业务规模与团队现状，做出最贴合实际的技术决策。

本机暂存

IT 2016-04-21 13:27:15 / 累计浏览 2,503

5分钟开始Maven

这篇指南旨在帮助Java开发者用最短的时间（标题承诺了5分钟）迈出Maven实践的第一步。文章没有泛泛而谈，而是手把手地演示了从安装、创建第一个项目、理解核心的pom.xml配置，到执行构建（mvn package）并看到输出“Hello World”的完整流程。它特别适合那些听说过Maven但还没动手的开发者，通过具体的命令行操作和清晰的目录结构展示，扫清了初始配置的障碍。文章还巧妙地利用构建一个简单项目的过程，引入了Maven生命周期（如验证、编译、打包）和插件这些核心概念，让读者在“做”中“学”。作者强调了首次运行时可能因下载依赖而耗时较长的现实情况，并指出了后续阶段（如install、deploy）的用途。最终，通过生成项目站点文档，展示了Maven不仅能管理构建，还能辅助生成统一文档的优势。整篇文章结构紧凑，从一个可运行的最小实例出发，为你后续探索更复杂的Maven特性打下了扎实的基础。

本机暂存

IT 2016-04-17 17:44:35 / 累计浏览 1,883

关于共享经济的杂谈

这篇探讨共享经济本质的文章，从一系列生动案例切入，厘清了真正的共享经济与打着“共享”旗号的传统租赁或资源再分配模式之间的区别。作者指出，核心在于是否**高效利用了个体的闲置资源**——无论是闲置的房子、空载的车辆，还是空闲的课时与厨房时间。文章没有止步于概念辨析。作者从产品市场的分析框架出发，从社会趋势（追求个性）、经济动力（个体崛起）和技术基础（移动互联网成熟）三个维度，论证了共享经济并非伪命题，而是有坚实土壤的未来趋势。其中关于“效率与个性”的辩证讨论尤为精彩：作者认为，效率会随平台网络效应的增强而自然提升，而**服务的非标准化与个性化**，才是共享经济区别于传统商业模式、决胜未来的关键。最后，文章以易到用车为例，探讨了平台运营的“道”：通过营造平等、尊重、宽容的社区氛围，建立一种全新的、有温度的商业文明。这为我们理解共享经济提供了一个超越单纯效率讨论的、更富人文关怀的视角。

本机暂存

IT 2016-04-05 14:57:08 / 累计浏览 2,644

谈谈Go语言的字符串设计

作者从一个实际的内存泄漏问题说起：在使用GoJieba库时，一段测试代码的内存持续增长。经过排查，发现问题出在调用C.CString后未手动释放内存——一个因思维惯性导致的“白痴”Bug。这个Bug的背后，是Go字符串与C字符串在内存模型上的根本差异。C语言以‘\0’作为字符串终结符，导致字符串无法直接复用父字符串的内存。而Go的字符串采用长度记录，设计上支持高效的子串内存共享。因此，当通过cgo的C.CString将Go字符串转换为C字符串时，必须分配全新的内存空间，这就要求开发者必须负责手动调用C.free进行释放，不能像使用C++的c_str()那样想当然地复用内存。文章最终回归文档，用cgo官方示例明确了这一“必须释放”的责任。这个小小的踩坑经历，提醒所有涉及跨语言内存管理的开发者：务必理解底层设计差异，严格遵守接口契约。

本机暂存

IT 2016-04-05 13:55:49 / 累计浏览 4,145

JVM内存结构

这篇讲的是JVM内存结构的核心组成与关键细节。文章清晰地梳理了Java虚拟机运行时所管理的五大内存区域：堆、方法区、PC寄存器、方法栈和本地方法栈。它不仅解释了每个区域的职责——比如堆用于存放对象实例并分代管理，方法区存储类信息与常量——还深入对比了它们在线程共享与私有、垃圾回收策略以及异常抛出方面的差异。文章特别指出了Java 8中方法区的重大变迁，即Metaspace替代了永久代，这是一个重要的版本演进知识点。同时，为每个区域都列出了常用的JVM调优参数（如-Xms, -Xmx, -Xss）和对应的OutOfMemoryError或StackOverflowError场景，使得理论立刻能与实践中的故障排查相结合。对于需要理解内存分配原理、或正面临OOM问题的开发者而言，这篇文章提供了一份结构化的全景图和实用的参数指南，能有效帮助建立起从代码到虚拟机内部运行的直观认知。

本机暂存

IT 2016-04-05 13:52:36 / 累计浏览 3,604

PHP返回内容过长时被nginx截断的解决办法

这篇讲的是作者升级博客环境后，发现后台编辑器界面莫名“消失”——页面内容被截断，功能完全无法使用。他没有急于胡乱配置，而是沉下心分析问题。排查过程一度很曲折，从复杂的网络抓包入手绕了远路，但最终从 nginx 的错误日志中找到了关键线索：一行 `Permission denied` 错误。原来，当 PHP 返回的响应内容过大时，nginx 会先将其缓存到本地临时文件中，但由于该临时目录（`/var/lib/nginx/tmp/fastcgi/`）的权限不正确，nginx 无法写入文件，从而导致连接中断、内容截断。解决方案其实很简单：将该目录的权限修改为 775。作者复盘时指出，这次本可快速解决的问题耗费了大量时间，核心教训是：面对异常，应当优先检查系统日志、基于线索推理，而非凭借假设盲目测试。一次具体的踩坑经历，清晰地揭示了 PHP 与 nginx 协作时一个容易被忽略的权限配置细节。

本机暂存

IT 2016-04-05 13:47:42 / 累计浏览 2,624

Nginx配置$request_uri与$uri变量的区别

这篇讲的是在Nginx配置中两个极易混淆的变量：$request_uri 与 $uri 的核心区别。文章从一个实际现象出发：浏览器请求同一个地址，这两个变量的值却可能不同。关键差异在于它们代表的“时间点”。$request_uri 记录的是客户端发起请求时最原始的路径与查询字符串，比如 /my/act?a=1，是“未处理”的状态。而 $uri 则是Nginx处理请求后，最终定位到服务器上资源的路径，比如经过rewrite规则变成 /dir/file.php，它不包含查询参数。文章特别指出，$request_uri 这个名字本身容易造成误解，因为按标准定义，URI并不包含查询字符串，但它却包含了。理解这个区别至关重要：当你需要记录或匹配客户端最初的原始请求时，应使用 $request_uri；而当你需要基于经过内部重写后的实际资源位置进行逻辑判断或记录日志时，则应使用 $uri。搞混两者可能导致rewrite规则失效或日志记录不准确。

本机暂存

IT 2016-04-02 22:59:49 / 累计浏览 1,863

使用 Elasticsearch 实现博客站内搜索

作者从使用 Bing 的 `site:` 搜索作为博客站内搜索方案所遇到的索引更新延迟问题出发，转而决定自建搜索服务。这篇实操记录详细介绍了如何使用 Elasticsearch 这一分布式搜索引擎来实现这一目标。文章首先指导读者在 Ubuntu 环境下手动安装 Elasticsearch，随后重点讲解了配置的关键步骤：安装并编译 IK Analysis 插件以支持智能的中文分词（提供了 `ik_max_word` 与 `ik_smart` 两种粒度选项），以及通过修改配置文件添加同义词过滤器，让搜索能识别“js”和“javascript”这类等价术语。在基础服务搭建完毕后，作者进一步展示了如何通过 Node.js 客户端将 Elasticsearch 无缝集成到现有的博客系统中。最终实现的搜索不仅支持中文分词与同义词，还通过定制查询策略达成了“标题匹配优先”和“近期文章优先”的优化效果，为读者提供了一个从部署到应用的全链路参考。

本机暂存

IT 2016-04-02 14:17:30 / 累计浏览 2,463

Java -- Hotspot虚拟机调优与GC垃圾回收策略

这篇讲的是Java HotSpot虚拟机如何进行性能调优，核心是理解并优化其垃圾回收（GC）机制。作者从Java与C/C++的常见争论切入，指出Java在动态优化方面的特性，引出对JVM和GC进行研究的必要性。文章首先详细图解了JVM的堆内存分区：Eden、Survivor、老年代和持久代，解释了各区域的用途。接着，重点剖析了GC的核心流程与算法，从经典的引用计数法和Java实际采用的根搜索法说起，对比分析了标记-清除、复制（用于新生代）、标记-整理（用于老年代）等回收算法的原理与优缺点，特别阐述了它们如何协同工作以平衡效率与内存碎片问题。最后，文章落脚于实践，列举了如-XX:-DisableExplicitGC、-XX:+UseConcMarkSweepGC等一系列关键的JVM启动参数，并结合Full GC与Young GC的特点，提供了具体的调优方向与性能优化Tips，帮助开发者从理论到实践全面掌握GC调优。

本机暂存

IT 2016-04-02 14:12:38 / 累计浏览 1,502

Python UnicodeEncodeError问题的分析和思考

这篇讲的是作者在用Python爬取网络数据时频繁遇到的一个棘手问题：程序会因 `UnicodeEncodeError` 意外中断，报错指向一个无法编码的特殊字符 “·”（Unicode码点 u+2022）。问题的直接诱因是远程文件包含了本地编码无法表示的字符。文章没有止步于解决问题，而是深入Python的“内核”，系统梳理了编码处理的全流程。作者解释了Python 2中字符串对象（str与unicode）的本质区别，以及它们如何受源文件编码和系统控制台编码（如Windows下的GBK）的影响。通过 `encode` 和 `decode` 的示例，厘清了编码转换的基本逻辑。最关键的部分在于对输出环节的剖析。文章指出，`print` 语句会调用 `sys.stdout` 这个 `TextIOWrapper` 对象，它默认使用终端编码（如GBK）对unicode字符串进行 `encode`。当字符（如 u+2022）不在目标编码的码表中时，异常便产生了，这也解释了为何同样的代码在GBK终端的Windows上报错，而在通常使用UTF-8的Linux上却能正常运行。文章从IO层和编码映射原理上，把这个常见错误的来龙去脉讲得非常透彻。

本机暂存

IT 2016-04-02 13:46:04 / 累计浏览 1,063

专注和游离

作者在文中探讨了一个普遍困扰：为何总渴望“21天精通”，却常在该专注时沉迷碎片信息，在该放松时又陷入焦虑。他直指那种“快速提升”的幻想往往是骗局，真正的成长是持续、渐进的“日拱一卒”。但作者也承认，在诱惑泛滥的时代，坚持“日拱一卒”极难。他分享了自己摸索出的方法：将晚上时间刻意切分为“专注”与“游离”两块。专注时段屏蔽一切干扰，全力用于写作、编程或深度学习；游离时段则坦然刷圈、看剧、泛读，用于放松和拓宽视野。这种有节奏的交替，让他能在效率和广度上逐步积累优势。文章最终落脚于一个朴素的信念：对于大多数普通人，接纳成长的缓慢节奏，找到适合自己的专注与游离的平衡点，坚持下去，就是通往“大器晚成”的路径。文末引用的“十年学会程序设计”七条建议，如重实践、多交流、学多门语言，也为这条长期主义的道路提供了具体的路标。

本机暂存

IT 2016-04-02 13:15:20 / 累计浏览 804

从启用 HTTP/2 导致网站无法访问说起

这篇讲的是网站升级到 HTTP/2 后反而无法访问的典型案例。作者从朋友遇到的具体故障出发——启用 HTTP/2 后 Chrome 报「ERR_SPDY_INADEQUATE_TRANSPORT_SECURITY」错误，Firefox 直接中断请求，而关闭 HTTP/2 则一切正常。问题的根源在于 HTTP/2 协议对 TLS 有更严格的安全限制。它强制要求使用 TLSv1.2 或更高版本，并禁用了一大批在旧协议中可用的加密套件（CipherSuite）。当服务端配置的 CipherSuite 列表被包含在 HTTP/2 的黑名单中时，浏览器在 TLS 握手阶段就会直接终止连接，导致页面无法加载。文章通过 Wireshark 抓包和具体的 Nginx 配置示例，清晰地展示了这一协商失败的过程。对于遇到类似问题的开发者，这篇不仅提供了调整 CipherSuite 配置的直接解法，更重要的是梳理了从现象到本质的排查思路，值得参考。

本机暂存