本页面展示了文档结构中的所有文件,包括已完成和待完成的文章。

列表项中的链接表示已存在的文件,无链接的项目表示尚未创建的文件。

核心概念库

通用模式库

通用案例库

Spark

  • 1.1 Flink知识体系概览
  • 1.2 流处理架构设计
  • 1.3 状态管理架构设计
  • 1.4 资源管理与调度系统
  • 1.5 时间与窗口处理系统
  • 2.1.1 StreamGraph构建实现
  • 2.1.2 JobGraph生成与优化
  • 2.1.3 执行图与任务部署
  • 2.1.4 检查点与快照实现
  • 2.1.5 状态后端与容错
  • 2.2.1 资源管理与调度
  • 2.2.2 任务执行与内存管理
  • 2.2.3 窗口处理系统实现
  • 2.2.4 Table与SQL引擎实现
  • 2.3.1 事件处理机制实现
  • 2.3.2 异步IO实现机制
  • 2.3.3 Savepoint机制实现
  • 2.3.4 CEP实现原理
  • 3.1.1 性能分析方法论
  • 3.1.2 状态后端优化技术
  • 3.1.3 反压处理与流控制
  • 3.1.4 资源配置优化
  • 3.1.5 查询与窗口优化
  • 3.2.1 大规模流处理案例
  • 3.2.2 低延迟实时计算案例
  • 3.2.3 微服务集成最佳实践
  • 3.2.4 故障处理与异常应对
  • 4.1.1 流处理架构设计题
  • 4.1.2 状态管理系统设计题
  • 4.1.3 事件时间处理系统
  • 4.1.4 端到端精确一次保障
  • 4.2.1 TaskManager执行机制
  • 4.2.2 分布式快照算法
  • 4.2.3 窗口计算与触发机制
  • 4.2.4 反压机制实现分析
  • 4.3.1 性能调优策略题
  • 4.3.2 状态膨胀问题排查
  • 4.3.3 作业失败恢复案例
  • 4.3.4 检查点性能优化

Kafka

  • 1.1 Kafka知识体系概览
  • 1.2 消息存储设计原理
  • 1.3 分区与复制架构
  • 1.4 集群控制与协调
  • 1.5 客户端协议与交互
  • 2.1.1 日志系统实现
  • 2.1.2 消息格式与序列化
  • 2.1.3 磁盘IO优化实现
  • 2.1.4 存储层性能优化
  • 2.1.5 消息编解码实现
  • 2.2.1 Controller实现机制
  • 2.2.2 副本管理机制实现
  • 2.2.3 分区管理与分配
  • 2.2.4 事务协调器实现
  • 2.3.1 网络层实现原理
  • 2.3.2 客户端会话管理
  • 2.3.3 Producer实现原理
  • 2.3.4 Consumer实现原理
  • 2.3.5 协议交互流程实现
  • 3.1.1 性能分析方法论
  • 3.1.2 IO与网络优化
  • 3.1.3 生产者性能优化
  • 3.1.4 消费者性能优化
  • 3.1.5 集群配置优化
  • 3.2.1 大规模集群运维
  • 3.2.2 实时数据管道设计
  • 3.2.3 微服务通信架构
  • 3.2.4 故障诊断与恢复
  • 4.1.1 消息系统设计题
  • 4.1.2 数据复制系统设计题
  • 4.1.3 事务消息系统设计题
  • 4.1.4 流处理引擎设计题
  • 4.2.1 Controller实现原理
  • 4.2.2 副本同步机制源码
  • 4.2.3 存储引擎实现分析
  • 4.2.4 位移管理实现原理
  • 4.3.1 性能调优案例题
  • 4.3.2 数据丢失问题排查
  • 4.3.3 集群稳定性问题
  • 4.3.4 规模扩展性问题

Iceberg

  • 1.1 Iceberg知识体系概览
  • 1.2 元数据模型与演进设计
  • 1.3 快照与时间旅行
  • 1.4 数据组织与存储设计
  • 2.1.1 表元数据实现
  • 2.1.2 快照实现机制
  • 2.1.3 目录服务实现
  • 2.1.4 统计信息管理
  • 2.2.1 读取路径实现
  • 2.2.2 写入路径实现
  • 2.2.3 增量变更处理
  • 2.2.4 维护操作实现
  • 2.2.5 事务与并发控制