Paper Notes
benchmarks
1. tpch-chokepoints
2. ssb
bigdata
compiler
databases
datalayout
data structures
distributed system
filesystem
1. gfs
2. polarfs
llm
storage

论文阅读笔记

bigdata

MapReduce: Simplified Data Processing on Large Clusters
Nephele: Efficient Parallel Data Processing in the Cloud
The Dataflow Model
Apache Flink: Stream and Batch Processing in a Single Engine
State Management in Apache Flink