Category Archives: 大数据技术

format_datetime(current_date, 'YYYY-MM-dd'),
format_datetime(DATE_ADD('day', -1, current_date), 'YYYY-MM-dd')
format_datetime(DATE_ADD('day', -2, current_date), 'YYYY-MM-dd')
[......]

继续阅读

定制Hadoop的MapReduce任务的FileOutputFormat

Leave a reply

需求：Reduce输出特殊的格式结果
例如：如Reducer的结果，压到Guava的BloomFilter中
import com.google.common.hash.BloomFilter;
import com.google.common.hash.Funnels;
import org.apache.hadoop.fs.FSDataOutputStream;
import org.apache.hadoop.fs.FileSystem;
import org.apache.h[......]

继续阅读

四号程序员

Keep It Simple and Stupid

Category Archives: 大数据技术

Roaring Bitmaps 的基本原理

[转]深度对比 Delta、Iceberg 和 Hudi 三大开源数据湖方案

Flink双流join原理

Presto获取当天、昨天的格式化日期字符串

定制Hadoop的MapReduce任务的FileOutputFormat