文章目录
0x00 文章内容说明:本文章在MapReduce编程例子之Combiner与Partitioner 的Combiner例子基础上执行。
0x01 未修改前情况1. 当前文件情况
[hadoop-sny@master jar]$ hadoop fs -ls /files/
Found 4 items
-rw-r--r-- 1 hadoop-sny supergroup 39 2019-04-18 21:20 /files/put.txt
-rw-r--r-- 1 hadoop-sny supergroup 50 2019-12-30 17:12 /files/small1.txt
-rw-r--r-- 1 hadoop-sny supergroup 31 2019-12-30 17:10 /files/small2.txt
-rw-r--r-- 1 hadoop-sny supergroup 49 2019-12-30 17:11 /files/small3.txt
2. 执行未修改前作业
a. 执行命令如下:
hadoop jar hadoop-learning-1.0.jar com.shaonaiyi.hadoop.CombinerWC /files/* /output/comwc/
3. 查看结果
a. 可在YARN的Web UI界面上看到有4个Map Task
1. 修改代码
//合并小文件CombineTextInputFormat
job.setInputFormatClass(CombineTextInputFormat.class);
2. 执行修改后作业
a. 执行命令如下(与前面一样):
hadoop jar hadoop-learning-1.0.jar com.shaonaiyi.hadoop.CombinerWC /files/* /output/comwc/
3. 查看结果
a. 可在YARN的Web UI界面上看到只有1个Map Task
作者简介:邵奈一
全栈工程师、市场洞察者、专栏编辑
| 公众号 | 微信 | 微博 | CSDN | 简书 |
福利:
邵奈一的技术博客导航
邵奈一 原创不易,如转载请标明出处。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。