大数据实验五 MapReduce初级编程实践

1实验目的 1.通过实验掌握基本的MapReduce编程方法; 2.掌握用MapReduce解决一些常见的数据处理问题,包括数据去重、数据排序和数据挖掘等。 2实验平台 已经配置完成的Hadoop伪分布式环境。 (1)操作系统:Linux(Ubuntu18.04) (2)Hadoop版本:3.1.3 3实验内容和要求 1.编程实现文件合并和去重操作

编写程序实现对输入文件的排序

对给定的表格进行信息挖掘

推荐阅读

评论可见,请评论后查看内容,谢谢!!!
 您阅读本篇文章共花了: