Hadoop 造数

仙童 测试交流1 136字数 855阅读模式

大数据测试需要准备的测试数据跟普通数据测试主要区别是数据量的大小,靠手工写 1G、10G、100G 等体量的数据的难度很大,所以大家都想到用脚本来写一个造数的工具,本文主要介绍基于 hadoop 自带的造数工具来实现自己造数的需求。
造数的核心代码是 map 阶段:

```java demo
public static class SortDemoMapper extends Mapper {
private Text key = new Text();
private Text value = new Text();文章源自玩技e族-https://www.playezu.com/183748.html

public SortDemoMapper() {
}文章源自玩技e族-https://www.playezu.com/183748.html

public void map(LongWritable row, NullWritable ignored, Mapper.Context context) throws IOException, InterruptedException {文章源自玩技e族-https://www.playezu.com/183748.html

this.key.set("name:");//数据可以改成自己需要的格式
this.value.set("wangyi,age:15,sex:1rn");//数据可以改成自己需要的格式,输出结果可以是 Text,Text,还可以改成 Text,NullWritable 等其他格式,
context.write(this.key, this.value);文章源自玩技e族-https://www.playezu.com/183748.html

}
}文章源自玩技e族-https://www.playezu.com/183748.html

对应的文件的输入也需要进行变化,当然也可以直接使用GenSort自带的InputFormatClass、OutputFormatClass,在图1电脑配置情况下本地运行造数工具,造数 64,424,509,448 字节,运行时间23分钟左右如图2,打成jar包在hadoop集群上的运行时间后期再补充 。
![](/uploads/photo/2022/cdfb512c-c88a-4181-be7a-5782ff11dfe5.png!large)
![](/uploads/photo/2022/9b8a2be2-7a20-440b-9807-1ed0f1123938.png!large)
整体代码上传git再同步

软件功能测试文档文章源自玩技e族-https://www.playezu.com/183748.html 文章源自玩技e族-https://www.playezu.com/183748.html

玩技站长微信
添加好友自动发送入群邀请
weinxin
rainbow-shownow
玩技官方公众号
官方微信公众号
weinxin
PLAYEZU
 
  • 版权提示:本站仅供存储任何法律责任由作者承担▷诈骗举报◁▷新闻不符◁▷我要投稿◁
    风险通知:非原创文章均为网络投稿真实性无法判断,侵权联系2523030730
    免责声明:内容来自用户上传发布或新闻客户端自媒体,切勿!切勿!切勿!添加联系方式以免受骗。
  • 原创转载:https://www.playezu.com/183748.html
    转载说明: 点我前往阅读>>>
    • 王一
      王一 9

      设备信息如图 1,造数时间如图 2

    匿名

    发表评论

    匿名网友
    确定