您好,欢迎访问一九零五行业门户网

hive优化之自动合并输出的小文件

1.先在hive-site.xml中设置小文件的标准.
<property>  <name>hive.merge.smallfiles.avgsize</name>  <value>536870912</value>  <description>when the average output file size of a job is less than this number, hive will start an additional map-reduce job to merge the output files into bigger files.  this is only done for map-only jobs if hive.merge.mapfiles is true, and for map-reduce jobs if hive.merge.mapredfiles is true.</description></property>
2.为只有map的mapreduce的输出并合并小文件.
<property>  <name>hive.merge.mapfiles</name>  <value>true</value>  <description>merge small files at the end of a map-only job</description></property>
3.为含有reduce的mapreduce的输出并合并小文件.
<property>  <name>hive.merge.mapredfiles</name>  <value>true</value>  <description>merge small files at the end of a map-reduce job</description></property>
更多相关教程请访问 mysql视频教程
其它类似信息

推荐信息