大多数情况下, 在使用了S3作为主要的存储服务后,我们在创建EMR集群时通常是不会再添加EBS卷的,但是作为一些用用的参考,我们还是记录一下这方面的情况,以备后查。首先,整个EMR集群,添加的卷会分别挂载到/mnt, /mnt1, /mnt2, …目录上,在配置HDFS的本地映射目录时,我们需要将所有挂载的目录配置上去,以便HDFS能利用到所有的磁盘空间。以下是/etc/hadoop/conf/hdfs-site.xml
中的一份配置示例:
<property><name>dfs.datanode.data.dir</name><value></