Amazon EC2不就是一台虚拟机么,它和本地一台服务器是一样的,你在本地怎么搭建Hadoop集群的,在EC2上就怎么搭建。如果你想采用S3替代HDFS,作为Hadoop的存储系统,这个也很容易啊,Hadoop本来就提供了使用S3作为存储的接口.
你是在说EMR吗?你是想知道EMR是如何实现的?架构是什么?