一、一个广为传播的经典故事
话说NYT有一大票1851-1922年间扫描的1100万份文章,要从TIFF图档格式转换为PDF,由于数量实在太庞大,转换起来不但耗时甚久,也需要极大数量的机器。最后NYT的工程师将所有文档传到S3放着,然后到EC2开了100个Instance,再装个Hadoop利用这100台电脑跑分布运算,结果是只花了24小时和大约3000美金就搞定(由于处理速度实在太快,他们实际上还跑了两次)。
如果按传统的方式,自己来处理分布式问题,那么广软件开发费用的增加都远远不止3000美元,更不用讲硬件的问题。这一堆硬件不买不行,买了以后呢好像就用了那么一回,也不是个事啊。这里就显出Hadoop+EC2的威力来了,这个也被称作是云计算。
二、AWS介绍
EC2是整个亚马逊Web Service的冰山一角,整个AmazonWeb Service(简称AWS)的体系如下图所示:
后续见 https://blog.csdn.net/yangss123/article/details/70174933