AWS Elastic MapReduce和AWS Redshift有什么区别

宿务

我看到AWS Elastic MapReduce和AWS Redshift都使用集群结构,并且可以用于数据分析。他们有哪些不同的用例?

Amazon Redshift支持使用多种类型的应用程序的客户端连接,包括商业智能(BI),报告,数据和分析工具。

Amazon Elastic MapReduce(Amazon EMR)是一个托管集群平台,可简化在AWS上运行的大数据框架(如Apache Hadoop和Apache Spark)以处理和分析大量数据。

约翰·罗滕斯坦

您是正确的,Amazon EMR和Amazon Redshift都是可以扩展以提供更多计算能力的集群系统。但是,两种服务之间有一些非常明显的区别。

Amazon EMR提供Apache Hadoop和在Hadoop上运行的应用程序。这是一个非常灵活的系统,可以读取和处理非结构化数据,通常用于处理大数据。但是,学习Hadoop和相关技术可能非常困难。(“拥有权利的同时也被赋予了重大的责任!”)

Amazon Redshift是可通过SQL访问的PB级数据仓库。在查询之前,必须将数据加载到Redshift中,这通常需要进行一些转换(“ ETL”)。

那么选择哪一个呢?

  • 如果您想使用SQL并且具有结构化数据(例如CSV文件),那么Redshift是最简单的解决方案。
  • 如果您要处理非结构化数据(例如,以奇怪的格式而不是结构化的CSV文件),则Amazon EMR可以提供功能非常强大的Hadoop系统。
  • 有时人们会同时使用两者-使用Hadoop转换数据,然后使用Redshift来查询数据。

如果Amazon Redshift可以满足您的需求,请使用它而不是Hadoop。Redshift使用起来更简单,因为它将自己呈现为一个标准的SQL数据库,您可以在几分钟内使用它。所有集群的东西都是幕后花絮,您不必了解太多就可以使用它。

如果您需要更灵活的功能,并且不介意获得低级技术知识,那么Amazon EMR上的Hadoop将为您提供更多功能。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

AWS Autoscaling和AWS Opsworks有什么区别

AWS Elasticsearch和AWS CloudSearch有什么区别?

AWS lambda和AWS Lambda @ EDGE有什么区别?

AWS WAF和AWS GuardDuty有什么区别?

有什么区别:Django、Apache、AWS

AWS boto和boto3有什么区别

AWS ELB和Route53有什么区别?

AWS EBS 中的“卸载”和“分离”有什么区别?

AWS IAM组和组织单位有什么区别?

AWS CDK中的VPC和cfnVPC有什么区别?

AWS Amplify 中的 currentAuthenticatedUser() 和 currentUserPoolUser() 有什么区别?

aws:SourceAccount和aws:SourceOwner AWS SNS访问策略语句之间有什么区别

Amazon ec2和AWS Elastic Beanstalk之间的区别

CloudFormation :: APIGateway中的AWS和AWS_PROXY有什么区别?

AWS_DEFAULT_REGION和AWS_REGION系统变量之间有什么区别?

AWS ElastiCache群集和AWS ElastiCache复制组之间有什么区别?

aws-amplify-react和@ aws-amplify / ui-react有什么区别?

AWS Glue ETL Job和AWS EMR有什么区别?

具有AWS Elastic Block Storage的Kubernetes

AWS Elastic Beanstalk问题

AWS Elastic BeanStalk SignatureDoesNotMatch

AWS Elastic Beanstalk缓存?

AWS Lambda与Elastic Beanstalk

AWS Elastic MapReduce中的Python程序无法执行步骤

AWS EC2上的Amazon Linux和RedHat Enterprise Linux有什么区别?

Topic ARN和Target ARN AWS SNS有什么区别?

AWS Cognito:访问令牌和身份令牌之间有什么区别?

AWS S3中的对象和对象ACL有什么区别?

AWS中内部和外部负载均衡器之间有什么区别?