我可以在Jupyter / IPython中使用Hadoop和MapReduce吗?是否有与Spark的PySpark类似的东西?
当然可以。Hadoop Streaming,mrjob和dumbo等许多框架仅举几例。subprocess.Popen()
根据框架的不同,在Jupyter中包括这些的技术方面应包括调用或典型的python导入。
可以在此cloudera博客文章中找到对其中一些框架的很好的概述/评论。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句