本地文件系统上的Hadoop

学习者

我在伪分布式上运行Hadoop。我想通过抽象HDFS为我的工作从本地文件系统读取和写入。我正在使用file:///参数。我点击了此链接。

这是的文件内容core-site.xml，

<configuration>
 <property>
  <name>hadoop.tmp.dir</name>
  <value> /home/abimanyu/temp</value>   
 </property>

 <property>
  <name>fs.default.name</name>
  <value>hdfs://localhost:54310</value>
 </property>

</configuration>

这是的文件内容mapred-site.xml，

<configuration>

 <property>
  <name>mapred.job.tracker</name>
  <value>localhost:54311</value>
 </property>

 <property>
    <name>fs.default.name</name>
    <value>file:///</value>
 </property>

 <property>
    <name>mapred.tasktracker.map.tasks.maximum</name>
    <value>1</value>
 </property>

 <property>
    <name>mapred.tasktracker.reduce.tasks.maximum</name>
    <value>1</value>
 </property>

</configuration>

这是的文件内容hdfs-site.xml，

<configuration>

 <property>
  <name>dfs.replication</name>
  <value>1</value>
 </property>
</configuration>

这是我尝试启动恶魔时遇到的错误（使用start-dfs或start-all），

localhost: Exception in thread "main" java.lang.IllegalArgumentException: Does not contain a valid host:port authority: file:///
localhost:      at org.apache.hadoop.net.NetUtils.createSocketAddr(NetUtils.java:164)
localhost:      at org.apache.hadoop.hdfs.server.namenode.NameNode.getAddress(NameNode.java:212)
localhost:      at org.apache.hadoop.hdfs.server.namenode.NameNode.getAddress(NameNode.java:244)
localhost:      at org.apache.hadoop.hdfs.server.namenode.NameNode.getServiceAddress(NameNode.java:236)
localhost:      at org.apache.hadoop.hdfs.server.namenode.SecondaryNameNode.initialize(SecondaryNameNode.java:194)
localhost:      at org.apache.hadoop.hdfs.server.namenode.SecondaryNameNode.<init>(SecondaryNameNode.java:150)
localhost:      at org.apache.hadoop.hdfs.server.namenode.SecondaryNameNode.main(SecondaryNameNode.java:676)

对我来说奇怪的是，从本地文件系统读取的内容在中完全可以正常运行，hadoop-0.20.2而在中则不能hadoop-1.2.1。从最初的发行版到更高的版本有什么变化吗？让我知道如何从Hadoop JAR的本地文件系统读取。

克里斯·怀特

您可以从mapred-site.xml文件中删除fs.default.name值-该值仅应位于core-site.xml文件中。

如果要在本地文件系统上以伪模式运行，通常可以通过以所谓的本地模式运行来实现-通过将core-site.xml中的fs.default.name值设置为file：///（您目前已将其配置为hdfs：// localhost：54310）。

您看到的堆栈跟踪是辅助名称节点正在启动时-在“本地模式”下运行时不需要此操作，因为没有fsimage或2NN可以使用的编辑文件。

修复您的core-site.xml和mapred-site.xml。停止所有hadoop守护程序，然后仅启动map-reduce守护程序（Job Tracker和Task Tracker）。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-03-12

我来说两句

0 条评论

登录后参与评论

上一篇：Visual Studio 2008和Xcode中的浮点精度

TOP 榜单

文章

本地文件系统上的Hadoop

本地文件系统上的Hadoop

Android Studio Kotlin：提取为常量

IE 11中的FormData未定义

计算数据帧R中的字符串频率

如何在R中转置数据

如何使用Redux-Toolkit重置Redux Store

Excel 2016图表将增长与4个参数进行比较

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

未捕获的SyntaxError：带有Ajax帖子的意外令牌u

OpenCv：改变 putText() 的位置

ActiveModelSerializer仅显示关联的ID

算术中的c ++常量类型转换

如何开始为Ubuntu开发

将加号/减号添加到jQuery菜单

去噪自动编码器和常规自动编码器有什么区别？

获取并汇总所有关联的数据

OpenGL纹理格式的颜色错误

在 React Native Expo 中使用 react-redux 更改另一个键的值

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

TreeMap中的自定义排序

Redux动作正常，但减速器无效

如何对treeView的子节点进行排序