将HTML写入txt文件时出现编码错误

用户名

我正在下载html网页的源代码,并将其写回到txt文件。终端上的输出看起来正确,但是在写入文件并使用gedit读取文件内容时,内容看起来像这样:

<^ @!^ @ D ^ @ O ^ @ C ^ @ T ^ @ Y ^ @ P ^ @ E ^ @ ^ @ h ^ @ t ^ @ m ^ @ l ^ @ ^ @ P ^ @ U ^ @ B ^ @ L ^ @ I ^ @ C ^ @ ^ @“ ^ @-^ @ / ^ @ / ^ @ W ^ @ 3 ^ @ C ^ @ / ^ @ / ^ @ D ^ @ T ^ @ D ^ @ ^ @ X ^ @ H ^ @ T ^ @ M ^ @ L ^ @ ^ @ 1 ^ @。^ @ 0 ^ @ ^ @ T ^ @ r ^ @ a ^ @ n ^ @ s ^ @ i ^ @ t ^ @ i ^ @ o ^ @ n ^ @ a ^ @ l ^

我正在使用BufferedReader逐行读取文件,如下所示:

URL oracle = new URL("http://example.com");
BufferedReader in = new BufferedReader(
                    new InputStreamReader(oracle.openStream()));

while ((inputLine = in.readLine()) != null)
    {
        // appending to get the complete html string 
    }

然后,我使用PrintWriter编写内容。

PrintWriter pout = new PrintWriter("output.txt");
pout.write(html); // here html is the appended html string
pout.close();

有人可以帮我弄这个吗。

普拉巴

在读取URL时,您需要将编码设置为UTF-8,而在回写时,应再次提及您的编码是UTF-8。默认编码可能是系统的编码,可能无法很好地处理unicode字符。无论是InputStreamOutputstream支持编码作为参数。因此,您可能希望将其替换PrintWriterOutputStream

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

将数据写入csv文件时出现编码错误

将熊猫df写入CSV时出现Unicode编码错误

将Pandas DataFrame写入XLSX文件时出现权限错误

写入文件时出现Python unicode错误

写入文件时出现C分段错误

将列表写入txt文件时被缩短

使用python将列表写入.txt文件时,出现'\n'(反斜杠n)?

将JSON文件导入HTML文档时出现冒号错误

在Java中写入.txt文件时出现问题

将Python Pandas数据框写入CSV文件时出现Unicode错误

将JSON数据写入JSON文件时出现JSON.parse错误

将 Geodataframe 写入 geopandas 中的文件时出现“不受支持的驱动程序”错误

将扫描线写入文件 C++ 时出现 libjpeg-turbo 分段错误

将“ <”或“>”写入.txt文件

Python写入HTML时如何解决编码错误

将新项目写入 Firebase 时出现错误状态错误

尝试将txt文件插入MySql时出现MySql错误1054

将.txt转换为.sql文件后编码错误

尝试从Django应用打开json文件时出现编码错误

写入GML文件时出现NetworkX密钥错误

读取和写入 csv 文件时出现 Python pandas 错误

错误:使用Node.js写入文件时出现EACCES

尝试写入 json 文件时出现 Fs.writeFile 错误

快速写入 JSON 文件时出现意外错误

将数据帧写入 HDFS 时出现 NumberFormatException 错误

将俄语符号写入CSV时出现Unicode错误

将数据框写入 excel 时出现错误消息

将数据写入动态数组时出现分段错误

将HTTP响应正文写入文件后,出现EOF错误