如何从BufferedReader中S3中读取文件？

116

sbhatla：

我有一个非常大的文件（几个GB）的AWS S3，而我只需要少量的文件中的线，满足一定条件的。我不希望加载在内存中的整个文件，然后搜索和打印这些几行字 - 此内存负载会太高。以正确的方式将只加载所需要的内存中的那些行。

fullObject = s3Client.getObject(new GetObjectRequest(bucketName, key));
 displayTextInputStream(fullObject.getObjectContent());

private static void displayTextInputStream(InputStream input) throws IOException {
    // Read the text input stream one line at a time and display each line.
    BufferedReader reader = new BufferedReader(new InputStreamReader(input));
    String line = null;
    while ((line = reader.readLine()) != null) {
        System.out.println(line);
    }
    System.out.println();
}

在这里，我们使用的是BufferedReader中。这是我不清楚发生了什么下面在这里。

难道我们做每一次，我们正在阅读一个新行，且只保留当前行缓冲区中的网络呼叫S3？抑或是整个文件在内存中加载，然后通过读取的BufferedReader行由行？或者是介于两者之间？

洛萨：

其中一个问题的答案，你链接的文档中已经给出：

您的网络连接保持打开状态，直到你读所有的数据或关闭输入流。

一个BufferedReader不知道它会读取数据是从，因为你传递的另一个未来Reader吧。甲BufferedReader创建特定大小的缓冲液（例如4096个字符），并通过从底层填充读取该缓冲器Reader开始发放的呼叫数据之前read()或read(char[] buf)。

在Reader您传递到BufferedReader是-顺便说一句-用另一个缓冲区为自己做从转换byte基于流为char基础的读者。它的工作方式与相同BufferedReader，因此内部缓冲区由从通过读取填充InputStream它是InputStream由您的S3-客户端返回。

如果你从流尝试加载数据这个客户端中到底会发生依赖于实现。一种方法是保持一个开放的网络连接，你可以从它如你所愿或数据块已经被读取，当你试图让下一个新打开后的网络连接可以关闭阅读。

上面引述的文件似乎是说，我们已经得到了前一种情况在这里，所以：没有，电话readLine都没有导致单一的网络电话。

并回答您的其他问题：没有，一BufferedReader中，InputStreamReader最有可能的InputStream由S3客户端返回的不是整个文件到内存中加载。这将违背首先使用流和S3客户可以简单地返回的整个目的byte[][]，而不是（来左右的2 ^ 32个字节每极限byte-阵列）

编辑：有最后一段的一个例外。如果整个千兆字节大文件没有换行符，要求readLine实际上将导致读取整个数据到内存（最有可能的OutOfMemoryError错误）。我认为一个“正规”的文本文档，同时回答你的问题。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-03-11

我来说两句

0 条评论

登录后参与评论

TOP 榜单

文章

如何从BufferedReader中S3中读取文件？

如何从BufferedReader中S3中读取文件？

IE 11中的FormData未定义

如何一次从多个文本框中获取值？

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

OpenCv：改变 putText() 的位置

Redux动作正常，但减速器无效

如何从JavaScript中的MP3文件读取元数据属性？

如何使用Redux-Toolkit重置Redux Store

将加号/减号添加到jQuery菜单

OpenGL纹理格式的颜色错误

获取并汇总所有关联的数据

超过时间限制错误C ++

ActiveModelSerializer仅显示关联的ID

在交互式Python Shell中获得最后结果

如何开始为Ubuntu开发

去噪自动编码器和常规自动编码器有什么区别？

Excel 2016图表将增长与4个参数进行比较

算术中的c ++常量类型转换

使用因子时如何在y轴上的ggplot中插入count或％

TreeMap中的自定义排序

如何在R中转置数据

在 React Native Expo 中使用 react-redux 更改另一个键的值