CSV Java文件读取和保存（在不同的ArrayList中）

切萨雷·尤拉罗（Cesare Iurlaro）

好的队友，这是我的代码。我有一个问题，因为“ records.csv”是一个包含多达2000万行的文件，每个行由4个字段组成，并以'，'分隔。

正如您从代码中可以理解的那样，我想拥有4个Arraylist，每个数组具有不同字段的所有值。片刻之后的方法停止工作（我认为是因为要将元素“添加”到列表中，所以Java具有一个指针，该指针必须先执行所有arraylist的操作）。

我需要解决，但我不知道如何。

有什么建议吗？

import java.io.BufferedReader;
import java.io.FileReader;
import java.io.IOException;
import java.util.ArrayList;

    public class RecordReader {
    static ArrayList<String> id = new ArrayList <String> ();
    static ArrayList<String> field1 = new ArrayList <String> ();
    static ArrayList<String> field2 = new ArrayList <String> ();
    static ArrayList<String> field3 = new ArrayList <String> ();



    public static void Reader () {
        try {
        FileReader filein = new FileReader("Y:/datasets/records.csv");
        String token="";
        String flag = "id";
        int index=0, next;

        do {
            next = filein.read();

            if (next != -1) {

                if (next !=',' && next !='\n') 
                    token = token + next;

                else if (next == ','){
                    if (flag.compareTo("id")==0) {id.add (index, token); flag = "field1";}
                    else if (flag.compareTo("field1")==0) {field1.add (index, token); token=""; flag = "field2";}
                    else if (flag.compareTo("field2")==0) {field2.add (index, token); token=""; flag = "field3";}
                }

                else if (next == '\n') { 
                    if (flag.compareTo("field3")==0) {field3.add (index, token); token=""; flag = "id"; index++;} 
                }

                char nextc = (char) next; 
                System.out.print(nextc); 
                }
        } while (next!=-1);

        filein.close();
        }
        catch (IOException e) { System.out.println ("ERRORE, birichino!"); }
    }
}

我必须一次完成所有操作，该文件为711000字节。

Exception in thread "main" java.lang.OutOfMemoryError: Java heap space at java.nio.CharBuffer.wrap(Unknown Source) at sun.nio.cs.StreamEncoder.implWrite(Unknown Source) at sun.nio.cs.StreamEncoder.write(Unknown Source) at java.io.OutputStreamWriter.write(Unknown Source) at java.io.BufferedWriter.flushBuffer(Unknown Source) at java.io.PrintStream.write(Unknown Source) at java.io.PrintStream.print(Unknown Source) at RecordReader.Reader(RecordReader.java:42) at prova.main(prova.java:26)

导航系统

我有两个建议给您。

首先，您不需要单独使用4个ArrayLists，只需一个就可以。而不是使用filein.read()，我将FileReader用a包裹您，BufferedReader并使用它逐行读取文件，并将每一行添加到一个文件中ArrayList。

BufferedReader br = new BufferedReader(filein);
ArrayList<String> content = new ArrayList<String>();
String line = br.readLine();
while(line != null){
    //add lines to ArrayList
    content.add(line);
    line = br.readLine();
}

这将把整个文件的内容读入内存，而不会产生3 extra的额外开销ArrayLists。

其次，由于您的字段由,和分隔（我假设）始终具有相同数量的字段，因此可以使用split（）方法将每一行分成字符串数组。

String[] record = content.get(index).split(",");
//record[0] = id
//record[1] = field1
//record[2] = field2
//record[3] = field3

将以上内容放入循环中，即可遍历文件的所有内容。由于您知道信息的排序方式，因此检索所需信息很简单。

但是，我会警告您，如果文件足够大（具有多个GB的数据），此方法最终也会失败。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-04-14

我来说两句

0 条评论

登录后参与评论

上一篇：编写Haskell函数以计算函数的n次幂？

TOP 榜单

文章

CSV Java文件读取和保存（在不同的ArrayList中）

CSV Java文件读取和保存（在不同的ArrayList中）

构建类似于Jarvis的本地语言应用程序

Qt Creator Windows 10 - “使用 jom 而不是 nmake”不起作用

在 Avalonia 中是否有带有柱子的 TreeView 或类似的东西？

SQL Server中的非确定性数据类型

使用next.js时出现服务器错误，错误：找不到react-redux上下文值；请确保组件包装在<Provider>中

错误：找不到存根。请确保已调用spring-cloud-contract：convert

如何了解DFT结果

ng升级性能注意事项

Embers js中的更改侦听器上的组合框

Swift 2.1-对单个单元格使用UITableView

Java中的循环开关案例

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

如何使用geoChoroplethChart和dc.js在Mapchart的路径上添加标签或自定义值？

ggplot：对齐多个分面图-所有大小不同的分面

如何避免每次重新编译所有文件？

Swift中的指针替代品？

完全禁用暂停（在内核级别？-必须与使用的DE和登录状态无关！）

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

使用分隔符将成对相邻的数组元素相互连接

如何开始为Ubuntu开发

Blazor：如何将事件传递给通用组件中的onClick函数