我有以下csv
文件:
OF_DEPARTURE_COORDINATE_Y,OF_ARRIVAL_COUNTRY,OF_ARRLV2,OF_ARRLV1,OF_ARRLV0,OF_ARRIVAL_CITY,OF_ARRIVAL_ZIPCODE,OF_ARRIVAL_COORDINATE_X,OF_ARRIVAL_COORDINATE_Y,OF_WEIGHT,OF_VOLUME,OF_LENGTH,OF_GOODS_KND,OF_TAIL_LIFT,OF_PALLETS_EXCHANGE,OF_NB_PALLETS
D,SN,1,,DRESDEN,01067,1372931,5105325,A,3,SB,57,ZELL AM SEE,5700,1279591,4732422,2500,0,36,MG,N,N,0
D,HE,35,,HAIGER,35708,820051,5074357,RO,2,,,ORADEA,410000,2193891,4705371,100,1,0,MG,N,N,0
F,NP,62,,ANVIN,62134,225617,5044640,F,BR,29,,QUIMPER,29000,-410790,4799464,10000,0,50,MG,N,N,0
我需要检查那里提到过多少次到达和离开的国家。并用于此功能方法。CSV文件仅包含国家/地区代码。所有国家/地区都存储在预定义的枚举中。
我的解决方案肯定是迭代地工作的,我确信它可以用流来实现。我尝试与collect()
&一起玩,groupingBy()
但没有成功。
这是迭代解决方案(结果存储到键的国家/地区映射-值出现的次数):
public class CountryCounter {
private static Map<Country, Long> countryMap = Country.getCountryMap();
public static void main(String[] args) {
processPath(FileLocation.SEARCHES_REG);
printMap();
}
private static void printMap() {
Map<Country, Long> reversedMap = new TreeMap<>(countryMap);
Map<Country, Long> result = new LinkedHashMap<>();
reversedMap.entrySet().stream()
.sorted(Map.Entry.<Country, Long>comparingByValue().reversed())
.forEachOrdered(x -> result.put(x.getKey(), x.getValue()));
for (Map.Entry entry : result.entrySet()) {
System.out.println(entry.getKey() + ", " + entry.getValue());
}
}
private static void processPath(FileLocation filePath) {
FileLocation.printFileName(filePath);
Path path = Paths.get(".", filePath.getFilePath());
List<String> csvLines = null;
try {
csvLines = Files.readAllLines(path);
} catch (IOException e) {
e.printStackTrace();
}
for (String csvLine : csvLines) {
String[] lineArgs = csvLine.split(",");
String arrivalCntCode = lineArgs[0];
String departureCntCode = lineArgs[8];
if (arrivalCntCode == null || departureCntCode == null) {
return;
}
Country arrCountry = Country.getByCode(arrivalCntCode);
Country depCountry = Country.getByCode(departureCntCode);
if (countryMap.containsKey(arrCountry)) {
countryMap.put(arrCountry, countryMap.get(arrCountry) + 1);
}
if (countryMap.containsKey(depCountry)) {
countryMap.put(depCountry, countryMap.get(depCountry) + 1);
}
}
}
}
FileLocation
是用于存储csv文件的相对路径的枚举。
在这里您可以找到国家枚举
它工作正常:
France, 82109
Germany, 31589
Romania, 27634
Italy, 11652
Netherlands, 9190
...
如何通过Java 8
流之类的功能实现相同的目的?
我们可以:
使用Files.lines(path)
而不是readAllLines
直接将这些行作为流获取。
使用flatMap
转线为国家流。
使用下游收集器对发生次数进行计数的国家/地区进行分组。
例如:
public Map<Country, Long> count(Path path) throws IOException {
return Files.lines(path)
.flatMap(line -> getRelevantCells(line))
.map(Country::getByCode)
.filter(Objects::nonNull)
.collect(Collectors.groupingBy(Function.identity(), Collectors.counting()));
}
private Stream<String> getRelevantCells(String line) {
String[] cells = line.split(",");
return Stream.of(cells[0], cells[8]);
}
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句