如何从Java文本文件中的特定起始索引获取第一个整数的索引?

厨房里的黄色衣服

我已经使用Apache PDFBox库将PDF转换为文本。我想在公司名称后获取整数索引。例如,我在控制台中看到的这样的文本:

Some infos
..
53252
..
Some infos
..
Company
Bla Bla LTD.
12312
..

我可以通过以下方式获得公司的起点指数:

int IndexFirst = pdfText.indexOf("Company");
String companyName = pdfText.substring(IndexFirst+7, ?? )  

我想获得我所有的公司名称,因此我需要最后一个整数索引。如果您想问我为什么不将公司名称总索引号添加到IndextFirst以查找最后的索引并获取公司名称,我还有许多其他PDF,并且公司名称将是动态的。我可以找到起点,因为PDF的Company是静态的,但是Company索引的长度不是。其他静态文本是公司名称后的编号。我想说“在公司名称后得到第一个整数的索引”的Java

亚瑟·摩根

如果公司名称后pdf以整数继续,则可以使用正则表达式。

Pattern pattern = Pattern.compile("[0-9]");
Matcher matcher = pattern.matcher(pdfText.substring(unvanIndexFirst)); // If pdfText text file which came from your PDF with PDFBox lib.
            
unvanIndexLast = unvanIndexFirst + matcher.start();
            
unvan = pdfText.substring(unvanIndexFirst, unvanIndexLast);

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

读取文本文件一行中的第一个单词时出现索引错误

获取文本文件中第一个字符的计数?

如何在Python中从文本文件中删除第一个空格?

如何只读取文本文件中的第一个值

如何从文本文件中删除逗号的最后一个索引?

Java文件:从文本文件获取特定的索引

获取文本文件中第一个匹配项的正则表达式

如何批量重命名文本文件使其成为每个文本文件中的第一个单词?

如何从文本文件中读取最后一行的第一个单词?

如何读取文本文件中的第一个单词并将其显示在richTextBox中

Java-读取文本文件的第一个单词

如何按第一个单词对文本文件的行进行排序?

如何从文本文件中删除第一个字符串和逗号

如何将文本文件中的第一个colmn分配给list变量?

如何使用 Python 仅打印文本文件中字符串的第一个实例?

读入python后从文本文件中删除第一个标题行

如何从多索引数据框中获取第一个二级索引?

读取文本文件的每一行并获取第一个拆分字符串

在给定起始索引的数组中查找第一个匹配的对象

当第一个表的列数少于其他表时,如何使R读取一个文本文件中的多个表

从Prolog中读取文本文件时,如何忽略每行的第一个和最后一个元素?

提取文本文件中第一个和第二个重复字符串之间的特定行

获取特定月份的第一个起始周

如何在C#中提取文本文件每一行的第一个单词

从r中第一个元素之后的文本文件中删除特殊字符

如何仅从组合框 c# 中获取第一个索引

我如何获取数组的返回列表中的第一个索引的值

在Java中创建一个填充有随机整数的文本文件

使用Powershell从文本文件中删除第一个字符