如何从Java文本文件中的特定起始索引获取第一个整数的索引？

厨房里的黄色衣服

我已经使用Apache PDFBox库将PDF转换为文本。我想在公司名称后获取整数索引。例如，我在控制台中看到的这样的文本：

Some infos
..
53252
..
Some infos
..
Company
Bla Bla LTD.
12312
..

我可以通过以下方式获得公司的起点指数：

int IndexFirst = pdfText.indexOf("Company");
String companyName = pdfText.substring(IndexFirst+7, ?? )

我想获得我所有的公司名称，因此我需要最后一个整数索引。如果您想问我为什么不将公司名称总索引号添加到IndextFirst以查找最后的索引并获取公司名称，我还有许多其他PDF，并且公司名称将是动态的。我可以找到起点，因为PDF的Company是静态的，但是Company索引的长度不是。其他静态文本是公司名称后的编号。我想说“在公司名称后得到第一个整数的索引”的Java

亚瑟·摩根

如果公司名称后pdf以整数继续，则可以使用正则表达式。

Pattern pattern = Pattern.compile("[0-9]");
Matcher matcher = pattern.matcher(pdfText.substring(unvanIndexFirst)); // If pdfText text file which came from your PDF with PDFBox lib.
            
unvanIndexLast = unvanIndexFirst + matcher.start();
            
unvan = pdfText.substring(unvanIndexFirst, unvanIndexLast);

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-02-7

我来说两句

0 条评论

登录后参与评论

上一篇：从带有十进制列和十进制JPA属性的csv文件插入H2数据库Spring Boot

读取文本文件一行中的第一个单词时出现索引错误

获取文本文件中第一个字符的计数？

如何从Java文本文件中的特定起始索引获取第一个整数的索引？

如何从Java文本文件中的特定起始索引获取第一个整数的索引？

蓝屏死机没有修复解决方案

计算数据帧中每行的NA

UITableView的项目向下滚动后更改颜色，然后快速备份

Node.js中未捕获的异常错误，发生调用

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Linux的官方Adobe Flash存储库是否已过时？

验证REST API参数

ggplot：对齐多个分面图-所有大小不同的分面

Mac OS X更新后的GRUB 2问题

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

带有错误“ where”条件的查询如何返回结果？

用日期数据透视表和日期顺序查询

VB.net将2条特定行导出到DataGridView

如何从视图一次更新多行（ASP.NET - Core）

Java Eclipse中的错误13，如何解决？

尝试反复更改屏幕上按钮的位置 - kotlin android studio

离子动态工具栏背景色

应用发明者仅从列表中选择一个随机项一次

当我尝试下载 StanfordNLP en 模型时，出现错误

python中的boto3文件上传

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID