如何在C中查找所有出现的子串

Luca 发表于 Dev

路卡

我试图用C编写一个解析程序，该程序将从HTML文档中提取文本的某些片段。为此，我需要在文档中找到子字符串“ name”的每个实例：但是，C函数strstr仅找到子字符串的第一个实例。我找不到一个可以找到第一个实例之外的任何东西的函数，并且我已经考虑过在找到每个子串后删除它，以便strstr返回下一个子串。我无法使用这两种方法中的任何一种。

顺便说一句，我知道while循环将其限制为六个迭代，但是我只是在测试它以查看是否可以首先使函数正常工作。

while(entry_count < 6)
{   
    printf("test");
    if((ptr = strstr(buffer, "\"name\":")) != NULL)
    {   
        ptr += 8;
        int i = 0;
        while(*ptr != '\"')
        {   
            company_name[i] = *ptr;
            ptr++;
            i++;
        }   
        company_name[i] = '\n';
        int j;
        for(j = 0; company_name[j] != '\n'; j++)
            printf("%c", company_name[j]);
        printf("\n");
        strtok(buffer, "\"name\":");
        entry_count++;
    }   
}

伊尔马里·卡洛宁（Ilmari Karonen）

只需将返回的指针加一个返回，strstr()以找到下一个匹配项：

char *ptr = strstr(buffer, target);
while (ptr) {
    /* ... do something with ptr ... */
    ptr = strstr(ptr+1, target);
}

附言尽管您当然可以做到这一点，但我还是建议您不妨考虑使用更合适的工具来完成这项工作：

C是一种非常低级的语言，尝试用它编写字符串解析代码很费力（尤其是如果您坚持从头开始编写所有代码，而不是使用现有的解析库或解析器生成器）并且容易出现错误（其中一些错误，例如缓冲区溢出，可能会造成安全漏洞）。有很多被更高级别的脚本语言（如Perl和Ruby，Python或甚至和JavaScript）的多少更适合这样的任务。
解析HTML时，您确实应该使用适当的HTML解析器（最好与良好的DOM构建器和查询工具结合使用）。这将使您能够基于文档的结构定位所需的数据，而不仅仅是匹配原始HTML源代码中的子字符串。真正的HTML解析器还将透明地处理诸如字符集转换和字符实体解码之类的问题。（是的，有是HTML解析器C，如浓汤和喧哗，所以即使你坚持坚持C.你可以和应该使用一个）

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-03-30

我来说两句

0 条评论

登录后参与评论

上一篇：供电的USB集线器为台式机供电：到底是什么？

如何在Java中查找并替换出现在字符串中的所有子字符串？

如何在以{{开头并以}结尾的字符串中查找所有子字符串

如何在列表中查找子列表的所有出现次数（索引）

如何在C中查找所有出现的子串

如何在C中查找所有出现的子串

UITableView的项目向下滚动后更改颜色，然后快速备份

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Mac OS X更新后的GRUB 2问题

验证REST API参数

Java Eclipse中的错误13，如何解决？

带有错误“ where”条件的查询如何返回结果？

ggplot：对齐多个分面图-所有大小不同的分面

尝试反复更改屏幕上按钮的位置 - kotlin android studio

如何从视图一次更新多行（ASP.NET - Core）

计算数据帧中每行的NA

蓝屏死机没有修复解决方案

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

离子动态工具栏背景色

VB.net将2条特定行导出到DataGridView

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

在Windows 7中无法删除文件（2）

python中的boto3文件上传

当我尝试下载 StanfordNLP en 模型时，出现错误

Node.js中未捕获的异常错误，发生调用