Z-Function 和独特的子串：到处乱七八糟的算法？

Zeks 发表于 Dev

泽克斯

我不是一个巨大的数学书呆子，所以我可能很容易遗漏一些东西，但是让我们从https://cp-algorithms.com/string/z-function.html中获取算法并尝试将其应用于 string baz。这个字符串肯定有一个子字符串集'b'，'a'，'z'，'ba'，'az'，'baz'。

让我们看看 z 函数是如何工作的（至少我是怎么理解的）：

我们取一个空字符串并在其中添加“b”。根据算法 z[0] = 0 的定义，因为它对于大小 1 是未定义的；
我们取'b'并添加'a'，反转字符串，我们有'ab'......现在我们计算z函数......它产生{0,0}。第一个元素是“未定义”的，第二个元素应该定义为：

i-th element is equal to the greatest number of characters starting from the position i that coincide with the first characters of s.

因此，在 i = 1 处，我们有 'b'，我们的字符串以 a 开头，'b' 与 'a' 不重合，所以当然 z[i=1]=0。这将在整个单词中重复。最后，我们得到了全零的 z 数组，尽管字符串有 6 个子字符串，但它并没有告诉我们任何信息。

我错过了什么吗？有很多网站推荐 z 功能，count of distinct substrings但它......不起作用？我是不是误解了distinct这里的意思？

见测试用例：https ://pastebin.com/mFDrSvtm

马特·蒂默曼斯

当您在字符串 S 的开头添加一个字符x时，S的所有子字符串仍然是xS的子字符串，但是您得到了多少个新子字符串？

新的子字符串都是xS的前缀。这些有长度（xS），但是
其中的max(Z( xS )) 已经是S的子字符串，所以
你得到 length( xS ) - max(Z( xS )) 新的

因此，给定一个字符串 S，只需将 S的每个后缀P的所有长度 ( P ) - max(Z( P )) 相加即可。

您的测试用例baz有 3 个后缀：z、az和baz. 所有字母都是不同的，因此它们的 Z 函数处处为零。结果是不同子串的数量只是后缀长度的总和：3 + 2 + 1 = 6。

尝试baa：Z 函数中唯一的非零是 Z('aa')[1] = 1，因此唯一子串的数量是 3 + 2 - 1 + 1 = 5。

请注意，您链接到的文章提到这是一个 O(n ² ) 算法。这是正确的，尽管它的开销很低。通过构建后缀树可以在 O(n) 时间内完成此操作，但这非常复杂。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2022-05-29

我来说两句

0 条评论

登录后参与评论

TOP 榜单

文章

Z-Function 和独特的子串：到处乱七八糟的算法？

Z-Function 和独特的子串：到处乱七八糟的算法？

计算数据帧R中的字符串频率

Android Studio Kotlin：提取为常量

Excel 2016图表将增长与4个参数进行比较

获取并汇总所有关联的数据

如何使用Redux-Toolkit重置Redux Store

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

将加号/减号添加到jQuery菜单

算术中的c ++常量类型转换

TYPO3：将 Formhandler 添加到新闻扩展

TreeMap中的自定义排序

如何开始为Ubuntu开发

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

无法使用 envoy 访问 .ssh/config

在Ubuntu和Windows中，触摸板有时会滞后。硬件问题？

遍历元素数组以每X秒在浏览器上显示

在Jenkins服务器中使用Selenium和Ruby进行的黄瓜测试失败，但在本地计算机中通过

警告消息：在matrix（unlist（drop.item），ncol = 10，byrow = TRUE）中：数据长度[16]不是列数的倍数[10]>？

未捕获的SyntaxError：带有Ajax帖子的意外令牌u

如何使用tweepy流式传输来自指定用户的推文（仅在该用户发布推文时流式传输）

尝试在Dell XPS13 9360上安装Windows 7时出错

如果从DB接收到的值为空，则JMeter JDBC调用将返回该值作为参数名称