简单的HTML DOM,如何仅回显锚文本中的文本

约翰·史密斯

我的代码摘要:

foreach($html->find('a') as $element) {

..我将内部文本用于此:

$element->innertext

有任何机会在不使用简单HTML DOM的情况下仅从锚文本中回显文本,我尝试抓取大约1万个链接,但在某些情况下,如果<a tagdivs代码,图像代码等内部则它会打印

如果<a tag是标准(简单),例如:

<a href="http://www.test.com">Anchor Text</a>

因此,在这种情况下,$ element-> innertext将为“锚文本”

如果情况是这样的:

1    <a href="http://www.test.com"><div id=whatever>Anchor Text</div></a>

或者

2    <a href="http://www.test.com"><img src="whatever" /></a>

$element->innertext将是:

Result1 <div id=whatever>Anchor Text</div>
Result2 <img src="whatever" />

是否仅打印文本有任何更改?或者我应该为每种情况写自己的自定义条件:div,img等吗?

TecBrat

就这么简单 strip_tags($element->innertext);

如果锚点是图像,则结果将为空字符串。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章