我的代码摘要:
foreach($html->find('a') as $element) {
..我将内部文本用于此:
$element->innertext
有任何机会在不使用简单HTML DOM的情况下仅从锚文本中回显文本,我尝试抓取大约1万个链接,但在某些情况下,如果在<a tag
divs代码,图像代码等内部,则它会打印。
如果<a tag
是标准(简单),例如:
<a href="http://www.test.com">Anchor Text</a>
因此,在这种情况下,$ element-> innertext将为“锚文本”
但
如果情况是这样的:
1 <a href="http://www.test.com"><div id=whatever>Anchor Text</div></a>
或者
2 <a href="http://www.test.com"><img src="whatever" /></a>
我$element->innertext
将是:
Result1 <div id=whatever>Anchor Text</div>
Result2 <img src="whatever" />
是否仅打印文本有任何更改?或者我应该为每种情况写自己的自定义条件:div,img等吗?
就这么简单 strip_tags($element->innertext);
如果锚点是图像,则结果将为空字符串。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句