使用PHP Simple HTML DOM解析器解析输出

aPinix

我正在使用此库(PHP简单HTML DOM解析器)来解析链接,这是代码:

$htmlUrl = 'http://trailers.apple.com/trailers/independent/thelook/includes/playlists/web.inc';
$html = file_get_html($htmlUrl);

当我打印时:

print_r($html . "\n");

向我输出这个(html树):

<h2>
  <span class="dropdown-handle" id="trailers-handle">
    <span id='single-trailer-info'>Info</span>
    <span class='button'>
...

然后我想找到一个带有类的元素(下拉列表):

$divList = $html->find('.dropdown-list'); // tried find('.dropdown-list', 0);

然后我打印:

print_r($divList);

输出这个(数组):

simple_html_dom_node Object
(
    [nodetype] => 1
    [tag] => div
    [attr] => Array
        (
            [class] => dropdown-list
        )

    [children] => Array
...

并采取永远的解析!

难道我做错了什么?一些链接具有此输出(数组)而不是输出(html树)。

谢谢你的帮助 :)

科技狂热者

尝试在print_r之前清除或关闭(对不起,我忘记了,先尝试一个然后再尝试另一个)。

$html->clear();

$html->close();

如果那不起作用,并且您知道要“查找”的对象是某种选择器类型,则应首先获取所有这些选择器。然后搜索它们,如果可以的话,可以更快地进行搜索。因此,如果首先<select>查找所有这些内容,则对它们进行查找,或者甚至不使用find并使用foreachand自己解析它们strpos

如果那不起作用,请尝试先使用抓取您的页面wget,然后将它们保存到服务器后再使用html简单dom对其进行解析。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

PHP Simple Dom HTML解析器的语法解析错误

使用PHP Simple HTML DOM解析器解析所有项目

使用PHP Simple HTML DOM解析器“遍历”未嵌套的div

如何使用PHP Simple HTML DOM解析器查找所有元素?

将代理与PHP Simple HTML DOM解析器一起使用

使用PHP Simple HTML DOM解析器获取Div属性

使用PHP Simple HTML DOM解析器从表中获取数据

PHP Simple HTML DOM解析器将该元素放在当前元素之后

使用PHP Simple DOM解析器查找直接后代

simple_html_dom 解析器:过滤找到的标签

PHP简单HTML DOM解析器-解析嵌套元素

PHP DOM解析器解析html表

PHP:如何使用simple_html_dom解析器将CSS text-align属性添加到元素的现有内联样式属性中?

PHP简单HTML DOM解析器-查找跨度ID

PHP DOM解析器我的html ul代码

使用简单的HTML dom解析器创建多维数组?

使用简单HTML DOM解析器转换为JSON?

解析网站并使用“ PHP简单HTML DOM解析器”保存特定的DIV

无法使用 PHP 简单 HTML DOM 解析器解析网页

PHP Simple Html Dom解析php表单

如何在使用html dom解析器PHP的特定html标记开始之前获取文本

使用PHP简单HTML DOM解析器提取HTML文件的特定部分

如何使用PHP简单HTML DOM解析器获取标签的属性

如何使用php curl和简单的html dom解析器获取span标签值?

在使用PHP简单HTML DOM解析器进行选择时需要帮助

File_get_html在PHP简单HTML DOM解析器中返回空html

用php simple_html_dom解析html

使用Parsec的Haskell HTML解析器

使用LXML解析器的HTML getnext