使用PHP简单HTML DOM解析器提取HTML文件的特定部分

腐败的网络

我有一个带有几个表的HTML文件,尝试从中提取链接和图像部分。我正在使用PHP简单HTML DOM解析器。

这是要解析的HTML文件:

<h1>Title</h1>
<p>Text</p>

<table cellspacing="0" cellpadding="0" border="0">
    <tbody>
        <tr><td>
            <a href="http://www.google.com/some_url">
                <img width="100" height="100" border="0" src="http://google.com/some_image.jpg"/>
            </a>
        </td></tr>
    </tbody>
</table>

<h2>Title</h2>
<p>Text</p>

<table cellspacing="0" cellpadding="0" border="0">
    <tbody>
        <tr><td>
            <a href="http://www.google.com/this_url">
                <img width="100" height="100" border="0" src="http://google.com/this_image.jpg"/>
            </a>
        </td></tr>
    </tbody>
</table>

<p>Text</p>
<p>Text</p>

而我需要作为输出:

<a href="http://www.google.com/some_url">
    <img width="100" height="100" border="0" src="http://google.com/some_image.jpg"/>
</a>

<a href="http://www.google.com/this_url">
    <img width="100" height="100" border="0" src="http://google.com/this_image.jpg"/>
</a>

这是PHP的一部分–但无法按我想要的方式工作...

<?php

// Include the library
include('simple_html_dom.php');

// Retrieve the DOM from a given URL
$html = file_get_html('http://google.com');

// Find all images & links
foreach($html->find('img') as $IMGelement)
foreach($html->find('a') as $Aelement)
echo '<a href="' . $Aelement->href . '"><img src="' . $IMGelement->src . '" /><br>';

?>
飞溅58

我认为您想在标签中找到一个img:

foreach($html->find('a img') as $IMGelement) {
    echo '<a href="' . $IMGelement->parent()->href . '"><img src="' .$IMGelement->src .'" /><br>';
}

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

解析网站并使用“ PHP简单HTML DOM解析器”保存特定的DIV

PHP简单HTML DOM解析器-解析嵌套元素

PHP简单HTML DOM解析器-查找跨度ID

无法使用 PHP 简单 HTML DOM 解析器解析网页

PHP简单HTML DOM解析器在特定网站上不返回任何内容

简单的HTML DOM解析器错误

简单的 html dom 解析器表

使用简单的HTML dom解析器创建多维数组?

使用简单HTML DOM解析器转换为JSON?

使用简单的HTML dom解析器通过特定的搜索文本获取链接

如何使用PHP简单HTML DOM解析器获取标签的属性

如何使用php curl和简单的html dom解析器获取span标签值?

在使用PHP简单HTML DOM解析器进行选择时需要帮助

html dom解析器从span sibiling提取href

如何在使用html dom解析器PHP的特定html标记开始之前获取文本

使用简单的HTML Dom PHP

使用PHP Simple HTML DOM解析器解析输出

File_get_html在PHP简单HTML DOM解析器中返回空html

简单的HTML DOM解析器无法解析<body>标签

PHP:简单的HTML DOM解析器-如何获取具有特定标签名称的元素?

如何将CURL和PHP简单HTML DOM解析器与对象一起使用

循环遍历 html 表并使用简单的 dom 解析器在 php 中获取 tr、th 和 td

使用简单HTML DOM解析器获取H2 HTML

来自简单HTML Dom解析器的数值被视为文本

输入字段中的简单 HTML DOM 解析器

简单的html dom解析器->查找“条件”

用于Laravel 5的简单HTML dom解析器

Laravel中简单HTML DOM解析器的问题

Java等同于PHP简单HTML DOM解析器