简单的HTML DOM无法获取文件

乔纳斯·霍尔曼（Jonas Hallmann）

我不知道解决方案可能是什么。我只是无法获取此Charizard的html文件，即使链接正确也没有任何响应。Bulbasaur工作正常，但我想要这个可爱的Charizard ...

include("simple_html_dom.php");
$html = file_get_html('https://bulbapedia.bulbagarden.net/wiki/Charizard_(Pok%C3%A9mon)');
$html2 = file_get_html('https://bulbapedia.bulbagarden.net/wiki/Bulbasaur_(Pok%C3%A9mon)');
echo $html;
echo $html2;

此页面有任何保护，还是仅难抓住Charizard？如果您能帮助我，我将不胜感激。

乔纳斯:)

尼玛

这里有两个问题：

从此URL提取的内容的长度超过MAX_FILE_SIZE（在中定义simple_html_dom.php）
评论中指出的错误（https://github.com/sunra/php-simple-html-dom-parser/issues/37）。该错误似乎已在github上维护的分支存储库中得以解决，但它仍存在于原始版本中（似乎不再维护了）。

要解决第一个问题，请编辑simple_html_dom.php并更改define('MAX_FILE_SIZE', 600000);为使用更大的数字。

作为第二个问题的解决方法，将正确的参数传递给file_get_html，并且我的意思是传递0给$offset：

$html = file_get_html('https://bulbapedia.bulbagarden.net/wiki/Charizard_(Pok%C3%A9mon)',
false,
null,
0); // this last one is the offset

var_dump($html);

或者，您可以使用该库的分支版本。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。