简单的HTML DOM无法获取文件

乔纳斯·霍尔曼(Jonas Hallmann)

我不知道解决方案可能是什么。我只是无法获取此Charizard的html文件,即使链接正确也没有任何响应。Bulbasaur工作正常,但我想要这个可爱的Charizard ...

include("simple_html_dom.php");
$html = file_get_html('https://bulbapedia.bulbagarden.net/wiki/Charizard_(Pok%C3%A9mon)');
$html2 = file_get_html('https://bulbapedia.bulbagarden.net/wiki/Bulbasaur_(Pok%C3%A9mon)');
echo $html;
echo $html2;

此页面有任何保护,还是仅难抓住Charizard?如果您能帮助我,我将不胜感激。

乔纳斯:)

尼玛

这里有两个问题:

  1. 从此URL提取的内容的长度超过MAX_FILE_SIZE(在中定义simple_html_dom.php
  2. 评论中指出的错误(https://github.com/sunra/php-simple-html-dom-parser/issues/37)。该错误似乎已在github上维护的分支存储库中得以解决,但它仍存在于原始版本中(似乎不再维护了)。

要解决第一个问题,请编辑simple_html_dom.php并更改define('MAX_FILE_SIZE', 600000);为使用更大的数字。

作为第二个问题的解决方法,将正确的参数传递给file_get_html,并且我的意思是传递0$offset

$html = file_get_html('https://bulbapedia.bulbagarden.net/wiki/Charizard_(Pok%C3%A9mon)',
false,
null,
0); // this last one is the offset

var_dump($html);

或者,您可以使用该库分支版本

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章