无法使用Jsoup获取DOM视图html页面

dmitry_dreko

当我得到页面时

 public void getHtml() throws IOException {
    String html = Jsoup.connect("http://vp.by/").get().html();
    System.out.println(html);
}

Jsoup还给我

<html>
<head></head>
<body></body>
</html>

如何在DOM视图中获取完整页面?(如google.com,facebook.com之类的网站正常显示)

拉维

这里的问题是vp.by正在做一些事情来检测它认为无效的浏览器请求的奇数连接。例如,如果您执行curl -v -X GET http://vp.by,您将只收到200 OK的响应,没有任何内容。添加User-Agent标头后,我们可以更好地模仿基于浏览器的有效请求。

请尝试以下方法:

public void getHtml() throws IOException {
    String html = Jsoup
            .connect("http://vp.by/")
            .userAgent("Mozilla/5.0 (Macintosh; Intel Mac OS X 10_8_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.112 Safari/537.36")
            .get().html();
    System.out.println(html);
}

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章