我正在尝试在Eclipse中运行一个Web抓取器,该抓取器使用Jsoup,可以使用此页面上教授的姓名:yu.edu/faculty并将其打印出来。这是我的代码:
import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class YUscraper {
public static void main(String[] args) throws IOException {
// fetches & parses HTML
String url = "http://yu.edu/faculty/";
Document document = Jsoup.connect(url).get();
// Extract data
Element content = document.getElementById("mainlist");
Elements names = content.getElementsByTag("a");
// Output data
for (Element name : names) {
System.out.println("Name: " + name.text());
}
}
}
我收到此错误:
Exception in thread "main" java.lang.NullPointerException
at YUscraper.main(YUscraper.java:18)
我对此还比较陌生,所以如果我缺少真正明显的东西,请原谅。我已经使用许多示例说明了这一点,但是我仍然不明白IOException的用途是什么,以及发现异常的含义。请帮忙,谢谢!
第18行是
元素名称= content.getElementsByTag(“ a”);
从http://yu.edu/faculty/检索到的html中似乎没有ID为“ mainlist”的标签。
似乎您正在尝试访问标签main-nav而不是mainlist。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句