给定以下源页面:
< a class="card-click-target id-track-click" data-server-cookie="CAIaHgocEhoKFGNvbS5yb3Zpby5hbmdyeWJpcmRzEAEYAw==" data-uitype="500" href="/store/apps/details?id=com.rovio.angrybirds" aria-hidden="true" tabindex="-1"></a>
我已经搜索了一段时间,找不到答案。搜索完应用后,我需要从Google Play源页面中提取href内容,例如,如果我搜索愤怒的小鸟,我想从源页面中提取下一个文本:“ /store/apps/details?id=com.rovio.angrybirds ”(我得到此信息后的主要目标是获取应用的说明)。谢谢您的帮助 !
试试这个:
Document doc = Jsoup.parseBodyFragment(source);
Elements links = doc.getElementsByTag("a");
for (Element element : links) {
System.out.println(element.attr("href"));
}
顺便说一下,您在开始标签中有一个多余的空间(“ <a”),这也可能会引起问题。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句