对不起我的英语不好。我正在使用Jsoup从网站上提取手机的用户评分。比率是在span标记之间,但是没有class或id,为此,我使用了span所在的div标记。
for(int j=0; j<=3; j++){
//get page
Document rate = Jsoup.connect("http://www.skroutz.gr/c/40/kinhta-thlefwna.html?order_dir=asc&page=" + j).userAgent("Mozilla").get();
// get rate
Elements phoneRate = rate.select("div[class=rating-wrapper]");
//print all rates
for(int i = 1; i<phoneRate.size(); i++){
System.out.println("Rate: " + phoneRate.get(i).text());
}
}
我得到的结果是这样的:
评分:102.9 评分:44 评分:00 评分:113.1 评分:43 评分:33.3 评分:00 评分:15
等级编号在点之前和之后。有没有一种简单的方法可以只提取这些数字。
它行得通吗?
Elements phoneRate = rate.select("div[class=rating-wrapper] span");
(注意:他似乎想要span元素内的值,请参见例如:http : //www.skroutz.gr/c/40/kinhta-thlefwna.html?order_dir=asc&page=2)
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句