次のコードを使用して、検索結果全体を取得しました
library(RCurl)
library(XML)
url <- "https://www.google.com/search?&q=cran&hl=en"
doc <- htmlTreeParse(getURL(url), useInternalNodes = TRUE)
nodes <- getNodeSet(doc, "//div[@id='result-stats']")
しかし、次の出力が得られます。
list()
attr(,"class")
[1] "XMLNodeSet"
29,500,000のような数を取得したいところ
誰か助けてもらえますか?それは私にとって本当に素晴らしいことです。
有効なユーザーエージェントが必要です。これを試して
ua <- "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.111 Safari/537.36"
doc <- htmlTreeParse(getURL(url, httpheader = list(`User-Agent` = ua)), useInternalNodes = TRUE)
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加