Pythonのキーワードのリストを使用したGoogle検索Webスクレイピング

Jbae.H 投稿 Dev

45

Jbae.H

名前のリストを入力として使用してGoogle検索でウェブスクレイピングを実行し、DataFameでデータセットを取得しようとしています。以前はWebスクレイピングにセレンを使用していましたが、ループを使用して名前のリストを入力として実行し、結果を取得して各ページをスクレイピングする構文を構築するのに苦労しています。これが私のPythonコードです：

baseUrl = 'https://www.google.com/search?q='
pluseUrl = input('CEO: ')    
url = baseUrl + quote_plus(pluseUrl)

browser = webdriver.Chrome(r"C:\Users\...\chromedriver.exe")
browser.get(url)

table = browser.find_elements_by_css_selector('div.ifM9O') 

df = pd.DataFrame(columns = ['ceo', 'value'])
values =[]


for row in table:
    ceo = str(([c.text for c in row.find_elements_by_css_selector('div.kno-ecr-pt.PZPZlf.gsmt.i8lZMc')])).strip('[]').strip("''")
    value = str(([c.text for c in row.find_elements_by_css_selector('div.Z1hOCe')])).strip('[]').strip("''")

ceo = pd.Series(ceo)
value = pd.Series(value)

df = df.assign(**{'ceo': ceo, 'value': value}) 


print(df)

そして、これがビル・ゲイツを入力として入れた後の結果です：

CEO: Bill gates
          ceo                                              value
0  Bill Gates  Born: October 28, 1955 (age 64 years), Seattle...

任意の提案や推奨事項をいただければ幸いです。

chrispalmo

これを試して：

baseUrl = 'https://www.google.com/search?q='
browser = webdriver.Chrome(r"C:\Users\...\chromedriver.exe")
input_list = ["Bill Gates", "Elon Musk", "Warren Buffet"]
output = {}

def scrape_ceo_list(list_of_ceo):
     for ceo in list_of_ceo:
          browser.get(baseUrl + ceo)

          // query selectors, dataframes etc as per original code
          // ...

          output[ceo] = df

output は、CEO名を辞書キーとして使用したデータフレームの辞書になりました。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-08-5

コメントを追加

0

サインイン

関連記事

Pythonを使用したGoogle検索Webスクレイピング

ワイルドカードを使用して、クエリにリンクされたテキストボックスのレコードを検索する

Python を使用したトリップアドバイザーの Web スクレイピング

検索フィルターにワイルドカードパターンを使用したネストされたグループのActiveDirectory検索クエリ

Webスクレイピングからテキストを検索し、次の4行をPythonデータフレームに変換します

リクエストPythonライブラリを使用したWebスクレイピング-キーエラー

Python：検索キーワードのクラスタリング

Pythonを使用したネットワーク（外部）IPアドレスの検索

セレンWebドライバーを使用してGoogle検索結果リストの2番目のリンクをクリックする方法

Ghost.pyを使用したPythonでのスクリーンスクレイピング動的Webページ

Googleの検索結果をWebスクレイピング

nodejsでネットワークリクエストを使用したWebスクレイピング

Google Scriptsを使用して、検索したキーワードを含むWebサイトをGoogleスプレッドシートに表示する方法

PythonのSeleniumでのWebスクレイピング-xpathまたはidを介して要素を検索すると空のリストが返されます

ImportXmlを使用したGoogleスプレッドシートでの画像のスクレイピング

Pythonを使用した特定のページのWebスクレイピング

複数のワイルドカードを使用したマッピングのリクエスト

BeautifulSoupを使用したWebスクレイピング-マークアップされたテキストの後ろに埋め込まれたリンク

Python Webスクレイピングは、検索されたオブジェクトのリストから要素を見逃します

Beautifulsoupを使用したWebスクレイピングとテーブルテキスト値の収集

Pythonを使用したWebスクレイピングWeiboフォロワー数

ネストされたforループ、python3のBeautifulSoupを使用したWebスクレイピング

Pythonを使用したBeautifulSoupの属性エラー（Webスクレイピング）

複数のページに Python を使用した Web スクレイピング

Webスクレイピング：キーワードが見つかったときにテキストの段落全体を返すのに助けが必要

以下のWeb要素を使用して検索入力キーワードを検索するためのロボットフレームワークテストケースを作成しますか？

Pythonを使用したWebスクレイピングテキストへのアクセス方法

BeautifulSoupとSeleniumを使用したWebスクレイピングWebサイトは、Webページ内のテーブル要素を検出しません

BeautifulSoupを使用したリストのWebスクレイピング

TOP 一覧

記事

ホットタグ

アーカイブ