Pythonのキーワードのリストを使用したGoogle検索Webスクレイピング

Jbae.H

名前のリストを入力として使用してGoogle検索でウェブスクレイピングを実行し、DataFameでデータセットを取得しようとしています。以前はWebスクレイピングにセレンを使用していましたが、ループを使用して名前のリストを入力として実行し、結果を取得して各ページスクレイピングする構文構築するのに苦労しています。これが私のPythonコードです:

baseUrl = 'https://www.google.com/search?q='
pluseUrl = input('CEO: ')    
url = baseUrl + quote_plus(pluseUrl)

browser = webdriver.Chrome(r"C:\Users\...\chromedriver.exe")
browser.get(url)

table = browser.find_elements_by_css_selector('div.ifM9O') 

df = pd.DataFrame(columns = ['ceo', 'value'])
values =[]


for row in table:
    ceo = str(([c.text for c in row.find_elements_by_css_selector('div.kno-ecr-pt.PZPZlf.gsmt.i8lZMc')])).strip('[]').strip("''")
    value = str(([c.text for c in row.find_elements_by_css_selector('div.Z1hOCe')])).strip('[]').strip("''")

ceo = pd.Series(ceo)
value = pd.Series(value)

df = df.assign(**{'ceo': ceo, 'value': value}) 


print(df)

そして、これがビル・ゲイツを入力として入れた後の結果です:

CEO: Bill gates
          ceo                                              value
0  Bill Gates  Born: October 28, 1955 (age 64 years), Seattle...

任意の提案や推奨事項をいただければ幸いです。

chrispalmo

これを試して:

baseUrl = 'https://www.google.com/search?q='
browser = webdriver.Chrome(r"C:\Users\...\chromedriver.exe")
input_list = ["Bill Gates", "Elon Musk", "Warren Buffet"]
output = {}

def scrape_ceo_list(list_of_ceo):
     for ceo in list_of_ceo:
          browser.get(baseUrl + ceo)

          // query selectors, dataframes etc as per original code
          // ...

          output[ceo] = df

output は、CEO名を辞書キーとして使用したデータフレームの辞書になりました。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

Pythonを使用したGoogle検索Webスクレイピング

ワイルドカードを使用して、クエリにリンクされたテキストボックスのレコードを検索する

Python を使用したトリップアドバイザーの Web スクレイピング

検索フィルターにワイルドカードパターンを使用したネストされたグループのActiveDirectory検索クエリ

Webスクレイピングからテキストを検索し、次の4行をPythonデータフレームに変換します

リクエストPythonライブラリを使用したWebスクレイピング-キーエラー

Python:検索キーワードのクラスタリング

Pythonを使用したネットワーク(外部)IPアドレスの検索

セレンWebドライバーを使用してGoogle検索結果リストの2番目のリンクをクリックする方法

Ghost.pyを使用したPythonでのスクリーンスクレイピング動的Webページ

Googleの検索結果をWebスクレイピング

nodejsでネットワークリクエストを使用したWebスクレイピング

Google Scriptsを使用して、検索したキーワードを含むWebサイトをGoogleスプレッドシートに表示する方法

PythonのSeleniumでのWebスクレイピング-xpathまたはidを介して要素を検索すると空のリストが返されます

ImportXmlを使用したGoogleスプレッドシートでの画像のスクレイピング

Pythonを使用した特定のページのWebスクレイピング

複数のワイルドカードを使用したマッピングのリクエスト

BeautifulSoupを使用したWebスクレイピング-マークアップされたテキストの後ろに埋め込まれたリンク

Python Webスクレイピングは、検索されたオブジェクトのリストから要素を見逃します

Beautifulsoupを使用したWebスクレイピングとテーブルテキスト値の収集

Pythonを使用したWebスクレイピングWeiboフォロワー数

ネストされたforループ、python3のBeautifulSoupを使用したWebスクレイピング

Pythonを使用したBeautifulSoupの属性エラー(Webスクレイピング)

複数のページに Python を使用した Web スクレイピング

Webスクレイピング:キーワードが見つかったときにテキストの段落全体を返すのに助けが必要

以下のWeb要素を使用して検索入力キーワードを検索するためのロボットフレームワークテストケースを作成しますか?

Pythonを使用したWebスクレイピングテキストへのアクセス方法

BeautifulSoupとSeleniumを使用したWebスクレイピングWebサイトは、Webページ内のテーブル要素を検出しません

BeautifulSoupを使用したリストのWebスクレイピング

TOP 一覧

  1. 1

    Unity:未知のスクリプトをGameObject(カスタムエディター)に動的にアタッチする方法

  2. 2

    セレンのモデルダイアログからテキストを抽出するにはどうすればよいですか?

  3. 3

    Ansibleで複数行のシェルスクリプトを実行する方法

  4. 4

    tkinterウィンドウを閉じてもPythonプログラムが終了しない

  5. 5

    Crashlytics:コンパイラー生成とはどういう意味ですか?

  6. 6

    GoDaddyでのCKEditorとKCfinderの画像プレビュー

  7. 7

    Windows 10 Pro 1709を1803、1809、または1903に更新しますか?

  8. 8

    Chromeウェブアプリのウェブビューの高さの問題

  9. 9

    モーダルダイアログを自動的に閉じる-サーバーコードが完了したら、Googleスプレッドシートのダイアログを閉じます

  10. 10

    Windows 10の起動時間:以前は20秒でしたが、現在は6〜8倍になっています

  11. 11

    Reactでclsxを使用する方法

  12. 12

    ファイル内の2つのマーカー間のテキストを、別のファイルのテキストのセクションに置き換えるにはどうすればよいですか?

  13. 13

    MLでのデータ前処理の背後にある直感

  14. 14

    グラフからテーブルに条件付き書式を適用するにはどうすればよいですか?

  15. 15

    Pythonを使用して同じ列の同じ値の間の時差を取得する方法

  16. 16

    mutate_allとifelseを組み合わせるにはどうすればよいですか

  17. 17

    ネットワークグラフで、ネットワークコンポーネントにカーソルを合わせたときに、それらを強調表示するにはどうすればよいですか?

  18. 18

    テキストフィールドの値に基づいて UIslider を移動します

  19. 19

    BLOBストレージからデータを読み取り、Azure関数アプリを使用してデータにアクセスする方法

  20. 20

    PowerShellの分割ファイルへのヘッダーの追加

  21. 21

    ソートされた検索、ターゲット値未満の数をカウント

ホットタグ

アーカイブ