¿Cómo rastrear como recuentos de comentarios en videos de youtube?

Déjame dormir

Estoy tratando de hacer un corpus de comentarios en cierto video de youtube con selenium y BeautifulSoup. (No estoy tratando de usar la API de datos de Youtube, debido al límite).

y casi lo hago, pero podría haber obtenido el resultado con solo comentarios e identificadores ...

Revisé el espacio que contiene la información de recuentos similares y luego lo ingresé en mi código, de todos modos va bien, pero no recupera el resultado, no me da nada ... no sé por qué ... ..

import time
from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
import pandas as pd 
import re
from collections import Counter
from konlpy.tag import Twitter

options = webdriver.ChromeOptions()
options.add_experimental_option('excludeSwitches', ['enable-logging'])
driver = webdriver.Chrome(executable_path='C:\chrome\chromedriver_win32\chromedriver.exe', options=options)
url = 'https://www.youtube.com/watch?v=D4pxIxGdR_M&t=2s'
driver.get(url)
driver.implicitly_wait(10)

SCROLL_PAUSE_TIME = 3

# Get scroll height
last_height = driver.execute_script("return document.documentElement.scrollHeight")

while True:
    # Scroll down to bottom
    driver.execute_script("window.scrollTo(0, document.documentElement.scrollHeight);")

    # Wait to load page
    time.sleep(SCROLL_PAUSE_TIME)

    # Calculate new scroll height and compare with last scroll height
    new_height = driver.execute_script("return document.documentElement.scrollHeight")
    if new_height == last_height:
        break
    last_height = new_height

html_source = driver.page_source

driver.close()

soup = BeautifulSoup(html_source, 'lxml')

ids = soup.select('div#header-author > a > span')

comments = soup.select('div#content > yt-formatted-string#content-text')

likes = soup.select('ytd-comment-action-buttons-renderer#action-buttos > div#tollbar > span#vote-count-middle')

print('ID :', len(ids), 'Comments : ', len(comments), 'Likes : ' ,len(likes))

y 0 se acaba de imprimir ... he buscado algunas de las formas de lidiar con eso, pero la mayoría de las respuestas fueron solo para hacerme usar la API.

JM Arnold

En realidad, no usaría BeautifulSoup para la extracción, solo vaya con las herramientas de selenio integradas, es decir:

ids = driver.find_elements_by_xpath('//*[@id="author-text"]/span')
comments = driver.find_elements_by_xpath('//*[@id="content-text"]')
likes = driver.find_elements_by_xpath('//*[@id="vote-count-middle"]')

De esta manera, aún puede usarlos len()debido a que son iterables. También puede iterar sobre la variable likesy obtener el .textvalor para sumarlos:

total_likes = 0
for like in likes:
    total_likes += int(like.text)

Para obtener esto más pitónico, también podría ir con una lista de comprensión adecuada.

Este artículo se recopila de Internet, indique la fuente cuando se vuelva a imprimir.

En caso de infracción, por favor [email protected] Eliminar

Editado en2021-08-18

Déjame decir algunas palabras

0Comentarios

Iniciar sesiónRevisión de participación posterior

Anterior:Aritmética PHP usando variables

TOP Lista

Artículos

¿Cómo rastrear como recuentos de comentarios en videos de youtube?

¿Cómo rastrear como recuentos de comentarios en videos de youtube?

¿Cómo ocultar la aplicación web de los robots de búsqueda? (ASP.NET)

Ver todos los comentarios en un video de YouTube

Redis 세션 저장소와 함께 SpringSessionBackedSessionRegistry 사용

Kibana 4 , making pie chart , error message

OAuth 2.0 utilizando Spring Security + WSO2 Identity Server

uitableview delete button image in iOS

Pregunta de fórmula de desplazamiento y transposición de Excel / Google Sheets

Visual Studio 2012 Unit Test Report

Manera correcta de agregar referencias al proyecto C # de modo que sean compatibles con el control de versiones

선언되지 않은 유형 'MessagingDelegate'사용

Cómo extraer una palabra clave (cadena) de una columna en pandas dataframe en python

desbordamiento: oculto no funciona al hacer zoom en un iframe de YouTube usando transformar

Obtenga todos los comentarios y responda a los comentarios en un solo SQL

récupérer les noms de clés depuis Firebase react-native

Today Extension con UICollectionView comportamiento diferente en comparación con la aplicación de vista única

WPF pleine largeur DataGridColumn sur la largeur de DataGrid

ViewPager2 parpadea / recarga al deslizar

¿Cómo puedo hacer accesible la información de color en tablas HTML?

actualizar el contenido de la vista de reciclaje falla en la hoja inferior

Chartkick histogrammes plusieurs couleurs

¿Cómo formatear el valor mínimo y máximo de android-range-seek-bar?