Obtenga data-testid y atributos de html usando Beautifulsoup

smerllo Publicado en Dev

smerllo

Novato de Web-Dev aquí. así que por favor sé amable.

Encuentro esta etiqueta realmente extraña de analizar.

Considere el siguiente documento HTML:

import urllib3
from bs4 import BeautifulSoup

url = 'https://www.carrefourkuwait.com/mafkwt/en/Frozen-Food/c/FKWT6000000?currentPage=1&filter=&nextPageOffset=0&pageSize=60&sortBy=relevance'

req = urllib3.PoolManager()
res = req.request('GET', url)
soup = BeautifulSoup(res.data, 'html.parser')
soup

Estoy intentando obtener el nombre y el precio del producto. Pero el uso soup.findAll('div', {'data-testid': 'product_name'})no funciona.

El problema aquí es que el nombre y el precio del producto son atributos de un enlace en la <a\>etiqueta. Incluso con soup.findAll('a')no obtengo nada:[]

¿Podrías ayudarme con esto?

QHarr

Los datos se extraen dinámicamente de una etiqueta de secuencia de comandos. Como javascript no se ejecuta con solicitudes, esta información permanece dentro de la etiqueta del script y no está presente donde está buscando.

Puede regexizar la cadena que contiene la información relevante, analizar con json y crear un dictado de la siguiente manera:

import requests, re, json

r = requests.get('https://www.carrefourkuwait.com/mafkwt/en/Frozen-Food/c/FKWT6000000?currentPage=1&filter=&nextPageOffset=0&pageSize=60&sortBy=relevance',
                 headers = {'User-Agent':'Mozilla/5.0'})
data = json.loads(re.search(r'(\{"prop.*\})', r.text).group(1))
info = {i['name']:str(i['originalPrice'])+ ' '+ i['currency'] for i in data['props']['initialState']['search']['products']}

Este artículo se recopila de Internet, indique la fuente cuando se vuelva a imprimir.

En caso de infracción, por favor [email protected] Eliminar

Editado en2021-08-29

Déjame decir algunas palabras

0Comentarios

Iniciar sesiónRevisión de participación posterior

Anterior:PHP - ¿Por qué se ejecutan las funciones cuando se llama a un archivo de inclusión?

TOP Lista

Artículos

Obtenga data-testid y atributos de html usando Beautifulsoup

Obtenga data-testid y atributos de html usando Beautifulsoup

¿Cómo ocultar la aplicación web de los robots de búsqueda? (ASP.NET)

Redis 세션 저장소와 함께 SpringSessionBackedSessionRegistry 사용

Ver todos los comentarios en un video de YouTube

Modbus Python Schneider PM5300

OAuth 2.0 utilizando Spring Security + WSO2 Identity Server

¿Es una pila LAMJ un entorno posible?

Today Extension con UICollectionView comportamiento diferente en comparación con la aplicación de vista única

使用FailureFolicy将`gcloud beta functions deploy`命令转换为Deployment Manager模板

¿Cómo formatear el valor mínimo y máximo de android-range-seek-bar?

WPF pleine largeur DataGridColumn sur la largeur de DataGrid

Cómo utilizar HttpClient con cualquier certificado SSL, no importa lo "malo" que es

Visual Studio 2012 Unit Test Report

Autocompletar con Java, Redis, elástico de la búsqueda, Mongo

Typescript compiling and changing filenames to lowercase all the time (VS2015)

Obtenga todos los comentarios y responda a los comentarios en un solo SQL

ElasticSearch: error al obtener bloqueos de nodo

Kibana 4 , making pie chart , error message

récupérer les noms de clés depuis Firebase react-native

Vscode sin intellisense / autocompletado con múltiples proyectos

¿Cómo puedo hacer accesible la información de color en tablas HTML?

ViewPager2 parpadea / recarga al deslizar