无法使用 BeautifulSoup 从网站上抓取所有数据

K-镇

我正在尝试从该网站抓取数据,但无法从以下行获取此特定信息:

"p class="mt-3 pt-2 mb-0 rs-rel-085"": "6,10 % aller Aktien sind besser bewertet.

(英文:“6.1% 的股票评级更高。”)

我的代码适用于其余部分:

from bs4 import BeautifulSoup as soup
from urllib.request import Request, urlopen

# Set up scraper
url = (f"https://aktie.traderfox.com/visualizations/US30303M1027/DI/facebook-inc")
req = Request(url, headers={'User-Agent': 'Mozilla/5.0'})
webpage = urlopen(req).read()
html = soup(webpage, "html.parser")

#find company name
name_1 = html.find("span",attrs={"class":"h1 m-0"})
name = name_1.text.strip()

#Ticker+WKN+ISIN
WKN_1 = html.find("span",attrs={"class":"color-grey2 d-lg-none"})
WKN = WKN_1.text.strip().replace("[","").replace("]","")

#enterprise value
value_2 = html.find("div",attrs={"class":"col-5 col-lg-auto d-lg-table-cell align-top text-nowrap"})
value_1 = value_2.find("td")
enterprise_value = value_1.text.strip()

#P/E, P/S, div. yield
fin_all = html.find_all("span",attrs={"class":"d-block d-sm-inline d-lg-block fs-rel-110"})
fin_pe = fin_all[0]
PE = fin_pe.text.strip()
fin_ps = fin_all[1]
PS = fin_ps.text.strip()
fin_div20 = fin_all[2]
div20 = fin_div20.text.strip()
fin_div19 = fin_all[3]
div19 = fin_div19.text.strip()

#Performance since year X and avg. return
perf3 = html.find_all("div",attrs={"class":"col-auto py-2 fs-080 color-grey2"})
perf2 = perf3[0]
perf1 = perf3[1]
perf_h = perf2.text.strip()
perf_d = perf1.text.strip()
perf_1 = html.find_all("div",attrs={"class":"col-auto py-2 fs-125 fs-lg-110 fs-xl-125"})
perf_2 = perf_1[0]
perf_hist = perf_2.text.strip()
perf_4 = perf_1[1]
perf_avg = perf_4.text.strip()
perf_year = perf_h[23:27]

print(name)
print(WKN)
print(enterprise_value)
print(PE,PS, div20, div19)
print(perf_year, perf_hist, perf_avg)
马丁·埃文斯

5,95是从经由单独的JSON请求得到的百分比的分数计算。该值计算如下100 - (100 * score)

from bs4 import BeautifulSoup
from urllib.request import Request, urlopen
from urllib import parse
import json

# Set up scraper
url = (f"https://aktie.traderfox.com/visualizations/US30303M1027/DI/facebook-inc")
req = Request(url, headers={'User-Agent': 'Mozilla/5.0'})
webpage = urlopen(req).read()
soup = BeautifulSoup(webpage, "html.parser")

# << Your code here to get other items >>

# Locate the stock ID and request the JSON data for it
stock_id = soup.find('span', attrs={"data-id" : True})['data-id']
data = parse.urlencode({"stock_id" : stock_id}).encode()
req_fa =  Request("https://aktie.traderfox.com/ajax/getFactorAnalysis.php", data=data)
json_data = json.loads(urlopen(req_fa).read())

umsatzwachstum_growth = 100 - (100 * json_data["data"]["scores"]["salesgrowth5"]["score"])
eps_growth = 100 - (100 * json_data["data"]["scores"]["epsgrowth5"]["score"])
print(f"{umsatzwachstum_growth:.2f}, {eps_growth:.2f}")

这会给你:

5.95, 3.55

我建议您打印出来json_data以更好地理解返回数据的格式。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

需要使用xpath和beautifulsoup从网站抓取数据

如何使用BeautifulSoup从网站上获取所有标头?

删除网站以使用BeautifulSoup下载网站上的所有文档会引发IOError

无法使用BeautifulSoup4抓取网站

Python脚本,使用BeautifulSoup将网站上的所有图像下载到指定的文件夹

无法使用网站上的BeautifulSoup剪贴表数据

无法使用BeautifulSoup抓取嵌套标签

如何使用beautifulsoup获取所有数据?

我无法使用BeautifulSoup抓取HTML文本

抓取网站时BeautifulSoup无法显示所有数据

beautifulsoup无法获取所有数据

如何使用Beautifulsoup从网站上抓取产品价格?

BeautifulSoup不会抓取所有数据

如何使用BeautifulSoup从eCom网站上抓取<li>?

使用BeautifulSoup抓取特定网站

如何使用python中的BeautifulSoup库从具有“查看更多”选项的网站上抓取数据

使用 BeautifulSoup 从网站抓取数据的问题

无法使用beautifulsoup抓取日本网站

无法抓取所有数据

无法使用美丽的汤抓取所有数据

使用 BeautifulSoup 抓取数据

我正在使用 beautifulsoup 抓取数据,但我没有获得所有数据

无法使用beautifulsoup抓取div文本

无法使用 BeautifulSoup 抓取特定表格

使用 python 抓取网站 - BeautifulSoup

无法使用 Beautifulsoup 正确抓取 <strong> 标签

使用 BeautifulSoup 或 Selenium 抓取网站时找不到数据

无法使用 Selenium 和 BeautifulSoup 抓取文本

不使用beautifulsoup抓取网站数据