使用BeautifulSoup从html解析表并将其另存为csv时出现问题

Dawn17 发表于 Dev

54

黎明17

import requests
import csv
import requests
from bs4 import BeautifulSoup

r = requests.get('https://pqt.cbp.gov/report/YYZ_1/12-01-2017')
soup = BeautifulSoup(r)
table = soup.find('table', attrs={ "class" : "table-horizontal-line"})
headers = [header.text for header in table.find_all('th')]
rows = []
for row in table.find_all('tr'):
    rows.append([val.text.encode('utf8') for val in row.find_all('td')])

with open('output_file.csv', 'wb') as f:
    writer = csv.writer(f)
    writer.writerow(headers)
    writer.writerows(row for row in rows if row)

我正在尝试解析此特定网页中的所有表数据：https : //pqt.cbp.gov/report/YYZ_1/12-01-2017

我在一行中出错soup = BeautifulSoup(r)。我得到一个错误TypeError: object of type 'Response' has no len()。我也不确定我的逻辑是否正确。请帮我粘贴表格数据。

QHarr

我会这样

import pandas as pd
result = pd.read_html("https://pqt.cbp.gov/report/YYZ_1/12-01-2017")
df = result[0]
# df = df.drop(labels='Unnamed: 8', axis=1)
df.to_csv(r'C:\Users\User\Desktop\Data.csv', sep=',', encoding='utf-8',index = False )

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-12-18

我来说两句

0 条评论

登录后参与评论

上一篇：在Visual Studio中的正则表达式无法找到并替换

相关文章

在for循环中设置表并将其另存为csv

将大矩阵另存为.csv文件时出现问题“”

使用@OneToOne批注保存外键时出现问题。另存为空

另存为==> Csv时在Excel中出现怪异问题

将numpy数组另存为图像时出现问题

如何使用Excel VBA打开.csv并将其另存为.xlsx

如何使用OpenOffice打开Excel文件并将其另存为CSV

使用HTML5捕获签名并将其另存为图像到数据库

使用jsoup解析HTML表时出现问题

为什么下载html并将其另存为硬盘上的文件时，html文件的内容与查看源的内容不同？

如何使用反射从已编译的程序集中随机生成短语/问题/值并将其另存为数据集？

如何将其转换为数据框并将其另存为 csv？

使用熊猫将数日长的数据框拆分为半小时的数据框，并将其另存为csv文件

尝试将XLSM另存为CSV时出现“对象_workbook的方法另存为失败”错误

Powershell问题进行比较并将其另存为文本文件

Python文本解析并另存为html

我如何从TradingView图表中获取数据并将其另存为CSV文件？

Shell脚本从文件列表中提取数据并将其另存为csv

Python：遍历 .csv 的 url 并将其另存为另一列

在Matlab中创建表并将其另存为.mat文件

复制工作表中的范围并将其粘贴并另存为新的用户指定文件

打开 HTML 文件并将其另存为字符串变量的最简单方法

捕获布局并将其另存为图像

OSX-使用Swift加载图像并将其另存为较小的png文件

结合使用UIImageView和UIView并将其另存为Image

Python：读取csv文件并将列另存为变量

创建表并将其填充到 HANA RODBC R 时出现问题

使用pd.read_csv（）读取多个文件，并将每个文件另存为不同的变量

循环遍历 excel 文件中的工作表并另存为 csv 文件的问题

TOP 榜单

文章

热门标签

归档