如何使用bs4 / python从Wikipedia网站获取txt文件中单词的搜索结果?

信息农民

我在维基百科页面上搜索了“ Eudicots”一词。搜索URL显示262个标题我该如何在txt文件中写标题。BeautifulSoup4 / python有可能吗?如何 ?

宏杰李
import requests, bs4

url = 'https://ta.wikipedia.org/w/index.php?title=specal:Search&limit=500&offset=0&profile=default&search=Eudicots&searchToken=doo0wuq364b1m60hlcb894gt6'
r = requests.get(url)
soup = bs4.BeautifulSoup(r.text, 'lxml')

t_tags = soup.find_all('div', class_="mw-search-result-heading")
with open('a.txt', 'w') as f:
    for t in t_tags:
        print(t.text, file=f)

出去:

இருவித்திலைத் தாவரம் 
கழுதைப்பிட்டி-மூலிகை 
ஃபபேசியே பூக்குடும்பத்தின் பேரினங்கள் பட்டியல் 
வில்வம் 
பாலை (மரம்) 
சந்தனம் 
ஆத்தி 
தோடம்பழம் 
வேம்பு 
நெல்லி 
செங்கொடுவேரி 
கரந்தை 

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何使用bs4正确打印Google搜索结果?

如何使用bs4从网站获取表数据

如何使用bs4在p标签中获取文本

如何使爬虫使用bs4抓取网站

如何使用python bs4获取Wikipedia表中的第一列值?

如何使用BS4获取HTML正文的特定部分

如何使用 Python 拆分 Javascript 代码 (bs4)

Python-如何使用bs4抓取JavaScript代码?

Python - 如何在 bs4 中使用 select()

如何从Wikimedia BS4获取作者

使用BS4获取值

如何使用bs4在python中抓取单页应用程序网站

使用python进行bs4过滤

使用 bs4 解析 Python

如何从beautifulsoap中的bs4结果集中获取价值?

如何使用 bs4 在 python 中获取带连字符的标签值?

使用python bs4时如何从嵌套标签中获取信息?

如何在bs4中使用以下分页方式抓取网站?

如何使用python和bs4读取和覆盖文件夹中的所有* .txt文件?

如何使用 bs4 在 <font> 中获取 <td> 中的文本?

如何在 python bs4 中使用 xpath 获取字符串?

如何在 python bs4 中使用 xpath 获取字符串?

如何使用bs4或lxml获取在Python中找到XML标签的文本行?

如何使用 bs4 从 html 中获取银行名称、小细节和公司评分?

使用bs4搜索<span>时得到空结果

如何使用python使用bs4进行网络抓取和访问<script>

如何在 Python 上使用 bs4/selenium 从解析代码中创建 Pandas DataFrame?

如何使用BeautifulSoup bs4获取HTML标签的内部文本值?

BS4如何在不使用.text的情况下获取文本?