如何使用Pywikibot获取Wiki页面的HTML?

奥布里

我正在使用pywikibot-core,并且在另一个Python MediaWiki API包装器之前使用了Wikipedia.py(具有.HTML方法)。我切换到pywikibot-core,因为我认为它具有更多功能,但是我找不到类似的方法。(请注意:我不是很熟练)。

奥布里

我将在这里发布user283120第二个答案,比第一个答案更精确:

Pywikibot核心不支持任何直接(HTML)与Wiki交互的方式,因此您应该使用API​​。如果需要,可以使用urllib2轻松完成。

这是我用来获取Wiki页面HTML共同点的示例: import urllib2 ... url = "https://commons.wikimedia.org/wiki/" + page.title().replace(" ","_") html = urllib2.urlopen(url).read().decode('utf-8')

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

Azure Devops-如何使用Rest API获取Wiki页面的发布信息

如何使用Scrapy和Splash获取动态页面的html?

如何使用JavaScript获取HTML页面的标题?

如何使用pyWikiBot创建和/或编辑页面

使用GitHub API获取呈现的html Wiki页面

OS X Server Wiki-如何获取一个Wiki页面的内容以显示在另一个Wiki页面上

如何使用python或php获取带有已加载的html页面的嵌套标签?

使用 Sapper,如何在 template.html 中获取当前页面的 slug

如何使用Javascript从HTML页面的<SCRIPT>标记中获取特定数据

如何使用PHP函数获取以HTML页面的{$开头的所有单词

如何获取Javascript中的html页面的名称?

如何在Android中获取动态页面的html?

Framework7:如何获取所有页面的 HTML?

如何获取QWebEngineView中加载的页面的html

如何找到链接到特定Wiki页面的所有Wiki页面?

使用 powershell 更新 Sharepoint wiki 页面的 aspx

如何获取和使用当前页面的URL

如何使用壁虎获取当前页面的URL?

页面的 <title> 正在改变。如何使用 XPath 获取它?

如何使用PHP获取当前页面的完整URL

如何使用GridView在滚动页面的末尾获取刷新信号

如何获取Facebook页面的页面ID

如何使用Nokogiri解析页面的HTML内容

如何使用.css在每个.html页面的末尾添加地址?

如何使用sed打印html页面的正文内容

如何获取php页面以接收来自html页面的ajax帖子

获取当前页面的HTML

Flutter:获取HTML页面的某些元素

有没有办法在 pywikibot 替换命令中使用变量“当前页面的标题”?