如何使用Pywikibot获取Wiki页面的HTML？

Aubrey 发表于 Dev

奥布里

我正在使用pywikibot-core，并且在另一个Python MediaWiki API包装器之前使用了Wikipedia.py（具有.HTML方法）。我切换到pywikibot-core，因为我认为它具有更多功能，但是我找不到类似的方法。（请注意：我不是很熟练）。

奥布里

我将在这里发布user283120第二个答案，比第一个答案更精确：

Pywikibot核心不支持任何直接（HTML）与Wiki交互的方式，因此您应该使用API。如果需要，可以使用urllib2轻松完成。

这是我用来获取Wiki页面HTML共同点的示例： import urllib2 ... url = "https://commons.wikimedia.org/wiki/" + page.title().replace(" ","_") html = urllib2.urlopen(url).read().decode('utf-8')

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-10-27

我来说两句

0 条评论

登录后参与评论

上一篇：使用Android检测用户活动（跑步，骑自行车，开车）

Azure Devops-如何使用Rest API获取Wiki页面的发布信息

如何使用Scrapy和Splash获取动态页面的html？

如何使用JavaScript获取HTML页面的标题？

如何使用pyWikiBot创建和/或编辑页面

使用GitHub API获取呈现的html Wiki页面

OS X Server Wiki-如何获取一个Wiki页面的内容以显示在另一个Wiki页面上

如何使用python或php获取带有已加载的html页面的嵌套标签？

使用 Sapper，如何在 template.html 中获取当前页面的 slug

如何使用Javascript从HTML页面的<SCRIPT>标记中获取特定数据

如何使用PHP函数获取以HTML页面的{$开头的所有单词

如何获取Javascript中的html页面的名称？

如何在Android中获取动态页面的html？

Framework7：如何获取所有页面的 HTML？

如何获取QWebEngineView中加载的页面的html

如何找到链接到特定Wiki页面的所有Wiki页面？

使用 powershell 更新 Sharepoint wiki 页面的 aspx

如何获取和使用当前页面的URL

如何使用壁虎获取当前页面的URL？

页面的 <title> 正在改变。如何使用 XPath 获取它？

如何使用PHP获取当前页面的完整URL

如何使用GridView在滚动页面的末尾获取刷新信号

如何获取Facebook页面的页面ID

如何使用Nokogiri解析页面的HTML内容

如何使用.css在每个.html页面的末尾添加地址？

如何使用sed打印html页面的正文内容

如何获取php页面以接收来自html页面的ajax帖子

获取当前页面的HTML

Flutter：获取HTML页面的某些元素

有没有办法在 pywikibot 替换命令中使用变量“当前页面的标题”？

TOP 榜单

文章

如何使用Pywikibot获取Wiki页面的HTML？

如何使用Pywikibot获取Wiki页面的HTML？

Android Studio Kotlin：提取为常量

IE 11中的FormData未定义

计算数据帧R中的字符串频率

如何在R中转置数据

如何使用Redux-Toolkit重置Redux Store

Excel 2016图表将增长与4个参数进行比较

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

未捕获的SyntaxError：带有Ajax帖子的意外令牌u

OpenCv：改变 putText() 的位置

ActiveModelSerializer仅显示关联的ID

算术中的c ++常量类型转换

如何开始为Ubuntu开发

将加号/减号添加到jQuery菜单

去噪自动编码器和常规自动编码器有什么区别？

获取并汇总所有关联的数据

OpenGL纹理格式的颜色错误

在 React Native Expo 中使用 react-redux 更改另一个键的值

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

TreeMap中的自定义排序

Redux动作正常，但减速器无效

如何对treeView的子节点进行排序