如何从Ruby中的文本中提取img src内容

阿杰

我在Ruby中的变量中有以下字符串。

"<p><img alt=\"\" src=\"/ckeditor_assets/pictures/35/content_raw_lemon_cheesecake.jpg\" style=\"height:533px; width:800px\" /></p>\r\n"

我只想提取src内容,即:

"/ckeditor_assets/pictures/35/content_raw_lemon_cheesecake.jpg\" 

在Ruby中,如何从src属性中提取文本

蒂姆·彼得斯

在Ruby中使用html / xml解析器,Nokogiri是一个不错的选择。例子:

require 'nokogiri'
html = "<p><img alt=\"\" src=\"/ckeditor_assets/pictures/35/content_raw_lemon_cheesecake.jpg\" style=\"height:533px; width:800px\" /></p>\r\n"
doc = Nokogiri::HTML(html)
src = doc.xpath("//img")[0]['src']

在此示例中,使用xpath提取所有节点,选择第一个节点,然后将'src'属性作为字符串返回。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

从 XML 中的 cdata 文本中提取 img src

如何在ruby中的方括号中提取内容

如何从正文中获取<img src =>的内容

如何使用src中的内容打开newWindow?

如何在python中使用Selenium或请求提取<img src链接和其他内容?

如何从python中的文本文件中提取特定内容?

如何在Linux中从文本文件中提取任意标签并测量内容长度

如何从数组中的元素中提取所有 td 的文本内容?

如何在Java中提取网页文本内容?

如何从重复的文本模式中提取内容?

如何从 PDF 的内容中提取(十六进制编码)文本?

Google Adwords CSP(内容安全策略)img-src

内容安全策略:“ img-src'自身'数据:”

Img src值在更改动态内容时不会更改

從 HTML 圖像標籤 (img) 中的 source(src) 屬性中提取路徑

如何获取指定为<script>标记的'src'的文件的内容?

Observable.of对图像src中的管道不返回任何内容

Makefile错误,从src目录中的所有内容构建

如何从Java中的XSD AppInfo元素中提取内容

如何在flutter中从apiServices中提取准确的内容

删除img src url中两个单词之间的所有内容,并使用htaccess从新的src提供文件

从img中提取data-src和data-srcset

无法使用 BeautifulSoup 从“img”标签中提取 src 属性

内容安全策略-img-src中的data:image / svg + xml被忽略

正则表达式以匹配div中img src的内容

在 Javascript 中从 iFrame 中提取 SRC

Python/Selenium - 如何从模态淡入淡出内容中提取文本?

如何从网站中提取所需的内容?

如何从.ipa文件中提取内容(2018)