HTML 태그에서 속성을 가져 오는 정규식

크리슈나 쿠마르 :

Java에서 다음 HTML 코드 조각에서 src (대소 문자 구분 안 함) 태그를 얻을 수있는 정규식을 찾고 있습니다.

<html><img src="kk.gif" alt="text"/></html>
<html><img src='kk.gif' alt="text"/></html>
<html><img src = "kk.gif" alt="text"/></html>
DMI :

한 가지 가능성 :

String imgRegex = "<img[^>]+src\\s*=\\s*['\"]([^'\"]+)['\"][^>]*>";

가능성이 있습니다 (대소 문자를 구분하지 않고 일치하는 경우). 약간 엉망이고 따옴표가 사용되지 않는 경우를 의도적으로 무시합니다. 문자열 이스케이프에 대해 걱정하지 않고 표현하려면 :

<img[^>]+src\s*=\s*['"]([^'"]+)['"][^>]*>

다음과 일치합니다.

  • <img
  • 그렇지 않은 하나 이상의 문자 >(예 : 가능한 다른 속성)
  • src
  • 선택적 공백
  • =
  • 선택적 공백
  • '또는의 시작 구분자"
  • 이미지 소스 (작은 따옴표 또는 큰 따옴표를 포함 할 수 없음)
  • 끝 구분자
  • 식은 여기서 멈출 수 있지만 다음을 추가했습니다.
    • 그렇지 않은 0 개 이상의 문자 >(가능한 더 많은 속성)
    • > 태그를 닫으려면

참고할 사항 :

  • 포함 src=하려면 여는 괄호를 왼쪽으로 더 이동하십시오 :-)
  • 이 구분없이 구분 밸런싱 또는 속성 값에 대해 상관하지 않는다, 또한 (예 : 포함 속성과 심하게 형성 특성에 질식 할 수 있습니다 >포함하거나 이미지 소스 '또는 ").
  • 이와 같은 정규식으로 HTML을 구문 분석하는 것은 사소한 일이 아니며 기껏해야 대부분의 경우에 작동하는 빠른 해킹입니다.

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

HTML 태그에서 동적 값을 가져 오는 정규식

문자열에서 YouTube URL을 가져 오는 정규식

하나의 일반 정규식에서 여러 캡처 그룹을 가져 오는 정규식

텍스트에서 href 속성 데이터를 가져 오는 Javascript 정규식

자바 스크립트 용 정규식을 사용하여 문자열에서 HTML 태그를 가져 오는 방법

정규식 HTML 태그 사이에 텍스트 가져 오기-PHP

SQL에서 값을 가져 오는 정규식

문자 뒤에 특정 패턴을 가져 오는 정규식

HTML 코드의 img 태그에서 파일 이름을 가져 오는 정규식

특정 단어 뒤에 값을 가져 오는 정규식

정규식을 사용하여 HTML에서 태그 속성 추출

텍스트에서 LastName / FirstName을 가져 오는 정규식

스타일에서만 "왼쪽"을 가져 오는 정규식

정규식 (.NET) : 중간에 그룹을 가져 오는 방법

HTML 태그 정규식 패턴 가져 오기에 대해 혼란 스러움

HTML 태그 콘텐츠에서 공백을 무시하는 정규식

C #에서 html 태그의 내용을 가져 오는 방법

정규식이있는 태그에 고유 한 HTML 속성이 없습니다.

HTML 문자열에서 정규식으로 스타일 속성 가져 오기

HTML 태그에서 속성 값을 가져 오는 방법

URL에서 파일 유형을 가져 오는 정규식

기사에서 html 태그가없는 문장을 찾는 정규식을 사용하고 해당 문장은 html 단락 태그로 래핑됩니다.

콘텐츠에서 배열을 가져 오는 정규식?

html select 태그의 모든 값을 가져 오는 정규식

이 HTML에서 "Configuración de clientes"를 가져 오는 정규식

xml 태그 내에서 쉼표를 가져오는 정규식

html 태그 사이에 문자열을 가져오는 정규식: 닫는 태그의 첫 번째 일치에서 선택 중지

정규식(Regex): 여러 줄 html 태그에서 누락된 속성을 찾는 방법

HTML JavaScript 태그에서 주석을 찾는 정규식