파이썬으로 큰 html 파일에서 숫자를 추출하고 싶습니다. 내 생각은 다음과 같이 정규식을 사용하는 것이 었습니다.
import re
text = 'gfgfdAAA1234ZZZuijjk'
try:
found = re.search('AAA(.+?)ZZZ', text).group(1)
except AttributeError:
found = ''
found
그러나 불행히도 나는 정규식에 익숙하지 않으며이 예제를 다음에서 추출하는 데 실패합니다 0,54125
.
(...)<div class="vk_ans vk_bk">0,54125 count id</div>(...)
번호를 추출하는 다른 방법이 있습니까? 아니면 정규식으로 나를 도울 수 있습니까?
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다