반응형

paginate 2

파이썬 재귀함수로 블로그 paginate url 추출 if문 탈출구가 하이라이트

오늘은 정적 html 블로그에서 다음 url로 넘어가며블로그의 게시글 url들을 추출하는 작업을 계속반복하는 재귀함수를 파이썬으로 구현해보겠습니다.  실무로 배우는 파이썬 BeautifulSoup 모듈로 파싱한 블로그 html의 paginate anchor 링크들 리스트로 출력오늘은 파이썬으로 정적 html 타입의 네이버블로그의게시물들을 모두 scrap해오기 위해 BeautifulSoup모듈에 대해 배우고, html을 파싱 후 개발자 도구로필요한 부분을 뽑아 링크를 scrap까지 해보겠습s-dobby.tistory.com 이전 게시글에서 BeautifulSoup으로 블로그url의html을 다루기(먹기) 좋은 soup형태로 만들고그 안에서 책갈피인 paginate를 찾아 1~10까지페이지들의 링크(a_hr..

실무로 배우는 파이썬 BeautifulSoup 모듈로 파싱한 블로그 html의 paginate anchor 링크들 리스트로 출력하기

오늘은 파이썬으로 정적 html 타입의 네이버블로그의게시물들을 모두 scrap해오기 위해 BeautifulSoup모듈에 대해 배우고, html을 파싱 후 개발자 도구로필요한 부분을 뽑아 링크를 scrap까지 해보겠습니다.  네이버블로그 모든 게시글 url 추출해 사이트맵 만들기 정적,동적 html 확인 방법파이썬을 이용한 html을 공부 중입니다.역시 필요한게 생겼을때 목표를 세우고실무로 바로 들어가며 배우는게 재밌습니다. 목표는 지금까지 네이버 블로그에 작성한모든 게시글의 url을 전부 추s-dobby.tistory.com 블로그의 html이 정적인지 동적인지는 위 게시글 참고 정적 HTML의 경우 BeautifulSoup(이하 bsp)이란모듈만 쓰면 되서 코드 짜기는 아주 쉬운 편입니다.(재귀만 좀 ..

반응형