반응형

안녕하세요, 츄르 사려고 코딩하는 집사! 코집사입니다.


1. 퍼머링크의 정의

2. 파이썬 퍼머 링크 목록 추출하기

3. 파이썬 다음 뉴스 웹 크롤링하기

4. 파이썬 셀레늄(Selenium)을 이용한 크롤링하기


퍼머링크란?


1. 퍼머링크

> 인터넷에서 특정 페이지에 영구적으로 할당된 URL 주소

> 블로그 각각의 글에 영원히 고정된 주소를 제공하는 것

> 게시한 글의 링크를 타고 들어갔는데, 게시한 글이 아닌 메인 화면이 나오는 경우를 대비하여 만든 것이 퍼머링크

> 게시한 글의 링크가 게시한 글로 접속을 할 수 있는 주소를 말한다.

> 예를 들어, tistory에서 https://yongku.tistory.com/1025 처럼 뒤의 숫자가 블로그의 글을 고정시켜주는 것처럼 말이다.


파이썬 퍼머 링크 목록 추출하기


yongku.tistory.com/entry/%ED%8C%8C%EC%9D%B4%EC%8D%AC-%ED%8D%BC%EB%A8%B8-%EB%A7%81%ED%81%AC-%EB%AA%A9%EB%A1%9D-%EC%B6%94%EC%B6%9C%ED%95%98%EA%B8%B0

 

파이썬 퍼머 링크 목록 추출하기

파이썬 퍼머 링크 목록 추출하기 1. 목록 추출 단계 1) Requests로 웹페이지 추출 2) lxml로 웹 페이지 스크래핑 3) sqlite3 DB에 데이터 저장 import requests import lxml.html response = requests.get('h..

yongku.tistory.com


파이썬 다음 뉴스 웹 크롤링하기


yongku.tistory.com/entry/%ED%8C%8C%EC%9D%B4%EC%8D%AC-%EB%8B%A4%EC%9D%8C-%EB%89%B4%EC%8A%A4-%EC%9B%B9-%ED%81%AC%EB%A1%A4%EB%A7%81%ED%95%98%EA%B8%B0

 

파이썬 다음 뉴스 웹 크롤링하기

파이썬 다음 뉴스 웹 크롤링하기 import requests import lxml.html REG_DATE = '20200819' response = requests.get('https://news.daum.net/breakingnews/digital?regDate={}'.format(REG_DATE)) root = lx..

yongku.tistory.com


파이썬 셀레늄(Selenium)을 이용한 크롤링하기


yongku.tistory.com/entry/%ED%8C%8C%EC%9D%B4%EC%8D%AC-%EC%85%80%EB%A0%88%EB%8A%84Selenium%EC%9D%84-%EC%9D%B4%EC%9A%A9%ED%95%9C-%ED%81%AC%EB%A1%A4%EB%A7%81%ED%95%98%EA%B8%B0

 

파이썬 셀레늄(Selenium)을 이용한 크롤링하기

파이썬 셀레늄(Selenium)을 이용한 크롤링하기 1. 셀레늄(Selenium) 설치하기 1) anaconda prompt에서 pip install selenium 명령어를 입력하여 설치하기 2) 크롬 브라우저 버전 확인하기 > [메뉴] - [도움말..

yongku.tistory.com

 

 

 

 

 

 

 

 

반응형

'자기개발 > TIL' 카테고리의 다른 글

TIL(Today I Learned) 20200907  (0) 2020.09.07
TIL(Today I Learned) 20200905 - 20200906  (0) 2020.09.06
TIL(Today I Learned) 20200904  (0) 2020.09.04
TIL(Today I Learned) 20200903  (0) 2020.09.03
TIL(Today I Learned) 20200901  (0) 2020.09.01
TIL(Today I Learned) 20200831  (0) 2020.08.31
TIL(Today I Learned) 20200830  (0) 2020.08.30
TIL(Today I Learned) 20200829  (0) 2020.08.30
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기