반응형 파이썬자동화1 파이썬 웹크롤링 기초 본 포스팅에서는 파이썬으로 따라할 수 있는 웹 크롤링 방법을 소개한다. 목차는 아래와 같다. BeautifulSoup 시작하기 태그(Tag) 탐색하기 웹사이트 구조 분석하기 (개발자 도구) find_all을 통해 원하는 부분 가져오기 CSS 선택자를 통해 원하는 부분 가져오기 텍스트만 읽어오기 들어가기에 앞서 일단 웹 사이트라는 걸 이해해야 한다. 기본적으로 웹사이트는 문서다. HTML이라는 형식으로 쓰여진 문서. 그래서 우리는 HTML 문서에 담긴 내용을 가져 오도록 request(요청) 해야 한다. 파이썬에는 애초에 requests라는 라이브러리로 편리하게 사용이 가능하다. (만약 설치가 안 되어 있다면 pip를 통해 설치하고 사용하자.) 이제 아래와 같이 requests.get()안에 url을 넣어.. 2022. 6. 14. 이전 1 다음 반응형