web

웹 스크래핑(웹 크롤링) : 라이브러리를 활용해 내려받은 html 에서 내가 원하는 정보 솎아내는 것 import requests from bs4 import BeautifulSoup headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'} data = requests.get('https://movie.naver.com/movie/sdb/rank/rmovie.nhn?sel=pnt&date=20200303',headers=headers) # requests로 불러온 html 정보를 soup 변수에 담기 soup..
1. 웹의 동작 개념 html을 받는 경우 우리가 보는 웹페이지는 브라우저가 서버에 요청한 html 파일을 받아 그려주는 것 서버가 만든 API라는 창구에 미리 정해진 약속대로 요청을 보냄 예) https://naver.com/ 은 "naver.com"이라는 서버에 "/" 창구에 요청을 보낸 것 데이터만 받는 경우 html 말고 데이터만 전송받기도 한다 데이터만 내려받은 경우, JSON 형식으로 2. html 기초 개념 1) html: 크게 head와 body, 태그로 이루어짐 head는 페이지 속성정보, body는 페이지 내용 나는 구역을 나누죠 나는 문단이에요 bullet point!1 bullet point!2 h1은 제목을 나타내는 태그입니다. 페이지마다 하나씩 꼭 써주는 게 좋아요. 그래야 구글..