본문 바로가기

Python/Python Basics

(3)
python에서 리스트 복사 및 같은 주소 참조 list1=[1,2,3,4,5] # list2는 list1이 가리키는 list와 동일한 주소 list2=list1 # 아래 두 줄은 동일한 id를 출력함 print("list1 id :", id(list1)) print("list2 id :", id(list2)) ################################# # list2는 list1을 바탕으로 slicing을 통해 복사된 # list1과 똑같이 생겼지만, 또다른 list인 녀석을 # 가리킨다. list2=list1[:] # 아래 두 줄은 다른 id를 출력함 # 지금의 list1과 위에서의 list1은? - 동일 print("list1 id :", id(list1)) print("list2 id :", id(list2)) # 마찬가지로 l..
파이썬 웹 크롤링 마스터하기-1 requests 모듈, HTTP Request란? * HTTP Request란? : HTTP는 Hyper Text Transfer Protocol의 줄임말입니다. 즉 Hyper Text 형식으로 주고 받는 Protocol이다. Transfer Protocol은 한국어로 통신 규약이라고 할 수 있는데, 이 또한 무슨 소리인지 잘 이해가 안 될 거예요. 쉽게 말하면 그냥 주고 받는 형식이나 양식이라고 보시면 됩니다. 예를 들자면, 어떤 통신 규약의 이름이 "편지 프로토콜"이고 이 프로토콜은 "수신자", "내용", "발신인" 등등을 기본적으로 갖고 있다고한다면, 이 프로토콜로 주고받는 데이터는 모두 저 내용을 갖고 있는 겁니다. HTML 을 예로 들면 body, head, method 등을 갖겠네요. 가장 빠르고 간편하게 HTTP Request를 확인하는 법..
파이썬 웹 크롤링 마스터하기 계획 1. requests module과 간단한 HTTP Request 개념 2. requests 모듈과 BeautifulSoup 모듈의 사용법과 예제 3. requests 모듈과 BeautifulSoup 모듈을 이용해 가져온 데이터를 저장 및 시각화하기. (json, matplotlib, pandas 등등) 4. form 제출 없이 데이터 가져오기 5. REST API 이용해 데이터 가져오기 5. headless chrome 모듈인 pyppeteer을 이용해 데이터 가져오기