'useragent'에 해당되는 글 1건

2021.02.07 [파이썬 증권 데이터 분석] 4. 웹 스크레이핑을 사용한 데이터 분석 191p 3

[파이썬 증권 데이터 분석] 4. 웹 스크레이핑을 사용한 데이터 분석 191p

책들 2021. 2. 7. 14:52

녹화한 실습 동영상을 보니 꽤 플레이 타임이 길다.
오래 걸린 이유는 고질병인 '오타'!
그리고 그리고 '유저 에이전트'

'유저 에이전트' 정보 없이 웹페이지를 읽을 경우
원하는 데이터를 얻을 수 없다.

import pandas as pd
import urllib.request as urllib

sise_url = 'https://finance.naver.com/item/sise_day.nhn?code=068270'

opener = urllib.build_opener()
opener.addheaders = [("User-Agent" , "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.104 Safari/537.36")]

df = pd.DataFrame()
last_page = 385

print('wait......')
for page in range(1, int(last_page) + 1):
    print('.', end = '')
    page_url = '{}&page={}'.format(sise_url, page)
    df = df.append(pd.read_html(opener.open(page_url), header = 0)[0])

df = df.dropna()

셀트리온 데이터를 읽어 오는 코드다. 책에 있는 내용에
'유저 에이전트' 부분을 추가한 코드.

크롬 개발자 모드 콘솔에서 'navigator.userAgent'로 확인

실습 동영상

Web Scraping 관련 동영상 자료 - 한 번쯤 보면 좋은 동영상

CHAPTER 4 웹 스크레이핑을 사용한 데이터 분석
4.1 팬더스로 상장법인 목록 읽기
4.1.1 엑셀 파일 내용 확인하기
4.1.2 read_html() 함수로 파일 읽기

4.2 HTML 익히기 ....
4.2.1 HTML 기본 구조
4.2.2 HTML 주요 태그
4.2.3 HTML 예시 ...

4.3 웹에서 일별 시세 구하기
4.3.1 네이버 금융 일별 시세 분석하기
4.3.2 소스 코드에서 링크 주소 검색하기

4.4 뷰티풀 수프로 일별 시세 읽어오기
4.4.1 파서별 장단점
4.4.2 find_al() 함수와 find() 함수 비교
4.4.3 맨 뒤 페이지 숫자 구하기
4.4.4 전체 페이지 읽어오기

이전글 - 2021/02/02 - [책들] - 파이썬 증권 데이터 분석 3.6 회귀 분석과 상관관계 ~ 171p

이후글 - 2021/02/07 - [책들] - [파이썬 증권 데이터 분석] 4.5 OHLC 캔들 차트 203p

저작자표시 (새창열림)

'책들' 카테고리의 다른 글

[홍마리오의 워드프레스 입문 + 실전(종합편)] 워드프레스 설치하기(in cafe24.com) ~ 86p (0)	2021.02.07
[파이썬 증권 데이터 분석] 4.5 OHLC 캔들 차트 203p (2)	2021.02.07
[파이썬 증권 데이터 분석] 3.6 회귀 분석과 상관관계 ~ 171p (0)	2021.02.02
[파이썬 증권 데이터 분석] 3.4 주식비교하기 ~ 153p (0)	2021.02.01
[파이썬 증권 데이터 분석] Numpy, Pandas, Matplotlib ~ 142p (0)	2021.01.31

두리뭉실2:해피파인더그룹

레고가 좋고~ PBL 매력에 빠졌으며~ 취미로 개발하는 두리둥실

'useragent'에 해당되는 글 1건

[파이썬 증권 데이터 분석] 4. 웹 스크레이핑을 사용한 데이터 분석 191p

'책들' 카테고리의 다른 글

공지사항

카테고리

태그목록

글 보관함

달력

링크

두리뭉실2:해피파인더그룹

LATEST FROM OUR BLOG

LATEST COMMENTS

BLOG VISITORS

티스토리툴바

« 2026/07 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31