728x90
반응형

Python 4

[Python] BeautifulSoup로 웹 데이터 분석 with DART

오늘은 웹 데이터 분석을 위해 BeautifulSoup에 대해서 간단하게 알아보도록 하겠습니다. BeautifulSoup는 HTML 및 XML 데이터 분석을 위한 Python 라이브러리입니다. 지난번에 알아본 urllib 라이브러리와 함께 예제로 활용했던 DART를 활용해보겠습니다. 1. BeautifulSoup 설치 BeautifulSoup는 python.org의 Document의 라이브러리에서 확인할 수 없고 PyPI(Python Package Index)에서 확인할 수 있습니다. 관련 URL> pypi.org/project/beautifulsoup4/ anaconda를 사용할 경우 자동으로 설치되어 있지만 Python만을 설치한 경우 별도의 설치가 필요합니다. #ln1: easy_install을 이..

ITStudy/Python 2021.02.01

[Python] urllib로 웹 데이터 핸들링 with DART

오늘은 파이썬 라이브러리 중 웹 데이터를 핸들링 할 수 있는 urllib에 대해서 알아보고자 합니다. urllib 중 urllib.request 모듈과 urllib.parse 모듈을 사용하여 간단하게 웹 페이지에 데이터를 요청하고 저장해보도록 하겠습니다. 오늘 사용할 예는 금융감독원에서 운영하고 있는 전자공시시스템(DART; Data Analysis, Retrieval and Transfer System)의 RSS를 통해 사용해 보도록 하겠습니다. 1. RSS RSS는 Rich Site Summary의 줄임말로 사이트에 직접 방문할 필요없이 RSS 리더를 활용하여 최신 정보를 활용할 수 있도록 해주는 콘텐츠입니다. DART에서는 RSS 리더를 통해 최근공시 혹은 회사별 공시를 확인 할 수 있도록 정보를 ..

ITStudy/Python 2021.01.31

import와 from의 차이[Python]

Python 라이브러리 사용 시 import와 from의 차이를 알아보고자 합니다. Python 공부를 시작하면서 라이브러리를 사용하기위해서 import하거나 from을 통해 import하는 것을 보고 정리를 해보고자 합니다. urllib을 통해서 알아보겠습니다. urllib는 request / error / parse / robotparser 모듈로 구성됩니다. 일반적으로 우리가 urllib를 통해서 URL를 오픈하고 읽기 위해서 는 request 모듈을 사용합니다. 그렇다면 우리는 해당 모듈을 사용하기 위해서 import를 해야할 것입니다. 아래의 두 코드의 결과는 동일한 결과값을 출력할 수 있습니다. # import 사용 import urllib.request #전체 라이브러리를 사용할 때: imp..

ITStudy/Python 2021.01.29

아나콘다(Anaconda)/주피터 노트북(Jupyter notebook) 설치하기[Python]

파이썬을 편리하게 설치 및 활용할 수 있는 패키지를 설치하는 방법을 알아보도록 하겠습니다. 1. 아나콘다 설치 아나콘다 다운로드 URL: www.anaconda.com/products/individual# 해당 URL로 접속하여 하단으로 내려가면 OS 설치를 확인할 수 있습니다. Anaconda | Individual Edition Anaconda's open-source Individual Edition is the easiest way to perform Python/R data science and machine learning on a single machine. www.anaconda.com 1.1. 아나콘다 OS에 따른 선택 1.2. 아나콘다 설치 제가 설치한 2021년 1월은 2020년 11..

ITStudy/Python 2021.01.27
728x90
반응형