본문 바로가기

Python/crawling-instagram

Python 인스타그램 크롤링 환경 셋팅

반응형

안녕하세요. 파이썬을 이용해 인스타그램에서 이미지, 게시글, 좋아요와 같은 정보를 크롤링하는 자동화 프로그램을 개발했습니다. 개발한 지는 조금 지났지만 이제서야 포스팅을 올리네요.

 

개발환경은 다음과 같습니다.

언어 : Python 3.7 (64bit)
개발 도구 : Visual Studio 2019
라이브러리 : BeautifulSoup4, requests, lxml, selenium

저는 가상환경, 라이브러리 설치가 편해서 Visual Studio를 사용하여 개발하였습니다. (이제는 개인 적으로 가장 익숙하고 편한 환경을 사용하게 되네요.)

 

Visual studio 파이썬 프로젝트 환경 구축을 해보겠습니다.

 

1. 파이썬 애플리케이션을 생성해주세요

 

2. 프로젝트명을 입력하고 프로젝트를 생성하세요
3. 웹크롤링을 위해서 가상환경을 생성해줍니다. [Python환경]->[환경추가], [가상환경]->[기본인터프리터 선택] 후 가상환경 만들기 버튼 클릭

현재 구축 할 프로젝트를 위한 가상환경을 생성해줍니다. 가상환경은 추후 기능에 따라 식별할 수 있도록 만들어 두면 좋으니 참고하세요

ex) 신규 프로젝트를 개발 시 유사한 프로젝트의 환경을 사용할 수 있습니다. 그리고 더 중요한 환경에 따라서 패키지(라이브러리)의 버전이 있기때문에 환경 구축이 좋습니다.

 

4. 3번에서 생성한 가상환경의 이름으로 프로젝트 경로에 가상환경 디렉토리가 생성되며, Python환경에서도 선택 할 수 있습니다.

 

5. Python 환경에서 콤보박스 선택 후 [패키지]를 선택합니다. 패키지(라이브러리)에서는 다운 받아야할 패키지를 검색하여 설치할 수 있습니다.

 

PyPi 및 설치된 패키지 검색 에디트에 저희가 설치할 목록을 검색 후 설치해줍니다.(BeautifulSoup4, requests, lxml, selenium)

 

BeautifulSoup4검색 후 하단에 출력되는 명령 실행을 클릭해 줍니다.

해당 명령은 기존 명령프롬프트나 파워쉘같은 명령을 통해 설치해주는 것입니다. 실제로 입력해도 되지만 Visual Studio에서 편하게 가상환경에 패키지를 설치를 지원해줍니다.

 

 

 

순서대로 모든 패키지 설치 시, 설치된 패키지 목록이 표시됩니다.

 

반응형