파이썬 가상환경에 대해서 알아 보겠습니다.

가상환경은 PC 안에서 별도의 개발 환경을 만들 때 유용하게 사용됩니다.

 

라이브러리를 사용할 때 가상환경에서만 전용으로 설치하여 사용하실 수 있습니다.

 

 

가상환경을 만들고 싶은 디렉토리 위치로 이동하여

python -m venv py_crawl 을 실행합니다.

 

python -m venv 다음에 자기가 원하는 가상환경명을 입력하시면 됩니다.

 

저는 py_crawl 로 만들었습니다.

 

 

위와 같이 가상환경이름으로 디렉토리가 생성된 것을 확인하실 수 있습니다. 

 

저는 py_crawl 로 만들어졌습니다.

 

 

해당 디렉토리로 이동합니다.

 

 

Scripts 로 한번 더 이동합니다. 맥 같은 경우에는 아마 bin 일 것입니다.

 

Scripts 안으로 들어오니 activate, pip , python 등이 있는 것을 확인하실 수 있습니다.

 

- activate : 가상환경 활성화

- pip : 라이브러리 설치할 때 사용

- python : 가상환경 안에서 실행될 python 파일

 

가상환경을 활성화 시키기 위해 activate 를 수행합니다.

 

 

위와 같이 (가상환경명) 이 제일 앞에 생기는 것을 알 수 있습니다. 

 

pip list 를 통해서 설치된 라이브러리르 확인해보겠습니다.

 

lxml 라이브러리를 설치하고 pip list 를 통해서 설치된 것을 확인하실 수 있습니다.

 

가상환경 안에서 python 을 수행하고 import lxml 을 수행하면

정상적으로 수행되는 것을 확인할 수 있습니다. 

 

가상환경에서 나가는 명령어는 deactivate 입니다. 

 

가상환경에서 나가면 제일 앞에 ( ) 괄호가 사라지는 것을 확인하실 수 있습니다.

 

c:\ 로 이동하여서 설치된 라이브러리를 확인해보겠습니다.

 

 위와 같이 아까 가상환경에서 설치한 lxml 은 확인할 수 없으며,

import 를 해도 에러가 발생하는 것을 확인하실 수 있습니다.

 

고맙습니다.

파이썬 파일 저장방법에 대해서 알아 보겠습니다.

 

파이썬 설치가 되어 있지 않으시면 파이썬 설치 링크 를 참고 해 주세요.

 

파이썬 IDLE 로 저장하고 실행하는 방법이 궁금하신 분들은
PYTHON IDLE 실행 링크를 참고해 주세요. 

 

이번에는 명령프롬프트 ( CMD ) 에서 실행하는 방법에 대해서 알아 보겠습니다.

 

 

돋보기 버튼에서 cmd 를 입력하셔서 명령 프롬프트를 클릭하셔서 실행합니다.

 

 

윈도우버튼 + R 을 누르셔서 cmd 를 입력하셔도 명령 프롬프트를 실행하실 수 있습니다.

 

 

 

명령 프롬프트 화면에서 python 을 입력합니다. 

 

python 이 실행되지 않으시면 파이썬 환경변수 설정 방법 링크를 참고 하세요. 

 

print 명령어를 통해서 Hello Python 을 출력한 화면입니다.

 

이번에는 파이썬 파일을 저장 하고 실행 하는 방법에 대해서 알아 보겠습니다.

 

돋보기 버튼에서 notepad 을 검색하셔서 실행하시거나 

윈도우버튼 + R 에서 notepad 로 실행하시면 됩니다.

 

 

메모장에서 위와 같이 print 함수를 입력한 후에 저장 합니다.

 

왼쪽 위에 메뉴에 파일 을 클릭하시고 저장 을 클릭합니다.

 

단축키는 Ctrl + S 입니다.

 

 

 

저장하고 싶은 경로를 선택하시고  파일명을 정한 후에 뒤에 .py를 꼭 붙여 주셔야 합니다.
파일 형식은 모든 파일을 선택해주세요. 

 

저 같은 경우에는 아래와 같이 저장 하였습니다.

 

       파일 경로 : c:\python_test

파일 이름 : print2.py 

파일 형식 : 모든 파일 

 

 

 

 

정상적으로 저장이 되었다면 print2.py 라는 파일명이 왼쪽 위에 표시됩니다.

 

이제 다시 명령 프롬프트 창으로 돌아와 주세요. 

 

 

파이썬 파일을 저장한 경로로 이동한 후에 ( cd c:\python_test )

어떤 파일들이 있는지 확인하고 ( dir )

파이썬 파일을 실행하였습니다. ( py print2.py ) 

 

위와 같이 정상적으로 파이썬 파일이 실행되는 것을 확인할 수 있습니다.

 

고맙습니다. 

 

 

 

 

 

 

 

 

파이썬 파일을 저장 한 후에 실행 하는 방법에 대해서 알아 보겠습니다.

파이썬 설치가 안 된 분들은 파이썬 설치 링크 를 참고 해 주세요.

명령 프롬프트( CMD )로 실행하는 방법에 대해서 알고 싶으신 분들은
파이썬 cmd 실행 링크를 참고 해 주세요. 

 

 

돋보기 버튼에서 python 을 검색하면 위와 같이 출력됩니다.

 

python 을 클릭하지 마시고 IDLE 을 클릭하시면 python IDLE 이 실행됩니다.

 

IDLE 이라는 단어가  잘 생각나지 않을 때가 있어서
python을 검색한 후에 찾아가는 방법에 대해서 설명 드렸습니다.

 

위와 같이 실행하셔도 되지만 가장 간단한 방법은
돋보기 버튼에서 바로 idle 을 입력하셔서 실행하셔도 됩니다.

 

 

 

IDLE 실행되었을 때 화면 입니다. 

 

IDLE 화면에서 바로 print 를 통해서 실행하였을 때 화면입니다.

 

이번에는 파이썬 파일을 저장하고 실행하는 방법에 대해서 알아 보겠습니다.

 

화면 왼쪽 위에 메뉴에 FILE  을 선택하신 후에

New File 을 선택하시면 됩니다.


단축키는 Ctrl + N 입니다.

 

New File을 선택하였을 때 실행되는 화면 입니다. 상단에 untitled 로 되어 있습니다.

 

간단하게 print 하는 함수를 입력하고 저장해보겠습니다.

 

왼쪽 위에 메뉴에서 File 을 선택하시고 Save 를 선택하시면 됩니다.

 

단축키는 Ctrl + S 입니다.

 

 

 

 

파이썬 파일을 저장할 경로를 지정하시고 

 

파이선 파일명을 입력하신 후에 저장하시면 됩니다.

 

저는 c:\python_test 라는 경로에 print3 이라는 파일로 저장하였습니다.  

IDLE 에서는 별도로 확장자명을 지정하지 않아도 자동으로 저장됩니다.

 

 

저장하시고 나면 아까 untitled 라고 표시되어 있던 곳에 저장된 경로와 함께 파일명으로 변경된 것을 확인하실 수 있습니다.

 

저장을 하였으니 실행 해 보겠습니다. 

 

 

 

메뉴 화면 중간에 Run 을 선택하시고  Run Module 을 선택하시면 됩니다.

 

단축키는 F5 입니다.

 

 

실행하게 되면 위와 같이 실행경로와 파일명이 출력되고 

 

결과화면도 정상적으로 출력되는 것을 확인할 수 있습니다.

 

고맙습니다.

파이썬 웹 크롤링 예제 알아 보겠습니다.

beautifulsoup  예제 입니다.

 

파이썬 설치를 하지 않으신 분은 파이썬 설치 링크 를 참고 하세요.

 

beautifulsoup을 설치 하지 않으신 분은 beautifulsoup 설치 링크를 참고 하세요. 

 

첫번째 네모 부분에는 어디를 크롤링 할지 물어보는  안내하는 문구 입니다. 

input('~~~') : ~~~ 부분은 마음대로 변경하셔도 됩니다.

 

두번째 네모 부분은 어떤 태그를 크롤링 할지 정하는 문법입니다.

soup('~~~') : ~~~ 부분에 크롤링 원하는 태그로 변경하셔도 됩니다.

 

세번째 네모 부분은 두번째 네모에서 크롤링 한 태그 중에 어떤 단어가 있으면 그 단어에 해당하는 내용을 가지고 오라는 뜻입니다. 설명이 어려운에 실습하실 때 보시면 이해가 되실 겁니다.

prtin(tag.get('~~~',None)) : ~~~ 부분에 원하는 단어를 입력하시면 됩니다.

 

 

 

저는 위의 내용대로 개발을 한 후에 bs4_1.py 라는 파일명으로 저장하였습니다. 원하시는 파일명으로 저장하시면 됩니다.

 

그리고 해당 파일이 저장되어 있는 위치로 가셔서 실행하시면 됩니다. 

 

 

위의 그림처럼 명령 프롬프트를 실행하시면 됩니다.  윈도우에서는 윈도우버튼 + R 을 입력하시고 cmd 로 실행하셔도 됩니다.

 

 

 

 

개발한 파일명 위치로 이동하셔서 해당 파일이 있는지 확인합니다.

 

 

이제 크롤링을 하기 전에 여러분이 크롤링 하고 싶은 사이트를 선택하셔야 합니다.

 

저는 파이썬 공식 홈페이지에서 Documentation (www.pyhton.org/doc) 를

크롤링 해 보겠습니다.

 

저와 동일한 사이트를 크롤링 해보시려면 www.python.org 에 접속하셔서

 Documentation  를 클릭하시면 됩니다.

 

크롤링할 대상을 확인합니다. 저는 www.pyhton.org/doc 입니다.

 

크롤링 할 페이지 화면에서 마우스 오른쪽 버튼을 클릭하시고 페이지 소스 보기를 클릭합니다.

 

 

위와 같은 화면이 보이실 겁니다. 저는 <link > 라는 태그를 크롤링 해보겠습니다.

 

 

 

Ctrl + F (찾기 단축키) 를 클릭하셔서 <link 를 검색하시면

크롤링 할 대상들을 확인하실 수 있습니다. 

 

<link > 라는 태그를 찾아서 저는 href 라는 단어가 있으면

그 해당되는 내용을 불러오게 해보겠습니다.

 

위와 같은 경우는

//ajax ... ,

/static ...

...

같은 내용들이 불러와지겠죠? 

 

이제 정상적으로 불러오는지 아까 개발한 파일을 실행해 보겠습니다. 

 

py bs4_1.py 로 실행을 하시고 

( bs4_1.py 부분에 여러분이 개발해서 저장한 파일명을 입력하세요.)

 

실행할 웹 주소를 입력하세요 : 라는 문구가 나오면 거기에 사이트를 입력하시면 됩니다. 

 

파일을 수행했을 때 바로 밑에 결과를 확인해보면

저희가 예상한 데이터가 잘 출력되는 것을 확인하실 수 있습니다. 

 

 

 

 

이번에는 <link > 태그 대신에 <a > 태그를 크롤링하도록 변경하고 저장해보겠습니다.

 

 

 

 

저희가 크롤링 할 대상들을 미리 확인해보겠습니다. 

 

#content
#python-network

...

https://docs.python.org  

위와 같은 내용들이 불러와지면 정상이겠죠? 

 

해당 파일을 실행하니 위와 같이 예상된 값들을 잘 불러오는 것을 확인할 수 있었습니다.

 

이상으로 beautifulSoup 을 활용한 파이썬 웹 크롤링 예제를 알아보았습니다.

 

고맙습니다. 

 

 

beautifulsoup 을 import 하려고 하였을 때 에러가 발생한다면
beautifulsoup 설치가 정상적으로 되지 않았을 수 있습니다.

 

from bs4 import BeautifulSoup

을 수행하였을 때 아래와 같이 에러가 발생하면 pip install을 설치하시기 바랍니다.

 

beautifulsoup 설치 링크를 참고하시거나
아래처럼 파이선 설치 경로로 이동하신 후에 설치해보세요.

 

 

파이썬을 설치한 경로로 이동하신 후에 Scripts 으로 한번 더 이동하셔야 합니다.

 

 

 

해당 경로에서 설치하시면 정상적으로 설치가 될겁니다.

 

 

정상적으로 설치가 되셨으면 아래와 같이 에러가 발생하지 않고  파이썬 개발 프로그램에서도 자동완성이 정상적으로 출력되는 것을 확인하실 수 있습니다.

 

 

 

 

 

위와 같이 python python은 내부 또는 외부 명령 이라는 에러메세지가 발생한 경우에는 

python 설치할 때 python path를 추가해 주지 않았기 때문입니다.

아래 2가지 방법 중에 원하시는 방법을 선택하시면 해결됩니다.

 

첫번째는 파이썬 삭제 후 재설치하면서  add path 클릭 한 후에 설치하는 방법인데

아래 링크 참조하시면 됩니다.

  파이썬 설치 방법 링크

 

두번째는 재설치 하지 않고 환경변수 추가( add path )하는 방법은
아래 스샷확인하면서 따라하시면 됩니다.

 

왼쪽 밑에 돋보기 클릭 후 고급 검색하셔서 고급 시스템 설정 보기 클릭

 

 

환경 변수 클릭

 

Path 클릭 후 편집 클릭 해주세요.

 

 

새로 만들기 클릭

Python이 실제로 설치된 경로를 입력해주셔야 합니다.

저와 동일하게 입력하시면 안 됩니다.

 

Python 실제로 설치된 경로를 알아보겠습니다.

 

 

돋보기 클릭한 후에  python.exe 를 입력하신 후에 파일 위치 열기를 클릭 하세요.

python.exe 모두 입력해주셔야 합니다. 

 

 

 

 

 

path를 입력하신 후에 다시 명령 프롬프트에서 python 을 아무 경로에서나 입력하셨을 때

 

아래와 같이 버전 정보와  >>> 가 보이면 정상적으로 설정되신 것입니다. 

 

바로 안 되시는 경우에는 Path를 다시 확인해보시고

cmd (명령 프롬프트)를 다시 실행해보세요.

 

고맙습니다.

 

 

 

파이썬 설치에 대해서 알아볼게요

 

구글에서 python 을 검색합니다. 

 

welcome to python.org 를 클릭하시면 홈페이지로 이동합니다. 

 

(설치 말고 환경변수 설정 방법만 궁금하신 분은 아래 링크를 참고해주세요.)

파이썬 환경설정 방법 링크

 

 

 

Dowloads를 클릭 하시거나 Dowloads에 마우스를 가져가서 바로 Python 3.7.3을 선택하셔도 됩니다.

 

버전은 변경될 수 있지만 설치하는 것은 동일합니다.

 

 

 

 

 

Download Python 을 클릭하시면 아마 32비트로 자동으로 설치됩니다. 

 

쉽게 설치하시고 싶으시면 아래 다운 버튼만 클릭하시면 됩니다. 

 

 

다운된 경로에 가시면 파이썬 설치 파일을 확인하실 수 있습니다.

 

 

64비트 다운 방법이 궁금하시는 분들은 아래 더보기 버튼을 클릭하세요

...더보기

여기서부터는 64비트 다운 방법입니다. 무시하셔도 됩니다. 

 

windows를 클릭하세요

 

 

 

중간에 Windows X86-64 executable installer를 선택하시면 다운됩니다.

 

 

 

다운된 파일 확인이 가능합니다. 

 

 

여기까지는 64비트 다운 방법이였습니다.

 

 

 

다운된 파일을 더블 클릭하시면 아래 화면이 나타납니다.

 

 

1) 가장 쉽게 설치하시고 싶으신 분

화면 제일 밑에 Add Python 3.7 to PATH만 선택하시고

Install Now를 클릭하시면 설치가 진행됩니다.

 

2) 권장하는 방법( 향후 파이썬 실행할 때 환경변수 문제나 실행이 잘 되게 하고 싶으신 경우)

화면 제일 밑에 Add Python 3.7 to PATH 선택하시고

Customize installation 을 클릭합니다.  

 

 

 

** 팝업으로 이 앱이 디바이스를 변경하려고 합니다 
허용하시겠습니까?  화면이 뜰 경우에는 예 클릭 하시면 됩니다.

 

 

 

 

이 화면은 NEXT 하시면 됩니다.

 

 

 

Add python to environment varibales를 클릭된 것을 확인하세요

( add PATH 선택하셨으면 클릭되어 있을 것입니다.)

 

Customize install location (실행경로) 에서 기존에 입력된 것을 지우고

아래 경로로 하시면 좋을 것 같습니다.

(중간에 한글만 들어가지 않는 경로로 아무것이나 하셔도 상관은 없습니다)

 

이유는 컴퓨터 사용자 계정을 한글로 하셨을 경우에 에러가 나고

파이썬이 정상적으로 설치가 안될 수 있습니다.

 

 

 

 

 

설치가 완료 되셨으면 윈도우버튼과 R를 누르시거나 아래 화면 처럼 돋보기 화면에서 cmd 를 입력하세요

 

명령 프롬포트를 실행합니다.

 

 

 

 

 

명령 프롬포트 화면에서 아래와 같이 아무 경로에서나 python 을 입력하셨을 때

 

>>> 가 나타나면 정상적으로 설치가 완료된 것입니다.

 

종료하실 경우에는 quit() 를 입력하시면 됩니다.

 

 

고맙습니다.

 

 

파이썬을 쉽게 개발하고 싶으시면 VSCODE 설치법과 파이썬 관련 환경설정 방법도 알아보세요

https://studyhard24.tistory.com/231

+ Recent posts