Selenium패키지는 웹 사이트에서 데이터를 추출하는 위해 사용되는 Web scraping(웹 정보 수집) 또는 Data Scraping(웹 데이터 추출) 소프트웨어입니다. 이 글에서는 python Selenium패키지를 사용하여 특정 홈 페이지의 정보를 취득하는 방법을 소개합니다.
전제 조건
- Internet Explorer, Google Chrome과 같이 Web Browser 소프트웨어를 사용할 수 있어야 합니다.
- [Python Selenium “This version of ChromeDriver only supports Chrome version 89” 버전 오류] 의 글을 참조해서 chromedriver.exe파일을 C:\temp\selelium_test 폴더에 저장합니다.
- [python 실행 오류 ModuleNotFoundError: No module named ‘selenium’]의 글 내용이 설치 되어 있어야 합니다.
샘플 소스 작성
다음 소스를 selenium_sample01.py 파일 명으로 C:\temp\selelium_test 폴더에 저장합니다.
소스 설명
- 5행 – 6행의 설명은 [python 파일(확장자 .py) 자신의 위치로 현재 작업 디렉토리 변경하기]의 글을 참조 하십시오.
- 7행 : C:\temp\selelium_test 폴더 명과 chromedriver.exe 파일 명을 붙여서 C:\temp\selelium_test\chromedriver.exe 전체 패스를 만듭니다.
- 9행 – 10행 : C:\temp\selelium_test\chromedriver.exe 파일을 이용하여 https://tech.zinnunkebi.com 홈페이지 화면을 chrome 브라우저에 표시합니다.
- 12행 – 14행 : 10초 기다린 후 chrome 브라우저를 닫습니다.
소스 실행
다음과 같이 파일이 저장 되어 있는지 확인합니다.
C:\temp>cd selelium_test
C:\temp\selelium_test>dir /b
chromedriver.exe
selenium_sample01.py
다음과 같이 저장된 python소스를 실행합니다.
C:\temp\selelium_test>python selenium_sample01.py
만약 다음과 같이 python명령으로 chrome 브라우저를 열려고 할 때 “Windows보안 경고”화면이 표시된다면 “액세스 허용(A)” 버튼을 눌러 python명령을 실행 가능하도록 변경합니다.
실행 결과
https://tech.zinnunkebi.com 홈페이지 화면 chrome 브라우저에 표시됩니다. 그리고 10초 후 chrome 브라우저를 닫습니다.