* 해당 글은 페스트캠퍼스 실습조교로 6/22 ~ 6/25일(총32시간) 까지 진행된 Fastcampus 주관 C* Digital Academy 강의 내용을 정리한 것이다.
이 강의 과정은 C* 내 CBP 과제 중심 전문인력 육성 프레임 중 첫번째 단계인 AI 입문단계로서 강의 내용이 입문자 중심으로 구성되었다. 구성을 간략히 살펴보면,
1. 파이썬 문법 기초
2. 파이썬 라이브러리를 활용한 EDA
3. 파이썬을 활용한 웹 크롤링
강사님의 강의중 좋았던 내용들만 간략하게 정리하고자 한다.
1. 파이썬 문법
파이썬에 대해 어느정도 알고 있는 사람들이라면 파이썬 문법에 관한 내용이 지겨울 수 있다. 하지만 Fastcampus 실습 조교를 반복적으로 하다 보니 파이썬 문법에 대해 반복적으로 듣게 되었다. 해당 강의가 입문자 초점에 맞춰 진행되지만 파이썬에 대한 인사이트가 조금씩 더 넓어지는 것을 느낄 수 있었다.
(1) 윤년(Leap year) 찾기
윤년이라 함은 4로 나누어 떨어지면 윤년, 그 밖의 해는 평년이라고 한다.
또한 4로 나누어 떨어지지만 100으로는 나누어 떨어지는 해는 평년이라고 한다.
단, 400으로 나누어 떨어지는 해는 윤년이라고 한다.
해당 알고리즘을 한번에 구현하면 다음과 같다.
강사님이 구현한 코드는 다음과 같다.
같은 결과의 코드이지만 복잡도가 훨씬 덜하다. 간결한 코드를 선호하지만 위와 같은 코드로도 하나의 프로그램이 만들어진다는 것을 알 수 있었다.
2. Crawler
(1) Stock data
다음은 다음 주식 페이지에서 주식 정보를 엑셀로 저장하는 실습이다.
selenium 모듈을 사용하지 않고 requests, Beautifulsoup 모듈을 사용하였다. requests로 페이지 정보를 가져왔을 때 내용이 없는 경우는 js 를 이용하여 추가로 불러오는 단계가 있기 때문이다. 따라서 개발자 도구에서 js로 데이터를 가져오는 주소를 찾아 그 주소에서 크롤링을 진행해줘야 한다. 해당 주소는 header를 가지고 있기 떄문에 referer, user-agent를 dictionary로 저장하여 같이 요청을 보내줘야 한다.
다음은 엑셀로 저장하는 코드이다. openpyxl을 사용하였다.
해당 과정은 입문자용이기에 데이터 수집 및 EDA 맛보기까지 진행되었다. 생각보다 쓸 내용이 없다....
댓글