[책리뷰] 판다스 인 액션 (feat. 최고의 pandas 가이드 문서)
Python으로 데이터 분석을 한다고 하면 필수적으로 쓸 수 밖에 없는 것이 pandas라고 생각한다. csv 데이터 처리부터 머신러닝, 딥러닝에 필요한 데이터프레임 처리까지 다양한 작업을 할 수 있기 때문이다.
판다스 인 액션 책은 pandas를 디테일하게 잘 설명한 책이라고 추천 받게 되어 읽어보게 되었다.
책에는 기본적인 기초 사용법과 실제 데이터 분석 작업 시 유용하게 사용할 수 있는 다양한 프로세스들이 담겨있고, 책에서 다루는 내용들을 따라할 수 있도록 데이터와 코드가 제공되어 있다.
- 책의 예제 코드는 jupyter notebook 형태로 제공
- github 주소 : https://github.com/paskhaver/pandas-in-action
책은 크게 1부와 2부로 나뉘어져있으며, 아마 python을 이용하여 데이터 분석을 조금이라도 할 줄 아는 사람이라면 1부 보다는 2부 위주로 도움이 많이 될 것이라고 생각한다.
- 1부 기본기 다지기 : pandas에서 활용되는 자료형과 기본적인 매커니즘
- 2부 응용하기 : 실제 데이터셋을 예제로 하여, pandas에서 제공하는 api를 잘 활용할 수 있는 방법
R이든 Python이든 매번 구글링하면서 작업을 하지만, 특히 난 pandas의 경우에는 api를 모두 아는 것이 아니라 내가 원하는 데이터를 만들기 위해 비슷한 예시를 참고하여 대입하는 것으로 진행하는 편이다.
그런 면에서 이 책은 나에게 있어서 꽤나 좋은 가이드 문서로 다가와서, 올해가 가기 전에 책 내용을 간단히 정리하는 것도 도움이 되지 않을까 하여 포스팅을 해보려고 한다.
아직 어떻게 정리해서 업로드할지 생각해두지 않았지만, chapter별로 간단히 정리하여 포스팅하지 않을까 싶다. 포스팅 시 하단에 포스팅 링크를 담기도록 하겠다.
Contents
- Part 1. 판다스 기본기 다지기
- chapter 1 판다스 소개
- chapter 2 Series 객체
- chapter 3 Series 메서드
- chapter 4 DataFrame 객체
- chapter 5 DataFrame 필터링
- Part 2. 판다스 응용하기
- chapter 6 텍스트 데이터 다루기
- chapter 7 MultiIndex DataFrame
- chapter 8 재구성과 피벗
- chapter 9 GroupBy 객체
- chapter 10 병합, 조인 및 연결
- chapter 11 날짜 및 시간 다루기
- chapter 12 가져오기와 내보내기
- chapter 13 판다스 설정
- chapter 14 시각화