책 리뷰

SQL로 시작하는 데이터 분석

실무에 꼭 필요한 분석 기법 총정리! 실전 데이터셋으로 배우는 시계열, 코호트, 텍스트 분석

캐시 타니무라 저/박상근 역

한빛미디어

SQL for Data Analysis

SQL로 시작하는 데이터 분석

SELECT에 집중한 SQL

◎ 추천 포인트

  1. 흔치않은 SQL 데이터 분석 책
  2. 예제에 대한 다른 DBMS 문법 비교 설명
  3. 실습을 위한 데이터셋 제공

제목그대로 SQL를 사용하여 데이터 분석을 하고자 하는 사람을 위한 책이다.
책에서 사용하는 SQL 문법/기법 자체는 그렇게 어려운 수준은 아니다.
윈도우함수를 쓸수 있는 수준이라면 무리없이 소화할수 있으리라 생각한다.
2장에서 간단하게 책에서 사용할 SQL 문법 및 기초적인 기법을 소개해 주지만, SQL을 사용해 보지 않은 사람이라면 다소 어려울수도 있다.
어느정도 경험이 있는 데이터 분석가나 SQL에 익숙한 사람이 데이터 분석을 해보고자 할때 유용한 책이다.

업무적을 익히 많이 접해온 SQL이다보니 기술적인 어려움은 거의 없었다.
하지만 이 책은 데이터 분석을 배우기 위한 책이지, SQL을 공부하기 위한 책은 아니다.
3장까진 쉽게 읽을수 있었지만 4장부터는 통계에 기반한 본격적인 데이터 분석을 배우게 된다.

사실 데이터 분석에서 SQL의 대접이 좋지는 않다고 생각한다.
탐색적 데이터 분석을 많이 하게되는데 SQL만으로는 어렵기 때문이다.
이 책에서도 쿼리를 실행한 후 결과를 시각적으로 보여주기위한 차트를 같이 보여준다.
하지만 SQL만으로 차트를 그릴수 없기 때문에 다른 프로그램의 도움을 받아야 한다.
그렇기 때문에 Jupyter Notebook를 활용한 작업이 가능한 파이썬이나 R이 더 좋은 선택이라고 생각한다.
하지만 아직까지 많은 데이터들이 DB에 쌓여 있고, 이를 직접 활용할 수 있는 SQL의 강점은 아직 유효하다.
또한 대량의 데이터에서 원하는 부분을 추출하고, 전처리를 하는 작업 역시 SQL로 처리하는 것이 효과적 일것이다.
그런 면에서 SQL에 익숙하지 않은 데이터 분석가라면 한번 읽어보시길 권한다.

그리고

SELECT sales_month
,sales
FROM retail_sales

개인적으로 선호하는 개행한 뒤 콤마(,)를 찍는 포멧이라는 점이라 좋았다…
대부분 자신이 선호하는 SQL 스타일이나 회사의 코딩컨벤션이 있겠지만, 이 책에서 사용하는 SQL 스타일도 참고할만 하다.

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.