저자인 맷 태디는 아마존 08년부터 18년까지 시카고 대학교 부스 경영대학원에서 계량경제학 및 통계학 교수로 재직하였으며, MS의 수석 연구원과 이베이의 연구원을 포함하여 다양한 산업 분야에서 일한 경험이 있으며 현재는 아마존 부사장으로 재직하고 있다.
이 책은 비지니스에서 데이터 관련 문제를 해결하는데 중요한 수학적 이론 및 실용적인 방법들을 소개하고 있다. 저자의 특별한 시각과 비지니스 경험에서 얻은 지혜들을 담고 있기에, 많은 인사이트들을 얻을 수 있을 것이다.
이 책은 데이터 기반 회사에서 데이터 과학자로 일하려는 사람에게 촛점을 맞춰 저술되었다.
이 책을 통하여 비즈니스 정책에 중요한 영향을 미칠 변수를 식별하고, 정책 변경에 따른 재동의 반응을 파악하기 위한 SNS 데이터를 수입하여 분석할 수도 있다.
과거 데이터에서 패턴을 찾는 것은 유용하기 때문에 이 책에서 여러가지 패턴 인식 방법에 대해 배우겠지만 비즈니스 문제에 대해서 더 깊은 분석을 위해서는 ‘무슨 일’이 일어났는지보다 ‘왜’ 이런 일이 발생했는지를 파악해야하며, 이 책에서는 상관관계 뿐만 아니라 인과관계 분석에도 도움이 되는 기법들을 설명하고 있다. 주류 데이터 과학보다는 경제학에 더 가깝기에 실무에 실질적인 도움이 될 것이다.
솔직히 말해 개인적으로 친근함이 느껴지는 책은 아니다. 시작부터 수두룩하게 나열되는 수식들과 어려운 용어들, 도표들에 정신을 압도당한다.
아무래도 비전공자나 입문자들을 대상으로 하는 가벼운 책이 아니다보니 그런 것 같다.
의사 결정과 관련된 최신 기술을 알고싶고, 신기술을 문제에 적용하는데 관심이 있고, 데이터 분석을 바탕으로 더 나은 의사 결정을 내리는 것에 관심이 있는 사람에게는 강력히 추천할만 하다.
챕터는 크게 11개로 나뉘며 챕터 0 ‘들어가며’를 제외하면 모두 10개의 챕터로 이루어져 있다.
- 불확실성
- 회귀
- 정규화
- 분류
- 실험
- 제어
- 인수분해
- 데이터로서의 텍스트
- 비모수
- 인공지능
[한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.]