9가지 사례로 익히는 고급 스파크 분석(2판) 읽기 좋은책


대량의 데이터셋을 다루는 복잡한 분석을 스파크로 사용해 보는 좋은 기회를 주는 책이다. Python, Java를 많이 사용하는데, 이 책은 스칼라 로 구현되어 살짝 당황 했지만, 스칼라 를 사용하는데 충분한 예시가 주어져 있고, 스칼라를 공부하는 계기가 된것 같습니다. 또한 스파크 스칼라로 구현 되어있기에 스파크가 조금더 친숙하게 다가 온 것 같습니다.

책의 내용은 다양한 예제로 구성되어 있고 스파크 2.0 과 1.x 버전대의 바뀐점도 중간중간 설명이 되어있어 1.x 버전대의 사용자들이 2.x 버전대로 로 책의 예제를 실행한다 하여도 생각보다 많이 불편하진 않습니다. 책의 내용이 아주 초급의 내용은 많이 설명하지 않아 초보분들이 보기에는 다소 어렵거나 이해하기가 조금 어려울 수도 있겠지만, 스파크를 활용해야하는 기회가 주어진다면, 스파크의 기본적인 구성과 이해도를 가지고 이책을 본다면 더할 나위 없는 좋은 경험이 될 수 있다고 생각 됩니다. API에 대한 설명은 없지만, 시시때때로 변하는 API와 기능은 스파크 레퍼런스를 참고하고 저자의 의도중 “스파크를 사용한 분석에 있어서 수년간은 이 책이 유용한 자료로 남아있기를 희망한다.”  라는 문구가 아주 잘 맞아 떨어져 스파크를 활용하기에 유용한 자료가 될 책임에는 분명한것 같습니다.