스터디, 읽기

<나는 리뷰어다> 한빛미디어 '스파크를 이용한 자연어 처리'

Tech Signal 2021. 9. 5. 10:38

한빛미디어의 따끈따끈한 신작 '스파크를 이용한 자연어 처리'이다. 

소제목은 '대규모 텍스트를 다루는 가장 효율적인 딥러닝을 만나다'라고 한다. 

지금 하고 있는 프로젝트에서 빅데이터를 처리하고자 쓰려고 했던 스파크에 대해 미리 알아보려 한다! 

스파크는 스파크만의 자료구조를 사용해서 분산처리를 하는 분석엔진이다.

빅데이터를 다룰 때 많이 사용된다.

'스파크를 이용한 자연어 처리'책에서는 아파치 스파크로 자연어를 처리하는데 의미를 둔다.

그래서 텍스트, 자연어 처리를 할 때 알아두어야하는 개념에 대해 미리 설명하고 시작한다.

스파크 NLP 참고 자료

다만 빅데이터에 대해 잘 모르거나 통계학 전공자가 아닌 독자에게는 조금 어려울 수도 있을 것 같다.

코드 예시. 히스토그램과 같이 시각화하는 방법도 실려 있다.

뒤 설명에 적혀있는 대로 자연어와 스파크 NLP, 딥러닝 기초를 친절하게 설명한다.

그리고 자연어 처리에 필요한 여러 개념부터 배포까지 설명해준다. 

스파크를 사용해 자연어 처리를 해보고 싶은 사람이라면 이 책 한권으로도 최소한의 개발은 앱 구축은 해볼 수 있지 않을까 싶다!

 

- 해당 도서를 한빛미디어로부터 제공받아 작성한 리뷰입니다. -