한빛미디어의 따끈따끈한 신작 '스파크를 이용한 자연어 처리'이다.
소제목은 '대규모 텍스트를 다루는 가장 효율적인 딥러닝을 만나다'라고 한다.
지금 하고 있는 프로젝트에서 빅데이터를 처리하고자 쓰려고 했던 스파크에 대해 미리 알아보려 한다!
스파크는 스파크만의 자료구조를 사용해서 분산처리를 하는 분석엔진이다.
빅데이터를 다룰 때 많이 사용된다.
'스파크를 이용한 자연어 처리'책에서는 아파치 스파크로 자연어를 처리하는데 의미를 둔다.
그래서 텍스트, 자연어 처리를 할 때 알아두어야하는 개념에 대해 미리 설명하고 시작한다.
다만 빅데이터에 대해 잘 모르거나 통계학 전공자가 아닌 독자에게는 조금 어려울 수도 있을 것 같다.
코드 예시. 히스토그램과 같이 시각화하는 방법도 실려 있다.
뒤 설명에 적혀있는 대로 자연어와 스파크 NLP, 딥러닝 기초를 친절하게 설명한다.
그리고 자연어 처리에 필요한 여러 개념부터 배포까지 설명해준다.
스파크를 사용해 자연어 처리를 해보고 싶은 사람이라면 이 책 한권으로도 최소한의 개발은 앱 구축은 해볼 수 있지 않을까 싶다!
- 해당 도서를 한빛미디어로부터 제공받아 작성한 리뷰입니다. -
'스터디, 읽기' 카테고리의 다른 글
<왕초보 판매자도 파워셀러가 되는 네이버 스마트 스토어 시작하기>를 읽고 (0) | 2021.11.07 |
---|---|
[한빛 리뷰어] 파이썬을 활용한 금융 공학 레시피 (1) | 2021.10.14 |
'식당, 생각을 깨야 이긴다, 이경태'를 읽고 (0) | 2021.08.06 |
[도서 리뷰] 고성능 파이썬 / 한빛 미디어 (1) | 2021.05.16 |
[도서 리뷰] 학교에서 알려주지 않는 17가지 실무 개발 기술 / 한빛 미디어 (0) | 2021.03.31 |