한땀한땀 정성들인 코딩
[spark]스파크 코어 본문
반응형
인메모리 클러스터 컴퓨팅 프레임워크
고급실행엔진 존재
스파크 맵리듀스 모두 단방향성 frame_work
반복적 알고리즘
-데이터를 반복하여 여러번 처리하는 알고리즘.
주요 엔티티
드라이버 프로그램 - data처리 코드 제공, 스파크를 사용하는 애플리케이션
클러스터 매니저 - 리소스 관리, 상세한 수준의 리소스 스케줄링 제공
워커 - cpu,메모리,disk 스토리지 제공
익스큐터 - jvm프로세스로 다수의 스레드에서 동시에 애플리케이션 코드를 실행
테스크 - 가장 작은 작업단위
잡 : 연산의 묶음
스테이지 : 테스크의 묶음
반응형
'빅데이터' 카테고리의 다른 글
[HBase]기본필터기능 (0) | 2017.01.17 |
---|---|
[빅데이터]원천데이터 (0) | 2017.01.17 |
[spark]스파크 생태계 (0) | 2017.01.16 |
[빅데이터]동시성공부 (0) | 2017.01.16 |
[spark]스파크가 왜 좋냐? (0) | 2017.01.16 |