하둡은 분산 저장과 분산 처리를 위한 오픈소스 프레임워크이며, 다양한 부가 도구들과 함께 사용됩니다.🔹 기본 구성 요소 구성요소설명HDFSHadoop Distributed File System. 분산 저장 시스템MapReduce분산 처리 프레임워크 (현재는 Spark가 대체하는 추세)YARN클러스터 자원 관리 시스템 (Yet Another Resource Negotiator)🔹 확장 구성 요소분류기술설명데이터 수집Flume, Sqoop로그 수집 / RDBMS 데이터 수집데이터 저장HBase, HiveHBase: 실시간 NoSQL DB / Hive: SQL 기반 데이터 웨어하우스데이터 처리Pig, Spark, TezPig: 스크립트 언어 / Spark: 메모리 기반 빠른 처리데이터 관리Oozie, Zo..