아파치 하둡(Apache Hadoop, High-Availability Distributed Object-Oriented Platform)은 대량의 자료를 처리할 수 있는 큰 컴퓨터 클러스터에서
동작하는 분산 응용 프로그램을 지원하는 프리웨어 자바 소프트웨어 프레임워크이다.
원래 너치의 분산 처리를 지원하기 위해 개발된 것으로, "아파치 루씬":https://ko.wikipedia.org/wiki/아파치_루씬의 하부 프로젝트이다.
분산처리 시스템인 구글 파일 시스템을 대체할 수 있는 하둡 분산 파일 시스템(HDFS: Hadoop Distributed File System)과 맵리듀스를 구현한 것이다..
베이스 아파치 하둡 프레임워크는 다음의 모듈을 포함하고 있다