네임노드(NameNode)1 HDFS(Hadoop Distributed File System) HDFS(Hadoop Distributed File System)는 Apache Hadoop 프로젝트의 일부로 개발된 분산 파일 시스템으로, 대용량 데이터를 저장하고 처리하는 데 사용됩니다. HDFS는 대규모 데이터를 여러 머신에 분산하여 저장하고, 안정성과 확장성을 제공하여 대용량 데이터를 효율적으로 관리할 수 있도록 설계되었습니다. HDFS의 주요 특징 1. 분산 저장: 파일을 블록(Block) 단위로 나누어 여러 노드에 분산하여 저장합니다. 기본 블록 크기는 일반적으로 128MB 또는 256MB로 설정되며, 파일은 이러한 블록으로 나뉘어 저장됩니다. 2. 높은 내고장성: 데이터의 안정성을 위해 블록은 여러 노드에 복제됩니다. 기본적으로 각 블록은 3개의 복제본으로 저장되며, 복제본은 서로 다른 머신.. 2023. 12. 5. 이전 1 다음