하둡 분산 파일 시스템

From IT위키
Revision as of 22:00, 2 January 2020 by 김형교 (talk | contribs) (새 문서: 분류:데이터베이스분류:데이터 분석 ;Hadoop Distributed File System == 네임노드 == ;Namenode; 마스터 노드 * 메타 데이터만 보관하고, 실제 데...)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

분류:데이터베이스분류:데이터 분석

Hadoop Distributed File System

네임노드

Namenode; 마스터 노드
  • 메타 데이터만 보관하고, 실제 데이터는 저장하지 않음

동작

  • 클라이언트로부터 특정 파일에 대한 요구 전달
  • 해당 파일을 보관하고 있는 블록 정보 탐색
  • 실제 데이터가 보관되어 있는 데이터 노드 위치 파악

데이터노드

Datanode; 슬레이브 노드
  • 64MB, 128MB 등의 블록 단위로 데이터 저장

이중화 구성

결함 허용, 성능 향상을 위해 데이터와 노드 다중 구성

네임노드 이중화

  • 클러스터에 2개의 네임노드 구축
  • Active-Standby로 운영
  • 무중단 시스템 보장

데이터 복제

  • 데이터를 기본 3 Copy Replication 형성
  • 신뢰성 보장: 하나의 노드, 데이터가 손실되어도 무중단 동작 보장
  • 성능 향상: 데이터의 지역성을 향상시켜 빠른 처리 도모