HDFS (Hadoop Distributed File System)

2015. 10. 1. 12:31·IT기술 관련/빅데이터 관련
반응형

출처: http://redju.tistory.com/256

 

I.       HDFS(Hadoop Distributed File System) 개요

-       Master/Slave 구조로 Master인 Name node가 파일의 메타(meta) 정보를 관리하고 실제 데이터는 여러 대의 Data node에 분산해서 저장하는 하둡 분산 파일 시스템

 

II.      HDFS의 특징 및 읽기 및 쓰기 동작

가.   HDFS의 특징

구분

특징

Data Block

파일을 블록단위로 쪼개서 여러 Data node에 나눠서 저장하고 각 파일의 기본 정보 및 각 블록들의 위치 정보를 Name node에서 관리

Replication

일부 Data node에 장애가 발생하더라도 데이터가 유실되는 것을 막기 위해 각 데이터 블록에 대해서 여러 개의 복제본(Replica) 유지(보통은 3개의 복제본을 유지)

Rack Awareness

랙 단위의 장애에 대해 최대한 가용성을 높이기 위해 데이터 블록의 복제본을 관리할 때 복제본이 한 군데에 몰려 있지 않도록 관리

복제본 개수가 3인 경우 두 개는 같은 랙의 다른 노드에 저장하고 나머지 하나는 다른 랙에 있는 노드에 저장

Data Read(Locality)

사용자가 파일을 읽을 때는 먼저 Name node에 해당 파일 위치 정보를 요청하고 그 정보를 토대로 Data node와 통신하여 파일을 읽음

Data Write

(Consistency)

먼저 Name node에 해당 파일 쓰기 요청을 하면 Name node에서는 기본적인 유효성 검사를 수행

그후 Name node는 데이터를 저장할 Data node 리스트를 사용자에게 전달하고

첫번째 Data node에 데이터를 쓰기 시작하고 다른 Data Node에 복제 데이터를 완료하면 쓰기 작업이 완료

 

 

나.   읽기 및 쓰기 동작

-       읽기 동작

 

-     쓰기 동작

 

 

반응형
저작자표시 (새창열림)

'IT기술 관련 > 빅데이터 관련' 카테고리의 다른 글

RDBMS vs MongoDB  (0) 2015.10.01
빅데이터 저장 기술 - NoSQL  (0) 2015.10.01
빅데이터 분석 기술 - 데이터 마이닝 vs 텍스트 마이닝  (0) 2015.09.30
빅데이터 저장 기술 - HDFS vs Object Storage  (0) 2015.09.30
빅데이터 저장 기술 - DAS, NAS, SAN 비교  (0) 2015.09.30
'IT기술 관련/빅데이터 관련' 카테고리의 다른 글
  • RDBMS vs MongoDB
  • 빅데이터 저장 기술 - NoSQL
  • 빅데이터 분석 기술 - 데이터 마이닝 vs 텍스트 마이닝
  • 빅데이터 저장 기술 - HDFS vs Object Storage
호레
호레
창업 / IT / 육아 / 일상 / 여행
    반응형
  • 호레
    Unique Life
    호레
  • 전체
    오늘
    어제
    • 분류 전체보기
      • 법률
        • 기본
        • 개인정보보호법
        • 정보통신망법
        • 전자금융거래법
        • 전자금융감독규정
        • 신용정보법
        • 온라인투자연계금융업법
      • 창업
        • 외식업 관련
        • 임대업 관련
        • 유통업 관련
        • 세무 관련
        • 마케팅 관련
        • 기타 지식
        • 트렌드
        • Youtube
      • IT기술 관련
        • 모바일
        • 윈도우
        • 리눅스
        • MAC OS
        • 네트워크
        • 빅데이터 관련
        • A.I 인공지능
        • 파이썬_루비 등 언어
        • 쿠버네티스
        • 기타 기술
      • 퍼블릭 클라우드 관련
        • Azure
        • GCP
        • AWS
      • 정보보안 관련
        • QRadar
        • Splunk
        • System
        • Web
      • 기타
        • 세상 모든 정보
        • 서적
      • 게임 관련
        • 유니티
      • 부동산
      • 맛집 찾기
        • 강남역
        • 양재역
        • 판교역
        • ★★★★★
        • ★★★★
        • ★★★
        • ★★
        • ★
      • 결혼_육아 생활
        • 리얼후기
        • 일상
        • 육아
        • 사랑
        • Food
      • 영어
        • 스피킹
        • 문법
        • 팝송
        • 영화
      • K-컨텐츠
        • 드라마
        • 영화
        • 예능
      • 독서
      • 프로젝트 관련 조사
        • 시스템 구축
        • 로그 관련
        • 웹
        • APT
        • 모의 해킹
        • DB
        • 허니팟
        • 수리카타
        • 알고리즘
        • FDS
      • 기업별 구내 식당 평가
        • 한국관광공사
        • KT telecop
        • KT M&S
        • KT powertel
        • KT cs 연수원
        • 진에어
      • 대학 생활
        • 위드윈연구소
        • 진로 고민
        • 채용정보
        • 자동차
        • 주식
        • 악성코드
        • 게임 보안
      • 쉐어하우스
  • 블로그 메뉴

    • 홈
    • 게임 관련
    • IT 기술 관련
    • 태그
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    상호관세
    쥬쥬랜드
    런치
    돈까스
    AWS
    수제버거
    수제버거존맛
    맛집
    마케팅
    판교역
    보안가이드
    판교맛집
    복리후생
    점심
    판교
    무역전쟁
    수제버거맛집
    이재곧죽습니다
    유니티
    대통령
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.0
호레
HDFS (Hadoop Distributed File System)
상단으로

티스토리툴바