HFDS的搭建和基本使用

一、概述

 • 简介:
  • 源自Google的GFS论文的巨大分布式文件系统
 • 特点:
  1. 扩展性
  2. 容错性
  3. 海量数据存储
 • 优缺点:
  • 优点:
   1. 数据冗余, 硬件容错
   2. 处理流式(一次写入多次读取)的数据访问
   3. 适合存储大文件
   4. 构建在廉价机器上
  • 缺点:
   1. 不满足低延迟的数据访问
   2. 不适合小文件的存储
 • 存储:
  • 将文件切分成指定大小的数据块并以多副本的存储在多个机器上
  • 数据的切分,多副本,容错等操作对用户透明
   NameNode (Filename, numReplicas, block-ids)

- 阅读剩余部分 -

基本数据结构复习之图的总结

简介

 • 概念:
  • 由顶点的有穷非空集合和顶点之间边的集合组成, 通常表示为: G(V,E), 其中, G表示一个图, V是图G中顶点的集合, E是图G中边的集合
 • 异同:
  • 线性表中把数据元素叫做元素, 树中将数据元素叫结点, 在图中数据元素叫做顶点(Vertex)
  • 线性表中可以没有数据元素,称为空表; 树中可以没有结点,叫做空树; 图中不允许没有顶点,若V是顶点的集合, 则集合V有穷且非空
  • 线性表中, 相邻的数据元素具有线性关系; 树结构中, 相邻两层的结点具有层次关系; 图中, 任意两个顶点之间都可能有关系, 顶点之间的逻辑关系用边来表示, 边集可以是空

- 阅读剩余部分 -