第1题
A.20世纪50年代后期到60年代中期
B.计算机不仅用于科学计算,而且还大量用于管理
C.硬件上已有了磁盘、磁鼓等直接存取的存储设备三、问答题
D.软件方面,操作系统中已经有了专门的数据管理软件,一般称为文件系统
第4题
A.法规名称
B.规章名称
C.被转发的文件名称
D.被印发的文件名称
E.被批复的文件名称
第6题
B.大规模并行计算:在分布式并行环境中将一个任务分解成更多份细粒度的子任务,这些子任务在空闲的处理节点之间被调度和快速处理之后,最终通过特定的规则进行合并生成最终的结果。典型技术为MapReduce
C.结构化分布式数据存储:类似文件系统采用数据库来存储结构化数据,云计算也需要采用特殊技术实现结构化数据存储,典型技术为BigTable/Dynamo等
D.分布式文件系统:可扩展的支持海量数据的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用。它运行于廉价的普通硬件上,提供容错功能(通常保留数据的3份拷贝),典型技术为GFS/HDFS/KFS等
第7题
A.是一种通过网络实现文件在多台主机上进行分布式存储的文件系统
B.所有的分布式文件系统的设计都是采用“客户机/服务器”(Client/Server)模式
C.谷歌开发了分布式文件系统GFS
D.Hadoop分布式文件系统(HadoopDistributedFileSystem,HDFS)是针对GFS的开源实现
第8题
A.对象存储服务
B.FTP
C.S3Browser
D.存储网关
第9题
A.数据处理框架(MapReduce),集群管理(YARN),分布管理控制(ZooKeeper)
B.Spark高效数据处理架构
C.安全管理组件
D.Hadoop的客户端
第10题
A.hadoop的文件API不是通用的,只用于HDFS文件系统
B.Configuration类的默认实例化方法是以HDFS系统的资源配置为基础
C.FileStatus对象存储文件和目录的元数据
D.FSDataInputStream是java、io、DataInputStream的子类
第11题
A.使用AmazonGlacier
B.使用文件系统或建立一定程度的冗余
C.使用AmazonEBS卷或将数据备份到AmazonS3
D.使用本地实例存储