>成都教育培训网>成都IT培训>成都软件工程师培训>成都大数据面试宝典(分析题) 免费发布软件工程师培训信息
广告
热门浏览

成都大数据面试宝典(分析题)

更新时间:2020-07-13 04:07:30 信息编号:263364518
成都大数据面试宝典(分析题)
  • 面议

  • 其它

  • 大数据

分享

详情介绍

服务项目
Python培训,Web开发,大数据,JavaEE
面向地区
版本类型
其它

成都大数据面试宝典(分析题)

金三银四,正值求职的黄金季节,求职大数据的小伙伴们,看过来了,千锋教育小编给你送福利了,千锋教育大数据面试宝典已经为你备好,请各位小主儿过目。

一、hive的使用,内外部表的区别,分区作用,UDFHive优化

(1)hive使用:仓库、工具

(2)hive内外部表:内部表数据删除,外部表数据删除后、其他人依然可以访问

(3)分区作用:防止数据倾斜

(4)UDF函数:用户自定义的函数(主要解决格式,计算问题),需要继承UDF

java代码实现

class TestUDFHive extends UDF {

public String evalute(String str){

try{

   return "hello"+str

}catch(Exception e){

   return str+"error"

 (5)Hive优化:看做mapreduce处理

 a\排序优化:sort by 效率 order by

 b\分区:使用静态分区 (statu_date="20160516",location="beijin"),每个分区对应hdfs上的一个目录

 c\减少jobtask数量:使用表链接操作

 d\解决groupby数据倾斜问题:设置hive.groupby.skewindata=true ,那么hive会自动负载均衡

 e\小文件合并成大文件:表连接操作

 f\使用UDFUDAF函数:

二、简要描述如何安装配置一个apache开原本hadoop,只描述即可,无需列出完整步骤,能列出步骤更好。

流程:

1.创建hadoop用户

2.修改IP

3.安装JDK,并配置环境变量

4.修改host文件映射

5.安装SSH,配置无秘钥通信

6.上传解压hadoop安装包

7.配置conf文件夹下的hadoop-env.shcore-site.xlmapre-site.xmlhdfs-site.xml

8.配置hadoop的环境变量

9.Hadoop namenode -format

10.start-all

三、MapReduce优化

  1.  任务调度

    I/O 方面:Hadoop 会尽量将 Map 任务分配给 InputSplit 所在的机器,以减少网

I/O 的消耗。

  2.数据预处理与 InputSplit 的大小

    合理地设置 block块大小是很重要的调节方式。除此之外,也可以依靠合理地设置 Map 任务的数量来调节 Map 任务的数据输入。

  3. Map Reduce 任务的数量

Reduce 任务的数量是任务槽的 1.75 倍时,执行速度快的机器可以获得更多

Reduce 任务,因此可以使负载更加均衡,以提高任务的处理速度。

以上大数据的经典面试题,各位小主先用着,待小编深度挖掘千锋教育讲师的满满大数据技术干货库,为大家谋福利!

千锋教育http://www.mobiletrain.org/

千锋成都校区:http://cd.mobiletrain.org/

成都校区地址:成都市武侯区科华北路62号力宝大厦N(北楼)18

培训咨询专线:

     : 3429754908   联系人:许老师

面授课程:全栈Web开发+培训、全链路设计培训、PHP全栈+服务器集群培训、JavaEE+分布式开发培训、大数据+人工智能培训、 Unity游戏开发培训、Python培训、云计算+Python运维培训、全栈软件测试培训、Android培训、iOS培训

 

 

 


北京千锋互联科技有限公司 7年

  • ui交互设计培训,php培训,大数据开发培训,python人工智能培训
  • 北京市海淀区宝盛北里西区28号天丰利商城4层

———— 认证资质 ————

没有个人认证
企业认证已通过
天眼查已核实
手机认证已通过
没有微信认证

最近来访记录

  • 北京丰台网友用iPhone手机一个月前在百度APP访问了本页

相关推荐产品

留言板

  • Python培训Web开发大数据JavaEE
  • 价格商品详情商品参数其它
  • 提交留言即代表同意更多商家联系我
北京千锋互联科技有限公司为你提供的“成都大数据面试宝典(分析题)”详细介绍,包括大数据价格、型号、图片、厂家等信息。不是你想要的产品?点击发布采购需求,让供应商主动联系你。
“成都大数据面试宝典(分析题)”信息由发布人自行提供,其真实性、合法性由发布人负责。交易汇款需谨慎,请注意调查核实。