招生合作
课程分类
您当前的位置:青岛汇学通 >青岛汇学通 >大数据工程师具体工作是干什么的?

青岛Python学习网

大数据工程师具体工作是干什么的?

发布时间:2018-12-27 14:53:15 已帮助:1018人

大数据工程师具体工作是干什么的?

青岛大数据培训

  大数据开发在众多编程里,是很容易入门的,适合零基础的人去学习。在这里说一下,你要去应聘的时候,你至少要会什么,掌握到什么情况,你才能有被录用的机会。那么刚入职一家创业公司做大数据的基本工作内容是啥?

1数据采集


  业务系统的埋点代码时刻会产生一些分散的原始日志,可以用Flume监控接收这些分散的日志,实现分散日志的聚合,即采集。

2数据清洗


  1.一些字段可能会有异常取值,即脏数据。为了数据下游的"数据分析统计"能拿到比较高质量的数据,需要对这些记录进行过滤或者字段数据回填。

  2.一些日志的字段信息可能是多余的,下游不需要使用到这些字段做分析,同时也为了节省存储开销,需要删除这些多余的字段信息。

  3.一些日志的字段信息可能包含用户敏感信息,需要做脱敏处理。如用户姓名只保留姓,名字用'*'字符替换。

3数据存储


  清洗后的数据可以落地入到数据仓库(Hive),供下游做离线分析。如果下游的"数据分析统计"对实时性要求比较高,则可以把日志记录入到kafka。

4数据分析统计


  数据分析是数据流的下游,消费来自上游的数据。其实就是从日志记录里头统计出各种各样的报表数据,简单的报表统计可以用sql在kylin或者hive统计,复杂的报表就需要在代码层面用Spark、Storm做统计分析。一些公司好像会有个叫BI的岗位是专门做这一块的。

5数据可视化


  用数据表格、数据图等直观的形式展示上游"数据分析统计"的数据。一般公司的某些决策会参考这些图表里头的数据~

  以上是小编整理的一些关于的大数据就业方向的一些基本问题,希望能对各位小白能有所帮助,欢迎各位来我们青岛思途教育咨询学习大数据课程!