设为首页收藏本站

小牛社区-大数据学习交流社区|大数据免费学习资源

 找回密码
 立即注册!

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 68|回复: 0

初学者学习大数据的这三个坑,各位程序员踩过几个? ...

[复制链接]

91

主题

0

帖子

24

积分

吃土小白

Rank: 1

积分
24
发表于 2017-10-30 21:00:38 | 显示全部楼层 |阅读模式

Hello,各位程序员,前两篇关于大数据的文章收到了不少的肯定,小媛非常开心,我会陆陆续续在后面继续更新我在学习大数据过程中的一些见解,当然也希望我的一些建议能够为大家的对于了解大数据以及如何学习大数据贡献一份绵薄之力。今天我的主题是讲讲如何在初学大数据时候能够快速入门,避免踩坑。废话不多说了,首先上图一张。

这是今天也就是2017.10.30在某直聘app上看到的,从薪资以及招聘公司就可以看出现在大数据的缺口还是很大的,大数据也在像各个行业渗透,我们通过数据可以解决很多宏观上无法把控的事务,通过数据的收集处理分析可以得到更加科学性的得出一些用肉眼或者意识和思维无法得出的结论。例如,企业可以运用‘大数据’改善决策流程和业务成效的潜能;在医疗中,大数据剖析应用的计算能力可以让我们能够在几分钟内就可以解码整个DNA,而且让我们可以制订出最新的治疗方案,同时可以更好的去理解和预测疾病;在电商行业中,利用大数据进行精准营销,它根据客户的消费习惯提前生产资料、物流管理等,有利于精细社会大生产;在金融行业中,更多应用于交易,现在很多股权的交易都是利用大数据算法进行,这些算法现在越来越多的考虑了社交媒体和网站新闻来决定在未来几秒内是买出还是卖出。在传统领域大数据同样将发挥巨大作用:帮助农业根据环境气候土壤作物状况进行超精细化耕作;在工业生产领域全盘把握供需平衡,挖掘创新增长点;交通领域实现智能辅助乃至无人驾驶,堵车与事故将成为历史;能源产业将实现精确预测及产量实时调控。大数据不但单只是应用于企业和政府,在不久的未来在我们每个人身上会广泛应用。Balabala...好像要偏题了。关于大数据的应用后面会我专门策划一个专题给大家讲解。再说下学习吧,为了让我们的大数据技能跟就业接轨,学习内容一定要贴合现在的企业要求,就拿咱们官方头条和BAT的招聘为例,看图,各位看管。

头条的大数据招聘岗

百度、腾讯、阿里巴巴的大数据岗
从这些招聘中我看到HR对大数据的技能的要求,主要分为两个层面,一个是大数据的各个生态架构组件的灵活运用,因为大数据的整个框架是搭建在linux系统上面的,所以要熟悉linux开发环境,另外做任何开发,都离不开一门语言,从招聘中我们也看到,大数据主流的使用语言基本是C++,java和python,这里特别说一下python,Stack Overflow 最近的调查显示,Python 已经成了发展最快的主流编程语言,也是 Stack Overflow 上来自高收入国家的访问中,点击量最高的标签。而且python在数据领域方面性能卓越,开发周期短,在企业中也非常受欢迎。如果有新手想入门的话,力荐python,毕竟人生苦短嘛,嘿嘿哈。其实这个具体原因的话,大家可以看我上一篇文章。企业上需要的人才必须对大数据的一些组件比较擅长,包括Hadoop,yarn, HDFS, storm, zookeeper,Hive,Hbase,kafka,Flume,Spark等等,组件挺多,但是你如果能够做到精通其中的一个就可以拿到薪资可观的offer了,另外一个层面就是数据挖掘,数据提取出来很重要的一个环节就是数据挖掘,数据挖掘涉及到很多算法,针对不同的业务难点具体选择你要学习的算法,如果你是数学专业的想转行大数据这里的优势就体现出来了。学算法的重要就在于你能够在具体的业务场景中明确自己需要些什么数据,哪些数据作为收集和处理的重点,以及拟定我们数据处理的方式,不然的话,数据只是一个简单的收集,可能你收集到的数据都不一定是自己需要的,结果不仅浪费了人力,服务器也跟着你受苦受难了,哈哈。
根据以上分析,这下你应该知道自己需要学什么了吧,对于初学者入门大数据来讲就要先掌握大数据的生态架构以及数据挖掘算法等等。小媛解释的这么清楚,应该说出了很多HR的心声吧!

新手入门大数据一定要注意的几个误区(这里你们必须mark下,免得本末倒置):
第一:花太多学习语言的时间在上面,很多同学呀因为是零基础,所以先从语言着手,很多学java的大佬不仅会让你学语法基础,数据结构,核心编程,还推荐你把J2EE、HTML5、Struts2、SpringMVC、Mybatis、Hibernate也学习一下,天了噜,这些知识只有在大数据可视化阶段才能用到,如果你学这么多,干嘛还要来学大数据呢,直接做前后端攻城狮不就好了嘛。事实上你知道学习一门语言的语法基础,数据结构和核心编程就ok了,而且语言的功夫并不是一朝一夕的,好在学大数据生态架构的话编程的成分占得不算很多,很多时候需要从业务、规模、产品设计、应用场景等多个方面来考虑和解决问题,所以当你先进入这个领域慢慢在修炼自己语言的内功也不迟哈。如果你是新手,建议你从python学起,代码简单,容易上手。
第二:linux的学的太深,不可否认大数据的架构是基于linux基础上的,但是你要明白的是linux只是一个系统,说白了还是在为大数据服务,小媛认为你只要能够运用基本的linux知识将大数据生态系统搭建起来就可以,但是基本命令一定要通过多多练习熟练掌握。而且在大型公司作业中,系统搭建都是通过跑脚本,并且未来云主机的普及Linux环境都无需搭建啦。
第三:过度依靠书籍,不可否认,很多书籍是比较经典,例如人人皆知的Hadoop权威指南,但是作为初学者,光看书是不行的,你抓不到学习的重点,另外技术这东西一定要多多实践,而且现在有很多书籍,讨论的知识点非常的浅,在一个就是书籍出版一般都比真正企业中的技术落后。毕竟,这个时代,it领域内,技术更新太快啦。
今天内容就到这里,关于学习python和linux我来提点建议:
Python和linux也发展了很多年,网上的免费学习资源非常的多。
python大家可以去百度廖雪峰老师的官方网站,各个版本的教程都有,很适合零基础小白的学习。
Linux的话就是推荐鸟哥和阿铭老师的,这两位大佬的课都非常的经典。
然后具体的学习要点,我下次在分享给大家。
如果有想直接要链接的,可以关注私信我哦。
后面还会继续给大家推出一些大数据的入门方法,喜欢小媛的记得分享和关注哦。蟹蟹你们啦,可爱的程序员。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册!

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册!

本版积分规则

快速回复 返回顶部 返回列表