来才是重点。
第二步是数据清洗,即对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。
超麻烦。
第二步是导入数据挖掘算法,用四大类算法,关联、回归、分类、聚类,处理被清洗好的数据。
超麻烦。
最起码算法就够学一阵的。
第三步是数据可视化,相对简单。
第四步是数据分析报告写作,用于提交汇报备查,可省略。
第五步是数据分析,又是一个大麻烦,因为要拿结论——嫩出来的数据到底能干嘛?有什么指导意义?
必须得说句实话,以上的内容不但麻烦,而且在书本上看起来超级枯燥,属于正常人一辈子都用不到的知识。
不过方小武却读得津津有味,乐在其中。
非常人行非常事,没知识没内涵凭什么放倒学霸姐妹花?
没真货怎么在诸多大佬面前装逼?
以小五哥现在的段位,纨绔二代熊孩子已经无法提供装逼打脸的快感,再往上那个级别,一个赛一个的难搞,不学习不行啊。
三个小时搞定统计学里的贝叶斯分布,再花一个小时补完拟贝叶斯分析,方小武对关联分析就算是基本入门了。
要是说出去,这速度大概能吓死一群学霸,非数系的学生光是理解贝叶斯的概念就得死个上亿脑细胞。
开开心心睡觉。
第二天一早,刚到班级,学神五就被崇主任一个电话叫到办公室。
系主任办公室里坐着两个外人,一看那
第四百八十一章 不尬吹(3/4)