应用或创建数据分析模型心得

本文由用户“zjh57106775”分享发布 更新时间:2022-03-10 08:56:34 举报文档

以下为《应用或创建数据分析模型心得》的无排版文字预览,完整格式请下载

下载前请仔细阅读文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。

应用或创建数据分析模型心得

结合现实,定义问题和目标

数据分析的目的是解决问题。例如推测明年橄榄的产量,就是一个明确的目的。公司有两种方案基于对用户进行广告营销,哪一种方案更好?销售量下滑,是价格提高还是质量问题引起的?也要通过数据分析来验证。这里的示例是对豆瓣阅读上的电子书进行分析。属于探索性数据分析,在实际的应用中更多的是目标明确的。

2.收集数据

确定目标后,首先要收集数据。有时数据是现成的,***的业务数据库,存放了多年的系统数据。有时要利用各种方法获取数据,包括填写调查问卷,从网站上下载(例如国家统计局网站),自己写爬虫程序来抓取。数据的存储形式多种多样,包括数据库,文本文件,Excel文件等。我所需要的数据,只能利用爬虫从网页上抓取,包括每本书的作者、出版社、评分以及目录等信息。

3.清洗数据和处理数据

就像做菜之前要先备好原料,在分析之前也要进行一定的准备工 内容过长,仅展示头部和尾部部分文字预览,全文请查看图片预览。 字段,我们可以增加两个列,出生年月和年龄,分别从身份证号中提取出来。

4.数据探索是数据探索

数据探索是对数据进行概括性的描述,能帮助我们认识数据的全局。通常采用可视化方法,即利用图形如饼图、柱形图、折线图、散点图对数据进行对比、排序,可以更直观的展现数据特征,读者也更易于接受。假如我告诉你今年已经过了83天,恐怕你不会有很深的感受,但是当你看到这张图,心里会不会就有一种紧迫感?

5.数据建模

模型是对现实问题的抽象,发现数据的特征和内在联系。 评论人数较多的书,也就是热门书籍,评论人数和分数之间有没有相关性?引入一个线性模型来分析,结果显示相关度非常低,也就是说大家热衷于评论的书籍未必就是高分书籍。再如,假设我们手头有豆瓣阅读用户的购买数据,就可以对用户分类,并针对不同类别用户推荐不同的书籍。

6.数据分析报告结论 结合前面的分析结果,对数据进行解读,提出建议和解决方案。

[文章尾部最后300字内容到此结束,中间部分内容请查看底下的图片预览]

以上为《应用或创建数据分析模型心得》的无排版文字预览,完整格式请下载

下载前请仔细阅读上面文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。

图片预览