竹磬网-邵珠庆の日记 生命只有一次,你可以用它来做些更多伟大的事情–Make the world a little better and easier


174月/13

数据分析这点事

发布在 邵珠庆

 

 先声明一下,按照传统的定义,我还真不是数据分析高手,各种关联算法,只会最简单的一种(话说不少场合还算管用);各种挖掘技术,基本上一窍不通;各种牛逼的数据分析工具,除了最简单的几个免费统计平台之外,基本上一个都不会用。所以,各种高手高高手请随意BS,或自行忽略。这里说点高手不说的。

       从微博段子说起,微博上关于数据分析有两个段子,我经常当作案例讲,第一个段子,说某投资商对某企业所属行业有兴趣,要做背景调查,甲是技术流,一周分析各种网上数据,四处寻找行业材料,天天熬夜,终于写出一份报告;乙是人脉流,和对方高管喝了次酒,请对方核心人员吃了顿饭,所有内幕数据全搞定,问谁的方法是对的;第二个段子,某电商发现竞争对手淘宝店,周收入突然下降了30%,但是隔周后又自然恢复,中间毫无其他异常现象,于是老板让分析师分析,苦逼的分析师辛苦数日,做各种数学模型,总算找到勉强的理由自圆其说,老板读毕,虽说不能让人信服,却也没有更合理的解释,某日,见对手老板,闲聊此事,“你们某段时间怎么突然收入下降?”“嗨,别提了,丈母娘去世了,回家奔丧,公司放羊了。”老板恍然大悟。

       两个段子,第一个段子,微博上一边倒的说,苦逼分析没有人脉有用;第二个段子类似,一边倒的认为,人脉的消息比苦逼分析管用多了。但是我想说的是,这个解读绝对是错的!

       先说第一个段子,其实网络不乏这种“人脉达人”,特别是媒体圈,一些所谓的“IT名记”或者“著名评论家、分析师”和各种互联网大佬称兄道弟,天天秘闻不断,但是呢?他们从不研究产品,不分析用户,所以,他们知道了数据,却不懂数据背后是什么,更不知道什么是重要的,什么是次要的,我有时会批评身边这样的朋友,别天天觉得自己知道几个互联网大佬的花边新闻,就当自己是资深业内人士了,正因为掌握这些东西又觉得炫耀,才反而忽视了真正有价值的信息和有价值的数据。这就是为什么混网络媒体的,见过市面的各种达人,在互联网创业浪潮里,几乎没有成功几率的真实原因,自以为人脉广泛,无所不知,其实正因为缺乏最基本的数据背景分析,所以才是看上去什么都懂,细究下其实什么都不懂。请记住一点,除非你是富二代,官二代,衔着金钥匙出生,那不在我的讨论范围里,否则,没有苦逼的经历,就没有牛逼的成就。

      我常订阅一些著名分析师的微博,他们透露的数据往往是很有价值的(这是我订阅的原因),但是他们的解读通常是惨不忍睹的,这就是只看表象的恶果,而且随便翻看一下他们的数据解读,可以说他们的数据感和数据认知贫乏到可笑,甚至缺乏最基本的数据校核和考证的能力,他们拿到了某公司核心数据又怎样?没经历过苦逼的分析,他们其实什么都看不到。

      第二个段子同理,如果不是持续有效的数据跟踪,怎么能得出下降30%的结论,这一数据结论与人脉得到的消息相互验证,才会得到完整真实的结果,否则仅仅是闲聊,你怎能知道对方企业管理对业绩影响的范畴,苦逼的分析也许一时没有人脉的消息管用,但是你所得到的对数据的认知和积累,是人脉永远不会给你的。

      所以,再次强调,基本的数据跟踪和日常的数据感养成,绝不是可以忽略和无视的。人脉情报可以成为数据解读重要的信息来源,但是绝不能喧宾夺主,替代基本的数据分析工作。

 

     下面说一下数据感,什么是数据感?就是别人说一个数据出来,你会琢磨一下这个是否符合常理,与你日常的数据观测经验是否一致,如果不一致,那么可能的理由是哪些? 比如12306号称一天几十亿次点击,如果你有数据感,第一眼就会质疑这个“点击”定义的合理性;比如曾经有人说某国内图片分享网站一天多少亿访问量,第一眼就知道这个“访问量”定义是有歧义的,(事后官方解释是图片加载量,这个和访问量差异几十倍。) 数据感需要不断的培养,和基本的逻辑(比如你应该知道中国有多少网民,每天有多少人上网,一个大概什么类型,什么排名的网站会覆盖网民的比例是多少),以及善于利用各种工具,我以前在巨头公司,得益于公司巨大的数据资源,可以看到很多互联网的核心数据;但是离开后,才发现,其实互联网上公开可获取的数据途径是非常多的,而且善于利用的话非常有效。每天去查询一些感兴趣的数据,经过一段时间积累,想没有数据感都难。

      作为公司或团队负责人,怎么培养员工的数据感,我其实也有一个建议,平时可以搞一些小的竞猜,比如团队集体竞猜新产品或产品改版上线后的日活跃用户,或者pv数字,或者收入数据,等等;然后看谁的最准,一种是惩罚制,最不准的请最准的喝奶茶,吃冰淇淋;另一种不惩罚,最准的累计积分后公司可以发一些奖品鼓励,这样下去大家的数据感就会在日常培养起来,而且对团队的气氛培养也有帮助。

       数据感之后,谈数据分析的方法,我的建议是,不炫技,不苛求技术复杂度,最简单的数据,所包含的信息往往是最有价值的,而很多人恰恰这一步都没做好,就总想着弄一堆挖掘算法;数据的价值在于正确的解读,而不是处理算法的复杂度,切不可喧宾夺主。 大公司的kpi制度,往往会产生偏差,比如技术工程师的评定,要讲究“技术复杂度”、“技术领先性”,直接导致简单的事情没人肯做,最基本的工作不认真做!所以往往是大公司的分析工程师,为了评高级工程师,非要简单问题复杂化,四则运算就搞定的事情一定要弄一套诡异的算法,最终非但浪费了资源,消耗了时间,而且往往由于工程师对业务理解的漠视,对应的产品人员又对算法的陌生,导致了严重的理解歧义,从而出现各种误读。

 

       下面说关键,数据解读,正确的数据解读,是所有数据分析工作最关键的一步,这一步错了,前面的所有努力都是白搭,然后,往往很多人简单的以为“数据会说话”,他们认为把数据处理完一摆就ok了,所以我看到很多知名分析师拿着正确的数据信口胡诌;而更有甚者,显然是故意的行为,一个非常非常著名的、口碑极佳的跨国企业,曾经就同一份很酷的数据,在不同的场合下,为了市场公关的需求,做出不同的解读;这简直就是道德问题了。

      数据解读,不能是为了迎合谁,要遵循数据的本质,要遵循科学的逻辑,要有想象力(配合求证),可能有时候也需要依赖人脉关系所获得的情报,(这个也有很多典型范例),这个具体再怎么说可能我也说不清楚,说几个反面例子也许更容易理解。

      1、因果关联错误,或忽略关键因素,A和B的数据高度相关,有人就片面认为A影响了B,或者B影响了A;但是,有时候真实原因是C同时影响了A和B,有时候C被忽略掉了。

      2、忽略沉默的大多数,特别是网上投票,调查,极易产生这种偏差,参与者往往有一定的共同诉求,而未参与者往往才是主流用户。

      3、数据定义错误,或理解歧义,在技术与市场、产品人员沟通中产生信息歧义,直接导致所处理的数据和所需求的数据有偏差,结果显著不正确。

      4、强行匹配;不同公司,不同领域的数据定义可能不一致,在同一个公司内或领域内做对比,往往没有问题,大家对此都很习惯,却有评论家不懂装懂,强行将不同定义的数据放在一起对比做结论,显著失真

153月/122

电子商务数据分析经验总结

发布在 邵珠庆

很不错的一篇总结,转来分享一下,和自己比较接近。

08年毕业,不知不觉的混进了电子商务行业,又不知不觉的做了三年数据分析,恰好又赶上了互联网电子商务行业发展最快的几年,也算是不错吧,毕竟感觉前途还是很光明的。三年来,可以说跟很多同事学到了不少东西,需要感谢的人很多,他们无私的教给了我很多东西。

就数据分析职业来说,个人感觉这对互联网公司来说是非常重要的,也是确实能够带来实际效果的东西。比如说利用数据分析做会员的细分以进行精准化营销;利用数据分析来发现现有的不足,以作改进,让顾客有更好的购物体验;利用CRM系统来管理会员的生命周期,提高会员的忠诚度,避免会员流失;利用会员的购买数据,挖掘会员的潜在需求,提供销售,扩大影响力等等。

最开始进公司的时候是在运营部,主要是负责运营报表的数据,当时的系统还很差,提取数据很困难,做报表也很难,都是东拼西凑一些数据,然后做成PPT,记得当时主要的数据就是销售额、订单量、毛利额、客单价、每单价、库存等一些特别基础的数据,然后用这些数据作出一些图表来。在这个阶段基本上就是做一些数据的提取工作,Excel的技巧倒是学到了不少,算是数据分析入门了吧。

后来公司上了数据仓库,里面就有了大量的原始数据,提取数据非常方便了,而且维度也多,可以按照自己的想法随意的组合分析,那个阶段主要就是针对会员购物行为的分析,开始接触数据建模,算法等一些比较难的东西,也是学到东西最多的时候。记得当时做了很多分析报告,每周还要给总裁办汇报这些报告,下面详细说一下当时使用的一些主要的模型及算法:

1、RFM模型

模型定义:在众多的客户关系管理的分析模式中,RFM模型是被广泛提到的。RFM模型是衡量客户价值和客户创利能力的重要工具和手段。该机械模型通过一个客户的近期购买行为、购买的总体频率以及花了多少钱三项指标来描述该客户的价值状况。在RFM模式中,R(Recency)表示客户最近一次购买的时间有多远,F(Frequency)表示客户在最近一段时间内购买的次数,M (Monetary)表示客户在最近一段时间内购买的金额。一般的分析型CRM着重在对于客户贡献度的分析,RFM则强调以客户的行为来区分客户。利用RFM分析,我们可以做以下几件事情:

⑴建立会员金字塔,区分各个级别的会员,如高级会员、中级会员、低级会员,然后针对不同级别的会员施行不同的营销策略,制定不同的营销活动。

⑵发现流失及休眠会员,通过对流失及休眠会员的及时发现,采取营销活动,激活这些会员。

⑶在短信、EDM促销中,可以利用模型,选取最优会员。

⑷维系老客户,提高会员的忠诚度。

使用方法:可以给三个变量不同的权重或按一定的规则进行分组,然后组合使用,即可分出很多不同级别的会员。

2、关联分析

关联分析最原始的案例来自于沃尔玛的“啤酒与尿布”。通俗意义上讲,就是只买了A商品的人,又有很多人买了B商品,那么我们就可以认为A、B两个商品的关联性比较高。很多数据挖掘工具都有关联挖掘,主要使用的算法是Apriori算法,在计算的过程中会主要考察项集、置信度、相关性这三个结果数据,以最终确定商品之间的相关性。除了Apriori算法外,还有许多其他的关联分析的算法,基本上也都是从Apriori发展而来,比如FPgrowth。本人从几年的数据分析经验感觉,关联分析在零售业中并不太实用,挖掘出来的关联度比较高的商品一般都是同类商品或者同品牌的商品,像“啤酒与尿布”这种,很少能够有。

使用方法:组套销售或者相关陈列等。

3、聚类分析

零售行业的聚类分析主要是指将具有相似购物行为的顾客进行群体的细分,以支持精细化的营销活动,带来更大的营销效果,节省成本。Spss里面的聚类分析主要有两种K-means聚类和系统聚类。也可以在数据仓库中根据顾客购买的商品属性进行会员的聚类分析,这里就不需要算法的支持,只需要根据系统的已经有的商品分类,把购买过相同商品类别的顾客划分到一起。这种方法可能与公司的业务更加贴近。聚类分析是进行会员精细化管理,精细化营销的基础,做好聚类分析,对企业将有很大的益处。

使用方法:对顾客细分,精准化营销。

4、“之”字分析法

该种方法主要是有一种很明确的会员群体,然后通过分析这些会员群体的购买行为,提取这些购物行为的相似点,然后再通过这些相似点返回到整个数据里面,从中抽取更大的会员群体,以制定精准的营销。

再后来,公司又上了SAP,又去BW组去做报表开发,做报表开发这一块能够接触到更多的业务方面的知识,虽然做数据挖掘比较少了,但是数据最终是要指导业务的,所以这对我的成长也算是非常有利的。业务方面主要了解到了几大块:

1、库存管理-库存管理这块主要有正品库存的管理,滞销库存,高库存商品等各种不同类型的库存该怎么定义以及该如何去管理。比如去管理供应商的库存的时候会根据正品库存及滞销库存和库存正常的周转天数来计算该供应商的库存是否在合理的水平,是否该进货还是要减少库存。

2、促销管理-促销管理是以提高销售额为目的,吸引、刺激消费者消费的一系列计划、组织、领导、控制和协调管理的工作。数据方面来说主要是针对不同的促销方式来计算不同的方式收益情况,不同的促销方式可以带来不同的效果,因此在使用促销的时候要审慎的选择,以达到理想的效果。

另外,还有财务报表、采购流程等很多方面的东西,这些接触的比较少就不写啦。

在BW项目组的时候,也经常会帮网站做一些分析工作,自己也自学了两本关于网站数据分析方面的书,感觉学到了一些皮毛,下面说一下吧:

1、网站流量分析

网站流量的比较重要的KPI指标有浏览量、访问量、独立访客数、跳失率、转化率、页面停留时间、访问页面数、流量来源、流量来源ROI等等。通过这些数据可以全面的反映网站的整体情况。其中跳失率可以用来衡量页面的质量,流量来源及转化率可以衡量市场及营销的工作情况。进行网站数据分析的时候,需要牢牢的把握转化率这一指标,然后由这一指标的变化来寻找其他相关数据的变化,最终找出原因,做相对应的策略,改进我们的工作。

2、网站分析细分

数据分析行业有句话-无细分,毋宁死,足矣看出细分对数据分析意义。对于网站的数据分析尤其是如此。网站的流量数据量非常大,从整体上看根本都看不出那里会出现问题,所以必须要细分。比如说营销人员需要看的转化率,必须就要细分到每个渠道里面,然后再看到这些渠道来的会员的点击情况,他们都看过那些网页,对什么感兴趣,跳失率是多少,浏览时间多长,最终转化的是多少等等,这样才能看出问题。

3、网站的短信促销及EDM

在这个电子商务普遍烧钱的时代,花出去的钱到底能有多少能够带来实际的收益呢?在抢占市场的同时,怎么才能做到ROI最大化这个问题急需要解决。公司每天几乎都要发几万条甚至几十万条的促销的短信,短信的反馈率基本上都在2%一下,怎么才能提高转化率,这就需要更精准的用户定位,把钱花到最有可能带来收益的地方。因此网站的短息促销及EDM促销,必须要依据会员的精细化细分,不但要满足客户的需求,更要挖掘出他们的需求。

写到这里基本上写的差不多,通过总结才发觉自己原来很是知道的很少,还有很多需要学习的地方,比如说数学建模方面的知识不够,统计学软件使用不够好,业务了解的不够深入,对整个电子商务行业的发展把握不清晰,这些都是需要以后加强的地方。最近在一个数据分析师的前辈的博客上看到他对数据分析师的要求只有一点,就是要热爱数据。感觉自己还不够,平时工作的时候还不够投入,总觉得是在为公司工作,不是在为自己的兴趣工作,其实一个人每天做的事,一定要都当做是为自己做才行,就算真的不是为自己做,也要从中学到一些东西来变成自己的东西,为自己服务。

2212月/118

网站分析职业生涯规划

发布在 邵珠庆

明天分享读书报告《精通Web Analytics 2.0》相关资料

下面是网站分析大师Avinash的关于网站分析职业生涯规划的表格:

Web Analytics Career 纬度 个人贡献者 团队领导者
业务 角色 CMO – 分析师 – 业务部门 副总裁(CMO)-分析主管-分析师(业务部门)
技能 业务策略

Web analytics2.0衡量策略

有效的沟通者

统计方法与数学技能

JS技能

拥有领导能力的优秀分析师

激励下属

人际交往和沟通能力

提升 团队管理

数据策略

成长空间取决于公司的规模,业务部门领导者,不封顶
技术 角色 业务团队 – 个人技术 – 网站分析提供商 总裁 – 分析经理 – 业务部门
技能 技术加码和工具运用顺利 启发与激励下属

人际交往能力

提升 转向业务,进入IT行业商业智能 基于ASP的分析有瓶颈,可以延伸到CRM,ERP等职位

个人业务的提升,大家是不是倍感压力和动力呢

1610月/113

免费数据分析工具(插件)

发布在 邵珠庆

总结推荐22个免费的数据可视化和分析工具。列表如下:

数据清理(Data cleaning)

当你分析和可视化数据前,常需要“清理”工作。比如一些输入性列表“New York City”,同时其他人会说“New York, NY”。因此你需要标准化这些工作,使看到统一的样式。下面的两个工具被用来帮助使数据处于最佳的状态。

1.DataWrangler

斯坦福大学可视化组(SUVG)设计的基于web的服务,以你刚来清理和重列数据。点击一个行或列,DataWrangler会弹出建议变化。比如如果你点击了一个空行,一些建议弹出,删除或删除空行的提示。它的文本编辑很cooool。

Free data analysis

2.Google Refine

Google Refine。用户在电脑上运行这个应用程序后就可以通过浏览器访问之。这个东西的主要功能是帮用户整理数据,接下来的演示视频效果非常好:用户下载了一 个CSV文件,但是同一个栏中的同一个属性有多种写法:全称,缩写,后面加了空格的,单数复数格式不一的。。。但是这些其实都代表了同一个属 性,Google Refine 的作用就是帮你把这些不规范的写法迅速统一起来。

Free data analysis

统计分析(Statistical analysis)

有时,你需要你的数据的图形化的表达。

3.R项目

R语言是主要用于统计分析、绘图的语言和操作环境。虽然R主要用于统计分析或者开发统计相关的软体,但也有人用作矩阵计算。其分析速度可比美GNU Octave甚至商业软件MATLAB。

Free data analysis

可视化应用与服务(Visualization applications and services)

这些工具提供了不同的可视化选项,针对不同的应用场景。

4.Google Fusion Tables

Google Fusion Tables被 认为是云计算数据库的雏形。还能够方便合作者在同一个服务器上分享备份,email和上传数据,快速同步不同版本数据,Fusion Tables可以上传100MB的表格文件,同时支持CSV和XLS格式,当然也可以把Google Docs里的表格导入进来使用。对于大规模的数据,可以用Google Fusion Tables创造过滤器来显示你关心的数据,处理完毕后可以导出为csv文件。 

Google Fusion Tables的处理大数据量的强大能力,以及能够自由添加不同的空间视图的功能,也许会让Oracle,IBM, Microsoft传统数据库厂商感到担心,Google未来会强力介入数据库市场。

Free data analysis

5.Impure

Impure,允许点击、拖曳来连接模块,由西班牙分析公司Bestiario创建。 

6.Tableau Public

Free data analysis

7.Many Eyes

Free data analysis

Free data analysis

8.VIDI

Free data analysis

9.Zoho Reports

Free data analysis

10.Choosel

Free data analysis

11.Exhibit

12.Google Chart Tools

Free data analysis

13.JavaScript InfoVis Toolkit

InfoViz

14.Protovis

15.Quantum GIS (QGIS)

Free data analysis

16.OpenHeatMap

Free data analysis

17.OpenLayers

18.OpenStreetMap

19.TimeFlow

Free data analysis

20.IBM Word-Cloud Generator

21.Gephi

Free data analysis

22.NodeXL

IntroTutorial-Layout-v2_GraphImage-2.png

 

 

 

数据挖掘有什么用途?数据挖掘和数据仓库之间有什么样的联系?数据挖掘和市场调研、数据分析又有什么样的联系?…… 

   

一  扫盲篇

    研究结果表明,企业处理的数据每5年就会成倍增长,导致企业数据过度的重复和不一致,如何在这些数据中获取有利信息就促进数据挖掘技术发展。

1、数据挖掘的相关概念

   谢邦昌教授在《数据挖掘 clementine应用实物》一书中提到,数据挖掘是指寻找隐藏在数据中的信息(如趋势、特征及相关性)的过程,也就是从数据中挖掘信息或知识KDD(knowledge discovery in databases)。

   数据挖掘可以说汇合了以下六个领域:

  a 数据库系统-数据仓库和联机分析(OLAP)

  b 机器学习

  c 统计与数据分析方法

 可视化

  e 数学规划

  f 高性能计算

   

    数据挖掘和数据仓库有什么样的联系?我个人的理解是数据仓库的建立是数据挖掘的前提条件,因为数据仓库里的数据通常是整理过的数据,也就是我们通常所说的Clear Data,而从这些有用的数据中找出我们感兴趣或是有价值的信息的过程就是数据挖掘。

 

2、数据挖掘的应用领域

   数据挖掘对每个公司来说都是一个重要的策略性计划,因而将它设为高度机密,所以要调查各公司用数据挖掘到底做什么样的事相当不容易。这里简单的说说数据挖掘的几个常用领域:

   客户档案管理方面,通常公司都希望找出客户的一些共同特征,希望能借此预测哪些人可能成为他们的客户,以帮助营销人员找到正确的营销对象,以降低营销成本,提高成功率

   购物篮分析,通常用来帮助零售从业人员了解客户的消费行为,譬如哪些客户会一起购买,哪些客户会购买某种产品后隔段时间会购买另外一种产品,利用数据挖掘,零售从业人员可以更有效的决定进货量或库存量,商品如何排放等等

   客户关系管理,公司通常可以分析,原本一些属于自己的客户,后来却转变成竞争对象的客户,分析这一部分群体的特征,再根据这些特征到现有客户数据中找出有 可能转向的客户,然后设计出相应的方案来留住这一部分客户群体(毕竟找一个新客户的成本要比留住一个原有客户的成本高的多)

    除此之外,数据挖掘还运用到其他许多行业,如金融业、电信业、零售业、互联网等等,其常用情况汇总如下:

 

 

数据挖掘的应用

以客户为中心

以操作为中心

以研究为中心

终身价值

购物篮分析

档案细分

保留

目标市场

采集

知识门户

交叉销售

活动管理

电子商务

盈利能力分析

定价

欺诈检测

风险评估

投资组合管理

员工离职

现金管理

生产效率

网络性能

制造工艺

组合化学

遗传研究

流行病学

 

 

 

3、数据挖掘的进行步骤及常用分析方法

   每个人数据挖掘过程都不一样,但可以肯定的一点是他们大部分时间都花在准备数据阶段,而其他步骤也只是这样一个大致流程:

   1)理解数据与进行的工作

   2)获取相关知识和技术

   3)整合与检查数据

   4)去除错误与不一致的数据

   5)发展模型与假设

   6)实际数据挖掘工作

   7)测试与验证所挖掘的数据

   8)解释与使用数据

   数据挖掘分析方法是利用数据来建立一些模仿真实世界的模型,利用这些模型来描述数据中的模式以及关系,常用的数据挖掘分析方法主要有:

   1)用于分类聚类的分析方法,如:因子分析、判别分析、聚类分析等,除此之外还有决策树(常用分类方法为CART<classification and regression trees>及CHAID<chi-square automatic interaction detector>两种)

   2)推算预测分析方法,如回归、时间序列、神经网络等

   3)序列规则分析方法,如关联规则、序列规则等

 

4、主要数据挖掘软件

     目前市面上比较常用的数据挖掘软件有不下于30种(当然都是老外开发的,目前为止还没发现国人开发的此类软件),例如MLC++,Clementine,Darwin,Intelligent Miner,SAS data Mining,S-plus,matlab等等。下面简单的介绍几种:

1)SPSS Clementine,SPSS公司发行,此工具结合了多种图形用户接口分析技术,包含神经网络、关联规则及规则生成技术。

2)Oracle Darwin,甲骨文公司发行,其优点是支持多重算法,可在多种主从式架构上执行,服务器端可以是单处理器、同步多处理器或大量平行处理器,定位在中、大范围的执行

3)SAS Enterprise Miner,SAS公司发行,目前数据挖掘市场上的领导者,适用于企业在数据挖掘的发展及整个CRM的决策支持应用

4)IBM Intelligent Miner,IBM公司发行,是市场上最大容量及功能强大的工具,在顾客评定报告中它的整体效能是最好的,定位于企业数据挖掘解决方案的先锋。

 

二、数据挖掘与市场分析

   “统计分析给您以先机,分析报告给您后见之明,数据挖掘给您以洞察”这样一句话来形容市场分析与数据挖掘的关系再确切不过了。然而数据挖掘只是用来帮助业 务分析策划人员从数据中发现各种可能的假设,这些假设是否正确,是否有价值还有待确定,为了得到更加确定的答案,企业不得不花费一些时间和经历来验证这些 假设,从而导致企业提出调研目的,针对相关假设设计相应的调查问卷,根据调查结果,运用统计分析得出分析报告,从而推出一系列新的发展方案,发展新的客 户,回头又继续数据挖掘,形成一个数据挖掘--市场调研--统计分析的良性循环。

    除此之外,统计分析还给数据挖掘提高了许多新的分析方法,如神经网络技术应用中的---概率分析网(PLN),挖掘方法上的---贝叶斯网络,遗传算法中的---概率进化算法(PMEA)等等。

 

三、从事数据挖掘工作需掌握的相关知识

  1、数据库技术  数据挖掘是在大量数据中找出自己感兴趣或有用信息的过程,这其中涉及到数据库操作的相关功能,那么掌握一种数据库以上的知识就成了必然,这也是为什么目前国内许多企业数据挖掘从业人员是计算机专业的原因。

  2、相关行业知识  也就是前面数据挖掘步骤中有提到相关知识和技术,没有行业背景知识,纯技术做出来的分析报告就好像"无根"之水

  3、掌握一种以上的数据挖掘软件  其实许多的数据库也提供了相应的分析功能,比如前面提到的IBM、Oracle 数据挖掘软件

  4、相关统计及市场分析知识  没有这些知识做出来的报告可能犯下或多或少的错误,从而使分析结果出现严重的偏差

 

 

 

 

309月/118

网站运营一定要做的八件事

发布在 邵珠庆

一、内容建设

一个成功的网站核心是什么?那就是内容,如何去建设呢,下面介绍几点:

1、提供内容

内容是围绕用户的需求创建的,通过数据分析,市场调研来分析用户的行为,确定用户的需求.给用户提供有用的内容,这是主要的方向。

2、激励用户贡献内容

内容的建设起初是运营人员去创建内容,吸引用户,当网站有一定人气后,一定要做的是内容的日常维护和管理,主要通过运营策略去刺激用户不断地创造更多的内容,通过不断循环,带来新用户,产生更多内容。

3、挖掘忠实用户:

产品发展成熟后,可实行管理制度,主要是交流社区这一块,让忠实的用户去管理和交流,引导用户去维护,让内容和讨论都有针对性。

二、用户维护

用户维护是管理产品与用户群之间的关系,以社区类网站说明以下几点:

1、建立和完善帮助系统,发布友好的产品公告

2、及时解决用户的反馈的问题,为他们提供更好的服务(客服)

3、主动邀请用户来体验和尝试新产品,让用户参与到我们网站中来

4、对虚拟系统和等级系统进行合理的设置,并在运营中对其进行优化改进

5、在社区交友中,会存在一些用户之间的情绪问题,要调节用户之间的矛盾,争议并能调和氛围

6、社区管理员在用户群中会有一定的权威性,一定要树立一个好的形象,让用户建立对网站的信任度很重要,这样不仅能提高用户的忠诚度,而且能提高产品的品牌形象,为口碑营销打下好的基础。

三、产品需求

产品虽然是产品人员的工作,但是在运营过程中,运营人员与用户接触的最多,这样更能理解用户的需求,不断给产品提出建议,也是运营人员要做的事情,产品和运营人员共同策划出的产品,才能更好的满足用户的需求。

四、数据分析

数据分析是产品运营中最重要的一部分,以下介绍几点:

1、通过数据能了解产品的问题

每个产品都会有要分析的数据指标:pv,uv,登录数,会员数,帖子数,回帖数等,这些数据根据产品的不同,会有所改变的,通过分析这些数据的变化可以了解到产品目前存在哪些问题,发现问题所在,则需要对产品提出优化需求。

2、通过数据能了解用户的行为

通过一些特定的数据指标,分析用户在网站上的操作情况,更有利于了解用户的行为,如用户最喜欢进入的页面,最喜欢看的内容是哪些,通过一系列的分析,更能对产品进行深层次的优化。

3、作数据分析需要出的文档

数据记录表格(excel)和数据报告(word)

五、活动计划

产品发展到一定阶段是需要活动来维系的,一般有几种活动目的,第一个是引导用户创造内容;第二个活跃社区的气氛,增加用户群关系;第三个通过对外合作的方式,增强产品的品牌。

下面介绍下运营人员需要作的具体工作:

1、制定半年的活动计划:大概的了解下产品可能需要做什么活动,优先在脑海中思考下,当然这也随着时间的变化,活动也会有改变的。

2、活动的收集:多参考其它产品,看看其它产品做了什么活动并做收集,以便以后在做具体方案时,能够做参考。

3、活动方案制定:具体执行方案的文档内容包括主题,内容,时间地点,目的,奖项设置,说明,活动投入预算等。

4、活动总结:对结束的活动进行总结,输出总结报告,包括主题,时间地点,目的,实现效果,活动的优缺点,实际的预算。

六、营销计划

产品在推广过程中需要对外营销,提高产品的品牌形象,以下说明几点:

1、广告合作

2、渠道合作

3、病毒营销

4、事件营销

对于营销做的不是很多,只大概的说明几点,希望与有经验的高手一起学习探讨。

七、产品分析

分析同类产品是所有运营人员也需要做的

从产品角度:主要借鉴其它产品的优势和弥补我们产品的不足,多看多用能够给我们带来更多的灵感,也更能给产品提出好的建议。

从运营角度:在使用其它产品的同时,多多思考其它网站的运营思路和盈利模式,通过怎样的运营策略运用到自己的产品中。

产品分析的要点: 产品的内容,用户群,产品风格,发展方向,流量,盈利模式等。

八、运营总结

运营人员在做一段时间后,都会有一些运营的心得体会,感受等,可以将自己的想法记录下来,这也是一个成长的经历,如果能够发表到网站上与大家一起分享,交流,学习,与同行业的人沟通的越多,才能跑的更快,更远!

99月/114

PPT、EXCEL、SPSS、数据分析资料汇总

发布在 邵珠庆

一、PPT
1、我的PPT培训
技巧培训1(成功标准、设计原则、统一字体)
技巧培训2---色彩应用
技巧一:快速对齐与分布
技巧二:快速改变图形形状
技巧三:快捷键
技巧四:快速移动复制
技巧五:快速选中
技巧六:自动连接
技巧七:参考线
技巧八:填充
技巧九:裁剪
技巧十:为PPT瘦身
PPT制作参考书介绍
2、其他
PPT自动循环反映技巧
PPT制作技巧--拿填充做文章
PPT“高手”的自我总结
ppt密技真言
高手做PPT的流程
PowerPoint高效达人的七大习惯
制作ppt引人注目的PPT的一些细节
在PPT里图表方式的选择
怎样正确地使用图表
如何选择恰当的图表类型
图表应用总结
如何制作精美的Excel与PPT图表
PPT表格使用123原则
PowerPoint 2007 SmartArt 图形类型简介
如何在内容繁多的幻灯片中轻松选取目标内容(07版)
PPT2007中批量删除备注页
为你的ppt找到好图片
如何快速找到合适的图片
PPT设计、排版创意借鉴
如何用图片进行演示
成功PPT的标准是什么?
如何在PPT里插入FLASH文件
自定义PPT音乐在幻灯片起始结束位置
PPT中强调数据
2008年最新ThemeGallery PPT模版打包下载
TG经典PPT模版饼图制作过程演示
TechNet中文网络广播office系列视频教程下载(一)
TechNet中文网络广播office系列视频教程下载(二)
PPT分屏放映操作设置详解
幻灯片放映快捷键使用
表格字型、字体的选择技巧
Office 2007转为PDF和XPS格式插件(好用)
PPT页码设计
PPT设计容易犯的十大错误
打印PPT讲义
《PPT演义》里的十个专业powerpoint绝招
如何在幻灯片中应用金字塔原理
PowerPoint 2010汉化界面
强烈推荐PPT演说之道资料
二、EXCEL
我的EXCEL培训
小蚊子EXCEL培训--文本数据导入
小蚊子EXCEL培训--快速选中单元格
小蚊子EXCEL培训--图表美化技巧
小蚊子EXCEL培训--数据透视表
小蚊子EXCEL培训--VLOOKUP函数使用技巧
图表技巧--折线图
图表技巧--柱形图
图表技巧--条形图
图表技巧--饼图
1、图表
专业商务图表的设计与制作原则
EXCEL图表资料下载
图表类型选择应用总结
统计图表类型选择应用总结(续)
麦肯锡 用图表说话(中文完整版)
Pareto Chart在EXCEL制作步骤
图表设置操作技巧
什么是交叉表

利用EXCEL做矩阵图(散点图) [Excel图表] 搞定散点图
正确使用excel的复合饼图
用图表说话--复合饼图
用图表说话--饼图
用图表说话--柱形图
用图表说话--选择合适的图表类型
如何制作对称条形图
制作经过原点的折线图
EXCEL如何添加平均线(操作演示)
07版本线柱图
创建一个温度计式的Excel图表
用EXCEL制作双坐标轴图表
用EXCEL制作瀑布图
金字塔图在EXCEL的作法
人口金字塔的制作
竖型折线图(蛇形图)绘制步骤
EXCEL动态图
如何制作断层图-图表组合法
直方图、分步柱形图、分步折线图、长城图
加强Excel图表表现能力的小技巧
EXCEL添加辅助标签制作详解
EXCEL中X轴不等间距标签问题
利用JWalk Chart Tools在EXCEL添加文本标签
输入新数据时Excel图表自动更新
Excel图表技巧
图表美化技巧
Excel 图表教程
如何看报表(如何做报表)
图表制作需要注意的事项
Excel图表中的条件格式化
真的需要这么多图表来说明问题吗
[新华图表分析] 失败和错误的案例分析
2、数据分析
EXCEL矩阵相乘MMULT函数应用介绍
Excel技巧:处理折线图表的缺失数据
Excel在统计中的应用
用EXCEL数据分析工具进行抽样
重要程度排序多选题的解题思路
用EXCEL数据分析工具进行抽样
3、其他技巧
EXCEL找不到的函数与错误值提示
如何保护你的EXCEL公式
如何在EXCEL隔7个数就取最大值
我的数据处理
【实用技巧】Excel自定义菜单栏随身带
如果利用EXCEL数据有效性建立下拉菜单
通过使用条件格式查找重复数据
VLOOKUP函数使用的技巧
Excel—通配符在函数里的应用
测测自己对EXCEL的了解程度
困扰已久的问题被VBA搞掂啦
EXCEl问卷制作视频教程
Excel2003函数应用完全手册
关于EXCEL超级链接被禁止的解决方法
EXCEL条件格式的运用
找出重复的数据的几种方法
EXCEL2007删除重复项功能
Access导入Excel 数据注意事项
如何在Access和Excel之间选择
EXCEL打印如何设置每页都显示标题栏
三、OFFICE 2010
OFFICE 2010 BETA安装错误提示
OFFICE2010新功能--PDF转换
EXCEL2010新功能--切片器
EXCEL2010新功能--迷你图
EXCEL2010新功能--条件格式设置增强功能
PPT2010新功能--动画刷
PPT2010新功能--修剪视频
PPT2010新功能--消除图片背景
PPT2010新功能--将幻灯片组织为逻辑节
PPT2010新功能--将鼠标指针转变为激光笔
PPT2010新功能--合并和比较演示文稿
PowerPoint 2010汉化界面
四、水晶易表
如果利用水晶易表制作单选效果
制作简单的水晶易表图
水晶易表从入门到精通(英文视频)
水晶易表2008
水晶易表精美实例(源文件)下载
水晶易表电子版与视频教程
水晶易表不足之处
对水晶易表又进一步了解
再次完工
电子地图终于完工啦
用水晶易表做快递费计算器
用水晶易表做车型市场分析
数据展现的艺术——精通水晶易表Xcelsius
五、SPSS
SPSS 16实用教程--PPT资料下载
SPSS操作快捷键
SPSS中异常值检验的几种方法介绍
在SPSS中将连续变量转化为离散变量
利用SPSS进行快速聚类分析
SPSS12中文菜单
如何显示SPSS一个操作的syntax命令?
如何用SPSS进行数据Z标准化
spss中tables的使用
SPSS问卷分析---编码录入及描述统计详解
利用General tables做多选交叉分析
多项选择题选项在SPSS的转化
SPSS主成分相关资料
SPSS自动生成Case ID程序
如何选择SPSS英文版、中文版、汉化版?
关于顺序问题的设计、分析及SPSS处理(Z)
时间序列预测技术之一
时间序列预测技术之二——SPSS18 软件操作
EpiData数据管理软件的操作与应用--视频教程

137月/1121

Excel:数据分析工具名词解释

发布在 邵珠庆

数据分析

  • 如果显示“数据分析”对话框,请在“分析工具”下单击要使用的工具,然后单击“确定”
  • 在所选工具对应的对话框中输入适当的数据并单击相应选项,然后单击“确定”

    有关每种工具的说明以及如何使用每种工具的对话框的信息,请单击下面列表中的工具名:

 

注释

  • 该数据分析功能一次只能应用于一张工作表。如果对组合的工作表进行数据分析,计算结果只会显示在第一张工作表上,其余工作表上将显示带格式的空白表格。若要对其余工作表进行数据分析,分别在每张工作表上运行一次分析工具即可。
  • 有关提供用于创建 Microsoft Excel 统计工具和功能的统计方法或算法详细信息的书籍列表,请参阅统计方法和算法的参考书目

xl 使用什么方法能够分析统计信息? 使用什么方法能够分析统计信息? 使用什么方法能够分析统计信息? 使用什么方法能够分析统计信息? 使用什么方法能够分析统计信息? 双因素方差分析 双因素方差分析 双因素方差分析 双因素方差分析 双因素方差分析 数据分析结果错误 数据分析结果错误 数据分析结果错误 数据分析结果错误 数据分析结果错误 比较方法 比较方法 比较方法 比较方法 比较方法 自动散点图 自动散点图 自动散点图 自动散点图 自动散点图