网站分析 « 邵珠庆の日记

711月/11关

我有幸在一家业务非常齐全的360度营销公司带着这顶帽子为大大小小的各行业的顾客工作了2年多。在这期间，关于网站分析构成的图形做了一版又一版，越画越大；也越来越多的发现自己的能力的欠缺，甚至有时候也会迷失到极端。
尽管很多人不同意，我仍然认为，作为一个边缘学科，网站分析入门很简单。只要你愿意学习并且思维灵活，一点点Html+JS，一点点 datamining，marketing的基础知识最后加上一个免费的Google Analytics的使用技巧，你就可以成为一个入门级的网站分析师了.
然后，在做网站分析的过程中，你能够理解网站分析工具数据采集的原理和各种工具的个性化变量，知道如何做人群分组（Segment）和Campaign Tracking，能够深刻了解各种标准参数的含义和他们之间的区别，并且知道如何在各种主流工具中（诸如GA, SiteCatalyst，Unica, Webtrends, Cormetrics）提取这些数据，展示这些数据，那你就是一个初级网站分析师（Junior Web Analyst）了，在这同时，如果你还了解一点点广告服务器（Adserver），邮件服务器（Email Router），SEO和SEM的原理那就更好了。
紧接着，如果你掌握了网站分析工具的安装和调试技术，能够协调市场部门和IT部门之间的联系，能够做出诸如Tracking Plan这样的需求和技术文档（specification），同时能够debug，确认采集数据的可靠性并且能够解释对于所研究网站本身来说任何一个数据的含义和边际值所代表的含义，并且可以掌握诸如A/B Testing，行为定向等边缘的技术,那你便渐渐的向一个合格的网站分析师方向迈进。
不过，为了彻底的摘掉那个Junior，成为一个真正的网站分析师，你还需要更多的商业上的能力，比如说，
1、能够深刻理解公司的战略，并且把它分解，转化成网站的目标，进而转化成可以衡量这些目标的指标和影响它实现的因素，最终把他转化成从数据采集到提炼成指标到分析到结论的完整流程；
2、对于业务上出现的正向的和负向的变化，能够顺藤摸瓜找出这个结果在网站分析数据上的体现进而找到影响这些数据的因素和原因；
3、能够根据网站分析数据及时发现问题和潜在的机会，做出切实可行的市场策略或者建议方案；
4、能够设计出符合不同利益方需求的报表和分析报告，并且持续沟通，让他们知道网站分析的意义并且能够从你提供的材料中发现有价值的信息；
以上这些都是成为一个合格的网站分析师的必须条件；我曾经为此踌躇良久，认为一个好的网站分析师不应该是这一行单纯的从业者，而应该是一个传统的营销人，最好是一个商务分析师（Business Analyst）转型而来。如果不是的话，那就要积极的去理解企业的战略，去和所有的部门沟通，去了解他们的需求和挑战。那么，什么是一个高级网站分析师 (Senior Web Analyst)呢？如果初级网站分析师侧重于技术，成熟的网站分析师侧重于方法的话，那么高级网站分析师应该有丰富的经验和宽广的知识层面，能够设计和完成解决方案。一个品牌不仅仅只有网站，还有围绕这个网站的生态系统；网站分析必须要把这整个系统考虑进来，从消费者的角度去理解整个系统的数据和信息流，然后设计系统，尽可能多的捕捉有效的信息流，贯通他们，获得一个消费者整体的画像和决策历程。这个系统，可能要包含网站行为数据，网站数据库，线上媒体广告（display，search，email…）,社交网络，手机应用数据，线下数据，调查访问数据，call center，CRM等。这个系统应该能够，在宏观上给企业的战略决策和重大投资提供支持（包括产品设计，营销费用的分配），在微观上帮助网站（品牌）进行一对一个性化营销。
要做到这些，需要的能力就非常多样化了，我肯定会漏掉很多，这里我可以轻易列举出的就有下面很重要的三点：
1、了解信息系统的架构的知识,熟悉企业本身现有的信息系统的构成和信息流；
2、熟悉市场上各种管理工具和监测工具，知道他们采集数据的原理和所提供的各种接口；
3、有比较好的数据分析知识（datamining）和方法；
也许我想的有点儿多了，就如同张三丰最初想要把武当八卦阵精简到一个人身上一样。的确，上面的这些能力可以归结成一个团队的能力，比如我现在所在的团队可以为客户搭建类似的系统，但是任何一个团队成员都不能独立完成。不过，高级网站分析师肯定不能对以上任何一条持有空白。
我自认还比较年轻，虽然我正在积极扩展我的知识和能力层面，但是可能连个合格的网站分析师都算不上。我这里只想说出我对这个行业的认识，可能给一些后来者提供些借鉴，给一些踌躇不决的业外人士一些信息，但是不想争论；随便找来几个网站分析师的招聘启事可能会更实际一些。很可能三年之后我回头看这篇东西也会觉得很幼稚，但我目前是这样要求自己的。
我想补充的是，文中所列出的几个阶段并没有完全清楚的界限，各个方面都是交叉的，一个人各方面的发展也是同步的。以上分类，只是为了介绍的方便和条理的清晰。
扯了这么多，列举了这么多，最后，我不能回避我一次极端的经历（极端的网站分析师）。那次，我给我的部门经理写邮件说，网站分析归根结底就是两条，一个是分析内容和功能的有效性，一个是分析人机互动也就是设计的易用性。而我对内容和功能几乎没有任何话语权，又没有学习过设计，我这算是哪门子网站分析师呢？后来我给自己安慰说，至少我知道，当3月份的visit的数据比2月份增长了10.7%的时候，我可以蛋定的对公司的客户经理说，这两个月的流量数据没有任何变化。[转]

标签: 分析师, 感想, 网站 4 评论

3110月/11关

电子商务网站数据分析指标、名词定义与解析

发布在邵珠庆

网站分析采用指标可能有各种各样，根据网站目标和网站客户不同，可以有许多不同指标来衡量。常用网站分析指标有内容指标和商业指标，内容指标指是衡量访问者活动指标，商业指标是指衡量访问者活动转化为商业利润指标。

一、网站分析内容指标

转换率　Take Rates （Conversions Rates）

计算公式：转换率＝进行了相应动作访问量／总访问量

指标意义：衡量网站内容对访问者吸引程度以及网站宣传效果

指标用法：当你在不同方测试新闻订阅、下载链接或注册会员，你可以使用不同链接名称、订阅方式、广告放置、付费搜索链接、付费广告（PPC）等等，看看那种方式是能够保持转换率在上升？如何增强来访者和网站内容相关性？如果这个值上升，说明相关性增强了，反之，则是减弱。

回访者比率　Repeat Visitor Share

计算公式：回访者比率＝回访者数／独立访问者数

指标意义：衡量网站内容对访问者吸引程度和网站实用性(出自业务员网：www.yewuyuan.com)，你网站是否有令人感兴趣内容使访问者再次回到你网站。

指标用法：基于访问时长设定和产生报告时间段，这个指标可能会有很大不同。绝大多数网站都希望访问者回访，因此都希望这个值在不断提高，如果这个值在下降，说明网站内容或产品质量没有加强。需要注意是，一旦你选定了一个时长和时间段，就要使用相同参数来产生你报告，否则就失去比较意义。

积极访问者比率　Heavy User Share

计算公式：积极用户比率＝访问超过１１页用户／总访问数

指标意义：衡量有多少访问者是对网站内容高度兴趣

指标用法：如果你网站针对正确目标受众并且网站使用方便，你可以看到这个指标应该是不断上升。如果你网站是内容型，你可以针对不同类别内容来区分不同积极访问者，当然你也可以定义２０页以上才算是积极访问者。

忠实访问者比率　Committed Visitor Share

计算公式：访问时间在１９分钟以上用户数／总用户数

指标意义：和上一个指标意义相同，只是使用停留时间取代浏览页数，取决于网站目标，你可以使用两个中一个或结合使用。

指标用法：访问者时长这个指标有很大争议，这个指标应结合其它指标一起使用，例如转换率，但总体来说，较长访问时长意味着用户喜欢呆在你网站，高忠实访问率当然是较好。同样，访问时长也可以根据不同需要自行设定。

忠实访问者指数　Committed Visitor Index

计算公式：忠实访问者指数＝大于１９分钟访问页数／大于１９分钟访问者数

指标意义：指是每个长时间访问者平均访问页数，这是一个重要指标，它结合了页数和时间。

指标用法：如果这个指数较低，那意味着有较长访问时间但是较低访问页面（也许访问者正好离开吃饭去了）。通常都希望看到这个指数有较高值，如果你修改了网站，增加了网站功能和资料，吸引更多忠实访问者留在网站并浏览内容，这个指数就会上升。

忠实访问者量　Committed Visitor Volume

计算公式：忠实访问者量＝大于１９分钟访问页数／总访问页数

指标意义：长时间访问者所访问页面占所有访问页面数量

指标用法：对于一个靠广告驱动网站，这个指标尤其值注意，因为它代表了总体页面访问质量。如果你有１００００访问页数却仅有１％忠实访问者率，这意味着你可能吸引了错误访问者，这些访问者没有啥价值，他们仅仅看一眼你网页就离开了。这是你应该考虑是否广告词语产生了误解。

访问者参与指数　Visitor Engagement Index

计算公式：访问者参与指数＝总访问数／独立访问者数

指标意义：这个指标是每个访问者平均会话（session），代表着部分访问者多次访问趋势。

指标用法：与回访者比率不同，这个指标代表着回访者强烈度，如果有一个非常正确目标受众不断回访网站，这个指数将大大高于１；如果没有回访者，指数将趋近于１，意味着每一个访问者都有一个新会话。这个指数高低取决于网站目标，大部分内容型和商业性网站都希望每个访问者在每周／每月有多个会话（session）；客户服务尤其是投诉之类页面或网站则希望这个指数尽可能接近于１。

回弹率（所有页面）Reject Rate／Bounce Rate

计算公式：回弹率（所有页面）＝单页面访问数／总访问数

指标意义：代表着访问者看到仅有一页比率

指标意义：这个指标对于最高进入页面有很重要意义，因为流量就是从这些页面产生，当你对网站导航或布局设计进行调整时尤其要注意到这个参数。总而你是希望这个比率不断下降。

回弹率（首页）Reject Rate／Bounce Rate

计算公式：回弹率（首页）＝仅仅访问首页访问数／所有从首页开始访问数

指标意义：这个指标代表所有从首页开始访问者中仅仅看了首页访问者比率

指标意义：这个指标是所有内容型指标中最重要一个，通常我们认为首页是最高进入页面（当然，如果你网站有其他更高进入页面，那么也应该把它加入到追踪目标中）。对任意一个网站，我们可以想象，如果访问者对首页或最常见进入页面都是一掠而过，说明网站在某一方面有问题。如果针对目标市场是正确，说明是访问者不能找到他想要东西，或者是网页设计上有问题（包括页面布局、网速、链接文字等等）；如果网站设计是可行易用，网站内容可以很容易找到，那么问题可能出在访问者质量上，即市场问题。

浏览用户比率　Scanning Visitor Share

计算公式：浏览用户比率＝少于１分钟访问者数／总访问数

指标意义：这个指标一定程度上衡量网页吸引程度。

指标用法：大部分网站都希望访问者停留超过一分钟，如果这个指标值太高，那么就应该考虑一下网页内容是否过于简单，网站导航菜单是否需要改进。

浏览用户指数　Scanning Visitor Index

计算公式：浏览用户指数＝少于１分钟访问页面数／少于１分钟访问者数

指标意义：一分钟内访问者平均访问页数

指标用法：这个指数也接近于１，说明访问者对网站越没兴趣，他们仅仅是瞄一眼就离开了。这也许是导航问题，如果你对导航系统进行了显著改进，应该可以看到这个指数在上升；如果指数还是下降，应该是网站目标市场及使用功能有问题，应该着手解决。

将浏览用户比率和浏览用户指数结合起来使用，可以看出用户是在浏览有用信息还是厌烦而离开。

浏览用户量　Scanning Visitor Volume

计算公式：浏览用户量＝少于１分钟浏览页数／所有浏览页数

指标意义：在一分钟内完成访问页面数比率

指标用法：根据网站目标不同，这个指标高低有不同要求，大部分网站希望这个指标降低。如果是搞广告驱动网站，这个指标太高对于长期目标是不利，因为这意味着尽管你通过广告吸引了许多访问者，产生很高访问页数，但是访问者质量却是不高，所能带来收益也就会受到影响。

二、网站分析商业指标

平均订货额　Average Order Amount （AOA）

计算公式：平均订货额＝总销售额／总订货数

指标意义：用来衡量网站销售状况好坏

指标用法：将网站访问者转化为买家当然是很重要，同样重要是激励买家在每次访问是购买更多产品。跟踪这个指标可以找到更好改进方法。

转化率　Conversion Rate （CR）

计算公式：转化率＝总订货数／总访问量

指标意义：这是一个比较重要指标，衡量网站对每个访问者销售情况

指标用法：通过这个指标你可以看到即使一些微小变化都可能给网站收入带来巨大变化。如果你还能够区分出新、旧访问者所产生订单，那么就可以细化这个指标，对新旧客户进行分别统计。

每访问者销售额　Sales Per Visit （SPV）

计算公式：每访问者销售额＝总销售额／总访问数

指标意义：这个指标也是用来衡量网站市场效率

指标用法：这个指标和转化率差不多，只是表现形式不同。

单笔订单成本　Cost per Order （CPO）

计算公式：单笔订单成本＝总市场营销开支／总订货数

指标意义：衡量平均订货成本

指标用法：每笔订单营销成本对于网站盈利和现金流都是非常关键。营销成本计算各人有不同标准，有些把全年网站营运费用摊入到每月成本中，有些则不这么做，关键要看那种最适合自己情况。如果能够在不增加市场营销成本情况下提高转化率，这个指标就应该会下降。

再订货率　Repeat Order Rate （ROR）

计算公式：再订货率＝现有客户订单数／总订单数

指标意义：用来衡量网站对客户吸引力

指标用法：这个指标高低和客户服务有很大关系，只有满意用户产品体验和服务才能提高这个指标。

单个访问者成本　Cost Per Visit （CPV）

计算公式：单个访问者成本＝市场营销费用／总访问数

指标意义：用来衡量网站流量成本

指标用法：这个指标衡量是你市场效率，目标是要降低这个指标而提高SPV，为此要将无效市场营销费用削减，增加有效市场投入。

订单获取差额　Order Acquisition Gap （OAG）

计算公式：订单获取差额＝单个访问者成本（CPV）－单笔订单成本（CPO）

指标意义：这是一个衡量市场效率指标，代表着网站所带来访问者和转化访问者之间差异

指标用法：指标值应是一个负值，这是一个测量从非访问者中获客户成本。有两种方法来降低这个差额，当你增强了网站销售能力，CPO就会下降，这个差额就会缩小，说明网站转化现有流量能力到了加强；同样，CPV可能升高而CPO保持不变或降低，这个差额也会缩小，表明网站所吸引流量都具有较高转化率，这种情形通常发生在启用了PPC（pay per click）计划。

订单获取率　Order Acquisition Ratio （OAR）

计算公式：订单获取率＝单笔订单成本（CPO）／单个访问者成本（CPV）

指标意义：用另一种形式来体现市场效率

指标用法：用比率形式往往比较容易为管理阶层所理解，尤其是财务人员。

每笔产出　Contribution per Order （CON）

计算公式：每笔产出＝（平均订货数Ｘ平均边际收益）－每笔订单成本

指标意义：每笔订单给你带来现金增加净值

指标用法：公司财务总监总是对这个指标感兴趣，代表了你花了多少钱来赚多少钱。

投资回报率　Return on Investment （ROI）

计算公式：投资回报率＝每笔产出（CON） /每笔订单成本（CPO）

指标意义：用来衡量你广告投资回报

指标用法：比较你广告回报率，应该把钱分配给有最高回报率广告，但是这个回报率应当要有时间段限制，比如“２５％ RIO/每周”和“２５％　RIO／每年”是有很大差别。

标签: 分析, 名词定义, 指标, 数据, 电子商务, 网站, 解析 29 评论

149月/11关

分享一篇文章:我的职业理想：成为数据分析师

发布在邵珠庆

很不错的文章，建议大家都看看，特别是菜鸟们！

我小时候的理想是将来做一名数学家，可惜长大了发现自己天赋不够，理想渐行渐远，于是开始考虑现实，开始做一些人生规划，我一直在思考将来从事何种职业，专注什么样的领域，重新定义着自己的职业理想。我现在的职业理想，比较简单，就是做一名数据分析师。

我的职业理想：成为数据分析师（Z）

为什么要做数据分析师：

在通信、互联网、金融等这些行业每天产生巨大的数据量（长期更是积累了大量丰富的数据，比如客户交易数据等等），据说到2020年，全球每年产生的数据量达到3500万亿GB；海量的历史数据是否有价值，是否可以利用为领导决策提供参考依据？随着软件工具、数据库技术、各种硬件设备的飞快发展，使得我们分析海量数据成为可能。

而数据分析也越来越受到领导层的重视，借助报表告诉用户什么已经发生了，借助OLAP和可视化工具等分析工具告诉用户为什么发生了，通过 dashboard监控告诉用户现在在发生什么，通过预报告诉用户什么可能会发生。数据分析会从海量数据中提取、挖掘对业务发展有价值的、潜在的知识，找出趋势，为决策层的提供有力依据，为产品或服务发展方向起到积极作用，有力推动企业内部的科学化、信息化管理。

我们举两个通过数据分析获得成功的例子：

(1) Facebook广告与微博、SNS等网络社区的用户相联系，通过先进的数据挖掘与分析技术，为广告商提供更为精准定位的服务，该精准广告模式收到广大广告商的热捧，根据市场调研机构eMarketer的数据，Facebook年营收额超过20亿美元，成为美国最大的在线显示广告提供商。

(2) Hitwise发布会上，亚太区负责人John举例说明: 亚马逊30%的销售是来自其系统自动的产品推荐，通过客户分类，测试统计，行为建模，投放优化四步，运营客户的行为数据带来竞争优势。

此外，还有好多好多，数据分析，在营销、金融、互联网等方面应用是非常广泛的：比如在营销领域，有数据库营销，精准营销，RFM分析，客户分群，销量预测等等；在金融上预测股价及其波动，套利模型等等；在互联网电子商务上面，百度的精准广告，淘宝的数据魔方等等。类似成功的案例会越来越多，以至于数据分析师也越来越受到重视。

然而，现实却是另一种情况。我们来看一个来自微博上的信息：在美国目前面临14万~19万具有数据分析和管理能力的专业人员，以及150万具有理解和决策能力（基于对海量数据的研究）的管理人员和分析人员的人才短缺。而在中国，受过专业训练并有经验的数据分析人才，未来三年，分析能力人才供需缺口将逐渐放大，高级分析人才难寻。也就是说，数据分析的需求在不断增长，然而合格的为企业做分析决策的数据分析师却寥寥无几。好多人想做数据分析却不知道如何入手，要么不懂得如何清洗数据，直接把数据拿来就用；要么乱套模型，分析的头头是道，其实完全不是那么回事。按俗话说就是：见过猪跑，没吃过猪肉。

我的职业规划：

对于数据分析，有一句话说的非常好：spss/sql之类的软件、决策树、时间序列之类的方法，这些仅仅就都是个工具而已，最重要的是对业务的把握。没有正确的业务理解，再牛的理论，再牛的工具，都是白搭。做一名合格的数据分析师，除了对数据需要有良好的敏感性之外，对相关业务的背景的深入了解，对客户或业务部门的需求的清晰认识。根据实际的业务发展情况识别哪些数据可用，哪些不适用，而不是孤立地在“真空环境”下进行分析。

为此，我对自己的规划如下：

第一步：掌握基本的数据分析知识（比如统计，概率，数据挖掘基础理论，运筹学等），掌握基本的数据分析软件（比如，VBA，Matlab，Spss，Sql等等），掌握基本的商业经济常识（比如宏微观经济学，营销理论，投资基础知识，战略与风险管理等等）。这些基础知识，在学校里尽量的学习，而且我来到了和君商学院，这样我可以在商业分析、经济分析上面领悟到一些东西，增强我的数据分析能力。

第二步：参与各种实习。研一开始我当时虽然有课，不过很幸运的找到一份一周只需去一两天的兼职，内容是为三星做竞争对手分析，当然分析框架是leader 给定了，我只是做整合资料和往ppt里填充的内容的工作，不过通过兼职，我接触到了咨询行业，也向正式员工学习了很多商业分析、思考逻辑之类的东西。之后去西门子，做和VBA的事情，虽然做的事情与数据分析无关，不过在公司经常用VBA做一些自动化处理工作，为自己的数据分析工具打好了基础。再之后去了易车，在那里兼职了一个多月，参与了大众汽车销量数据短期预测的项目，一个小项目下来，数据分析的方法流程掌握了不少，也了解了企业是如何用一些时间序列模型去参与预测的，如何选取某个拟合曲线作为预测值。现在，我来到新的地方实习，也非常幸运的参加了一个央企的码头堆场优化系统设计，其实也算数据分析的一种吧，通过码头的数据实施调度，通过码头的数据进行决策，最后写成一个可操作的自动化系统。而这个项目，最重要的就是业务流程的把握，我也参与项目最初的需求调研，和制定工作任务说明书SOW，体会颇多。

第三步：第一份工作，预计3-5年。我估计会选择咨询公司或者IT公司吧，主要是做数据分析这块比较强的公司，比如Fico，埃森哲，高沃，瑞尼尔，IBM，AC等等。通过第一份工作去把自己的知识打得扎实些，学会在实际中应用所学，学会数据分析的流程方法，让自己成长起来。

第四步：去自己喜欢的一个行业，深入了解这个行业，并讲数据分析应用到这个行业里。比如我可以去电子商务做数据分析师。我觉得我选择电子商务，是因为未来必将是互联网的时代，电子商务必将取代传统商务，最显著的现象就是传统零售商老大沃尔玛正在受到亚马逊的挑战。此外，电子商务比传统的零售商具有更好的数据收集和管理能力，可以更好的跟踪用户、挖掘潜在用户、挖掘潜在商品。

第五步：未知。我暂时没有想法，不过我希望我是在一直的进步。

有一位数据分析牛人曾经总结过数据分析师的能力和目标：

能力：一定要懂点战略、才能结合商业；一定要漂亮的presentation、才能buying；一定要有global view、才能打单；一定要懂业务、才能结合市场；一定要专几种工具、才能干活；一定要学好、才能有效率；一定要有强悍理论基础、才能入门；一定要努力、才能赚钱；最重要的：一定要务实、才有reputation；不懂的话以后慢慢就明白了。

目标：1-做过多少个项目？2-业务背景有哪些，是否跨行业？3-做过多少种类型的模型？做了多少个模型？4-基于模型做过多少次完整的marketing闭环？以上四个问题，足以秒杀95%以上的忽悠和菜鸟！

我仅以此为努力之坐标，时刻提醒自己。

路在前方，漫漫前行。

标签: 分析师, 数据, 理想, 职业 25 评论

139月/11关

Google Analytics cookie内容详解

发布在邵珠庆

cookie在WiKi上的解释是：指某些网站为了辨别用户身份而储存在用户本地终端（Client Side）上的数据（通常经过加密）。

Cookie分为两种类型，第一方cookie和第三方cookie。Google Analytics使用第一方cookie

Google Analytics设置了5个不同的cookie，_utma, _utmb, _utmc, _utmz和 _utmv。分别用来存储不同的信息。所有的cookie统一使用_u-t-m开头，所以我们看到这三个字母就知道是google的cookie。

下面逐个介绍Google Analytics的cookie和功能。

_utma的主要功能：识别唯一身份访客

_utma的生存周期为2年。其中第二组的随机唯一ID和第三组的时间戳联合组成了访问者ID，Google Analytics通过这个ID来辨别网站的唯一访问者。而后面的几个时间戳用户计算网站停留时间和访问次数。

_utma Cookie存储的内容：127635166.1360367272.1264374807.1264374807.1264374807.1
第一组数字被叫做“域哈希”，是GA表示这个域的唯一代码。同一域中每个cookie的第一组数据都是“域哈希”，并且值都是一样的。
第二组数字是一个随机产生的唯一ID。
第三，四，五组数字是时间戳，其中第三组数字表示初次访问的时间。第四组数字表示上一次访问的时间，第五组数字表示本次访问开始的时间。
第六组数字是访问次数计数器。这个数字随着访问次数的增加而增加。
PS：上面的三个时间戳数字相同，并且最后的访问次数计数器是1，表示这是第一次访问。

_utmb的主要功能：和_utmc一起决定访客的Session

_utmb的生存周期为30分钟，当访问者在你的网站持续30分钟静止时，utmb将被删除。Google Analytics使用_utmb 和_utmc一起辨别一个session。

_utmb Cookie存储的内容：127635166.2.10.1264374807
第一组数字和_utma一样，是“域哈希”。
后面的几组数字是一些附加值。

_utmc的主要功能：和_utmb一起决定访客的Session

_utmc是一个临时cookie，当用户关闭浏览器时_utmc将一起被删除

_utmc和_utmb一起来识别一个session，当用户访问一个网站时，Google Analytics会检查这两个cookie，如果缺少其中任何一个，Google Analytics都将认为这是一个新的session。
_utmc的内容：127635166 代表“域哈希”。

_utmz的主要功能：存储流量来源信息和链接标记的变量值。

_utmz的生存周期是6个月，_utmz中存储了所有流量的来源信息。
_utmz的内容中一共有4组数字：127635166.1264374807.1.1
第一组数字是“域哈希”。
第二组数字是时间戳。
第三组数字是session number。
第四组数字是campaign number 记录通过不同来源访问网站的次数。
utmcsr=(direct)|utmccn=(direct)|utmcmd=(none)
这些信息代表流量的来源，因为我是直接输入域名直接访问的，所以来源和媒介都是direct

_utmv的主要功能：自定义访问者的属性。

_utmv的生存周期是2年，存储通过_setVar（）自定义用户属性。
_utmv的内容：127635166.user
第一组数字是“域哈希”。
第二个值user是通过_setVar（）设置的用户属性。
PS：_utmv只有在调用了_setVar（）时才会出现。
此外，还有两个cookie __utmx和__utmxx。这两个cookie不是由Google Analytics设置的，而是由Google的Website Optimizer用来做A/B测试或多变量测试用的。如果在访问某个页面后看到这两个cookie，那就说明这个页面正在进行页面优化测试，而你访问的页面可能是测试中的某一个版本。

Google Analytics中的cookie比较多，每个cookie的属性和功能也各不一样。我做了一个Google Analytics cookie速查表，请在这里下载。

Google Analytics（分析）如何使用 Cookie

Google Analytics（分析）利用 Cookie 定义用户会话，并提供 Google Analytics（分析）报告中的多种关键功能。Google Analytics（分析）设置或更新 Cookie 的目的仅在于收集报告所需数据。此外，Google Analytics（分析）仅使用第一方 Cookie。也就是说 Google Analytics（分析）针对您的域设置的所有 Cookie 仅会向您的域的服务器发送数据。这一做法有效地保证了 Google Analytics（分析）Cookie 成为您网站域的私有财产，来自其他域的任何服务器都无法篡改或获取其中的数据。

下表中列出了通过 Google Analytics（分析）Cookie 获取并在 Google Analytics（分析）报告中使用的信息类型。

功能	Cookie 说明	使用的 Cookie
设置您网站内容的范围	因为任何 Cookie 读/写访问都会同时受到 Cookie 名称和其所在域的限制，所以通过 Google Analytic（分析）进行的访问者跟踪会默认限制在安装跟踪代码网页所在域。一般来说，跟踪代码将安装在单个域中（并且没有其他子域），在这种情况下，通用设置是适用的。如果您希望跨多个域或子域跟踪内容，或将跟踪范围限制在单个域中更为具体的部分，您可以使用 `ga.js` 跟踪代码中的其他方法定义内容范围。有关详情，请参阅 Collection API 文档中的域和目录。	所有 Cookie
确定访问者会话	针对 `ga.js` 的 Google Analytics（分析）跟踪使用两个 Cookie 来建立会话。如果这两个 Cookie 中的任一个缺失，用户的后续活动将会导致启动一个新会话。有关详细的定义以及将会终止会话的情景的列表，请参阅帮助中心中的会话一文。您可以使用 _setSessionCookieTimeout() 方法自定义默认会话时间的长度。该描述专门针对网页的 `ga.js` 跟踪代码。如果您在其他环境（如 Flash 或移动设备）中使用 Google Analytics（分析）进行跟踪，请务必参阅说明文件中有关这些环境的内容，以了解其中的会话计算或建立的方式。	`__utmb __utmc`
识别唯一身份访问者	`__utma` Cookie 会为访问您网站网页的每一个浏览器指定唯一的 ID。通过这种方式，使用同一浏览器对您网站进行的后续访问，将会视为同一（唯一身份）访问者的访问而被记录下来。因此，如果某用户同时使用 Firefox 和 Internet Explorer 与您的网站互动，Google Analytics（分析）报告会将其视为两位唯一身份访问者的活动进行跟踪。同样，如果两位访问者使用同一浏览器，但登录到各自的计算机帐户，那么这些活动将按照两个唯一身份访问者 ID 进行记录。另一方面，如果两位访问者恰巧使用同一浏览器，同时共享同一计算机帐户，那么将按照一个唯一身份访问者 ID 进行记录，尽管事实上访问是由两个人分别进行的。	`__utma`
跟踪流量来源和浏览过程	当用户通过搜索引擎结果、直接链接或链接到您网页的广告到达您的网站时，Google Analytics（分析）会在 Cookie 中储存引荐类型的信息。Cookie 值字符串中的参数将得到解析，并通过 GIF 请求（`utmcc` 变量）发送。Cookie 的有效期为 6 个月。此 Cookie 会在用户对您网站的每个网页进行后续浏览时获得更新，进而确定访问者对您网站的浏览过程。	`__utmz`
自定义变量	您可以根据具体数据定义自己的报告细分。如果您在跟踪代码中使用 `_setCustomVar()` 方法定义了自定义变量，Google Analytics（分析）将使用此 Cookie 跟踪并报告这一信息。通常情况下，您可以使用此方法根据用户在您网站上选择的自定义人口统计学特点（收入、年龄范围、产品性能），对网站访问者进行细分。	`___utmv`
Website Optimizer	您可以将 Google Analytics（分析）与 Google 网站优化工具配合使用，该工具可帮助您确定最有效的网站设计。网站优化脚本在您的网页中执行时，会将一个 _utmx Cookie 写入到浏览器中，并将其值发送给 Google Analytics（分析）。有关详情，请参阅 Google 网站优化工具帮助中心。	`___utmx`

一旦在网络浏览器中设置/更新了 Cookie，其中包含的报告所需数据将通过 utmcc 参数发送到 GIF 请求网址中记录的 Google Analytics（分析）服务器。

Google Analytics（分析）设置的 Cookie

Google Analytics（分析）会设置下表中介绍的 Cookie。在默认的配置和使用情况下，Google Analytics（分析）仅会设置表中的前 4 个 Cookie。

名称	说明	有效期
`__utma`	此 Cookie 通常会在该网络浏览器首次访问您的网站时写入其中。如果此 Cookie 被浏览器操作者删除，而该浏览器又对您的网站进行了后续访问，一个拥有不同唯一 ID 的 `__utma` Cookie 将会写入其中。此 Cookie 用于确定您网站的唯一身份访问者，并会在每次网页浏览时获得更新。此外，Google Analytics（分析）会将为此 Cookie 指定的唯一 ID 作为额外的安全措施，以确保此 Cookie 的有效性和可访问性。	设置/更新后 2 年。
`__utmb`	此 Cookie 用于建立和保持用户与您的网站之间的会话。当用户浏览您网站的某个网页时，Google Analytics（分析）代码会尝试更新此 Cookie。如果未能找到此 Cookie，Google Analytics（分析）会写入一个新的该 Cookie 并建立新的会话。每当用户访问您网站中的其他网页时，此 Cookie 的有效期会重新更新为 30 分钟，因此只要在 30 分钟周期内重复发生了用户活动，单个会话就会一直持续下去。如果用户在您网站中某网页的停留时间超过了 30 分钟，此 Cookie 就会过期。您可以通过 `_setSessionCookieTimeout()` 方法修改默认的用户会话时间的长度。	设置/更新后 30 分钟。
`__utmc`	此 Cookie 会和 `__utmb` Cookie 结合使用，确定是否为用户建立新的会话。具体来说，此 Cookie 没有特定的有效期，所以它将在用户退出浏览器时失效。如果某用户访问过您的网站后退出了浏览器并在 30 分钟内再次访问了您的网站，该用户将会由于缺少 `__utmc` Cookie 而必须建立新的会话，尽管事实上 `__utmb` Cookie 还尚未失效。	未设置。
`__utmz`	此 Cookie 会储存访问者到达您的网站通过的引荐类型，即是否通过直接方法、引荐连接、网站搜索或广告系列（例如广告或电子邮件）到达。这些信息会用来计算您网站的搜索引擎流量、广告系列和网页的导航方式。此 Cookie 会在每次网页浏览时获得更新。	设置/更新后 6 个月。
`__utmv`	此 Cookie 正常情况下在默认跟踪代码配置中不会出现。`__utmv` Cookie 通过 `_setVar()` 方法传递所提供的信息，您可以使用该方法创建自定义用户细分。然后，此字符串将通过 `utmcc` 参数传递到 GIF 请求网址中记录的 Google Analytics（分析）服务器。仅当您将 `_setVar()` 方法添加到您网站页面的跟踪代码中时，此 Cookie 才会写入浏览器中。	设置/更新后 2 年。
`__utmx`	此 Cookie 用于 Google 网站优化工具，并且仅当您的网页正确安装并配置了 Google 网站优化工具跟踪代码时才会设置。当优化脚本执行时，此 Cookie 会储存该访问者针对每个实验所分配到的变量，确保用户在您的网站体验的一致性。有关详情，请参阅 Google 网站优化工具帮助中心。	设置/更新后 2 年。

标签: cookie, Google Analytics, 内容, 详解 5 评论

139月/11关

Google Analytics的能与不能

发布在邵珠庆

关于Google Analytics的Exit Rate的，我的错误在于我此前自己认识的定义其实一直是错误的。　　我一直以为，某个页面的Exit Rate=该页面上离开网站的PV÷经过该页面的Visit，但实际上公式是Exit Rate=该页面上离开网站的PV÷该页面的总PV。为什么是这个定义的原因我觉得很明确，因为对于GA，很严谨地区分了页面级的度量和网站级的度量，visit是一个网站级别的度量，而exit rate是页面级的，所以exit rate只能用page view来定义。

　　不过，请大家注意，Omniture跟GA在这个地方的定义不同，Omniture的定义是以前一个公式为准。我个人更倾向于前一个公式的定义，因为这能够让Exit Rate保持跟Bounce Rate的一致性。

　　好了，步入正题，今天要讲的是给初入网站分析大门的朋友们的，话题不深，但是挺有趣，关于Google Analytics，关于我们应该用什么工具做网站分析。

　　在我开始发表意见前，我要做一个免责声明:)。我非常了解Omniture，但我不愿意偏袒任何一种工具，因为我知道网站分析工具是全人类（咳，准确说是全部网站分析师）的财富，我们在享用这个财富之前，了解它，读懂它，扬长避短为我所用，就是大好，至于其他的主观色彩，我不会卷入。只是分享，为快乐而分享，为搞定抑郁症而分享。:)

　　今天这个话题关于Google Analytics，我们最常使用也最熟悉的网站分析工具，它给我的感觉如同一个十七八岁的年轻人，朝气蓬勃，富有主见和创造。这个工具擅长于做什么，又有哪些不能够做到的地方呢？今天愿以此文跟大家聊个尽兴，也是对我敬佩的导师Avinash Kaushik先生的致敬！

　　这个文章分为三个主要部分。第一部分是Google Analytics的长处；第二部分是Google Analytics的不足；第三部分是Google Analytics所适宜和不适宜的网站领域。

Google Analytics的能

牛B第一：界面

　　工具界面这东西，是个见仁见智的事情，不过我觉得Google Analytics的界面绝对是易用的，因为它符合人们的惯常思维。这一点对于初学者非常好。

牛B第二：度量

　　我认为Google Analytics在度量方面有长处的地方在于，它比较认真地系统考虑的度量的设置。由于是一个免费的通用的工具，所以在度量的设置上注意了三点，第一点是尽量采用约定俗成的度量名称；第二点是尽量采用约定俗成的度量定义（但不完全是）；第三点是区分了网站级和页面级的度量。所以，度量入门学习用 Google Analytics很好。

牛B第三：细分

　　Google Analytics不能说具有最好的细分能力，但是其他免费系统，甚至很多付费系统都没有它的细分能力。Google Analytics之所以在细分上如此给力，是因为Avinash非常强调网站分析中的细分分析。对于我而言，大家也看到了我的想法——“无细分，毋宁死”，做最深入的一些分析，细分数据的确非常重要。

Google Analytics在推出新版之前，细分其实做的很差，但是我记得去年推出新的版本之后，细分功能大大增强。最棒的就是增加了高级细分功能，即你自己可以定义你需要的细分规则，即我给它起的名字——规则细分。规则细分是网站分析中最重要的工具之一，能够在免费工具中看到这样的功能，你除了感动还是感动。虽然Google Analytics细分的结果很多需要做采样，但是如果看了Avinash的第二本书就知道，采样数据未必不能提供好的insight。

此外，Google Analytics还提供了其他的细分方法，例如过滤（filter）。值得注意的是，过滤是一种“事前细分”，即把监测数据放入报告之前进行筛选，一旦筛选不通过的数据，通过任何方法都将不能再获得。

牛B第四：响应

　　这里要提醒的一点是，响应是指你操作Google Analytics时的界面反应的速度，即你打开任意一个报告所需要花费的时间，而不是Google Analytics提供数据的实时性。在响应速度上，Google Analytics拜Google强大的服务器集群所赐，以及自身算法的优化，速度让人满意！毕竟Google Analytics是提供的SAAS（software as a service）服务，数据要在遥远的服务器端打个来回，响应上能够跟本地端的监测工具有得一拼，相当厉害。

牛B第五：集成AdWords

　　这个不值得多说，毕竟都是一家人，近水楼台先得月。Google Analytics集成了监测AdWords流量的功能，并且能够把关键词投放的成本整合其中，这对做Google SEM的用户有很大帮助。

牛B第六：异步代码

　　Google Analytics升级了自己的标准代码添加方式，原先必须添加在<body>…</body>中的代码现在可以添加在<head>…</head>中。这让GATC（Google Analytics Tracking Code）与其他JavaScript代码之间发生冲突的可能性大大降低，而且受到页面载入速度而影响监测的可能性也大大降低。

牛B第七：免费

　　这个优点不用多说了，反正谷歌的服务器肯定会为无数免费的账户增加数千台到数万台。也许，我估计的可能还是保守的了。

Google Analytics的不能

不牛B第一：路径

　　Google Analytics其实并无路径分析功能。Entrance Path，或者Navigation Summary都不是路径，只是前后页功能而已，甚至不是前后页的路径。路径功能是能够统计到网站访问者各条路径的功能，从他/她进入网站的那一页，直到他/她离开网站的那一页。这个功能的作用在于，帮助我们发现一些被很多访问者经过，但却超出我们预计的路径，这十分有助于我们分析网站的页面结构和链接结构，并据此优化它们。商用网站分析工具，例如Omniture的SiteCatalyst和Discover均很强调这个功能，它有专门的路径报告即 paths报告，支持无限层级的路径。

图：Omniture SiteCatalyst的Next Page Flow报告

不牛B第二：转化

　　这个不牛B之处不是很给力，因为Google Analytics并不是没有转化监测，事先预定10个转化页面对一般网站已经足够。不过，在数据报告中任意自定义页面之间的转化功能Google Analytics还不具备。对于有多种可能转化路径的网站（这种站其实很多，尤其是大量商品的电子商务网站）而言，灵活的转化自定义功能是很必要的。部分商用网站分析工具具有这个功能。

题外话：为什么Google Analytics的路径转化功能不强大

　　今天我还跟武凯讨论了这个话题，我们并无法知道Google Analytics在这两个方面做得不到的真实原因，但我们相信算法对Google而言绝对不是问题。我们推测，由于这两个功能的运算随着路径长度的增长，而变成天文级数字的可能性，Google Analytics实现这个功能需要更强大的运算和更多的服务器，这会使报告的响应时间变长，而影响用户体验，并且增加大量的成本开销。

不牛B第三：交易监测

　　Google Analytics在小型电子商务网站中占有大量的份额，但电子商务所重视的交易监测却不是它的长项，主要在于Google Analytics只提供了Add Trans和Add Item两种event，对于灵活多变，而且品类管理复杂的电子商务而言，这一点功能只能称得上“聊胜于无”。另外，Google Analytics没有提供以产品为中心的产品监测（product tracking），因为这个功能需要更灵活的自定义。

不牛B第四：自定义

　　毕竟只是免费工具，所以Google Analytics自定义并不强大，目前只提供自定义报告功能，虽然实际上这个功能很实用。自定义度量是一个令人期待的功能，但是Google Analytics似乎短时间内并不想把它放进去。此外，真正的自定义功能是结合网站业务需求的，尽管Event Tracking的出现改变了这一状况，但灵活性不足，而且称不上易用，实际上并无法涵盖网站中的业务功能——例如按照产品细分的添加购物车行为的监测，或者按照用户ID细分的支付监测等；或者也无法探知访问者填写表单的情况；在Campaign Tracking方面，Google Analytics提供的6个utm属性仍然有限，且不能自定义属性；Google Analytics也无法根据一个网站上用户的各种属性进行自定义细分。所以，Google Analytics的自定义能力是非常有限的。

不牛B第五：特殊链接监测

　　在Google Analytics中，特殊链接的监测并不是默认实现的，需要你动手添加Virtual Page或者Event Tracking。但商用网站分析工具，例如Omniture的SiteCatalyst，这些功能是默认自动实现的。也就是说，当你装上了 SiteCatalyst，Exit Link（也就是点击你网站上的外链的行为）的数据是自动监测的。同样，下载链接也是自动实现监测。

不牛B第六：数据关联

　　Google Analytics的数据关联不能说做的不好，不过，毕竟这个工具受制于自定义功能的薄弱，因此能够监测到的度量有限，数据关联也就相对比较简单。另外，由于细分功能出色，因此GA对数据关联的强调相对较小。不过，对任何一个网站分析工具而言，数据关联都是一个非常高的要求，毕竟3维的数据关联要比2维的关联多出Cnn（打不出来这个概率的符号，大家明白意思就好）种可能性，对服务器的要求太高了。Omniture利用Data Warehouse实现复杂的数据关联，但牺牲了实时性，它的另一个专门做细分和数据关联的产品——Discover——可以实现复杂而实时的数据关联，但能够涵盖的范围通常不超过数个月的数据。而Google Analytics则只提供预定的数据关联。

　　不过，从目前Google Analytics的一些界面微调情况看，这个部分的重要性逐渐被它认识到，相信未来有更多的改变。

不牛B第七：Raw Data

　　Google Analytics不提供Raw Data或者是未经报告再加工的数据。这些数据的好处在于，能够帮助解决一些对于数据报告中出现的疑问，也能够帮助进行深入的数据分析。

不牛B第八：数据接口

　　没错，Google Analytics为我们提供了API，但是这个API实在是很有限，至少，在跟一个企业的CRM或者是ERP系统对接的时候，根本派不上太多用场。由于并没有开放Raw Data，所以实际上这些API并不足以帮助用户将自己的其他商用系统与Google Analytics的数据报告进行对接。这也就意味着，Google Analytics只是一个封闭系统。

Google Analytics所适宜的和不适宜的网站

Google Analytics适宜的网站

　　GA实际上非常适用于博客网站以及内容网站。有时候我甚至觉得，sina.com.cn用GA在功能上应该也是够用的（除了路径分析之外），毕竟现在GA没有了月度Page View监测数量的上限。

　　小型的电子商务网站也可以使用GA，利用GA有限的电子商务监测功能、转化预定功能还是能够给出不少不错的insight。

　　朋友们会问我，我们男科医院的网站用Google Analytics行不行。我觉得，完全行，因为你那个网站也不涉及交易，而且转化也比较单一清晰，所以这一类的网站同样适宜Google Analytics。

Google Analytics不适宜的网站

　　大型电子商务网站很少用Google Analytics，因为Google Analytics对特质性和复杂性的支持有限。大型公司的网站，例如Intel、HP或者Sony的网站也不会使用Google Analytics，原因同前。另外，平台型的网站，比如淘宝、猪八戒、世纪佳缘之类，用Google Analytics肯定非常麻烦，因为这些网站有很复杂的分类和转化，GA同样力不从心。

　　SNS类的网站呢？GA也不易用，因为这些网站上的应用太多，如果要添加Event Tracking，人会疯掉。简单讲，随着网站复杂程度的提升，Google Analytics就会越来越不宜用。

标签: Google Analytics 没有评论

89月/11关

Google Analytics进阶运用之跨域跟踪

发布在邵珠庆

从今天开始一个介绍Google Analytics进阶运用的系列日志，其实没有多少技术含量，主要内容来自http://code.google.com/apis/analytics/docs/index.html，不过其中部分的用词与说法与官方不太一样。

首先，要清楚以下几点：

1、Google Analytics用document.domain定义一个网站的cookies

2、独立的域名意味着独立的访问者和流量数据，也就是说，在只使用Google Analytics默认代码的情况下，即使是访问不同的二级域名，都会被单独计算

3、独立的域名并不一定是不同的内容

4、子目录使用主域名的cookies

ps：本系列的ID都是google文档中的，想使用的话请更换成自己的

只统计一个子目录

假如我有一个网站www.example.com，还有一个网店www.example.com/myStore/，我只想统计网店的访问数据，需要用到_setCookiePath()方法，统计代码这么写：

var pageTracker = _gat._getTracker("UA-12345-1");
pageTracker._setCookiePath("/myStore/");
pageTracker._trackPageview();

这是因为cookie路径设置为您的子目录，而不是根目录www.example.com

统计同域名下连个子目录

假如我有一个网店，还有一个购物车

www.example-commerce-host.com/myStore/

www.example-commerce-host.com/myCart/

想统计他们的访问数据，需要用的_cookieCopyPath()方法，统计代码这么写：

var pageTracker = _gat._getTracker("UA-12345-1");
pageTracker._setCookiePath("/myStore/");
pageTracker._cookiePathCopy("/myCart/");
pageTracker._trackPageview();

这样就是设置了一个特殊的cookie，由第一个目录提供，也就是myStore目录，这些cookie数据会被复制到myCart目录cookie中

统计A域名及B域名的一个子目录

这是我认为比较有用的应用方式。

假如我有一个网店，使用的是第三方的购物车，这时候需要设定主次，一般自己的是主，第三方的东西是次。统计代码这么写：

主：www.example-petstore.com

var pageTracker = _gat._getTracker("UA-12345-1");
pageTracker._setAllowLinker(true);
pageTracker._setAllowHash(false);

次：www.example-commerce-host.com/petStoreCart

var pageTracker = _gat._getTracker("UA-12345-1");
pageTracker._setDomainName("none");
pageTracker._setAllowLinker(true);
pageTracker._setAllowHash(false);

_setAllowLinker()方法是为了让目标网站读取到post过来的数据和cookie，但是这样还不够，还需要用到_linkByPost()方法，将网店的cookie通过HTTP POST传到购物车，因此，在网店的表单里需要这样修改：

onSubmit="pageTracker._linkByPost('www.example-commerce-host.com/petStoreCart/begin.php');"

当然网店的相关链接也要改为这样的：

还有js形式的写法，用到_link方法

统计主域名及其二级域名

类似这样的：

www.example-petstore.com

dogs.example-petstore.com

cats.example-petstore.com

统计代码这么写：

var pageTracker = _gat._getTracker("UA-12345-1");
pageTracker._setDomainName(".example-petstore.com");
pageTracker._trackPageview();

用_setDomainName方法设定主域名

统计多域名及二级域名

这是一种混杂的情况，基本上是前两种情况相加，统计代码要这么写：

主：www.example-petstore.com

var pageTracker = _gat._getTracker("UA-12345-1");
pageTracker._setDomainName(".example-petstore.com");
pageTracker._setAllowLinker(true);
pageTracker._setAllowHash(false);

如果有表单指向了其他域名，需要用_link（）方法和_linkByPost（）方法将cookie传到其他域名去，用法上面已经写过了。如果表单指向的是二级域名，就不一定要使用_link（）方法和_linkByPost（）方法了，因为已经设定了主域名。

次：dogs.example-petstore.com

var pageTracker = _gat._getTracker("UA-12345-1");
pageTracker._setDomainName(".example-petstore.com");
pageTracker._setAllowLinker(true);
pageTracker._setAllowHash(false);

同样的，如果有表单指向了其他域名，需要用_link（）方法和_linkByPost（）方法将cookie传到其他域名去

其他域名：www.my-example-blogsite.com

var pageTracker = _gat._getTracker("UA-12345-1");
pageTracker._setDomainName("none");
pageTracker._setAllowLinker(true);
pageTracker._setAllowHash(false);

统计框架（iFrame）

假如想把框架中的www.my-example-iframecontent.com数据传到父一级www.example-parent.com的窗口中去，需要用到_getLinkerURL（）方法，用js读取框架，统计代码要这么写：

var iframe = document.getElementById("myIFrame");
iframe.src = pageTracker._getLinkerUrl(http://www.my-example-iframecontent.com/);

标签: Google Analytics, 跟踪, 跨域, 运用, 进阶没有评论

298月/11关

网站导航设计模式指南

发布在邵珠庆

在网页设计中有一些通用的交互设计模式。网站导航各种各样的通用和大家熟知的设计模式，可以用来作为为网站创建有效地信息架构的基础。这篇指南涵盖了流行的站点导航设计模式。对于每一种网站导航栏设计模式，我们将讨论它的一般特征，它的缺点，以及什么时候使用它最好。

顶部水平栏导航
顶部水平栏导航是当前两种最流行地网站导航菜单设计模式之一。它最常用于网站的主导航菜单，且最通常地放在网站所有页面的网站头的直接上方或直接下方。

顶部水平栏导航设计模式有时伴随着下拉菜单，当鼠标移到某个项上时弹出它下面的二级子导航项。

顶部水平栏导航一般特征
导航项是文字链接，按钮形状，或者选项卡形状
水平栏导航通常直接放在邻近网站logo的地方
它通常位于折叠之上

顶部水平栏导航的缺点
顶部水平栏导航最大的缺点就是它限制了你在不采用子级导航的情况下可以包含的链接数。对于只有几个页面或类别的网站来说，这不是什么问题，但是对于有非常复杂的信息结构且有很多模块组成的网站来说，如果没有子导航的话，这并不是一个完美的主导航菜单选择。

何时使用顶部水平栏导航
顶部水平栏导航对于只需要在主要导航中显示5-12个导航项的网站来说是非常好的。这也是单列布局的网站的主导航的唯一选择（除了通常用于二级导航系统的底部导航）。当它与下拉子导航结合时，这种设计模式可以支持更多的链接。

竖直/侧边栏导航
侧边栏导航的导航项被排列在一个单列，一项在一项的上面。它经常在左上角的列上，在主内容区之前——根据一份针对从左到右习惯读者的导航模式的可用性研究，左边的竖直导航栏比右边的竖直导航表现要好。
侧边栏导航设计模式随处可见，几乎存在于各类网站上。这有可能是因为竖直导航是当前最通用的模式之一，可以适应数量很多的链接。

它可以与子导航菜单一起使用，也可以单独使用。它很容易用于包含很多链接的网站主导航。侧边栏导航可以集成在几乎任何种类的多列布局中。

侧边栏导航的一般特征
文字链接作为导航项很普遍（包含或不包含图标）
很少使用选项卡（除了堆叠标签导航模式）
竖直导航菜单经常含有很多链接

竖直/侧边栏导航缺点

因为可以处理很多链接，当竖直菜单太长时有时可能将用户淹没。尝试限制你引入的链接数，取而代之可以使用飞出式子导航菜单以提供网站的更多信息。同时考虑将链接分放在直观的类别当中，以帮助用户很快地找到感兴趣的链接。

何时使用竖直/侧边栏导航
竖直导航适用于几乎所有种类的网站，尤其适合有一堆主导航链接的网站。

选项卡导航
选项卡导航可以随意设计成任何你想要的样式，从逼真的，有手感的标签到圆滑的标签，以及简单地方边的标签等。它存在于各种各样的网站里，并且可以纳入任何视觉效果。

选项卡比起其它类别的导航有一个明显的优势：它们对用户有积极的心理效应。人们通常把导航与选项卡关联在一起，因为他们曾经在笔记本或资料夹里看见选项卡，并且把它们与切换到一个新的章节联系在一起。这个真实世界的暗喻使得选项卡导航非常直观。

选项卡导航的一般特征
样子和功能都类似真实世界的选项卡（就像在文件夹，笔记本等中看到的一样）
一般是水平方向的但也有时是竖直的（堆叠标签）

选项卡导航的缺点

选项卡最大的缺点是它比简单的顶部水平栏更难设计。它们通常需要更多的标签，图片资源以及CSS，具体根据标签的视觉复杂度而定。选项卡的另一个缺点是它们也不太适用于链接很多的情况，除非它们竖直地排列（即使这样，如果太多的话它们还是看起来很不合适）。

何时使用选项卡导航
选项卡也适合几乎任何主导航，虽然它们在可以显示的链接上有限制，尤其在水平方向的情况下。将它们用于拥有不同风格子导航的主导航的较大型网站是个不错的选项。

面包屑导航
面包屑的名字来源于Hansel和Gretel的故事，他们在沿途播撒面包屑以用来找到加家的路，这可以告诉你在网站的当前位置。这是二级导航的一种形式，辅助网站的主导航系统。

面包屑对于多级别具有层次结构的网站特别有用。它们可以帮助访客了解到当前自己在整站中所处的位置。如果访客希望返回到某一级，它们只需要点击相应的面包屑导航项。

面包屑的一般特征
一般格式是水平文字链接列表，通常在两项中间伴随着左箭头以指示层及关系
从不用于主导航

面包屑导航的缺点

面包屑不适于浅导航网站。当网站没有清晰的层次和分类的时候，使用它也可能产生混乱。何时使用面包屑导航。面包屑导航最适用于具有清晰章节和多层次分类内容的网站。没有明显的章节，使用面包屑是得不偿失。

标签导航
标签经常被用于博客和新闻网站。它们常常被组织成一个标签云，导航项可能按字母顺序排列（通常用不同大小的链接来表示这个标签下有多少内容），或者按流行程度排列。

标签是出色的二级导航而很少用于主导航。他可以提高网站的可发现性和探索性。标签云通常出现在边栏或底部。如果没有标签云，标签则通常包括于文章顶部或底部的元信息中，这种设计让用户更容易找到相似的内容。

标签导航的一般特征
标签是以内容为中心的网（博客和新闻站）站的一般特性
仅有文字链接
当处于标签云中时，链接通常大小各异以标识流行度
经常被包含在文章的元信息中
标签导航的缺点
人们通常把标签和博客和新闻网站联系在一起（有时候也可能是电子商务网站），所以如果你的网站与这些网站有本质的不同，它可能对你就没有帮助。标签也会给内容创作者带来一定量的工作量，因为为了使标签系统有效，每篇文章都需要打上准确的标签。

何时使用标签
如果你拥有很多主题，为内容打上关键词标记是很有利的。如果你仅有几个页面（可能你的网站是一个公司网站），可能就不需要给内容打标签了。是否结合标签云或只是将标签包含在元信息中得取决于你的设计。

搜索导航
近些年来网站检索已成为流行的导航方式。它非常适合拥有无限内容的网站（像维基百科），这种网站很难使用其它的导航。搜索也常见于博客和新闻网站，以及电子商务网站。

搜索对于清楚知道自己想要找什么的访客非常有用。但是有了搜索并不代表着就可以忽略好的信息结构。它对于保证那些不完全知道自己要找什么或是想发现潜在的感兴趣内容的浏览者可以查找到内容依然非常重要。

搜索导航的一般特征
搜索栏通常位于头部或在侧边栏靠近顶部的地方
搜索栏经常会出现在页面布局中的辅助部分，如底部
搜索导航的缺点
搜索最大的缺点是并非所有搜索引擎都是平等的。取决于你选择的方案，你网站的搜索特性可能不能返回精确的结果或者缺失一些东西如文章元数据。搜索导航，对于大部分网站来说，应该作为次要的导航形式。搜索是用户在无法被导航到他们想找的东西的地方时的可靠选择。

何时使用搜索导航
对于具有无数页面并且有复杂信息结构的网站来说，肯定必须引入搜索功能。没有它用户可能很难通过遍历链接和多层的导航来找到他们想要的信息。搜索对于电子商务网站也非常重要，而关键的一点是电子商务网站的搜索结果要根据网站存货的多少具有相应的筛选和排序功能。

出式菜单和下拉菜单导航
出式菜单（与竖直/侧边栏导航一起使用）和下拉菜单（一般与顶部水平栏导航一起使用）是构建健壮的导航系统的好方法。它使得你的网站整体上看起来很整洁，而且使得深层章节很容易被访问。

他们通常结合水平，竖直或是选项卡导航一起使用，作为网站主导航系统的一部分。

出式菜单和下拉菜单导航的一般特征
用于多级信息结构
使用JavaScript和CSS来隐藏和显示菜单
显示在菜单中的链接是主菜单项的子项
菜单通常在鼠标悬停在上面时被激活，而有时候也可能是鼠标点击时激活

出式菜单和下拉菜单导航缺点
除非你在主导航链接边上放置一些标识（通常是箭头图标），不然访客可能不知道那有包含子导航项的下拉或出式菜单，因此使这些标识很明显是非常重要的。同时出式菜单和下拉可能使得导航在移动设备上非常难用，所以要确保你的移动样式表处理了这种情况。

何时使用出式菜单和下拉菜单导航
如果你想在视觉上隐藏很大的或很复杂的导航层次，出式菜单和下拉是很好的选择，因为它让用户决定他们想看见什么，以及什么时候可以看见它们。它们可以用来在不弄乱网页的情况下按需显示很大数量的链接。它们还可以用来显示子页面和局部导航，并且不需要用户首先点击打开新的页面。

分面/引导导航
分面/引导导航（也叫做分面检索或引导检索）最常见于电子商务网站。基本上来说引导导航给你提供额外的内容属性筛选。假设你在浏览一个新的LCD显示器，引导导航可能会列出大小，价格，品牌等选顶。基于这些内容属性，你可以导航到匹配你的条件的项。

引导导航在拥有巨大数量货物的大型电子商务网站中是非常宝贵的。用户通过直接搜索通常很难找到他们想要的东西，并且增加了用户漏掉一个产品的或能性。例如他们可能搜索一个灰褐色的产品，但你可能将它标记了灰色或褐色，虽然它可能就是用户想要的东西。

分面/引导导航的一般特征
最常见于电子商务网站
通常让用户对不同的特征做多次筛选
几乎总是使用文字链接，分解在不同的类别下或是下拉菜单下
常常与面包屑导航一起使用
分面/引导导航的缺点
引导导航可能会引起一些用户的迷惑。另外不能保证用户会在你预先定义的类别中查找。

何时使用分面/引导导航
分面导航对于大型电子商务网站非常有用。它方便了用户购物，提升了购物体验，并更容易找到它们真正想要的东西。它也可以用于其它目录风格的网站。

页脚导航
页脚导航通常用于次要导航，并且可能包含了主导航中没有的链接，或是包含简化的网站地图链接。

访客通常在主导航找不到他们要找的东西时会去查看页脚导航。

页脚导航的一般特征
页脚导航通常用于放置其它地方都没有的导航项
通常使用文字链接，偶尔带有图标
通常链接指向不是那么关键的页面
页脚导航的缺点
如果你的页面很长，没有人愿意仅仅为了导航而滚动到页面底部。对于较长的页面，页脚导航最好作为重复链接和简要的网站地图的地方。它不适合作为主导般形式。

何时使用页脚导航
绝大多数网站都有这样那样的页脚导航，即使它只是重复其它地方的链接。考虑什么放在那有用，以及你的访客可能最想找什么。

结论
大多数网站使用不只一种导航设计模式。例如一个网站可能会用顶部水平栏导航作为主导航系统，并使用竖直/侧边栏导航系统来辅助它，同时还用页脚导航来作冗余，增加页面的便利度。当选择你的导航系统基于的导航设计模式时，你必须选择支持你的信息结构以及网站特性的方案。导航是网站设计的重要部分，它的效果必须有坚实的基础设计。

标签: 导航, 指南, 模式, 网站, 设计 1个评论

268月/11关

Web-IA专业版报表说明

发布在邵珠庆

Web-IA专业版报表说明

常规分析
1、概要分析
2、指标分析
3、频道访问分析
4、原始访问记录查询
5、错误类型分析
6、访问状态分析

浏览数分析
1、浏览数地区分析
2、浏览数时段分析

访问分析
1、访问地区分析
2、访问时段分析

用户分析
1、用户地区分析
2、用户时段分析
3、唯一IP分析

变化趋势分析
1、浏览数趋势分析
2、访问趋势分析
3、用户趋势分析
4、停留时间趋势分析
5、首页浏览数趋势分析
6、点击数趋势分析

网页分析
1、页面浏览数分析
2、页面停留时间分析
3、页面类型分析

访问行为分析
1、进入页面分析
2、离开页面分析
3、访问次数分析
4、访问时长分析
5、访问轨迹分析

客户来源分析
1、客户来源网址分析
2、搜索引擎分析
3、搜索关键字分析

技术分析
1、Internet 接入方式分析
2、运营商分析
3、用户浏览器类型分析
4、用户操作系统类型分析

流量分析
1、地区流量分析
2、时段流量分析

分析结果显示与导出
1、常规显示
2、HTML方式
3、Excel表格数据导出与显示

标签: IA, web, 专业, 报表, 网站分析, 说明没有评论

248月/11关

海量数据的处理分析经验

发布在邵珠庆

在实际工作中，有幸接触到海量的数据处理问题，对其进行处理是一项艰巨而复杂的任务。原因有以下几个方面：

一、数据量过大，数据中什么情况都可能存在。如果说有10条数据，那么大不了每条去逐一检查，人为处理，如果有上百条数据，也可以考虑，如果数据上到千万级别，甚至过亿，那不是手工能解决的了，必须通过工具或者程序进行处理，尤其海量的数据中，什么情况都可能存在，例如，数据中某处格式出了问题，尤其在程序处理时，前面还能正常处理，突然到了某个地方问题出现了，程序终止了。

二、软硬件要求高，系统资源占用率高。对海量的数据进行处理，除了好的方法，最重要的就是合理使用工具，合理分配系统资源。一般情况，如果处理的数据过TB级，小型机是要考虑的，普通的机子如果有好的方法可以考虑，不过也必须加大CPU和内存，就象面对着千军万马，光有勇气没有一兵一卒是很难取胜的。

三、要求很高的处理方法和技巧。这也是本文的写作目的所在，好的处理方法是一位工程师长期工作经验的积累，也是个人的经验的总结。没有通用的处理方法，但有通用的原理和规则。

那么处理海量数据有哪些经验和技巧呢，我把我所知道的罗列一下，以供大家参考：

一、选用优秀的数据库工具

现在的数据库工具厂家比较多，对海量数据的处理对所使用的数据库工具要求比较高，一般使用Oracle或者DB2，微软公司最近发布的SQL Server 2005性能也不错。另外在BI领域：数据库，数据仓库，多维数据库，数据挖掘等相关工具也要进行选择，象好的ETL工具和好的OLAP工具都十分必要，例如Informatic，Eassbase等。笔者在实际数据分析项目中，对每天6000万条的日志数据进行处理，使用SQL Server 2000需要花费6小时，而使用SQL Server 2005则只需要花费3小时。

二、编写优良的程序代码

处理数据离不开优秀的程序代码，尤其在进行复杂数据处理时，必须使用程序。好的程序代码对数据的处理至关重要，这不仅仅是数据处理准确度的问题，更是数据处理效率的问题。良好的程序代码应该包含好的算法，包含好的处理流程，包含好的效率，包含好的异常处理机制等。

三、对海量数据进行分区操作

对海量数据进行分区操作十分必要，例如针对按年份存取的数据，我们可以按年进行分区，不同的数据库有不同的分区方式，不过处理机制大体相同。例如SQL Server的数据库分区是将不同的数据存于不同的文件组下，而不同的文件组存于不同的磁盘分区下，这样将数据分散开，减小磁盘I/O，减小了系统负荷，而且还可以将日志，索引等放于不同的分区下。

四、建立广泛的索引

对海量的数据处理，对大表建立索引是必行的，建立索引要考虑到具体情况，例如针对大表的分组、排序等字段，都要建立相应索引，一般还可以建立复合索引，对经常插入的表则建立索引时要小心，笔者在处理数据时，曾经在一个ETL流程中，当插入表时，首先删除索引，然后插入完毕，建立索引，并实施聚合操作，聚合完成后，再次插入前还是删除索引，所以索引要用到好的时机，索引的填充因子和聚集、非聚集索引都要考虑。

五、建立缓存机制

当数据量增加时，一般的处理工具都要考虑到缓存问题。缓存大小设置的好差也关系到数据处理的成败，例如，笔者在处理2亿条数据聚合操作时，缓存设置为100000条/Buffer，这对于这个级别的数据量是可行的。

六、加大虚拟内存

如果系统资源有限，内存提示不足，则可以靠增加虚拟内存来解决。笔者在实际项目中曾经遇到针对18亿条的数据进行处理，内存为1GB，1个P4 2.4G的CPU，对这么大的数据量进行聚合操作是有问题的，提示内存不足，那么采用了加大虚拟内存的方法来解决，在6块磁盘分区上分别建立了6个 4096M的磁盘分区，用于虚拟内存，这样虚拟的内存则增加为 4096*6 + 1024 = 25600 M，解决了数据处理中的内存不足问题。

七、分批处理

海量数据处理难因为数据量大，那么解决海量数据处理难的问题其中一个技巧是减少数据量。可以对海量数据分批处理，然后处理后的数据再进行合并操作，这样逐个击破，有利于小数据量的处理，不至于面对大数据量带来的问题，不过这种方法也要因时因势进行，如果不允许拆分数据，还需要另想办法。不过一般的数据按天、按月、按年等存储的，都可以采用先分后合的方法，对数据进行分开处理。

八、使用临时表和中间表

数据量增加时，处理中要考虑提前汇总。这样做的目的是化整为零，大表变小表，分块处理完成后，再利用一定的规则进行合并，处理过程中的临时表的使用和中间结果的保存都非常重要，如果对于超海量的数据，大表处理不了，只能拆分为多个小表。如果处理过程中需要多步汇总操作，可按汇总步骤一步步来，不要一条语句完成，一口气吃掉一个胖子。

九、优化查询SQL语句

在对海量数据进行查询处理过程中，查询的SQL语句的性能对查询效率的影响是非常大的，编写高效优良的SQL脚本和存储过程是数据库工作人员的职责，也是检验数据库工作人员水平的一个标准，在对SQL语句的编写过程中，例如减少关联，少用或不用游标，设计好高效的数据库表结构等都十分必要。笔者在工作中试着对1亿行的数据使用游标，运行3个小时没有出结果，这是一定要改用程序处理了。

十、使用文本格式进行处理

对一般的数据处理可以使用数据库，如果对复杂的数据处理，必须借助程序，那么在程序操作数据库和程序操作文本之间选择，是一定要选择程序操作文本的，原因为：程序操作文本速度快；对文本进行处理不容易出错；文本的存储不受限制等。例如一般的海量的网络日志都是文本格式或者csv格式（文本格式），对它进行处理牵扯到数据清洗，是要利用程序进行处理的，而不建议导入数据库再做清洗。

十一、定制强大的清洗规则和出错处理机制

海量数据中存在着不一致性，极有可能出现某处的瑕疵。例如，同样的数据中的时间字段，有的可能为非标准的时间，出现的原因可能为应用程序的错误，系统的错误等，这是在进行数据处理时，必须制定强大的数据清洗规则和出错处理机制。

十二、建立视图或者物化视图

视图中的数据来源于基表，对海量数据的处理，可以将数据按一定的规则分散到各个基表中，查询或处理过程中可以基于视图进行，这样分散了磁盘I/O，正如10根绳子吊着一根柱子和一根吊着一根柱子的区别。

十三、避免使用32位机子（极端情况）

目前的计算机很多都是32位的，那么编写的程序对内存的需要便受限制，而很多的海量数据处理是必须大量消耗内存的，这便要求更好性能的机子，其中对位数的限制也十分重要。

十四、考虑操作系统问题

海量数据处理过程中，除了对数据库，处理程序等要求比较高以外，对操作系统的要求也放到了重要的位置，一般是必须使用服务器的，而且对系统的安全性和稳定性等要求也比较高。尤其对操作系统自身的缓存机制，临时空间的处理等问题都需要综合考虑。

十五、使用数据仓库和多维数据库存储

数据量加大是一定要考虑OLAP的，传统的报表可能5、6个小时出来结果，而基于Cube的查询可能只需要几分钟，因此处理海量数据的利器是OLAP多维分析，即建立数据仓库，建立多维数据集，基于多维数据集进行报表展现和数据挖掘等。

十六、使用采样数据，进行数据挖掘

基于海量数据的数据挖掘正在逐步兴起，面对着超海量的数据，一般的挖掘软件或算法往往采用数据抽样的方式进行处理，这样的误差不会很高，大大提高了处理效率和处理的成功率。一般采样时要注意数据的完整性和，防止过大的偏差。笔者曾经对1亿2 千万行的表数据进行采样，抽取出400万行，经测试软件测试处理的误差为千分之五，客户可以接受。

还有一些方法，需要在不同的情况和场合下运用，例如使用代理键等操作，这样的好处是加快了聚合时间，因为对数值型的聚合比对字符型的聚合快得多。类似的情况需要针对不同的需求进行处理。

海量数据是发展趋势，对数据分析和挖掘也越来越重要，从海量数据中提取有用信息重要而紧迫，这便要求处理要准确，精度要高，而且处理时间要短，得到有价值信息要快，所以，对海量数据的研究很有前途，也很值得进行广泛深入的研究。

标签: 分析, 处理, 数据, 海量, 经验 10 评论

297月/11关

太平洋家居网首页栏目

发布在邵珠庆

标签: 太平洋 15 评论

支持博主

关于邵珠庆博客

文章标签

记事邵珠庆博客

1、Web前端网址导航
2、邵珠庆极客筛站
3、识别移动设备访问代码

竹磬网-了解慈善捐款计划

邵珠庆の日记生命只有一次，你可以用它来做很多伟大的事情–Make the world a little better and easier

网站分析师的一点感想

发布在邵珠庆

电子商务网站数据分析指标、名词定义与解析

发布在邵珠庆

分享一篇文章:我的职业理想：成为数据分析师

发布在邵珠庆

Google Analytics的能与不能

发布在邵珠庆

Google Analytics的能

Google Analytics的不能

Google Analytics所适宜的和不适宜的网站

Google Analytics进阶运用之跨域跟踪

发布在邵珠庆

网站导航设计模式指南

发布在邵珠庆

Web-IA专业版报表说明

发布在邵珠庆

海量数据的处理分析经验

发布在邵珠庆

太平洋家居网首页栏目

发布在邵珠庆

支持博主

关于邵珠庆博客

文章标签

记事邵珠庆博客

最近文章

最近评论

博客日历

目录分类

文章归档

博客功能

京东好物

2025年11月
一	二	三	四	五	六	日
« 8月
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30

邵珠庆の日记 生命只有一次，你可以用它来做很多伟大的事情–Make the world a little better and easier

发布在 邵珠庆

发布在 邵珠庆

发布在 邵珠庆

发布在 邵珠庆

Google Analytics（分析）如何使用 Cookie

Google Analytics（分析）设置的 Cookie

发布在 邵珠庆

Google Analytics的能

Google Analytics的不能

Google Analytics所适宜的和不适宜的网站

发布在 邵珠庆

发布在 邵珠庆

发布在 邵珠庆

发布在 邵珠庆

发布在 邵珠庆

支持博主

关于邵珠庆博客

文章标签

记事邵珠庆博客

最近文章

最近评论

博客日历

目录分类

文章归档

博客功能

京东好物

邵珠庆の日记生命只有一次，你可以用它来做很多伟大的事情–Make the world a little better and easier

发布在邵珠庆

发布在邵珠庆

发布在邵珠庆

发布在邵珠庆

发布在邵珠庆

发布在邵珠庆

发布在邵珠庆

发布在邵珠庆

发布在邵珠庆

发布在邵珠庆