最近在读《精通Web Analytics2.0——用户中心科学与在线统计艺术》,强烈推荐的一本数据分析入门加升级的宝典。今天想跟大家聊聊网站分析最基础的重要指标,可能原来对这些指标的概念理解的不够清楚明了,那么我想今天的讨论会给大家一个更明确的定义。
书中的一段话写的很好
很多人在提到“网站分析”时,其实往往指的只是网站分析中用到的各种指标。老板很少真正让你去分析,他们要的只是“数据”(网站指标)或“报表”(KPI)。当然你和我掌握的技能肯定不止如此,我们可以再深入考察复杂的指标和KPI基础之上提供更深入的分析。有一点需要牢记:所有的一切最终要能知道实际行动,如果你的分析工作不能知道任何实践,就需要停下来,重新开始。
一、访问
访问之一指标指明某人来到你的网站,花一定的时间浏览了某些内容然后离开。从技术的角度来讲,这个过程又称为“会话”(Session。在某些系统,如Coremetrics中,甚至直接用Session来取代Visits而避免混淆)。
会话大多是指访问(目前也许只有在ClickTracks用访客来表示)。会话通常是指某人在网站上发出的一些列请求的集合。主要原理如下:
(1)如果使用的是JavaScript加代码的方式,当有人在网站上发出第一个页面或功能的请求时,网站分析系统就会在浏览器中为这个人启动一个会话。
(2)此访客在接下来所做的其他请求都会归属于这一独立的会话ID。
(3)当这位访客离开网站时,可以基于这一独立的会话ID将浏览过的页面几种到一起形成一次完整的访问。
(4)网站分析系统中某一时间段的访问量就是指这段时间内所有的会话总数。
目前大多数网站分析系统中,一次会话(或访问)是由此次会话中的第一次请求和最后一次请求决定的。因此如果某位访客在浏览器中打开网站然后离开计算机,并在接下来的30分钟内没有任何动作,此次会话自动结束。
需要向网站分析系统供应商明确会话在系统中究竟用哪个指标来表示,因为在不同的系统中,这个指标肯能被称为访问、访客或会话。
二、独立访客
在计算独立访客时,网站分析系统尽可能使其接近真是访问的人数。主要原理如下
(1)如果使用的是JavaScript加代码的方式,当有人在网站上发出第一个页面或功能的请求时,网站分析系统就会在此人的浏览器中创建一个独立的cookie。
(2)即使此人离开该网站,cookie还是会保留在其浏览器中。cookie中包括一条独立的匿名字符串(其中有数字和字符),并不包括访问者的私人信息。
(3)每次只要有人用该浏览器来访问你的网站,系统就会识别这个cookie的ID号,并返回到网站分析系统。
(4)网站分析系统中的独立访问质保就是某段时间内这些cookie的个数。
对于独立访客这个指标,有几个方面需要引起注意。首先,独立访客很接近但并不完全是真是独立的人。因此,必须知道独立访客这个指标虽然可以很好的反应到达网站的真是访问者的数量,但并不等同于显示当中的人数。
其次,有些浏览器会设置成禁用cookie或禁用第三方cookie,这回使独立访客这一指标受到影响。目前大多数的网站分析系统都使用第一方cookie来尽量减少cookie被禁用的情况(被禁用的比例大概为2%~5%)。第三方cookie被禁用的比率相对而言就要高很多(大概为10%~30%)。
当然,即使是注意到了这方面,独立访客也只能高度接近于访问网站的真是人群的数量,而不是完全等同。
因此,可以比较网站分析系统中获得的访问数量与从基于用户库(Panel)的系统中得到的人数。基于用户库的系统通过监控软件来统计人数,通常通过对较小的用户样本组数据使用数学今夕的方法来推断整体的访客数量。例如,有一家非常有名的公司使用约18万人的用户库来模拟整个美国约2亿人口的互谅网浏览行为。这样得出的数据结果无疑差别很大。
在很多网站分析系统中,都会看到每日独立访客(Daily Unique Visitor)、每周独立访客(Weekly Unique Visitor)和每月独立访客(Monthly Unique Visitor)这些指标,有些系统当中还会出现绝对唯一独立访客(在Google Analytics里又称为绝对唯一身份访问者人数)指标。每个指标所传递信都是不同的。
举例说明:
网站的独立访客数据
此时网站分析系统得到的数据将如下所示:
每日独立访客:19
每周独立访客:15
每月独立访客:12
绝对唯一独立访客:9
三、页面停留时间和网站停留时间
除了访问与访客之外,网站分析系统另一个最基本的指标就是停留时间。停留时间用来衡量一个访客在网站上的某一页或是一次访问(会话)所停留的时间。
只有极少数人了解网页和网站停留时间是如何计算出来的。在打多少网站分析系统中,停留时间的计算都会比你理解的复杂一些。但真的勇士是从来不会害怕“复杂”。我们拥抱复杂,然后征服复杂。
网页停留时间()
四、跳出率
跳出率又被成为网站的第六大关键指标(很多人也罢这个指标成为崩失率)。我个人很喜欢跳出率这个指标,原因如下:
几乎所有的网站分析系统里都有跳出率指标
跳出率指标所表示的含义很容易理解。
在很多层面上,跳出率指标都有很好的可操作性,尤其是用于发现那些明显的问题页面。
跳出率用来衡量访客的行为,几乎是最重要的指标。
至少需要再两个层次上来衡量网站的跳出率。一是衡量整个网站总体的跳出率;
二是衡量最热门的着陆页的跳出率(即热门着陆页报表)。
现在网站的流量很大程度上是有搜索引擎决定的。因此,是搜索引擎而不是你自己来决定网站的首页到底是那个页面。排在前10个首页,改进这些首页就可以大大改善你们的业务。
另外,还有两条对于跳出率的提示:
衡量网站流量最大的反向链接的跳出率。最热门的反向链接是网站最重要的流量来源。你需要的不仅仅是这些给你带来流量的方向链接,而是那些带来流量而不会跳出的反向链接。
衡量所有关键词的跳出率(自然搜索与付费搜索)。可能是你的关键词选择存在问题,也可能是网站与关键词对应的着陆页存在问题,不管如何,都需要改进。
现在你知道为什么我说跳出率是一个可操作性非常强的指标了吧?
五、退出率
在讨论退出率这个指标时,要做两件事情:一时烦死之前的一些常规认识;二是解释为什么一个看起来非常有用的指标完全不能创造实际的价值。
其实退出率这个指标的目的很简单:在某个页面有多少访客离开网站。
退出率是指不管从哪个页面进入网站,而在这个页面退出的访问比率;跳出率是指仅从这个页面进入网站,没有做任何事情,就在这个页面退出网站的访问比率。
六、转化率
七、参与度