报表排序
图4.4中,标签I: 对任何特定的报告来说,报表数据默认是按流量(访问数)降序排列。点击”访问次数“的列标题项即可转为按升序排列。如果想按一特定列进行排序,单击该列的 标题即可。但是这类排序方式可能会给你展示一大堆异常或极端的数据,数据点的值可能会很大或是很小,这对于你的分析工作毫无意义。
要了解这 个问题, 我们来看一个按跳出率排序的数据表。在跳出率范围的两端,你很可能会看到有一小部分访问数的跳出率是100%,还有一小部分访问数的跳出率是0%。例如, 你会看到排名前10位的流量来源的跳出率均为100%,但这10个来源每个只贡献了一次访问。显然,这不是一个有用的报告。为了避免出现这类报告,我们可 以考虑从下图的标签I的下拉菜单中选择“加权”的排序方式。
加 权排序让你可以根据数据的重要性而非数据的大小进行排序。实质上加权算法在衡量所选指标的重要性时,它会把访问数的多少也考虑进去。当你想按这样一个比率 指标进行排序时,使用加权排序方法你可以获得更多有效的数据。为了说明这一点,图4.14显示了两个数据表,两个数据均按跳出率进行排序,其中 一个使用了加权的排列方式,一个没有。你可以对比一下两者的不同。
a
b
图4.14 按跳出率排序的报表:(a)默认排序,(b)应用加权排序
注: 在一些广告报告里,加权因素为展示或点击次数,而不是访问次数。
加权排序计算原理
加权排序会把对该特定系数指标有着重要影响的因素考虑进排序算法里。一个
常见的重要因素就是流量,在这里我用它来说明加权排序算法的原理,且在这个例子里它是唯一的重要因素。请注意这并不是Google Analytics所使用的确切方法,其他因素如展示次数、点击率等等,也会添加到算法中。以下的加权算法实例很好地说明了加权排序的原理。
报告中两个引荐来源的跳出率分别是:
• 来源1跳出率= 85%,访问数占比只有1%。
• 来源2跳出率= 55%,访问数占比为60%。
按默认的跳出率排列(从高到低)的方法,在报表中来源1将显示在来源2的上方。然而, 有效的跳出率(用于加权排序)需要考虑到访问数的多少。在此实例中,我假定报告中所有引荐来源的平均跳出率是35%:
有效的跳出率 来源1 =(0.01*85)+(0.99*35)
= 35.5%
有效的跳出率 来源2 =(0.60*55)+(0.40*35)
= 47.0%
我们可以得到以下公式:
有效指标值 N =(%访问次数 N * 指标值 N )+((1 – %访问次数 N )* 平均指标值 所有访问次数 )
当你在Google Analytics中选择加权排序的方式查看内容时,报表将会根据有效指标值进行排列。
正如你所看到的,现在来源2比来源1的有效跳出率要高,所以来源2显示在报表的前面。这意味着来源2的跳出率比来源1的跳出率更重要,因为来源2带来了更多的访问。