很多人对于Google Analytics的流量来源数据有着各种各样的误解,关于访客回访的流量来源的覆盖规则之前在文章:Visit计算方法调整对于访次数据的影响以及访客回访的覆盖规则http://www.analyticskey.com/new-visit-computation-traffic-source/ 已有介绍过,但除此外,关于流量来源数据的这个话题仍有很多可说的内容。
GA的流量来源报告中主要包括了以下三类流量媒介:搜索(含自然搜索和付费搜索)、引荐和直接。此外,一些来自社交媒体(网站已被GA的社交网络网站列表收录,或是你已把社交网络网站加到后台中)的会话会归为社交网络流量。而我们也可以自定义一些流量媒介类别,比如我们可以把来自EDM的流量归为一类。流量的分类似乎并不复杂,但实际上并不是这样,我们在大部分的流量来源报告中看到的数据都存在归类错误和数据不完整的问题。以下是一些导致流量归类错误的原因及修复方案:
一些市场占比较小的搜索引擎的流量
GA有自己的一份搜索引擎列表,但这份列表并没有包含世界上所有的搜索引擎,虽然偶尔也在更新增加一些新的搜索引擎,但缺失的搜索引擎还是不少,国内的搜索引擎仅有少数几个大厂商出现在列表中。即使是在国内市场表现不俗的搜狗搜索,在2014年5月才被收录。如果要对搜索的数据进行更好的收集与归类,我们需要把国内的搜索引擎(如神马、有道、易查等等)在后台中增加进去。另外,如果要细分各搜索引擎的垂直搜索(如图片搜索、视频搜索等等)的关键字数据,我们也可以按同样的方法添加多个垂直的搜索引擎。
方案:在UA的后台管理面板的自然搜索源中增加新的搜索引擎。下图只是以Sougo为例,实际上大家以后不用再为Sougo作这样的配置了。其他的搜索引擎可以使用类似的方法配置即可。
品牌词搜索流量
品牌词搜索流量指的是那些包含了“品牌关键词”的关键字的搜索流量,如集团品牌或公司名称。虽然从技术上来说这属于搜索流量,但这些访问是熟知你的品牌或公司的用户。他们可能一时记不住你的网站的完整地址无法在地址栏中直接输入,因此使用了“品牌关键字”进行搜索。比如用户没能记住凡客的网站地址vancl.com,因此他使用了“凡客”这个词进行搜索从而进入凡客的网站。在理想的情况下,把搜索品牌词的流量归类为直接流量更合理些。而GA也提供把品牌词流量转化为直接流量的功能配置。
某品牌电商网站,其中60%的搜索流量使用的关键字都是品牌词。乍一看,似乎大部分的流量都是流量都是来自关键字搜索,网站的SEO运营状态似乎比较健康,但事实上,该公司的网站SEO存在严重的问题,只是电视广告做得比较多,提升了品牌的知名度从而带动了品牌搜索量的上升。
方案:在Universal Analytics的管理界面设置:不把特定字词(品牌词)的搜索流量归于自然搜索流量。如果你用的仍是传统的Google Analytics,你可以使用_addIgnoredOrganic( )的方法来实现此功能。
被加密的关键字数据
从2011年11月开始,GA中一些关键字数据会显示为(not provided)。用户通过Google安全搜索(搜索链接以https://开头)以及通过一些可隐藏搜索关键字的浏览器进行Google搜索行为时,点击搜索结果进入网站页面,网站的所有者无法获取这些搜索关键字的信息。
只要用户使用了Firefox浏览器搜索框或Chrome的 “多功能框” (合并的地址栏和搜索栏) ,或是用户登录了谷歌任意一款产品的帐号,Google搜索的关键字都会被加密。如果你做的外贸电商网站,你们会发现近几年的(not provided)的关键字访问数据的占比已越来越高。如果你的网站主要面向的是国内的用户,那么Google搜索关键字加密对于你的影响并不大,因为Google搜索在国内搜索市场所占的比例较小,但你要留意一下百度移动搜索的关键字被加密这一事件。从2014年5月开始,百度使用了一些算法加密了百度移动端的搜索关键字数据,各个网站分析工具暂时无法对收集到的关键字进行解密,会导致关键字报告中出现诸多无法正常显示为中文的带着一堆百分号的字符串。
方案:关于Google关键字显示为(not provided)的问题,有些第三方厂商声称他们研发出了较为理想的算法和解决方案,可以估算出用户具体使用的是哪些关键字,我还没用过他们的解决方案,但我对于他们方案的期望值并不是很高。如果你是AdWords的用户,广告投放的搜索数据仍可以获取得到。新版的Google网站管理员工具提供了更多详细的关键字展示和点击数据,这些数据也可以充分利用起来。或者我们可以加强关键字着陆页面的数据分析,基于着陆页面而不是基于某个具体的关键字去优化我们的关键字推广工作。而对于百度移动端的数据加密的问题,已有第三方服务商可以提供解密方案,如有技术能力的可以自行研究一下,或者可以使用百度自家的统计系统,他们家的工具应该可以提供这一部分的数据。
来自社交网络的流量
社交媒体运营需要很多的时间和精力,我们希望可以单独地测量社交媒体运营的效果。但是,社交媒体流量实际上是分为引荐流量和直接流量两种。如果在社交网络上推广的链接URL没有添加跟踪标识,那么这个链接在浏览器内的点击会归为引荐流量。另外有很多的社会化网络的推广链接的点击都是在移动端的App中产生,那么则会被归为直接流量。
方案:对于在社交媒体中推广的链接,可以先添加跟踪标识后再生成短链接进行推广。并在GA管理面板的社交媒体来源的设置区域中增加本地常用的社交网络资源。这将有助于GA以一种更准确的方式划分引荐来源的数据。
来自邮箱网站或邮箱程序的流量
商家通常会给用户发送促销邮箱,引导用户回到网站上产生购买,收到邮件的用户很可能会在浏览器中打开他的163或QQ邮箱,然后点击邮件中的链接进入你的网站,如果你提供的链接是没有跟踪标识的话,这些流量就会记录为引荐流量。若用户是通过邮箱程序(如OutLook)打开链接即会被记录为直接流量。但其实真正的流量来源是邮件营销,如果我们想很好地跟踪EDM的效果,添加跟踪标识不失为一种好办法。
方案:使用网址构建器URL Builder 为电子邮件中的每个链接添加跟踪标识。这可以避免这部分流量被归到引荐或直接流量中去,还方便我们对来自邮件的访客进行深入分析。实际上部分EDM服务商已把跟踪标识的功能整合到了他们的邮件系统中,这使得跟踪标识的配置变得更加简单。
来自站内的自引荐流量
如果网站上存在着部分页面缺少GA跟踪代码或代码没有正确配置,那么从这此页面到其他页面的流量将会被显示网站的自我引荐流量。另外,如果一个页面打开后但很长时间(超过30分钟)都没有操作行为,这时你再点击页面上的链接进入另一页面,这时产生的新会话也会被归为自我引荐流量。
方案:对于缺失代码的问题,可使用工具Google Analytics Debugger或Scream Frog扫描检查网站是否代码配置不当或丢失代码。另外,在UA后台设置不把特定域名的流量归于引荐流量。
来自PDF、Word、PPT等文档的链接点击
来自非网页文件的不含跟踪标识的链接点击访问均会被记录为直接流量。很多PDF文件都会有一些页面链接,但很少人会添加跟踪标识。
方案:建议把这些文件的内容转为网页文件,这样可在一定程序上扩充你的网站网页内容的容量。若真的要给用户提供一些非网页的文档,建议给一些重要的链接添加上跟踪标识。
来自即时通讯软件的链接点击
国内有些企业喜欢利用QQ进行推广,但若没添加跟踪标识,这一部分流量也会归为直接流量。
方案:给推广链接添加上跟踪标识。如果觉得链接太长可以生成短链接再推广。
通过中转页面或程序跳转的流量
这类跳转多为后台或程序自动完成,如果没有添加跟踪标识,则会归为直接流量。
方案:如有必要,为这些链接添加跟踪标识。
来自公司内部的流量
很多公司里员工的电脑多会把公司网站设置为浏览器主页,如果你没有设置过滤内部流量的视图文件过滤器,内部产生的这些流量也多会归为直接流量,且他们的访问行为会和一般的用户有较大差异,会对你的分析工作造成捆扰。
方案:如果公司使用的IP是静态或属于一个某一个IP段的话, 设置一个排除公司网络IP的过滤器。
小结
最后小结一下,我们通常是这样理解GA里的三大流量媒介的:
- 搜索流量:通过点击搜索引擎的自然搜索结果或付费广告过来的访问
- 引荐流量:通过点击其他网站(非搜索引擎站点)上的链接来到你的网站的访问
- 直接流量:用户直接在浏览器键入网站地址进行的访问
我们对于搜索流量与引荐流量的认识与实际情况较为接近,当然如果在搜索流量中把品牌词的流量归为直接流量,在引荐流量中把社交媒体的流量分离出来对于我们对于网站流量的构成会有更全面的理解。
而直接流量的实际情况实际上要比上边的解释复杂得多,实际上GA中直接流量的真正定义是:未有明确的引荐来源的所有流量都属直接流量。换句话说,直接流量并不一定是用户直接在浏览器输入你的网址进行的访问。也可以这样说,来自非网站非搜索引擎或没有跟踪标识的流量在GA中都会被归为直接流量。直接流量是一个构成复杂的流量来源类别,那些未添加跟踪标识的来自各类桌面端程序或移动端App及各类网页文档的流量都属直接流量。之前也曾写过一篇介绍Google Analytics的直接流量的文章:http://www.analyticskey.com/google-analytics-direct-traffic/。