百分点分析引擎 (Baifendian Analytics Engine,简称BAE)

百分点分析引擎 (Baifendian Analytics Engine,简称BAE)


1产品概述

百分点分析引擎(Baifendian Analytics Engine,简称BAE)是一款面向独立电子商务网站的商业智能分析系统。系统采集目标站点的前后端数据进行整合,向企业提供基于流量、通路、访客、内容、商品和订单六大对象的数据分析,通过图形报表形式向企业管理者展示电子商务的核心数据,如动销、转化率、复购率和销售集中度等,同时满足企业对于WA和BA分析需求。在同类分析产品中,BAE首次提出基于商品维度的数据指标分析,更符合电商企业精细化管理需求。
 
BAE产品图  

2服务对象

企业管理者;
网站分析师和商业分析师;
需要用户数据来支持或验证产品改进效果的产品经理;
对站点流量负责的市场人员;
对销售业绩负责的运营人员;
 

3产品优势

永久免费
百分点承诺,BAE的基础功能永久免费。
 
基于商品的数据管理
提供基于商品(Units)的最小单位数据管理,实现企业精细化运营管理,并兼顾传统运营管理需求;
 
四种销售转化率
满足电子商务企业对商品和订单的并行管理需求,通过多维度业务指标的关联分析,为用户提供了基于Session和PV的订单转化率(Order Conversion Rate)及商品转化率 (Units Conversion Rate)。
 
三种用户复购率
提供基于访客、订单和商品三种维度的复购率计算体系,满足不同行业不同类型的企业需求。
 
量化营销性能
电子商务通过利用互联网营销效能可量化来进行零售生意,系统打通前后端数据,可以将前端可量化的营销性能,和后端运营数据结合。
 
打通流量和业务数据,订单溯源
真正打通流量和业务数据,评估推广活动的质量不光要看PV,更关键的是流量最终转化的订单数量。BAE通过归因算法,为每一笔订单溯源,真正将流量与订单数据打通,帮助企业管理自身推广通路,了解每一条通路的实际效果和投入产出。
 
GG 5
 
以访次为单位精细化数据样本
相比同类产品基于访客(UV)的分析,BAE系统中的各项数据分析全部基于用户访问最小单位访次(session),将用户的行为细化到最小样本,确保分析结果的精准。
 
用户行为轨迹的漏斗模型
通过四层漏斗模型向企业展示用户在站点内的行为轨迹,帮助企业了解用户的转化和流失情况。作为企业经营者,要了解用户在站内的转化情况,更要清楚用户在站内的流失情况。
 
兼容GOOGLE和BAIDU统计代码
提供自定义来源功能,企业可以自定义站外推广链接,监测每一个通路的推广效果。同类产品中,首家做到同时兼容GOOGLE和BAIDU两大统计系统代码,确保企业更换统计系统的平滑过渡。
 

4功能模块

基于时间和地区的访客分布
访客数据是网站数据中的重要组成部分,它直接反映了网站使用人群的情况,掌握访客数据的研究方法将有效的指导我们去认识自己的用户,他们拥有怎样的属性,如何分布。
 
 
新老访客比例
新访次的数量,代表着网站新用户的访问情况,不断提高的新访次数量,代表该网站拥有不断产生新用户的能力。老访次的数量,代表着网站老用户的回访,不断提高的老访次数量,代表越来越多的老用户再次访问该网站,说明网站内容对用户的粘度较高。也可以这样理解,新访次的数量映射着网站推广能力的高低,而老访次的数量映射着网站内容运营能力的高低。
用户终端设备特征(支持移动设备)
百分点分析引擎对于用户终端设备的特征分析也细致入微,可以从设备类型、操作系统、语言、浏览器、分辨率,FLASH版本和是否支持JAVA多个维度对用户数据进行分析。
考虑到国内电子商务已经步入“移动”时代,当前版本的BAE更是将使用移动设备访问站点的用户数据提取出来重点分析。
  
用户行为轨迹的转化率漏斗模型
BAE2.0系统中提供了基于访次的用户行为漏斗模型,从用户进入站点着陆开始,到达商品详情页,到达购物车,最终下单,每一个环节的流失率和转化率都一目了然。
 
流量来源及通路效能
电商企业希望通过营销推广活动来获取更多的访次、商品订单、新客以及更高的客单价。达成这些业务指标增长的通路推广方式大概分为几类,包括搜索引擎付费点击、硬广投放、联合推广、邮件营销和搜索引擎优化等。
企业所追求的营销目标,达成目标所采取的营销活动,以及对营销效果的量化分析,他们三者的关系就像是一组联动齿轮,其中数据分析在其他二者间起到连接作用。一方面,企业量化营销效果,从数据层面直观的反应营销通路的健康程度。另一方面,通过对营销数据的分析,企业可以不断的调整内外部资源分配,进而优化营销效果。
  
着陆页效果
百分点分析引擎中,设置了专门对着陆页效果进行分析的模块。在这个模块中,展示了用户进入站点后直到访次结束所有行为数据的汇总,是评估着陆页作用和效果的重要功能。
GG 6
  
站内搜索关键词
当前版本的BAE产品,全面的分析了站内搜索的相关数据,包括每一个关键词的有效及无效搜索次数,搜索退出率等,辅助运营人员深入挖掘用户的需求。
订单销售集中度分析
此功能是BAE2.0版本中新增的分析模块,展示了订单特征数据,以图形及数据结合的方式向运营人员展示订单金额、订单中所含商品件数和订单支付方式的集中度。
  
重复购买率
由于企业自身经营方式不同,对重复购买率的计算方法也不尽相同。百分点分析引擎BAE系统中集成了三种计算重复购买率的方式,用于满足不同类型企业对数据的分析需求。
基于用户计算重复购买率,是指统计时间区间内所有产生过购买行为的用户,以每个用户为独立的统计单位。
重复购买率=(产生过重复购买的用户数量/所有产生过购买的用户数量)*100
举例:统计某电子商务网站2012年4月份的重复购买率,自4月1日至4月30日期间内,共100个用户产生订单,其中20个用户产生了2笔(含)以上的订单。那么按照计算公式,该网站2012年4月份的用户重复购买率就是20%
基于订单计算重复购买率,是指统计时间区间内所有产生过购买行为的用户,以订单为独立的统计单位。
重复购买率=(用户重复购买的订单数量/所有购买的订单数量)*100
举例:还是刚才的例子,统计某电子商务网站2012年4月份的重复购买率,自4月1日至4月30日期间内,共100个用户名产生订单,其中80个用户名各自提交了1笔订单,产生重复购买的20个用户名中,有10个用户名各自提交了2笔订单,另外10个用户名各自提交了3笔订单。那么按照计算公式,该网站2012年4月份的订单重复购买率就是(20+30)/130,等于38.5%
基于商品计算重复购买率,是指统计时间区间内所有产生过销售的商品,以商品ID为独立的统计单位。
重复购买率=(销售过2次(含)以上的商品/所有产生过销售的商品数量)*100
举例:统计某电子商务网站2012年4月份的重复购买率,自4月1日至4月30日期间内,共100个商品产生了销售,其中有20款商品产生了2次(含)以上的销售。那么按照计算公式,该网站2012年4月份的商品重复购买率就是20%
 
自定义商品组
许多电商企业会存在跨产品线的促销活动,商品由多个品类和品牌组成,如果运营人员要统计活动的整体效果,往往需要提取许多数据碎块再拼接在一起。BAE2.0版本中,针对这一需求提供了自定义商品组功能,运营人员可以根据自己的需求将任意商品组合成一个商品组,系统会打包分析这些商品的运营数据,并以图文报表的方式展示。
 

5技术优势

分布式架构
分布式系统(distributed system)是建立在网络之上的软件系统。正是因为软件的特性,所以分布式系统具有高度的内聚性和透明性。因此,网络和分布式系统之间的区别更多的在于高层软件(特别是操作系统),而不是硬件。内聚性是指每一个数据库分布节点高度自治,有本地的数据库管理系统。透明性是指每一个数据库分布节点对用户的应用来说都是透明的,看不出是本地还是远程。在一个分布式系统中,系统拥有多种通用的物理和逻辑资源,可以动态的分配任务,分散的物理和逻辑资源通过计算机网络实现信息交换。系统中存在一个以全局的方式管理计算机资源的分布式操作系统。
我们采用的分布式平台为Hadoop。Hadoop实现了一个分布式文件系统(Hadoop Distributed FileSystem),简称HDFS。HDFS有着高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高传输率(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。
Hadoop具有高效,可靠,伸缩性强等特点,通过集群对多台计算机进行联合,使整个系统能高效完成工作,是当今主流的分布式处理系统,而且Hadoop带有用Java 语言编写的框架,因此运行在Linux平台上是非常理想的。
 
GG 7
 
平台负载均衡技术
负载均衡(又称为负载分担),其意思就是将负载(工作任务)进行平衡、分摊到多个操作单元上进行执行,例如Web服务器、FTP服务器、企业关键应用服务器和其它关键任务服务器等,从而共同完成工作任务。
负载均衡建立在现有网络结构之上,它提供了一种廉价又有效的方法扩展网络设备和服务器的带宽、增加吞吐量、加强网络数据处理能力、提高网络的灵活性和可用性。需要说明的是:负载均衡设备不是基础网络设备,而是一种性能优化设备。对于网络应用而言,并不是一开始就需要负载均衡,当网络应用的访问量不断增长,单个处理单元无法满足负载需求时,网络应用流量将要出现瓶颈时,负载均衡才会起到作用。
利用调度服务器以及相应的任务调度算法,尽量将hadoop可以达到高效且稳定的计算性能。
 
数据在线与离线分析
联机分析处理(OLAP),英文全称为On-Line AnalysisProcessing,也称为在线分析处理。OLAP具有灵活的分析功能、直观的数据操作和分析结果可视化表示等突出优点,从而使用户对基于大量复杂数据的分析变得轻松而高效,以利于迅速做出正确判断。它可用于证实人们提出的复杂的假设,其结果是以图形或者表格的形式来表示的对信息的总结。它并不将异常信息标记出来,是一种知识证实的方法。
OLAP的作用是帮助客户端对用户的访问行为迅速地得出分析结果。客户端向服务器端发送信息,服务器端接受后,把用户行为信息加入到分析系统进行处理,分析系统会调用计算集群,结合现有的分析模型,以极快的速度计算出当前商务网站的流量,用户,订单情况,同时根据用户指定的指标对网站现有的运营情况进行评估。
离线分析处理是将一个时间段内产生的所有日志(包括商家信息的更新,用户访问数据,购买记录等)进行归类并整理的过程。离线分析的特点在于,待分析数据是在每天的非繁忙时段(通常是深夜)转移至分析系统,由分析系统自动对有价值的信息进行提取并加入到数据库,然后系统会调用分析模块对这部分数据进行清洗,训练等操作,最后使用机器学习方法将处理后的数据集成到分析模型里面。。
在线分析与离线分析两者相辅相成,缺一不可,我们的分析系统很好地做到了两者的有机结合,该引擎的性能在中国电子商务分析行业中位列高端。
运行环境百分点分析引擎BAE是一款SaaS模式的企业级产品,为中小企业搭建数据分析所需要的所有网络基础设施及软件、硬件运作平台,并负责所有前期的实施、后期的维护等一系列服务,企业无需购买软硬件、建设机房、招聘IT人员,只需要按照系统要求完成前期部署,即可通过联网的终端机器使用百分点提供的卓越分析服务。
当前版本的BAE系统,共支持下列10种浏览器。
 
权重顺序
 
浏览器名称
 
版本
 
操作系统平台
 
1
InternetExplorer
8.0
Windows
2
InternetExplorer
6.0
Windows
3
InternetExplorer
7.0
Windows
4
360浏览器
4.1
Windows
5
搜狗浏览器
3.2
Windows
6
腾讯浏览器
4.8
Windows
7
Chrome
18.0
Windows
8
InternetExplorer
9.0
Windows
9
Safari
5.1.5
Windows
10
Firefox
10.0
Windows