在BI出现之前,数据分析领域几乎被传统的报表软件所笼罩,随着时间及客户需求的增长,这些报表软件逐渐显现出以下不足:
1. 报表速度慢、显示形式单一,同时不支持流行的分析手段,如KPI、平衡计分卡等等
记得当时有件很有意思的事,就是每天上班之后,先把报表打开,这样下午就可以看了。虽然未免有点夸张,但传统报表速度慢却是不争的事实。传统报表大都利用SQL对关系数据库进行查询,但随着数据库数据量的急剧膨胀,并且每个SQL查询都从最低粒度数据进行汇总,难免速度变慢。
同时传统的报表展现形式很单一,主要是表格和常规的图表。随着分析需求的增长,人们希望从更多的角度及更多的形式来分析数据,包括将数值分析转换为状态和趋势分析的KPI,分析各指示之间关系的平衡计分卡,以及GIS分析和更丰富的图表、仪表盘分析等等。
2. 展现的数据量有限
传统的报表展现形式能够展现的数据量非常有限,只能展现报表定义时所定义的数据项。当有新的分析需求时,则不得不开发新的报表,导致报表量增加,统计局每年发布的年鉴已达500多页。
传统的报表展现的数据固定,无法根据分析者的思想发生变化,从而很大程度上限制了数据分析者的思想。
3. 不支持数据挖掘,无法通过数学算法找到规律
传统数据分析只能完成数据的展现,而数据背后的规律只能依赖于分析者的创造,而普通的分析者却不具备这样的能力。这样,传统的数据分析只能流浮于数字表面。
在这种背景下,BI为分析者带来了希望。BI的含义是提供更加快速、灵活和丰富的数据支撑。这正好对应于传统数据分析的三个问题:
1. 报表---更加快速及更多的展现形式
1) 数据源为多维数据集,并提供缓存机制
多维数据集采取预运算机制,汇总数据在多维数据集中已经有了实际的存储,而不需要在每次查询时从最低粒度进行汇总,再加上新的报表软件提供的缓存机制,从而使报表的展现速度变得非常快。
2) 一定的钻取、跳转以及多报表之间的联动
新的报表展现与传统报表相比变得更加灵活,包括更丰富的筛选器、一定层次的钻取、跳转以及多报表之间的联动。
但报表仍不如多维数据分析更加灵活。
3) 更多的展现形式
新的报表展现目前已经可以实现KPI展现、仪表盘、树形大纲视图、更丰富的图表以及更多的自定义展现形式。
2. 多维数据分析---灵活
1) 报表及图表各元素的灵活定制
多维数据分析最大的特点就是报表及图表的各元素可以随意定制,我们可以很轻松的设定放置在行或列上的维度或量度,从而实现随心所欲的报表。
2) 新成员、新指标的快速创建
多维数据分析工具一般都提供了新的维度成员或新指标的快速创建的方法,从而实现在分析者不了解后台数据结构的情况下,也可以随意创建出自己想要的计算成员或集合等,这一点更清晰的体现出其灵活的特点。
3) 随意的钻取及钻透
随意的钻取,尤其是跨维度的钻取是多维数据分析非常重要的一项功能,正因为具有这样的功能,所以多维数据分析所展现的数据可以随着分析者的思想而发生变化,例如从产品分析到销售分析的跳跃性思维,多维数据分析都可以实现相应的数据支撑。
4) 数据访问范围的扩大
多维数据分析可以访问的数据范围几乎可以实现全部数据,尤其是一些新技术出现之后(例如SQL Server 2005的UDM)。
3. 数据挖掘---丰富
将分析者的思想与数据算法相结合,利用数据算法,分析者更容易从海量数据中找到规律,同时分析者的思维也赋予数据算法更多的活力,使其更贴近于行业规则。
数据挖掘为分析者带来了从数字表面无法发现的规律,提供更加丰富的分析,将数据分析延伸到了新的领域。
数据挖掘更为重要的是提供了预测的功能,这意味着我们在未来到来之前,已经获得了未来的数据,可以说报表和多维数据分析让我们更清晰的了解过去,而数据挖掘则让我们感受到了未来的气息。
BI附加价值:
1. 改善数据质量
2. 业务流程规范
3. 触发更多分析需求
BI项目的实施是对企业数据质量及业务流程的最好的检验,可以暴露很多以往很难发现的问题。同时,它也可以触发更多的分析需求,分析师可以通过BI系统获取更多的灵感,提供更多更、更好的数据分析结果。
综述,数据分析=分析的思想+BI技术。其中,分析的思想占70%,BI技术占30%,足见分析思想在数据分析过程中的重要性,而技术则是提供更好的支撑。
BI的真正含义是“利用各种不同的应用程序和技术,收集、存储、分析、共享数据并提供数据访问,从而帮助企业用户更容易的、更快速的获取更丰富的数据,以做出更好的业务决策。”