成都公司:成都市成华区建设南路160号1层9号
重庆公司:重庆市江北区红旗河沟华创商务大厦18楼
商业智能系统中应该支持多种数据源
BI作为一个数据分析系统,应该支持多种数据源。这主要是因为一家企业可能会同时有不同格式的数据。如有些数据来自于SQLServer数据库系统,而有些数据源则来源于Excel表格。甚至有些数据来自于网页等等。为了从不同的地方读取数据进行分析,则要求BI系统能够支持多种数据源。如下图所示,就是一个BI系统数据源的示意图。
一、企业数据保存的常见格式
通常情况下,企业会将数据保存在哪些地方呢?只有了解这个内容之后,才能够在BI系统中进行数据源的设计与开发。根据笔者的经验,企业通常会将数据保存在如下几个地方。

第一个地方是数据库。这也是企业主要的数据存储地。如erp系统、进销存系统、财务管理系统等等,都需要用到后台数据库。这个数据库可以是大型的Oracle数据库,也可以是小型的ACCESS数据库等等。在BI进行数据分析时,从数据库中获取所需要的数据,则是其必须具备的一个能力。
同时又因为其所采用的数据库不同,为此BI系统需要能够支持不同的数据库。如上图所示,在连接数据库中可以采用ODBC驱动程序,也可以使用OLEDB技术。无论采取什么手段,一个基本的要求,就是BI系统应该能够访问现在常见的数据库系统。从数据库文件中获取所需要的数据进行分析。
第二个地方是Excel文件。并不是所有企业都采用了ERP等信息化管理软件。没有采用这些软件的企业,一般他们是将数据存储在Excel文件中。如有些企业使用Excel表格来管理企业的库存信息、来做生产计划、来设计应付帐龄表等等。为此BI系统在设计时,还要能够直接出Excel文件中读取数据。在设计这个功能时需要注意一个问题,即Excel不同版本之间的兼容性。
特别是Excel2000、2003、2007几个版本在数据的存储上有很大的差异。企业的数据可能会同时存在不同版本的Excel文件中。在使用BI系统来读取Excel文件中的数据时,应该可以同时读取这几个不同版本的数据,而不需要再经过额外的转换。
第三个地方是Web网页中,如Web文件或者XML文件。这主要是用于读取外部网站的数据。如在进行汇率损益分析时,需要从银行网站上读取汇率信息。此时就需要BI系统能够直接从官方网站上读取相关的信息。而不是用户先从网页上复制出来保存到Excel表格中,再让BI系统去读取。
这多了一个中间环节,会导致额外的工作量。而且数据的准确性与即时性也会降低。为了减少中间环节,提高数据的准确率,就要求BI系统能够直接从Web文件或者XML文件中读取分析所需要的数据。

