成都公司:成都市成华区建设南路160号1层9号
重庆公司:重庆市江北区红旗河沟华创商务大厦18楼
在线零售站点的自适应与商业智能模型
1 引言
电子商务已经被称为是Internet最重要的应用之一www正以其简单易用性熹得越来越多的用户,为用户和商家提供了双向交流、“虚拟”交易的理想空间在电子商务环境下一个联机零售商在Web上开展电子商务的业务模型如图户二。其中市场数据存储商品信息和用户的交易信息;Web结构数据存储Web页和Web的结构.服务数据存储访问日志。
一个标准的在线零售网站的分类设计结构如图2所示其中:每一个节点表示一个页面.N节点表示导航页或分类页;C节点表示内容页或购买贞。网站的结构是介于树形和网状层次结构之间的一种结构.网站的设计者会尽量考虑到达一个购买页存在多个路径;而且从物品的分类结构匕说.很多物品属于多个类,如电子书.既属于书籍类又属于电子产品规模越大的站点。其结构越复杂。

开展在线零售业务的一个主要向题就是;用户面对厂家提供的大量产品信息,不知如何有效提取;而厂家面对大量的用户,不知他们的兴趣和要求所在,因而不知如何调整其服务方式和产品结构:
1.全体用户对零售商品的兴趣不一致。对物品的兴趣存在着一个概率分布,即全体用户对某些物品的兴趣要远远大于另一些物品.但Weh站点Web页面结构的分类层次设汁必须严格遵循商品的分类结构,因为如果不是这样,一般用户就无法访向。于是这两者之间就存在一种矛盾这种矛盾所导致的结果是大量用户不得不浏览许多不相关的页面,进人Web站点的很多层次最终才能找到自己所需要的商品.解决这个问题的一种思路是将图1上的导航页(N页)变成导航内容页(NC页).这样用户就可以在N页上直接购买自己需要的商品。
2. 许多用户购买的物品类似于啤酒和尿布这样的物品—属于数据挖掘中的经典问题,即在页面结构分类上两者相距很远.但很多顾客会同时购买干是这些用户就不得不反复进入退出多个Web页,来完成购买对于这样具有关联购买的物品集,要做的就是如何自动发现关联物品集.并且自动
建立包含它们的导航内容页,以帮助用户访问。
所以需要建立一个模型和相应的算法在各导航页上标注购买物品快捷清单。即经过算法处理后,N页要自动变成NC页,即导航助买页.原有的N页之问的导航关系不被破坏。NC页将满足大部分用户的需求,使他们不需访问过多的层次或尽量不需绕路而进行购买。
解决这个问题的方法是根据在线零售站点的Web访问到推荐点通过关联规则发现算法从用户的交易数据中,发现关联购买集合;在推荐点上标注这些商品及其关联购买集合;当处理完所有的关联购买集合后,通过竟争来决定出现在导肮页面上的物品集,最终将导航页合理地变成导航购买页。这样全体用户对这样的站点进行访问,他们的总的访问遍历教就会减小于是通过这样的过程卜这个站点就可以自动根据用户的访向购买情况,进行自适应。
文中首次提出将数据挖掘的技术应用于电子商务的环境下。以发现市场智能。挖拥的对象不仅包括日志、Web页面,也包括市场数据。文中还给出了在电子商务环境下挖拥的一个总的框架.但他们的方法依然局限在传统的挖掘手段.本文所述方法是建立在其基础之上,更好地发现并应用了市场智能。不仅应用传统的挖掘手段(如关联规则发现算法)而且新定义和建立了自适应模型进行Web站点结构的有限智能调整,即使站点能够根据群体用户的访问而自适应。
文中首次给出Web挖掘的定义,并且给出一个关于Web访向信息挖掘的系统WEBMINER。文中提到的思路是通过对Web站点的日志进行处理[ss7将数据组织成传统的数据挖掘方法能够处理的事务数据形式,然后利用传统的数据挖掘方法(如传统的关联规则发现算法)进行处理.其得出的挖掘结果也是传统的数据挖掘结果,并没有根据挖掘的结果调整站点的组织结构。找们的方法是在这种方法的墓础上.不但得到挖掘的结果而且把挖掘的结果用于改进在线零售站点的组织结构,以利于群体用户的访问。
Web Log Miner方法用OLAP技术来实现对Web日志数据的预测、分类、时间序列分析。其分析的结果没有用于Web站点的重新设计,而我们的方法是要主要用于站点的自动重新设计,且不破坏原有的分类结构,即自适应在文中,这些方法的目的是自动定制不同的用户访问界面。其特点是:1)W eb站点或代理动态地把一些增强的当前可视的Web页面给用户即定制个性化的页面;2)页面上的信息针对的是基于某种模型而得到的特定的某一个,或某一类用户;3)该棋型基于该用户或该类用户以前的访问方式。对比来说,找们的方法1)是一种优化方法;2)周期性、离线地进行挖掘;3)挖掘的对象是全体用户的交互行为,挖掘的是全体用户的共同访问购买兴趣,挖掘的结果面向全体用户;

