当用户和电子商务的商家充分享受电子商务的快捷和方便时,他们同时面临着某些新的问题。一方面,用户面对网站上提供的琳琅满目的众多商品,他们只对其中的一部分商品感兴趣。用户要实现一次的购买,就必须浏览许多不相关的网页,在众多的商品分类中找到自己所需要的商品;另一方面,商家面对众多的用户,不知道他们对商品的兴趣和要求是什么。因此,电子商务的商家无法及时调整网站的页面结构,提供给所有的用户是千篇一律的界面。缺乏个性化服务己经成为制约电子商务发展的关键问题。基于Web数据挖掘技术的电子商务推荐系统提供了一种有效的解决方法。 推荐系统就是根据用户个人的喜好、习惯来向其推荐信息、商品的程序。电子商务推荐系统能够直接与用户交互,模拟商店销售人员向用户提供商品推荐,帮助用户找到所需商品,从而顺利完成购买过程。从用户角度来看,电子商务推荐系统通过对收集到的用户的访问行为、访问频度、访问内容等浏览信息进行挖掘,提取用户的特征,获取用户访问Web的模式,动态地调整页面结构,为用户实现主动推荐,提供个性化服务;从企业角度来看,企业希望能够获取用户的访问规律,以帮助企业确定顾客消费的生命周期,针对不同的产品制定相应的营销策略,进一步优化网站的组织结构和服务方式,以提高网站的效率。推荐系统在帮助了客户的同时也提高了顾客对商务活动的满意度,换来对商务网站的进一步支持。 一、推荐系统在电子商务活动中的作用 一般说来,推荐系统在电子商务活动中的作用可以归纳为以下几点: (一)把浏览者转变成购买者 己有明确购物目标的客户也许可以借助检索系统找到自己需要的东西,但对于大多数只是四处逛逛看一看的冲浪者,或是对自己的需要比较模糊的购买者,很难有耐心在几十页长的商品目录逐项查找是否有自己感兴趣的东西。而推荐系统通过合适的推荐,可以将一个浏览者变为购买者。 (二)提高电子商务系统的交叉销售能力 电子商务推荐系统在用户购买过程中向用户提供其它有价值的商品推荐,用户能够从提供的推荐列表中购买自己确实需要但在购买过程中没有想到的商品,从而有效提高电子商务系统的交叉销售。例如站点可以根据客户当前购物车中的物品向他们推荐一些和这些己选购的物品相关的物品。如果有一个比较好的推荐系统,则企业的平均定购量就可能增加。 (三)提高客户对电子商务网站忠诚度。 与传统的商务模式相比,电子商务系统使得用户拥有越来越多的选择,用户更换商家及其方便,只需要一两次鼠标的点击就可以在不同电子商务系统之间跳转。电子商务推荐系统分析用户的购买习惯,根据用户需求向用户提供有价值的商品推荐。如果电子商务推荐系统的推荐质量很高,用户可以很容易找到自己想要的商品,那么用户会再次访问这个网站,并会推荐给其他人,这对于网站来说是一个很大的优势。 二、数据挖掘技术在电子商务推荐系统的具体应用 数据挖掘是在大型数据存储库中,自动地发现有用信息的过程。数据挖掘技术用来探查大型 数据库,发现先前未知的有用模式。电子商务推荐系统将数据挖掘技术运用到电子商务领域,以数据挖掘为基础衍生出许多算法。 (一)基于关联规则的推荐算法 关联规则是数据挖掘技术的一种,该技术挖掘发现大量数据中项集之间有趣的关联或相关联系。关联规则挖掘的一个典型例子就是购物篮分析。该过程通过发现顾客放入其购物篮中不同商品之间的联系,分析顾客的购买习惯。通过了解哪些商品频繁地被顾客同时购买,这种关联的发现可以帮助商家制定营销策略。 关联规则的挖掘是一个两步过程: 首先,找出所有频繁项集。这些项集出现的频繁性至少和预定义的最小支持计数一样。其次,由频繁项集产生强关联规则。这些规则必须满足最小支持度和最小置信度。 关联规则挖掘算法的瓶颈出现在第一步。由于第一步需要反复扫描交易数据库,所以增加了系统的开销,降低了系统性能。例如:Aprior算法是一种最有影响的挖掘关联规则频繁项集的算法。该算法使用一种称为逐层搜索的迭代方法寻找频繁项集,它开创性地使用基于支持度的剪枝技术,系统地控制候选项集指数增长。它缺点就是由于数据库数据的增多,需要多次扫描数据库,这样便影响了系统的性能。 (二)基于内同的推荐算法 基于内容的推荐系统的产生根源于信息检索与信息过滤。其具体是根据项之间的相似性来进行推荐的,先用机器学习等技术分析用户已经评分的项的内容,建立用户档案,然后从项集中选择与用户档案相似的项,再从中根据评分选择一定的项推荐给用户,最后根据用户的反馈信息修正推荐。 基于内容得推荐技术具有一定的局限性。首先,资源内容必须以机器可以理解的格式表示,而很多信息例如图像、视频等多媒体信息是很难做到这一点的;其次,资源内容的分析范围比较小,不能提供较多的建议;再次,基于内容的推荐不能从质量、样式、审美等角度对项进行过滤。 (三)协同过滤推荐算法 协同过滤是在信息过滤和信息系统中正迅速成为一项很受欢迎的技术。与传统的基于内容过滤直接分析内容进行推荐不同,协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测。 协同过滤推荐算法的缺点是:(1)用户对商品的评价非常稀疏,这样基于用户的评价所得到的用户间的相似性可能不准确(即稀疏性问题)。(2)随着用户和商品的增多,系统的性能会越来越低(即可扩展性问题)。(3)如果从来没有用户对某一商品加以评价,则这个商品就不可能被推荐(即最初评价问题)。 为了弥补各种推荐方法的缺点,在实际中常采用组合推荐。在组合推荐上,国外的有关学者提出了七种组合思路: (1)加权:加权多种推荐技术结果。 (2)变换:根据问题背景和实际情况采用不同的推荐技术。 (3)混合:同时采用多种推荐技术给出多种推荐结果,为用户提供参考。 (4)特征组合:组合来自不同推荐数据源的特征被另一种推荐算法所采用。 (5)层叠:先用一种推荐技术产生一种粗糙的推荐结果,第二种推荐技术在此推荐结果的基础上进一步做出更精确的推荐。 (6)特征扩充:一种技术产生附加的特征信息嵌入到另一种推荐技术的特征输入中。 (7)Metal-Level:一种推荐方法产生的模型作为另一种推荐方法的输入。 尽管理论上有很多种推荐组合方法,但在某一具体问题中并不见得都有效,组合推荐一个最重要的原则,就是通过组合后要能避免或弥补各自推荐技术的弱点。 三、电子商务推荐算法面临的挑战 电子商务推荐技术在实际应用中取得了巨大成功,许多电子商务网站都提供了各种不同的推荐服务。但随着站点结构内容的复杂度和用户人数的增加,电子商务推荐算法也面临许多挑战,主要包括: (一)实时性和扩展性问题:对于上百万之巨的数据,推荐系统必须快速处理、实时搜索,在几毫秒内处理成千上万用户并提供推荐。通常的推荐算法将遭到严重的实时性和扩展性问题。 (二)智能化推荐:目前大部分的协同过滤推荐系统采用显示评分输入的方式提供个推荐服务,用户必须显示输入对商品的数值评分。这种方式一方面使得评分数据的获取比较准确可信,但同时也使得用户在使用上不是很方便。如何根据用户的行为向用户提供完全智能化得推荐需要做进一步的研究。 (三)实时性与推荐质量之间的平衡:推荐系统的推荐精度和实时性是一对矛盾。大部分推荐技术在保证实时性要求的同时,是以牺牲推荐系统的推荐质量为前提的。在提供实时推荐服务的同时,如当用户和电子商务的商家充分享受电子商务的快捷和方便时,他们同时面临着某些新的问题。一方面,用户面对网站上提供的琳琅满目的众多商品,他们只对其中的一部分商品感兴趣。用户要实现一次的购买,就必须浏览许多不相关的网页,在众多的商品分类中找到自己所需要的商品;另一方面,商家面对众多的用户,不知道他们对商品的兴趣和要求是什么。因此,电子商务的商家无法及时调整网站的页面结构,提供给所有的用户是千篇一律的界面。缺乏个性化服务己经成为制约电子商务发展的关键问题。基于Web数据挖掘技术的电子商务推荐系统提供了一种有效的解决方法。 推荐系统就是根据用户个人的喜好、习惯来向其推荐信息、商品的程序。电子商务推荐系统能够直接与用户交互,模拟商店销售人员向用户提供商品推荐,帮助用户找到所需商品,从而顺利完成购买过程。从用户角度来看,电子商务推荐系统通过对收集到的用户的访问行为、访问频度、访问内容等浏览信息进行挖掘,提取用户的特征,获取用户访问Web的模式,动态地调整页面结构,为用户实现主动推荐,提供个性化服务;从企业角度来看,企业希望能够获取用户的访问规律,以帮助企业确定顾客消费的生命周期,针对不同的产品制定相应的营销策略,进一步优化网站的组织结构和服务方式,以提高网站的效率。推荐系统在帮助了客户的同时也提高了顾客对商务活动的满意度,换来对商务网站的进一步支持。 一、推荐系统在电子商务活动中的作用 一般说来,推荐系统在电子商务活动中的作用可以归纳为以下几点: (一)把浏览者转变成购买者 己有明确购物目标的客户也许可以借助检索系统找到自己需要的东西,但对于大多数只是四处逛逛看一看的冲浪者,或是对自己的需要比较模糊的购买者,很难有耐心在几十页长的商品目录逐项查找是否有自己感兴趣的东西。而推荐系统通过合适的推荐,可以将一个浏览者变为购买者。 (二)提高电子商务系统的交叉销售能力 电子商务推荐系统在用户购买过程中向用户提供其它有价值的商品推荐,用户能够从提供的推荐列表中购买自己确实需要但在购买过程中没有想到的商品,从而有效提高电子商务系统的交叉销售。例如站点可以根据客户当前购物车中的物品向他们推荐一些和这些己选购的物品相关的物品。如果有一个比较好的推荐系统,则企业的平均定购量就可能增加。 (三)提高客户对电子商务网站忠诚度。 与传统的商务模式相比,电子商务系统使得用户拥有越来越多的选择,用户更换商家及其方便,只需要一两次鼠标的点击就可以在不同电子商务系统之间跳转。电子商务推荐系统分析用户的购买习惯,根据用户需求向用户提供有价值的商品推荐。如果电子商务推荐系统的推荐质量很高,用户可以很容易找到自己想要的商品,那么用户会再次访问这个网站,并会推荐给其他人,这对于网站来说是一个很大的优势。 二、数据挖掘技术在电子商务推荐系统的具体应用 数据挖掘是在大型数据存储库中,自动地发现有用信息的过程。数据挖掘技术用来探查大型 数据库,发现先前未知的有用模式。电子商务推荐系统将数据挖掘技术运用到电子商务领域,以数据挖掘为基础衍生出许多算法。 (一)基于关联规则的推荐算法 关联规则是数据挖掘技术的一种,该技术挖掘发现大量数据中项集之间有趣的关联或相关联系。关联规则挖掘的一个典型例子就是购物篮分析。该过程通过发现顾客放入其购物篮中不同商品之间的联系,分析顾客的购买习惯。通过了解哪些商品频繁地被顾客同时购买,这种关联的发现可以帮助商家制定营销策略。 关联规则的挖掘是一个两步过程: 首先,找出所有频繁项集。这些项集出现的频繁性至少和预定义的最小支持计数一样。其次,由频繁项集产生强关联规则。这些规则必须满足最小支持度和最小置信度。 关联规则挖掘算法的瓶颈出现在第一步。由于第一步需要反复扫描交易数据库,所以增加了系统的开销,降低了系统性能。例如:Aprior算法是一种最有影响的挖掘关联规则频繁项集的算法。该算法使用一种称为逐层搜索的迭代方法寻找频繁项集,它开创性地使用基于支持度的剪枝技术,系统地控制候选项集指数增长。它缺点就是由于数据库数据的增多,需要多次扫描数据库,这样便影响了系统的性能。 (二)基于内同的推荐算法 基于内容的推荐系统的产生根源于信息检索与信息过滤。其具体是根据项之间的相似性来进行推荐的,先用机器学习等技术分析用户已经评分的项的内容,建立用户档案,然后从项集中选择与用户档案相似的项,再从中根据评分选择一定的项推荐给用户,最后根据用户的反馈信息修正推荐。 基于内容得推荐技术具有一定的局限性。首先,资源内容必须以机器可以理解的格式表示,而很多信息例如图像、视频等多媒体信息是很难做到这一点的;其次,资源内容的分析范围比较小,不能提供较多的建议;再次,基于内容的推荐不能从质量、样式、审美等角度对项进行过滤。 (三)协同过滤推荐算法 协同过滤是在信息过滤和信息系统中正迅速成为一项很受欢迎的技术。与传统的基于内容过滤直接分析内容进行推荐不同,协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测。 协同过滤推荐算法的缺点是:(1)用户对商品的评价非常稀疏,这样基于用户的评价所得到的用户间的相似性可能不准确(即稀疏性问题)。(2)随着用户和商品的增多,系统的性能会越来越低(即可扩展性问题)。(3)如果从来没有用户对某一商品加以评价,则这个商品就不可能被推荐(即最初评价问题)。 为了弥补各种推荐方法的缺点,在实际中常采用组合推荐。在组合推荐上,国外的有关学者提出了七种组合思路: (1)加权:加权多种推荐技术结果。 (2)变换:根据问题背景和实际情况采用不同的推荐技术。 (3)混合:同时采用多种推荐技术给出多种推荐结果,为用户提供参考。 (4)特征组合:组合来自不同推荐数据源的特征被另一种推荐算法所采用。 (5)层叠:先用一种推荐技术产生一种粗糙的推荐结果,第二种推荐技术在此推荐结果的基础上进一步做出更精确的推荐。 (6)特征扩充:一种技术产生附加的特征信息嵌入到另一种推荐技术的特征输入中。 (7)Metal-Level:一种推荐方法产生的模型作为另一种推荐方法的输入。 尽管理论上有很多种推荐组合方法,但在某一具体问题中并不见得都有效,组合推荐一个最重要的原则,就是通过组合后要能避免或弥补各自推荐技术的弱点。 三、电子商务推荐算法面临的挑战 电子商务推荐技术在实际应用中取得了巨大成功,许多电子商务网站都提供了各种不同的推荐服务。但随着站点结构内容的复杂度和用户人数的增加,电子商务推荐算法也面临许多挑战,主要包括: (一)实时性和扩展性问题:对于上百万之巨的数据,推荐系统必须快速处理、实时搜索,在几毫秒内处理成千上万用户并提供推荐。通常的推荐算法将遭到严重的实时性和扩展性问题。 (二)智能化推荐:目前大部分的协同过滤推荐系统采用显示评分输入的方式提供个推荐服务,用户必须显示输入对商品的数值评分。这种方式一方面使得评分数据的获取比较准确可信,但同时也使得用户在使用上不是很方便。如何根据用户的行为向用户提供完全智能化得推荐需要做进一步的研究。 (三)实时性与推荐质量之间的平衡:推荐系统的推荐精度和实时性是一对矛盾。大部分推荐技术在保证实时性要求的同时,是以牺牲推荐系统的推荐质量为前提的。在提供实时推荐服务的同时,如
电子商务论文范文