前言:本站為你精心整理了電子商務(wù)數(shù)據(jù)挖掘范文,希望能為你的創(chuàng)作提供參考價值,我們的客服老師可以幫助你提供個性化的參考范文,歡迎咨詢。
摘要:電子商務(wù)是現(xiàn)代商業(yè)的主流趨勢,如何充分利用網(wǎng)絡(luò)技術(shù)和數(shù)據(jù)庫技術(shù)發(fā)揮企業(yè)優(yōu)勢,成為企業(yè)制勝的法寶。本文介紹了常用的數(shù)據(jù)挖掘方法,以及在電子商務(wù)領(lǐng)域的應(yīng)用,分析了利用數(shù)據(jù)挖掘技術(shù)建設(shè)動態(tài)、高效電子商務(wù)的可行性。
關(guān)鍵詞:數(shù)據(jù)挖掘電子商務(wù)數(shù)據(jù)庫
一、引言
電子商務(wù)是指以Internet網(wǎng)絡(luò)為載體、利用數(shù)字化電子方式開展的商務(wù)活動。隨著網(wǎng)絡(luò)技術(shù)和數(shù)據(jù)庫技術(shù)的飛速發(fā)展,電子商務(wù)正顯示越來越強(qiáng)大的生命力。電子商務(wù)的發(fā)展促使公司內(nèi)部收集了大量的數(shù)據(jù),并且迫切需要將這些數(shù)據(jù)轉(zhuǎn)換成有用的信息和知識,為公司創(chuàng)造更多潛在的利潤。利用數(shù)據(jù)挖掘技術(shù)可以有效地幫助企業(yè)分析從網(wǎng)上獲取的大量數(shù)據(jù),發(fā)現(xiàn)隱藏在其后的規(guī)律性,提取出有效信息,進(jìn)而指導(dǎo)企業(yè)調(diào)整營銷策略,給客戶提供動態(tài)的個性化的高效率服務(wù)。
二、數(shù)據(jù)挖掘技術(shù)
1.數(shù)據(jù)挖掘
數(shù)據(jù)挖掘(DataMining),又稱數(shù)據(jù)庫中的知識發(fā)現(xiàn)(KnowledgeDiscoveryinDatabase,KDD),是從大量的、不完全的、有噪聲的、模糊的和隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的,但又是潛在有用的信息和知識的過程。數(shù)據(jù)挖掘是一門廣義的交叉學(xué)科,它匯聚了不同領(lǐng)域尤其是數(shù)據(jù)庫、人工智能、數(shù)理統(tǒng)計、可視化、并行計算等方面的知識。數(shù)據(jù)挖掘技術(shù)從一開始就是面向應(yīng)用領(lǐng)域,它不僅是面向特定數(shù)據(jù)庫的簡單檢索查詢調(diào)用,而且,要對數(shù)據(jù)進(jìn)行微觀、中觀乃至宏觀的統(tǒng)計、分析、綜合和推理,以指定實際問題的求解,企圖發(fā)現(xiàn)事件間的相互關(guān)聯(lián),甚至利用已有的數(shù)據(jù)對未來的活動進(jìn)行預(yù)測。數(shù)據(jù)挖掘技術(shù)在金融、保險、電信、大型超市等積累有大量數(shù)據(jù)的電子商務(wù)行業(yè)有著廣泛的應(yīng)用,如信用分析、風(fēng)險分析、欺詐檢驗、用戶聚類分析、消費(fèi)者習(xí)慣分析等。
2.數(shù)據(jù)挖掘過程
挖掘數(shù)據(jù)過程可以分為3個步驟:數(shù)據(jù)預(yù)處理、模式發(fā)現(xiàn)、模式分析。
(1)數(shù)據(jù)預(yù)處理。實際系統(tǒng)中的數(shù)據(jù)一般都具有不完全性、冗余性和模糊性。因此,數(shù)據(jù)挖掘一般不對原始數(shù)據(jù)進(jìn)行挖掘,要通過預(yù)處理提供準(zhǔn)確、簡潔的數(shù)據(jù)。預(yù)處理主要完成以下工作:包括合并數(shù)據(jù),將多個文件或多個數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行合并處理;選擇數(shù)據(jù),提取出適合分析的數(shù)據(jù)集合;數(shù)據(jù)清洗、過濾,剔除一些無關(guān)記錄,將文件、圖形、圖像及多媒體等文件轉(zhuǎn)換成可便于數(shù)據(jù)挖掘的格式等。
(2)模式發(fā)現(xiàn)。模式發(fā)現(xiàn)階段就是利用挖掘算法挖掘出有效的、新穎的、潛在的、有用的以及最終可以理解的信息和知識??捎糜赪eb的挖掘技術(shù)有路徑選擇、關(guān)聯(lián)分析、分類規(guī)則、聚類分析、序列分析、依賴性建模等等。
(3)模式分析。模式分析是從模式發(fā)現(xiàn)階段獲得的模式、規(guī)則中過濾掉不感興趣的規(guī)則和模式。通過技術(shù)手段,對得到的模式進(jìn)行數(shù)據(jù)分析,得出有意義的結(jié)論。常用的技術(shù)手段有:關(guān)聯(lián)規(guī)則、分類、聚類、序列模式等。
三、電子商務(wù)中幾種常用的數(shù)據(jù)挖掘方法
1.關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘研究的主要模式之一,側(cè)重于確定數(shù)據(jù)中不同領(lǐng)域之間的關(guān)系,找出滿足給定條件下的多個域間的依賴關(guān)系。關(guān)聯(lián)規(guī)則挖掘?qū)ο笠话闶谴笮蛿?shù)據(jù)庫,該規(guī)則一般表示式為:A1∧A2∧…Am=>B1∧B2∧…Bm,其中,Ak(k=1,2,…,m),Bj(j=1,2,…,n)是數(shù)據(jù)庫中的數(shù)據(jù)項。有Support(A=>B)=P(A∪B),Confidence(A=>B)=P(A|B)。數(shù)據(jù)項之間的關(guān)聯(lián),即根據(jù)一個事務(wù)中某些數(shù)據(jù)項的出現(xiàn)可以導(dǎo)出另一些數(shù)據(jù)項在同一事務(wù)中的出現(xiàn)。關(guān)聯(lián)分析的目的是挖掘出隱藏在數(shù)據(jù)間的相互關(guān)系。關(guān)聯(lián)規(guī)則用于尋找在同一個事件中出現(xiàn)的不同項的相關(guān)性,比如在一次購買活動中所買不同商品的相關(guān)性。關(guān)聯(lián)分析的典型例子是購物籃分析,描述顧客的購買行為,可以幫助零售商決定商品的擺放和捆綁銷售策略。如著名的(面包+黃油→牛奶)例子就屬于關(guān)聯(lián)分析:在超市中,90%的顧客在購買面包和黃油的同時,也會購買牛奶。直觀的意義是:顧客在購買某種商品時有多大的傾向會購買另外一些商品。找出所有類似的關(guān)聯(lián)規(guī)則,對于企業(yè)確定生產(chǎn)銷售、產(chǎn)品分類設(shè)計、市場分析等多方面是有價值的。
2.聚類分析方法
類聚分析就是直接比較樣本中各事物之間的性質(zhì),將性質(zhì)相近的歸為一類,而將性質(zhì)差別較大的分在不同的類。對變量聚類計算變量之間的距離,對樣本聚類則計算樣本之間的距離。它的目的是使得屬于同一類別的個體之間的距離盡可能小,而不同類別上的個體間的距離盡可能大。
聚類分析用于把有相似特性的客戶、數(shù)據(jù)項集合到一起。在電子商務(wù)中,聚類分析常用于市場細(xì)分。根據(jù)已有客戶的數(shù)據(jù),利用聚類技術(shù)將市場按客戶消費(fèi)模式的相似性分為若干細(xì)分市場,以進(jìn)行有針對性的市場營銷,提供更適合、更滿意的服務(wù)。如自動給一個特定的客戶聚類發(fā)送銷售郵件,為一個客戶聚類動態(tài)地改變一個特殊的站點等。通過對聚類的客戶特征的提取,電子商務(wù)網(wǎng)站還可以為客戶提供個性化的服務(wù)。
3.分類分析
分類系統(tǒng)是基于遺傳算法的機(jī)器學(xué)習(xí)中的一類,它包括一個簡單的基于串規(guī)則的并行生成子系統(tǒng)、規(guī)則評價子系統(tǒng)和遺傳算法子系統(tǒng)。分類系統(tǒng)正在被人們越來越多地應(yīng)用于科學(xué)、工程和經(jīng)濟(jì)領(lǐng)域中,是目前遺傳算法研究領(lǐng)域中一個非常活躍的領(lǐng)域。
分類分析是數(shù)據(jù)挖掘中應(yīng)用最多的方法。分類要解決的問題是為一個事件或?qū)ο髿w類,既可以用于分析已有的數(shù)據(jù),也可以用來預(yù)測未來的數(shù)據(jù)。分類通過分析已知分類信息的歷史數(shù)據(jù),總結(jié)出一個預(yù)測模型,預(yù)測哪些人可能會對郵寄廣告、產(chǎn)品目錄等有反應(yīng),可以針對這一類客戶的特點展開商務(wù)活動,提供個性化的信息服務(wù)。
4.序列模式
序列模式挖掘就是要挖掘出交易集之間有時間序列關(guān)系的模式。它挖掘的側(cè)重點在于分析數(shù)據(jù)間的前后或因果關(guān)系,找到那些“一些項跟隨另一些項”,以預(yù)測未來的訪問模式。序列模式分析和關(guān)聯(lián)分析類似,其目的也是為了挖掘數(shù)據(jù)之間的聯(lián)系,但序列模式分析的側(cè)重點在于分析數(shù)據(jù)間的前后序列關(guān)系。它能發(fā)現(xiàn)數(shù)據(jù)庫中形如“在某一段時間內(nèi),顧客購買商品A,接著購買商品B,而后購買商品C,即序列A-B-C出現(xiàn)的頻率較高”之類的知識。序列模式分析描述的問題是:在給定交易序列數(shù)據(jù)庫中,每個序列是按照交易時間排列的一組交易集,挖掘序列函數(shù)作用在這個交易序列數(shù)據(jù)庫上,返回該數(shù)據(jù)庫中出現(xiàn)的高頻序列。在進(jìn)行序列模式分析時,同樣也需要有用戶輸入最小置信度C和最小支持度S。
序列模式便于進(jìn)行電子商務(wù)的組織,預(yù)測客戶的訪問模式,對客戶開展有針對性的廣告服務(wù)或者主動推薦客戶感興趣的頁面,以滿足訪問者的特定要求。
四、結(jié)束語
電子商務(wù)是現(xiàn)代信息技術(shù)發(fā)展的必然結(jié)果,也是未來商業(yè)運(yùn)作模式的必然選擇。利用數(shù)據(jù)挖掘技術(shù)來分析大量的數(shù)據(jù),可以挖掘出商品的消費(fèi)規(guī)律與客戶的訪問模式,幫助企業(yè)制定有效的營銷策略,充分發(fā)揮企業(yè)的獨(dú)特優(yōu)勢,促進(jìn)管理創(chuàng)新和技術(shù)創(chuàng)新,提高企業(yè)競爭力。
隨著電子商務(wù)發(fā)展的勢頭越來越強(qiáng)勁,面向電子商務(wù)的數(shù)據(jù)挖掘?qū)⑹且粋€非常有前景的領(lǐng)域。它能自動預(yù)測客戶的消費(fèi)趨勢、市場走向,指導(dǎo)企業(yè)建設(shè)個性化智能網(wǎng)站,帶來巨大的商業(yè)利潤,可以為企業(yè)創(chuàng)建新的商業(yè)增長點。但是在面向電子商務(wù)的數(shù)據(jù)挖掘中也存在很多問題急需解決,比如怎樣將服務(wù)器的日志數(shù)據(jù)轉(zhuǎn)化成適合某種數(shù)據(jù)挖掘技術(shù)的數(shù)據(jù)格式,怎樣解決分布性、異構(gòu)性數(shù)據(jù)源的挖掘,如何控制整個Web上知識發(fā)現(xiàn)過程等。隨著硬件環(huán)境、挖掘算法的深入研究及應(yīng)用經(jīng)驗的積累,數(shù)據(jù)挖掘技術(shù)及在電子商務(wù)中的應(yīng)用必將取得長足的進(jìn)展。
電子商務(wù) 電子政務(wù)論文 電子技術(shù) 電子畢業(yè) 電子專業(yè) 電子政務(wù)的安全風(fēng)險 電子貨幣論文 電子論文 電子工程論文 電子政務(wù) 紀(jì)律教育問題 新時代教育價值觀