關規則演算法
❶ 關聯規則演算法的介紹
關聯規則就是支持度和信任度分別滿足用戶給定閾值的規則。
❷ 關聯規則演算法的關聯規則的定義
所謂關聯,反映的是一個事件和其他事件之間依賴或關聯的知識。當我們查找英文文獻的時候,可以發現有兩個英文詞都能形容關聯的含義。第一個是相關性relevance,第二個是關聯性association,兩者都可以用來描述事件之間的關聯程度。
設I={i1,i2…,im}為所有項目的集合,設A是一個由項目構成的集合,稱為項集。事務T是一個項目子集,每一個事務具有唯一的事務標識Tid。事務T包含項集A,當且僅當AT。如果項集A中包含k個項目,則稱其為k項集。D為事務資料庫,項集A在事務資料庫D中出現的次數佔D中總事務的百分比叫做項集的支持度(support)。如果項集的支持度超過用戶給定的最小支持度閾值,就稱該項集是頻繁項集(或大項集)。
關聯規則就是形如XY的邏輯蘊含關系,其中XI,YI且XY=Φ,X稱作規則的前件,Y是結果,對於關聯規則XY,存在支持度和信任度。
支持度是指規則中所出現模式的頻率,如果事務資料庫有s%的事務包含XY,則稱關聯規則XY在D中的支持度為s%,實際上,可以表示為概率P(XY),即support(XY)= P(XY)。信任度是指蘊含的強度,即事務D中c%的包含X的交易同時包含XY。若X的支持度是support(x),規則的信任度為即為:support(XY)/support(X),這是一個條件概率P(Y|X),即confidence(XY)= P(Y|X)。
❸ 關聯規則演算法怎麼刻畫相似度
關聯規則原始的定義裡面並沒有相似度的概念
只有支持度和置信度,
支持度 (A->B )=P(AB) 就是AB出現的概率
支持度 (A->B )=P(B|A) 就是A發生條件下B發生的概率。
相似度公式cosine (A->B) = P(AB)/√P(A)P(B)
不知道是不是你要的
❹ 數據挖掘關聯規則演算法如何做模擬實驗急呀!
當你把整個文件打開的時候說明文件已經被load到內存里了。所以請檢查你的內存是否夠大,或者虛擬內存太小。
按理來說T10I4D100K.dat是很小的一個文件,雖然有10W行,但寬度很小啊。
建議你把虛擬內存調大一點,關閉其他佔用大量內存的程序,例如IE,等等。
再么就是看看你的程序是否設計合理。這點兒數據根本不能算做大數據集。
over!
❺ JAVA實現關聯規則演算法
輸入支持度和置信度 之後進行判斷 如果符合條件 就顯示數組里的符合條件的數據 不過你還是表達的不夠確切啊
❻ 關於天津麻將的規則和演算法
基本的計分原則是:先計算基本牌型,如提溜、混吊、雙混吊、捉5、龍,然後在此牌型基礎上在進行疊加或加倍,加倍的包括杠開,素的,本混、混吊、雙混吊等。
提留1番,混吊、雙混吊2番,杠開翻倍;捉5 3番;龍 4番;
1、天和:莊家第一輪牌摸到的14張牌形成和牌牌形,天和按可組合出的最大牌型乘4計算。最小是提溜,即1番乘以4等於4番。
2、素的提溜:如345萬、123條、三個東風、2個7萬、4條和5條,最後摸上6條和牌;計2番。
3、有混杠開提溜:有混明杠杠開提溜:3番(含明杠1番);有混暗杠杠開提溜:4番(含暗杠2番)
4、杠開素的提溜:明杠杠開素的提留:5番(含明杠1番);暗杠杠開素的提留:6番(含暗杠2番)
5、捉5:有混,手中有46萬或者有將牌還有一個混抱著4、6萬,最後一張摸的牌是5萬或者是混和牌,3番
6、素5:沒有混,手中有46萬,最後一張摸的牌是5萬和牌,6番
7、有混杠開捉5:有混明杠杠開捉5:7番(含明杠1番);有混暗杠杠開捉5:8番(含暗杠2番)
8、杠開素的捉5:明杠杠開素的捉5:13番(含明杠1番);暗杠杠開素的捉5:14番(含暗杠2番)
9、混吊:如345萬、123條,三個東風、456條,還有一個混,此時摸上來的任何牌都可以和,形成混吊;得分為2番。
10、杠開混吊:明杠杠開5番(含明杠1番);暗杠杠開6番(含暗杠2番)
11、雙混吊:如345萬、123條,三個東風、一對6條,還有兩個混,此時摸上來的任何牌都可以和, 形成雙混吊;得分為2番。
12、杠開雙混吊:明杠杠開5番(含明杠1番);暗杠杠開6番(含暗杠2番)
13、雙混捉5:6番。如345萬、123條,三個東風、一對6條,還有兩個混,此時摸上來的牌剛好是5萬或者混,和原來的混牌組合成456萬。
14、杠開雙混捉5:明杠杠開雙混捉5:13番(含明杠1番);暗杠杠開雙混捉5:14(含暗杠2番)
15、提留龍:如一對5萬,234筒,145678條,兩個混,此時最後摸上2、3、9條中的任何一張牌或混則構成提留龍和牌牌型。計為4番。
16、素龍:沒有混的提溜龍,8番
17、捉5龍:7番
18、素龍捉5:14番
19、混吊龍:8番
20、杠開龍:明杠杠開龍:9番(含明杠1番);暗杠杠開龍:10番(含暗杠2番)
21、杠開素龍:明杠杠開素龍:17番(含明杠1番);暗杠杠開素龍:18番(含暗杠2番)
22、杠開素龍捉5:明杠杠開素龍捉5:29番(含明杠1番);暗杠杠開素龍捉5:30番(含暗杠2番)
23、杠開捉5龍:明杠杠開捉5:15番(含明杠1番);暗杠杠開捉5:16番(含暗杠2番)
24、本混龍:混和龍的花色一樣,記分為8番
25、混吊本混龍:混和龍的花色一樣,記分為16番
26、本混捉5龍:14番
27、杠開本混龍:明杠杠開本混龍:17番(含明杠1番);暗杠杠開本混龍:18番(含暗杠2番)
28、杠開混吊本混龍:明杠杠開混吊本混龍:33番(含明杠1番);暗杠杠開混吊本混龍:34番(含暗杠2番)
29、雙混吊捉5龍:14番
30、雙混吊本混捉5龍:28番
31、杠開本混捉5龍:明杠杠開本混捉5龍:29番(含明杠1番);暗杠杠開本混捉5龍:30番(含暗杠2番)
❼ 簡述一種關聯規則挖掘演算法基本過程。《數據挖掘》作業題追分100
Apriori演算法是一種發現頻繁項集的基本演算法。演算法使用頻繁項集性質的先驗知識。Apriori演算法使用一種稱為逐層搜索的迭代方法,其中K項集用於探索(k+1)項集。首先,通過掃描資料庫,累計每個項的計數,並收集滿足最小支持度的項,找出頻繁1項集的集合。該集合記為L1.然後,使用L1找出頻繁2項集的集合L2,使用L2找到L3,如此下去,直到不能再找到頻繁k項集。
Apriori演算法的主要步驟如下:
(1)掃描事務資料庫中的每個事務,產生候選1.項集的集合Cl;
(2)根據最小支持度min_sup,由候選l-項集的集合Cl產生頻繁1一項集的集合Ll;
(3)對k=l;
(4)由Lk執行連接和剪枝操作,產生候選(k+1).項集的集合Ck+l-
(5)根據最小支持度min_sup,由候選(k+1)一項集的集合Ck+l產生頻繁(k+1)-項
集的集合Lk+1.
(6)若L⋯≠①,則k.k+1,跳往步驟(4);否則,跳往步驟(7);
(7)根據最小置信度min_conf,由頻繁項集產生強關聯規則,結束。
❽ 我在做關聯規則演算法,請問在哪裡可以找到試驗用的數據
現在做關聯規則演算法實驗數據有兩種做法,一種是找專門的數據集,比如說Microsoft Anonymous Web Data (anonymous-msweb)、foodmart 這類數據集;還有一種是將分類數據集比如UCI數據集直接構造成可以用的關聯數據集
❾ 關聯規則的經典演算法有哪些,各自的優缺點
決策樹 貝葉斯 人工神經網路 k-近鄰 支持向量機 基於關聯規則的分類 集成學習
❿ 關聯規則演算法的關聯規則的演算法
關聯演算法是數據挖掘中的一類重要演算法。1993年,R.Agrawal等人首次提出了挖掘顧客交易數據中項目集間的關聯規則問題,其核心是基於兩階段頻繁集思想的遞推演算法。該關聯規則在分類上屬於單維、單層及布爾關聯規則,典型的演算法是Aprior演算法。
Aprior演算法將發現關聯規則的過程分為兩個步驟:第一步通過迭代,檢索出事務資料庫1中的所有頻繁項集,即支持度不低於用戶設定的閾值的項集;第二步利用頻繁項集構造出滿足用戶最小信任度的規則。其中,挖掘或識別出所有頻繁項集是該演算法的核心,占整個計算量的大部分。