當前位置:首頁 » 操作系統 » 打分演算法

打分演算法

發布時間: 2024-07-01 08:55:18

⑴ 文章自動打分演算法

文章自動打分簡稱 AES (Automated Essay Scoring),AES 系統利用 NLP 技術自動對文章進行打分,可以減輕閱卷人員的負擔。目前有不少大型的考試都採用了 AES 演算法進行作文打分,例如 GRE 考試,GRE 考試會有一位閱卷老師和 AES 系統一起打分,如果 AES 的分數和閱卷老師的分數相差過大,才有再增加一位閱卷老師進行打分。本文主要介紹兩種比較經典的自動打分演算法。

自動打分演算法從優化目標或者損失函數來說大致可以分為三種:

傳統的自動打分演算法通常會人工設置很多特徵,例如語法錯誤,N 元組,單詞數量,句子長度等,然後訓練機器學習模型進行打分。目前也有很多使用了神經網路的方法,通過神經網路學習出文章的特徵。

下面介紹兩種打分演算法:

出自論文《Regression based Automated Essay Scoring》。給定很多需要打分的文章後,首先需要構造出文章的特徵,用到了人工設置特徵和向量空間特徵。

拼寫錯誤 Spelling Errors :使用 pyenchant 包統計出拼寫錯誤單詞數量占總單詞數量的比例。

統計特徵 Statistical Features :統計字元數量,單詞數量,句子數量,段落數量,停止詞數量,命名實體數量,標點符號數量 (反映文章的組織情況),文本長度 (反映寫作流暢程度),不同詞彙的數量與總單詞數的佔比 (反映詞彙量水平)。

詞性統計 POS count :統計各種詞性出現的頻率,例如名詞,動詞,形容詞,副詞等,詞性通過 nltk 包獲取。

語法流暢特徵 Grammatical Fluency :使用 link grammar (鏈語法) 解析句子,然後統計 links 的個數;統計 n 元組出現的概率;統計詞性 n 元組出現的概率。

可讀性 Readability :可讀性分數是衡量文本組織以及文本句法和語義復雜程度的一個指標。採用了 Kincaid 可讀性分數作為一個特徵,計算公式如下

本體特徵 Ontological Features :為每個句子打上標簽,例如研究、假設、主張、引用、支持和反對等。

可以將一篇文章投影到一個向量空間模型中 (VSM),此時文章可以用向量空間中的一個特徵向量表示,例如可以用 one-hot 編碼表示一篇文章,長度等於詞彙表長度,如果一個單詞出現在文章中,則對應的位置置為 1,如下:

另外也可以使用 TF-IDF 向量表示文本,但是採用這種表示方式單詞之間不存在任何關聯,為了解決這個問題,文章中使用了一個單詞相關性矩陣 W 加上線性變換從而引入單詞之間的相關性。

單詞的相關性矩陣 W 通過 word2vec 生成的詞向量計算,即 W (i,j) = 單詞 i 和單詞 j 詞向量的餘弦相似度。

最後,為了考慮文章中單詞的順序問題,將文章拆分成 k 個段落,然後分別計算向量空間特徵,融合在一起。

得到上述特徵之後,採用 SVR 演算法進行回歸學習。數據集是 kaggle ASAP 比賽數據集,數據集包含 8 個集合的文章,評價指標採用 KAPPA 和相關系數,以下是一些實驗效果。

這是在 8 個集合上分別使用 linear kernel 和 rbf kernel 的效果。

這是和人類打分者的對比。

以下內容出自論文《Neural Networks for Automated Essay Grading》,可以採用回歸或者分類的方法進行訓練,模型如下圖所示。

論文中主要使用了三種方法構造出文章的特徵向量:

論文中主要用了三種神經網路結構,NN (前向神經網路),LSTM 和 BiLSTM。所有的網路都會輸出一個向量 h(out),根據 h(out) 構造出損失函數,下面分別是回歸和分類的損失函數。

回歸損失

分類損失

第一種模型:NN (前向神經網路)

使用了兩層前向神經網路,網路輸入的文章特徵向量是 Glove 詞向量的平均值或者訓練的詞向量平均值。h(out) 的計算公式如下。

第二種模型:LSTM

LSTM 模型接受的輸入是文章所有單詞的詞向量序列,然後將 LSTM 最後輸出的向量作為文章的特徵向量 h(out)。

第三種模型:BiLSTM

因為文章通常比較長,單向的 LSTM 容易丟失前面的信息,因此作者也使用了 BiLSTM 模型,將前向 LSTM 和後向 LSTM 模型的輸出加在一起作為 h(out)。

添加 TF-IDF 向量

以上模型的輸出 h(out) 都可以再加上 TF-IDF 向量提升性能,首先需要對 TF-IDF 向量降維,然後和模型的輸出拼接在一起,如下圖所示 (BiLSTM 為例子)。

《Regression based Automated Essay Scoring》
《Neural Networks for Automated Essay Grading》

⑵ 武漢服裝廠打分的工資演算法

打分工資法是指每一工時的工資=小組總工資/小組總工時。
個人工資=(個人工時*每一工時的工資)*(個人的分數/每人平均的分數)。例:每一工時的工資=小組總工資/小組總工時=10000/1000=10元/工時;個人工資=(個人工時*每一工時的工資)*(個人的分數/小組人均的分數)=(200*10)*(9、6/9、5)=2021、05元。

⑶ 淘寶店鋪是怎麼評分的

淘寶店鋪評分規則與寶貝與描述相符、賣家服務態度、賣家發貨速度、物流公司服務四項有關。

若買家在進行店鋪評分時,只對其中1項或幾項指睜基標作出評分,就確認提交了,則視為完成店鋪評分,無法進行修改和補充評分,剩餘未評的指標視作放棄評分,不會默認評分。

店鋪評分生效後,寶貝與描述相符、賣家服務態度、賣家發貨速度三項指標將分別悉蘆謹平均計入賣家的店鋪評分中,物流公司服務評分不計入賣家的店鋪評分中,但會計入物流平台中。

計算方法:每個自然月,相同買、賣家之間交易,賣家店鋪評分僅計取前三次。 店鋪評分一旦做出無法修改。

計算周期:每天計算近6個月之內數據。

另外,店鋪評分由買家對賣家作出,包括寶貝與描述相符、賣家服務態度、賣家發貨速度、物流公司服務四項。每項店鋪評分取連續六個月內所有買家給予評分的算術平均值。買家若完成對淘寶商城賣家店鋪評分中寶貝與描述相符一項的評分,則其信用積分增加一分。

(3)打分演算法擴展閱讀:

買賣雙方在支付寶交易成功後十五天內可以進行評價。評價包括「信用評價」及「店鋪評分」。

在信用嘩磨評價中,評價人若給予好評,則被評價人信用積分增加一分;若給予差評,則信用積分減少一分;若給予中評或十五天內雙方均未評價 ,則信用積分不變。如評價人給予好評而對方未在十五天內給其評價,則評價人信用積分增加一分。

相同買、賣家任意十四天內就同款商品的多筆支付寶交易,多個好評只加一分、多個差評只減一分。每個自然月,相同買家與淘寶網賣家之間交易,雙方增加的信用積分均不得超過六分;相同買家與淘寶商城賣家之間交易,買家信用積分僅計取前三次。

評價人可在作出中、差評後的三十天內,對信用評價進行一次修改或刪除。三十天後評價不得修改。淘寶有權刪除評價內容中所包含的污言穢語。

熱點內容
谷歌視頻緩存怎麼提取 發布:2025-01-15 08:07:47 瀏覽:77
php多條件篩選 發布:2025-01-15 08:07:39 瀏覽:928
百度提問怎麼上傳圖片 發布:2025-01-15 08:07:33 瀏覽:838
yy圖片文件夾 發布:2025-01-15 08:01:00 瀏覽:841
可緩存影視 發布:2025-01-15 07:42:50 瀏覽:799
php函數默認值 發布:2025-01-15 07:34:31 瀏覽:238
編譯應用後apk無法打開 發布:2025-01-15 07:33:45 瀏覽:438
lc腳本編輯器 發布:2025-01-15 07:18:59 瀏覽:529
追劇腳本 發布:2025-01-15 07:00:39 瀏覽:446
c語言字元串庫函數 發布:2025-01-15 06:54:49 瀏覽:526