打分算法
⑴ 文章自动打分算法
文章自动打分简称 AES (Automated Essay Scoring),AES 系统利用 NLP 技术自动对文章进行打分,可以减轻阅卷人员的负担。目前有不少大型的考试都采用了 AES 算法进行作文打分,例如 GRE 考试,GRE 考试会有一位阅卷老师和 AES 系统一起打分,如果 AES 的分数和阅卷老师的分数相差过大,才有再增加一位阅卷老师进行打分。本文主要介绍两种比较经典的自动打分算法。
自动打分算法从优化目标或者损失函数来说大致可以分为三种:
传统的自动打分算法通常会人工设置很多特征,例如语法错误,N 元组,单词数量,句子长度等,然后训练机器学习模型进行打分。目前也有很多使用了神经网络的方法,通过神经网络学习出文章的特征。
下面介绍两种打分算法:
出自论文《Regression based Automated Essay Scoring》。给定很多需要打分的文章后,首先需要构造出文章的特征,用到了人工设置特征和向量空间特征。
拼写错误 Spelling Errors :使用 pyenchant 包统计出拼写错误单词数量占总单词数量的比例。
统计特征 Statistical Features :统计字符数量,单词数量,句子数量,段落数量,停止词数量,命名实体数量,标点符号数量 (反映文章的组织情况),文本长度 (反映写作流畅程度),不同词汇的数量与总单词数的占比 (反映词汇量水平)。
词性统计 POS count :统计各种词性出现的频率,例如名词,动词,形容词,副词等,词性通过 nltk 包获取。
语法流畅特征 Grammatical Fluency :使用 link grammar (链语法) 解析句子,然后统计 links 的个数;统计 n 元组出现的概率;统计词性 n 元组出现的概率。
可读性 Readability :可读性分数是衡量文本组织以及文本句法和语义复杂程度的一个指标。采用了 Kincaid 可读性分数作为一个特征,计算公式如下
本体特征 Ontological Features :为每个句子打上标签,例如研究、假设、主张、引用、支持和反对等。
可以将一篇文章投影到一个向量空间模型中 (VSM),此时文章可以用向量空间中的一个特征向量表示,例如可以用 one-hot 编码表示一篇文章,长度等于词汇表长度,如果一个单词出现在文章中,则对应的位置置为 1,如下:
另外也可以使用 TF-IDF 向量表示文本,但是采用这种表示方式单词之间不存在任何关联,为了解决这个问题,文章中使用了一个单词相关性矩阵 W 加上线性变换从而引入单词之间的相关性。
单词的相关性矩阵 W 通过 word2vec 生成的词向量计算,即 W (i,j) = 单词 i 和单词 j 词向量的余弦相似度。
最后,为了考虑文章中单词的顺序问题,将文章拆分成 k 个段落,然后分别计算向量空间特征,融合在一起。
得到上述特征之后,采用 SVR 算法进行回归学习。数据集是 kaggle ASAP 比赛数据集,数据集包含 8 个集合的文章,评价指标采用 KAPPA 和相关系数,以下是一些实验效果。
这是在 8 个集合上分别使用 linear kernel 和 rbf kernel 的效果。
这是和人类打分者的对比。
以下内容出自论文《Neural Networks for Automated Essay Grading》,可以采用回归或者分类的方法进行训练,模型如下图所示。
论文中主要使用了三种方法构造出文章的特征向量:
论文中主要用了三种神经网络结构,NN (前向神经网络),LSTM 和 BiLSTM。所有的网络都会输出一个向量 h(out),根据 h(out) 构造出损失函数,下面分别是回归和分类的损失函数。
回归损失
分类损失
第一种模型:NN (前向神经网络)
使用了两层前向神经网络,网络输入的文章特征向量是 Glove 词向量的平均值或者训练的词向量平均值。h(out) 的计算公式如下。
第二种模型:LSTM
LSTM 模型接受的输入是文章所有单词的词向量序列,然后将 LSTM 最后输出的向量作为文章的特征向量 h(out)。
第三种模型:BiLSTM
因为文章通常比较长,单向的 LSTM 容易丢失前面的信息,因此作者也使用了 BiLSTM 模型,将前向 LSTM 和后向 LSTM 模型的输出加在一起作为 h(out)。
添加 TF-IDF 向量
以上模型的输出 h(out) 都可以再加上 TF-IDF 向量提升性能,首先需要对 TF-IDF 向量降维,然后和模型的输出拼接在一起,如下图所示 (BiLSTM 为例子)。
《Regression based Automated Essay Scoring》
《Neural Networks for Automated Essay Grading》
⑵ 武汉服装厂打分的工资算法
打分工资法是指每一工时的工资=小组总工资/小组总工时。
个人工资=(个人工时*每一工时的工资)*(个人的分数/每人平均的分数)。例:每一工时的工资=小组总工资/小组总工时=10000/1000=10元/工时;个人工资=(个人工时*每一工时的工资)*(个人的分数/小组人均的分数)=(200*10)*(9、6/9、5)=2021、05元。
⑶ 淘宝店铺是怎么评分的
淘宝店铺评分规则与宝贝与描述相符、卖家服务态度、卖家发货速度、物流公司服务四项有关。
若买家在进行店铺评分时,只对其中1项或几项指睁基标作出评分,就确认提交了,则视为完成店铺评分,无法进行修改和补充评分,剩余未评的指标视作放弃评分,不会默认评分。
店铺评分生效后,宝贝与描述相符、卖家服务态度、卖家发货速度三项指标将分别悉芦谨平均计入卖家的店铺评分中,物流公司服务评分不计入卖家的店铺评分中,但会计入物流平台中。
计算方法:每个自然月,相同买、卖家之间交易,卖家店铺评分仅计取前三次。 店铺评分一旦做出无法修改。
计算周期:每天计算近6个月之内数据。
另外,店铺评分由买家对卖家作出,包括宝贝与描述相符、卖家服务态度、卖家发货速度、物流公司服务四项。每项店铺评分取连续六个月内所有买家给予评分的算术平均值。买家若完成对淘宝商城卖家店铺评分中宝贝与描述相符一项的评分,则其信用积分增加一分。
(3)打分算法扩展阅读:
买卖双方在支付宝交易成功后十五天内可以进行评价。评价包括“信用评价”及“店铺评分”。
在信用哗磨评价中,评价人若给予好评,则被评价人信用积分增加一分;若给予差评,则信用积分减少一分;若给予中评或十五天内双方均未评价 ,则信用积分不变。如评价人给予好评而对方未在十五天内给其评价,则评价人信用积分增加一分。
相同买、卖家任意十四天内就同款商品的多笔支付宝交易,多个好评只加一分、多个差评只减一分。每个自然月,相同买家与淘宝网卖家之间交易,双方增加的信用积分均不得超过六分;相同买家与淘宝商城卖家之间交易,买家信用积分仅计取前三次。
评价人可在作出中、差评后的三十天内,对信用评价进行一次修改或删除。三十天后评价不得修改。淘宝有权删除评价内容中所包含的污言秽语。