問卷信度演算法
⑴ 誰知道調查問卷的信度和效度是怎麼回事
測試信度(test reliability)也叫測試的可靠性,指的是測試結果是否穩定可靠。也就是說,測試的成績是不是反映了受試者的實際語言水平。例如,如果同一套測試在對同一測試對象(即受試者本身沒有變化)進行的數次測試中,受試者的分數忽高忽低的話,則說明該測試缺乏信度。測試的信度與測試的效度有著密切的關系。一般說來,只有信度較高的測試才能有較高的效度,但效度較高不能保證信度也一定較高。測試的信度主要涉及到試題本身的可靠性和評分的可靠性這兩個方面。試題本身是否可靠主要取決於試題的范圍、數量、試題的區分度等因素;評分是否可靠則要看評分標準是否客觀和准確。
測試的信度通常用一種相關系數(即兩個數之間的比例關系)來表示,相關系數越大,信度則越高。當系數為1.00時,說明測試的可靠性達到最高程度;而系數是0.00時,則測試的可靠性降到最低程度。在一般情況下,系數不會高到1.00,也不會降到0.00,而是在兩者之間。對信度指數的要求因測試類別的不同而不同,人們通常對標准化測試的信度系數要求在0.90以上,例如「托福」的信度大致為0.95,而課堂測試的信度系數則以0.70-0.80之間為可接受性系數。測試信度的計算方法有很多種,以下僅介紹三種易於操作的方法:
1)重測法(the retesting method)。用同一套試卷在兩個不同時間內來測試同一批受試者,這樣便獲得兩組分數,然後計算出兩組分數的相關系數。當然,在兩次測試中,學生第二次的測試成績理應比第一次的要高,因為在第二次測試時學生已經有了進步而且臨場經驗也更豐富了。但是若該試題是比較可靠的,每個學生在兩次測試中的排名次序應該是基本不變的。
2)交替形式法(the alternative method)。對同一批受試者使用試題類型完全相同,難易程度相當,但具體題目不同的兩套對等試卷先後進行兩次測試,然後計算出兩次得分的相關系數。
3)對半法(the split-half method)。測試只進行一次,但將整份試卷的題目按單、雙數分成兩組來分別計分,算出兩組分數的相關系數,然後再用Spearman-Brown的公式計算整份試卷的信度系數。具體計算步驟是:將兩組分數的相關系數乘以2,再除以1加兩組分數的相關系數。
http://ke..com/view/698674.htm
測試效度(test validity)亦稱測試的有效性,指一套測試對應該測試的內容所測的程度。也就是說,一套測試是否達到了它預定的目的以及是否測量了它要測量的內容。例如:「Is photography an art orscience?Discuss.」這種題目以攝影的知識為前提和主要內容,用來考語言能力,就不具有效性。又如用聽寫來測量學生的聽覺能力,其效度也是不理想的,因為書面記錄有聲語言不僅涉及學生的聽覺能力,而且還與他們的書寫速度、拼寫能力、語法知識、記憶能力和對全文的理解能力等有關。
測試的效度一般可分為以下幾類:
1)表面效度(face validity)。指測試應達到的卷面標准,即一套測試題從表面看來是否是合適的。例如,若一次閱讀理解力的測試包括許多受試者沒有學過的方言詞彙,則可認為這次測試缺乏表面效度。表面效度是測試出受試者正常水平的一種保證因素。
2)內容效度(content validity)。指一套測試題是否測試了應該測試的內容或者說所測試的內容是否反映了測試的要求,即測試的代表性和覆蓋面的程度。例如,如果某一套發音技能測試題僅僅考查發音所必須具備的某些技能,如只考單一音素的發音,而不考查重讀、語調或音素在詞語中的發音,那麼,該測試的內容效度就很低。
3)編制效度(construct validity)。指一套測試題的諸項目對編制該測試所依據的理論的各個基本方面的反映程度。例如,以結構主義語言理論為基礎,認為系統的語言習慣是通過句型而獲得的,那麼,強調詞彙和語法環境的測試題目就失去了編制效度。
4)經驗效度(empirical validity)。經驗效度是一種衡量測試有效性的量度,通過把一次測試與一個或多個標准尺度相對照而得出。經驗效度可分為兩種:一是共時效度(concurrent validity),即將一次測試的結果同另一次時間相近的有效測試的結果相比較,或同教師的鑒定相比較而得出的系數;二是預測效度(predictive validity),即將一次測試的結果同後來的語言能力相比較,或是同教師後來對學生的鑒定相比較而得出的系數。
一般來說,對某次測試的效度進行檢驗時,除了要根據教學大綱的要求和觀念有效性的理論對試卷的內容進行考查以外,還須採用計算相關系數的定量方法,即計算出本次試卷與另一份已被確定能正確反映受試者水平的試卷之間的相關系數。系數高則有效性大。課堂測試的效度應在0.4-0.7之間,規模較大的測試其效度應在0.7以上。
⑵ 一張調查問卷,如何做信度與效度的測量
通常使用克朗巴哈
信度系數法(cronbach
α)來測量此種問卷的信度。
克朗巴哈
信度系數是目前最常用的信度系數。一般認為
在0.7以上問卷的可信度較高。
如果用spss,菜單analyze->scale->reliability
analysis
效度沒有公認的一個指標,可用專家法和因子分析。
⑶ 如何進行調查問卷的信度分析
可以使用在線分析SPSSAU,不需要下載,授權給SPSSAU即可進行在線分析。
⑷ 問卷的信度與效度是如何檢驗的
如何提高問卷的效度和信度
為了提高問卷的信度和效度,問卷設計時需要注意以下問題:
①問卷中所提的問題,應圍繞研究目的來編制,力求簡單、明了,含義准確。不要出現雙關語,避免片面和暗示性的語言。
②問題不要超過被調查者的知識、能力范圍。
③問題排列要有一定的邏輯次序,層次分明。問卷的目的、內容、數據、卷面安排標准答案等都要認真地推敲和設計。
④調查表上應有留給供人填寫答案的足夠空間,並編有填寫調查單位的名稱、填表人的姓名和填表年月日的欄目。
⑤問卷形式可以封閉式和開放式相結合,問題數量要適度,一般應控制在30個問題以內,最好在20分鍾內能答完。
⑥為使調查結果更為客觀、真實,問卷最好採用匿名回答的方式。
設計問卷的內容要符合實際情況。一般來說,問卷設計前要摸底,對組內全體成員進行使用問卷調查的培訓,並在小范圍內進行試測,反復修改設計的問卷,以期與實際情況相符合,並便於對結果進行處理
⑸ 問卷中,信度系數r是怎麼求得的
常見的有以下幾種方法:
1、再測法。用同一組被試對同一種測驗前後兩次施測的測驗得分的相關系數表示信度。它反映測驗分數的穩定程度,其相關系數又稱穩定性系數。
2、復本法。用同一組被試對兩個等值(復本)測驗得分的相關系數表示信度。反映兩個復本測驗的等值程度,其相關系數又叫等值性系數。
3、分半法。用同一組被試對同一測驗對等的兩半的測驗得分的相關系數表示信度。它是復本法的特例,還可用來估計測驗內部的一致性。這種相關系數及叫內部一致性系數。
4、同質法。用測驗內部(測量同一特質或屬性)不同分測驗(異質而有關聯的測驗題目)之間的相關系數表示信度,估計的是測驗題目的同質性或普遍性,其相關系數也叫普遍性系數。
(5)問卷信度演算法擴展閱讀:
重測信度法特別適用於事實式問卷,如性別、出生年月等在兩次施測中不應有任何差異,大多數被調查者的興趣、愛好、習慣等在短時間內也不會有十分明顯的變化。
如果沒有突發事件導致被調查者的態度、意見突變,這種方法也適用於態度、意見式問卷。由於重測信度法需要對同一樣本試測兩次,被調查者容易受到各種事件、活動和他人的影響,而且間隔時間長短也有一定限制,因此在實施中有一定困難。
⑹ 信度計算公式有哪些
若用t表示真實值,b表示偏差即系統誤差,e表示測量的隨機誤差,x表示測量結果,則有:x=t+b+e。
在上述分解式中,t是一個抽象的變數,是潛在的需要估計的值。系統誤差b是可通過採用一定的手段避免或減少的誤差,而隨機誤差e是無法避免的。
若測量得到的結果x與真實值t一致或者差異很小,則稱測量是「可靠的」或者是「可信的」;否則稱測量在某種程度上是「不可靠的」或者「不可信的」。
信度的估計
在對問卷的信度進行估計之前,需要通過採用適當的量表(如 Likert 量表)將問卷中的各類主觀的或客觀的備選答案轉化為數字形式,然後在此基礎上進行問卷評分(包括單項評分、相關題目分組評分和總評分等)。
信度分析的常用具體方法有重測信度、復本信度、分半信度、信度系數法四種(後兩種可歸為內部一致性信度)。
⑺ 什麼是問卷的信度和效度
信度(reliability)即可靠性,它指的是採取同樣的方法對同一對象重復進行測量時,其所得結果相一致的程度。從另一方面來說,信度就是指測量數據的可靠程度。
信度是指測驗結果的一致性、穩定性及可靠性,一般多以內部一致性來加以表示該測驗信度的高低。信度系數愈高即表示該測驗的結果愈一致、穩定與可靠。
系統誤差對信度沒什麼影響,因為系統誤差總是以相同的方式影響測量值的,因此不會造成不一致性。反之,隨機誤差可能導致不一致性,從而降低信度。
效度(Validity)即有效性,它是指測量工具或手段能夠准確測出所需測量的事物的程度。效度是指所測量到的結果反映所想要考察內容的程度,測量結果與要考察的內容越吻合,則效度越高;反之,則效度越低。效度分為三種類型:內容效度、准則效度和結構效度。
效度是測量的有效性程度,即測量工具確能測出其所要測量特質的程度,或者簡單地說是指一個測驗的准確性、有用性。效度是科學的測量工具所必須具備的最重要的條件。
在社會測量中,對作為測量工具的問卷或量表的效度要求較高。鑒別效度須明確測量的目的與范圍,考慮所要測量的內容並分析其性質與特徵,檢查測量的內容是否與測量的目的相符,進而判斷測量結果是否反映了所要測量的特質的程度。
問卷分類:
按調查方式分,問卷可分為:自填問卷和訪問問卷。
自填問卷是由被訪者自己填答的問卷。訪問問卷是訪問員通過來訪被采訪音.由訪問員填答的問卷。自填式問卷由於發送的方式不同而又分為發送問卷和郵寄問卷兩類。發送問卷是由調查員直接將問卷送到被訪問音手中,並由調查員直接回收的調查形式。
而郵寄問卷是由調查單位直接郵寄結被訪者,被訪者自己填答後,再郵寄回調查單位的調查形式。
這幾種調查形式的特點是:訪問問卷的回收率最高,填答的結果也最可靠,但是成本高,費時長,這種間卷的回收率一般要求在90%以上;寄間卷,回收串低,調查過程不能進行控制,因此可信性與有效性都較低。
而且由於回收率低.會導致樣本出現偏差,影響樣本對總體的報斷。一般來講,郵寄問卷的回收率在50%左右就可以了;發送式自填問卷的優缺點介於上述兩者之間,回收率要求在67%以上。
⑻ 如何用spss進行問卷信度分析
用spss進行問卷信度分析的方法
spss實際操作
整理數據,將數據整理為量表的分值(點值)形式。
輸入數據到spss中,可以使用excel導入或直接輸入等。
選擇分析→度量→可靠性分析
選擇statistics選項卡,勾選上描述性統計量項+度量後,選擇繼續,再點擊ok確定即可。
查看spss的分析結果,可靠性統計資料的Cronbach的Alpha系數,本例的結果為0.778.表明有些項目需要修訂。大於等於0.9表明量表的信度較好;0.8--0.9表明信度可以接受。0.7--0.8有些項目需要修訂;小於0.7表示量表中有些項目需要拋棄。
⑼ 如何進行調查問卷的信度分析
一、問卷的信度。
信度即可靠性,是指採用同一方法對同一對象進行調查時,問卷調查結果的穩定性和一致性,即測量工具(問卷或量表)能否穩定地測量所測的事物或變數。具體評價方法有:
1、重復檢驗法。同樣的問卷,對同一組訪問對象在盡可能相同的情況下,在不同時間進行兩次測量。兩次測量相距一般在兩到四周之內。用兩次測量結果間的相關分析或差異的顯著性檢驗方法,評價量表信度的高低。
2、交錯法。用兩個不同形式的等價問卷,對同一組受訪者在不同的時間(通常間隔兩到四周)進行測量。兩次測量結果間的相關性被用來評價問卷的信度。
3、折半法。折半法是將上述兩份問卷合成一份問卷(通常要求這兩份問卷的問題數目相等),每一份作為一部分,然後考察這兩個部分的測量結果之間的相關性。
二、問卷的效度
效度是指問卷正確測量研究者所要測量的變數的程度。檢驗效度的主要指標和方法有:表面效度、准則效度、架構效度。
1、表面效度(Face Validity)。也稱為內容效度或邏輯效度,指的是測量的內容與測量目標之間是否適合,也可以說是指測量所選擇的項目是否「看起來」符合測量的目的和要求。主要依據調查設計人員的主觀判斷。
2、准則效度(Criterion Validity)。准則效度是指量表所得到的數據和其他被選擇的變數(准則變數)的值相比是否有意義。根據時間跨度的不同,准則效度可分為同時效度和預測效度。
同質效度是指量表測量同一特徵的其他測量方法相互關聯的程度。異質效度是指量表和測不同特徵的測量方法不同但理論上有關特徵的測量方法之間相互關聯的程度。建構效度指測量工具所能測量到的理論概念的程度,也就是說若將測量工具所得的結果與相同理論下的其他概念相比較,當二者有某種預期的相關性時,就表示這種測量工具具有某種程度的架構效度。
一般來說,問卷調查容易產生誤差的原因,來自研究者的因素包括:測量內容不當、情景以及研究者本身的疏忽。來自受訪者的因素則可能是由於其年齡、性格、教育程度、社會階層等,而影響其答題的正確性。研究者透過信度與效度的檢驗,可以了解問卷本身是否優良,以作為改變修正的根據,避免做出錯誤的判斷。
問題意識形成的首要條件是你要對一切的現象充滿著好奇感和濃厚的興趣,具有較強的觀察能力。比如當你下到相關的實踐場所時,觀察到一定的現象和問題,如:課堂上教師為什麼會像是在表演一樣?為什麼教師在上面興趣盎然,而下面總有某些學生興趣索然?就要積極展開一定的思考,多問幾個為什麼,並結合自己所學的相關教育教學理論,追問一下怎麼才會更好?
其次是要具有強調的信息意識。信息資源是得以形成有價值問題的依據,除了實踐觀察中獲得鮮活的感性信息之外,豐富的理論資源也是形成問題的關鍵。對於確定領域的古今中外所有的研究成果,包括最新的一些提法等都要積累到腦子中,並按照優化的結構將其組織起來,內化於心。對於已有的問題,要學會換一個角度去多多思考,另外也要善於發掘新的尚未研究或還未足夠清楚的問題,並及時將這樣一些問題作以記錄。
再就是要學會思考,包括思考的方法、角度等等。只有能思考並善於思考的人才會一語中的地提出有意義的問題,並能夠給出有效解決問題的清晰思路。
在做科研的過程中,隨時隨處遇到問題及時作以深入思考,相信會有大收獲的。
基本的抽樣方法主要有兩大類:一類是在目標總體中,有意識地選擇若干有代表性的單位為樣本進行調查研究。這種抽樣叫做目標抽樣或主觀抽樣。
目標抽樣的方法適用於典型調查或研究。它的特點是作為樣本的各單位的代表性,都是由與該研究課題有關的專家來判斷和決定的。其結果的可靠性和精確度葉必須依靠這方面的專家來判斷和評價。採用目標抽樣,可以對總體的有關特性作出推論,也可以對研究所涉及的有關因素加以適當考慮。也可以使已知的樣本單位的某些信息在取樣時發揮作用。這些都是目標抽樣的優點。此外,採用目標抽樣在數據收集方面比較方便。但採用目標抽樣時,目標總體中各成員被抽取為樣本的概率不能用客觀方法來計算,因此抽樣的誤差和精度就無法用客觀方法加以評價,這是目標抽樣的最大缺點。
另一類是按照隨即的原則,從構成目標總體的各成員中抽取樣本,叫做隨即抽樣和概率抽樣。隨機抽樣的最大優點是可以藉助概率客觀地計算調查結果的可靠性和精確度。而且可以根據實際條件和所要求的精度確定樣本的大小。所以在教育科學研究尤其是大規模的評價研究中,應充分了解隨機抽樣的意義。
簡單隨機抽樣(簡稱SRS)是隨機抽樣中最簡單而又是最基本的一種。它的特點是採用隨機數碼表或抽簽的辦法確定樣本,因此各總體成員都保證有相等的抽取概率。
如果抽取的樣本數量很大,使用純粹的簡單隨機抽樣會有很多困難,因此常常可以採用機械隨機抽樣來代替。
採用簡單(或機械)隨機抽樣的好處是,可以根據概率理論來客觀地估計抽樣誤差的大小。