一月
23
真正開始接觸心理計量學是在碩一時修一門職治所潘老師講授的「評估與測量」,開始徹底學習信效度、問卷編制、翻譯流程、以及最後的現代測驗理論單參數模式。但是在進入單參數模式之前,想跟大家聊聊測驗理論。目前有兩大派分別為古典測驗理論與現代測驗理論,其實還有一派是推論利理論,但是該領域學者人數較少,因此還是以前兩個理論為主。
一、古典測驗理論(Classical test theory, CTT)
CTT主要是將各試題得分加總之後的總分作為評量學生能力或是病人生活品質狀態的依據,因此在CTT中,單獨一題的分數不具有解釋的意義。數學假說如下:
Χ = t + ε , X為測驗分數、t為真分數、ε為誤差分數
CTT有許多重要的假設:
- 潛在特質(即t)需存在,不然測量的東西都是沒有意義的
- 多次測量達到推論結果目的,因為潛在特質無法看見,因此我們需要依賴多次測量數據利用統計估算去求出量為多少。味道有點類似以前我上統計史導論黃旻華老師所說期望值的由來。。
- 測量誤差的存在
- …
其實還有許多假設,這裡僅僅列出三項作參考。CTT其實行之有年,1905年開始發展到現在也一百多年,加上CTT計算公式簡單明瞭,類似直覺上的思考因此很容易了解,醫界在使用問卷的部分也幾乎採用CTT方式估算病人的生活品質、憂鬱、焦慮等量化的程度。好用歸好用還是有缺點存在,余老師的書講得非常好,只列出幾點(有興趣的人請參照余老師的專書):
- Sample dependent
- Only one standard error of measurement
- Comparison?
- What’s the difference between two people with the same raw score?
為了克服這些缺點因此有現代測驗理論(又稱試題反應理論Item response theory)的誕生。而IRT中的Rasch model恰好是我碩論會用到的方法之一,下次再向大家介紹CTT與IRT的差異。
參考書目:
- 余民寧, 試題反應理論IRT及其應用, 2009
- Bond & Fox, 1st Edn., Applying the Rasch Model, 2001
Comments
You must be logged in to post a comment.