Dicky's Karma (請到新網站): 4月 2017

試題反應理論(Item Response Theory)中，需要看配適度(Fit)嗎？

從每個人在每個項目的實際得分(observed score)和該人該項目的預期得分(expected score)的差，除以變異數，可以得到這個資料點對模型的標準化的殘差(standardised residual)，把所有這些標準化的殘差平方後再求平均，就是未權重配適度均方(unweighted fit mean-squar)；若根據該資料點的變異數進行權重，則叫作權重配適度均方(weighted fit mean-square)。前者也叫outfit，因為它對極端值(outlier)相當敏感，如果高能力的人答錯簡單的題或低能力的人答對較難的題，則整個均方就會變大，資料和模型的配適就不好；後者又叫infit，因為其根據每個資料所能提供的資訊(information fit)進行權重，極端值的變異較小(例如：0.9*0.1或0.1*0.9，但中間的資訊較多(0.5*0.5)。

在項目反應理論(Item Response Theory)下，怎麼理解「難度」這個概念？三種取徑。

在項目反應理論(Item Response Theory)中，要描述一個項目的「難度」和古典測驗理論(classical test theory)有不一樣的方法。在古典測驗中，一個項目的「難度」被認為是參與答題者人中答對該項目的比率，越多人答對，難度越低。在項目反應理論中，我們可以從三個取逕來理解項目的難度。

在古典測驗理論(Classical Test Theory)中計算信度(reliability)

古典測驗理論(Classical Test Theory)中，存在一些假設：
一、Observed Scored = True Score + (Measurement) Error
X = T + E
二、mean(X) = T
三、Corr(E,T) = 0
四、Corr(E1,E2) = 0
五、Corr(E1,T2) = 0
如果平行測驗的兩次所觀察到的分數滿足上述五個假設，則兩次的真實分數(True Score)相等，兩次的van(E)相等。
van(E)為每一個題項(item)的變異數的總和。

網頁

試題反應理論(Item Response Theory)中，需要看配適度(Fit)嗎？

在項目反應理論(Item Response Theory)下，怎麼理解「難度」這個概念？三種取徑。

在古典測驗理論(Classical Test Theory)中計算信度(reliability)