臺師大劉振維教授
飽和診斷分類模型中的貝葉斯Q矩陣估計
《Bayesian Q Matrix Estimation of Saturated Diagnostic Classification Models》
文字、攝影/賴姵妘、盧品諺、林奕馨
5月8日本系邀請國立臺灣師範大學教育心理與輔導學系的劉振維副教授蒞臨演講,與師生分享他在診斷分類模型領域的最新研究成果,現場交流熱烈、收穫豐富。劉副教授的專長涵蓋心理計量、學習診斷、試題反應理論 (Item Response Theory, IRT) 與教育統計,曾榮獲國科會吳大猷先生紀念獎。本次演講以〈Bayesian Q Matrix Estimation of Saturated Diagnostic Classification Models〉為題,深入剖析 Q 矩陣推論在認知診斷模型中的應用與實例分析。
Q矩陣的基本概念與傳統建立方法
在演講中,劉教授介紹了認知診斷模型如何透過Q-matrix分析複雜資料,以機率指標判斷受試者是否具備特定能力或特質。Q-matrix是一個由0和1組成的矩陣,用以標示測驗題目 (Items) 與測量屬性 (Attributes) 之間的關聯 。傳統上,Q-matrix的建立主要仰賴專家判斷,然而此方法常面臨以下挑戰:不同專家可能對題目與屬性的關聯有不同的見解,因意見分歧而導致矩陣結構不穩定;又或題目設計不佳而引入系統性誤差,進而影響模型的診斷效度。
Nevo Package與Bayes Q矩陣估計
為了解決上述問題,劉教授的研究探索了如何透過Nevo package從實際資料中自動推導出Q-matrix。Nevo採用貝葉斯推論 (Bayesian Inference) 的方法,能在事先未知屬性數量的情況下,根據觀察數據反推出Q-matrix中的0和1數值 。此方法相較於傳統的專家判斷,更具有優勢。
此外,Nevo還引入了Monotonicity Constraint (單調性約束),即假設能力較高的受試者,其答對題目的機率應高於能力較低者,進一步提升了模型估計的穩定性。劉教授的研究結果顯示,相較於其他統計工具,Nevo在Q-matrix估計上的準確度與穩定性表現更佳,能更準確地回復Q-matrix。此外,Nevo亦可處理不同類型的認知診斷模型,具備高度的彈性與應用價值。
Nevo與Nimble的比較
在隨後的問答環節中,有參與者詢問Nimble相較於其他模型的優勢為何。講者指出:效能優勢來自於其彈性且模組化的統計建模框架。與傳統心理計量模型(例如:試題反應理論或結構方程模型)相比,Nimble採用的貝葉斯推論方法,並支援自訂模型結構與先驗設定,使研究者能夠根據資料特性,建立更符合理論假設的模型。此外,Nimble可結合Markov Chain Monte Carlo (MCMC) 等現代機率運算技術,使模型估計更為穩健,對於複雜模型或小樣本資料特別有效。
研究限制與未來方向
儘管Nevo在Q-matrix估計上具有顯著優勢,但也面臨計算效率與資源需求的挑戰。例如:在處理大型數據集時,Nevo的計算時間和記憶體需求可能較高。劉教授建議,未來的研究可著重於Nevo的優化。講者亦提到,即使事先未知潛在屬性(Attributes)的數量,研究者仍可使用Nimble建立模型,此點類似於探索性因素分析(Exploratory Factor Analysis, EFA)的精神,允許研究者先在資料中探索潛在結構,而非強加預設的維度數量。在Nimble中,可透過設定彈性變數數量、選擇性收斂條件、或使用階層模型等方式達成,甚至可結合可變維度的貝葉斯方法,為研究者在處理未知結構時提供極大的自由度。