手机浏览器扫描二维码访问
第二节计算机化多阶段自适应测验设计
banner"
>
MST设计涉及以下几个技术环节:阶段数的确定、每个阶段中模块数的确定、每个模块的项目长度、统计目标与定性规范约束、计分方法(能力估计)、自适应策略与过程、组卷等。
现对以上技术环节一一展开。
一、阶段数的确定
构建MST时,首先考虑需要构建多少个阶段。
大多数研究和应用中,通常使用3~4个阶段。
更多的阶段或每一阶段内更多样化的模块难度会使测验的自适应性和灵活性更佳。
但是增加阶段数会提升组卷的复杂性,却对测验最终的精度没有很大提升(Luegester,1998)。
当测验所含阶段数较少时也会出现问题。
例如,两阶段测验,仅有一个阶段一和一个阶段二。
由于只有一个自适应点,当被试得分处于划界分数附近时,就有更大的可能出现路径错误。
两阶段测验应考虑建立一个“恢复路径(RecoveryRoutine)”
,即被试从前一阶段到下一阶段出错时,应及时改正错误,减少下一阶段模块选择的错误。
使用更多的阶段可以减少出现这种错误的可能性。
Patsula和Hambleton(1999)比较了多种不同的MST设计,他们发现这些设计之间仅有很小的差别。
但是这些测验设计在测量精度和效能方面表现出较大的差别。
测验的阶段数越多就越接近于CAT。
因此构建测验时,测验开发者应选择合适的阶段数。
阶段数过少无法精确测量出被试能力。
阶段数过多不但无法提升测量精度还会加大组卷难度和题目浪费,并面临和CAT同样的问题,如路由出错、多自适应点增长测验时间等。
二、每个阶段中模块数的确定
大多数研究和应用是阶段一使用一个模块,在随后的阶段中增加模块数量。
通常情况,每一阶段的模块数不超过8个,平均值为5个。
随着阶段数的提升,增加更多难度的模块数,可使测验更具有自适应性和灵活性。
同样,增加模块数也增大了组卷复杂性,并对测验最终精度没有很大提升(Luegester,1998)。
一般情况下,每一阶段最多4个模块,并且每个模块3个平行水平,这样的组合比较合适(Armstrong,Jones,Koppel&Pashley,2004)。
因此在构建测验时,测验开发者要合理制定每一阶段内的模块数。
有两种可选择的模块数:一种是随着阶段增加,阶段内的模块数也增加,以此提升能力估计精度;另一种是每一阶段的模块数都相同,这种情况主要用于一致题目曝光率MST的情况(图4-1-2)。
测验开发者可根据自己的需求进行选取。
三、每个模块的项目长度
已有的研究和应用中,模块的题目数为1~90个不等,大多为5个。
不同阶段中模块的长度可根据实际情况而定。
一些测验在阶段一中有较多题目,而随后阶段中题目数量较少。
增加阶段一中模块的长度对减小估计误差有显著效果(Kim&Plake,1993)。
精神发疯文学,没有原型,没有原型,没有原型(讲三遍),请不要在评论区提真人哦。金手指奇大,cp沈天青。日六,防盗八十,上午十一点更新江繁星八岁时候看见律政电视剧里的帅哥美女环游世界谈恋爱...
官场如战场,尔虞我诈,勾心斗角,可陆浩时刻谨记,做官就要做个好官,要有两颗心,一颗善心,一颗责任心。且看陆浩一个最偏远乡镇的基层公务员,如何在没有硝烟的权利游戏里一路绿灯,两袖清风,不畏权贵,官运亨通。...
十级官路,一级一个台阶。刘项东重生归来,从乡镇城建办主任起步,把握每一次机会,选对每一次抉择,一步步高升。穷善其身,达济天下。为民谋利更是他的追求。小小城建办主任,那也是干部。且看刘项东搅动风云,在这辉煌时代里弄潮而上,踏上人生巅峰。...
林风因意外负伤从大学退学回村,当欺辱他的地痞从城里带回来一个漂亮女友羞辱他以后,林风竟在村里小河意外得到了古老传承,无相诀。自此以后,且看林风嬉戏花丛,逍遥都市!...
前世被当副镇长的老婆离婚后,崔向东愤怒下铸成了大错,悔恨终生!几十年后,他却莫名重回到了这个最重要的时刻!他再次面对要和他离婚的副镇长老婆,这次,他会怎么做?...
要想从政呢,就要步步高,一步跟不上,步步跟不上,要有关键的人在关键的时刻替你说上关键的话,否则,这仕途也就猴拉稀了...