学力通行证平台 · 前端→报告 训练资料表
演示原型 DEMO
前端→报告 训练资料表
前端 → 报告 · 训练资料对应表
核心问题:已有「前端(采集作答与行为)」与「报告(IRT 测评报告 + 校级报告)」,要让前端输入自动生成这份报告,中间需要把下列训练/标定资料准备齐。状态:已有=此前联考数据已可支撑;部分=有基础但需补;待补=需新增采集/整理。
前端输入 → 中间训练资料 → 报告输出 对应表
| 报告模块 / 输出 | 前端输入(来源) | 中间需准备的训练资料 | 用到的算法 | 状态 |
|---|---|---|---|---|
| 总体等级 · 能力量表分 · 95%CI | 学生逐题作答(得分/选项) | 题库题目的 IRT 参数(a/b/c) + 大样本标定作答 | 2PL/3PL IRT + MLE/EAP 估 θ | 部分已有 |
| 全省排位 PR · 七档升学定位(1–5++) | 总分 / θ | 全省常模(分数↔PR↔升学线映射) + 招生计划/历年录取线 | 常模分位 + 升学线标定 | 待补 |
| 学科核心素养雷达 | 逐题作答 + 题目维度标签 | 双向细目表(题→知识点→能力维度→素养) + 各学科核心素养清单 | MIRT / CDM 维度聚合 | 部分待补 |
| 知识点掌握诊断 · 热力图 | 逐题作答 + Q矩阵 | 双向细目表(Q矩阵) + DINA 标定(slip/guess) | CDM / DINA·GDINA | 待补 |
| 逐题「实际 vs 预期」 | 逐题作答 | 题目 IRT 参数 | IRT 期望得分 | 已有 |
| 难度阶梯 · 命题质量(信度/难度/区分度) | 全量逐题作答 | 大样本作答数据 | CTT(P/点二列/α) | 已有 |
| 个人成长轨迹 · 趋势预测 | 历次测评作答 | 跨次锚题表 + 学号贯通(同生追踪) + 等值参数 | IRT 垂直等值 + LGCM | 待补 |
| 群体位置 · 百分位 | 总分 | 群体常模分布 | 常模百分位 | 部分已有 |
| 错题本 · 变式题推荐 | 错题 + 考点标签 | 题库考点标签库 + 学生×试题作答矩阵 | 矩阵分解(SVD) + 协同过滤 | 待补 |
| 学习建议 · 8周提升路径 | 诊断结果 | 知识点先修关系(知识图谱) + 资源库 + 建议规则/模板 | 规则引擎 + 诊断结果 | 待补 |
| [校级] 升学潜力预测 · 上线人数 | 起点测试成绩 | 19级4次追踪出口数据 + 上线标签 | LGCM / XGBoost | 待补 |
| [校级] E值矩阵 · 班级分型 | 各科均分/标准差 | 班级聚合统计(已可从作答得到) | E值(EA×EB)四象限 | 已有 |
| [校级] Q值 · 选科组合有效性 | 各科达A/B率 + 选科组合 | 选科组合数据 + 历年组合出口常模 | Q值分析 | 部分待补 |
| [校级] 教师教学效能基线 | 班级起点-出口成绩 | 同一教师不同起点班级的出口数据 | HLM 多层线性 | 待补 |
| [校级] 弹性课时认证(非报告,但需训练) | 在线时长/行为/佐证 | 有效学习系数权重标定 + 佐证质量评分模型 | 加权评分 + (可选)材料判别 | 规则可定 |
最关键的 5 项待补资料(优先级)
1. 双向细目表 / Q 矩阵(每科每卷)
题目→知识点→能力层级→核心素养 的标注表。是认知诊断(CDM/DINA)、素养雷达、知识点热力图的前提。没有它,报告只能出总分/难度,出不了「学会了什么」。
2. 全省常模 + 升学线映射
分数↔全省排位 PR↔升学录取线(本科/重本/211·985) 的对照。决定「PR 与 1–5++ 升学定位」。需逐年招生计划与录取线。
3. 跨次锚题表 + 学号贯通
把不同年级/批次的卷放到同一能力量尺(垂直等值),并能按学号追踪同一学生多次。决定「成长轨迹/趋势预测/动态达标线」。
4. 题库考点标签 + 学生×试题作答矩阵
每题的知识点/能力/难度标签 + 大规模逐题作答。决定「错题本变式推荐」(矩阵分解/协同过滤)与自适应出题。
5. 纵向追踪出口 + 上线标签(校级)
19 级等连续多次追踪到高考/出口的成绩与上线结果。决定校级「升学潜力预测/上线人数/教师增值(HLM)」。
已具备的底座:题目难度/区分度/信度(CTT)、2PL IRT 标定(a/b)、E值矩阵、逐题实际vs预期——这些此前的联考数据已能支撑。补齐上面 5 项后,即可实现「学生在前端作答 → 自动生成完整测评报告」的闭环。