前端→报告训练资料表

前端 → 报告 · 训练资料对应表

核心问题：已有「前端（采集作答与行为）」与「报告（IRT 测评报告 + 校级报告）」，要让前端输入自动生成这份报告，中间需要把下列训练/标定资料准备齐。状态：已有=此前联考数据已可支撑；部分=有基础但需补；待补=需新增采集/整理。

前端输入 → 中间训练资料 → 报告输出对应表

报告模块 / 输出	前端输入(来源)	中间需准备的训练资料	用到的算法	状态
总体等级 · 能力量表分 · 95%CI	学生逐题作答（得分/选项）	题库题目的 IRT 参数(a/b/c) + 大样本标定作答	2PL/3PL IRT + MLE/EAP 估 θ	部分已有
全省排位 PR · 七档升学定位(1–5++)	总分 / θ	全省常模(分数↔PR↔升学线映射) + 招生计划/历年录取线	常模分位 + 升学线标定	待补
学科核心素养雷达	逐题作答 + 题目维度标签	双向细目表(题→知识点→能力维度→素养) + 各学科核心素养清单	MIRT / CDM 维度聚合	部分待补
知识点掌握诊断 · 热力图	逐题作答 + Q矩阵	双向细目表(Q矩阵) + DINA 标定(slip/guess)	CDM / DINA·GDINA	待补
逐题「实际 vs 预期」	逐题作答	题目 IRT 参数	IRT 期望得分	已有
难度阶梯 · 命题质量(信度/难度/区分度)	全量逐题作答	大样本作答数据	CTT(P/点二列/α)	已有
个人成长轨迹 · 趋势预测	历次测评作答	跨次锚题表 + 学号贯通(同生追踪) + 等值参数	IRT 垂直等值 + LGCM	待补
群体位置 · 百分位	总分	群体常模分布	常模百分位	部分已有
错题本 · 变式题推荐	错题 + 考点标签	题库考点标签库 + 学生×试题作答矩阵	矩阵分解(SVD) + 协同过滤	待补
学习建议 · 8周提升路径	诊断结果	知识点先修关系(知识图谱) + 资源库 + 建议规则/模板	规则引擎 + 诊断结果	待补
[校级] 升学潜力预测 · 上线人数	起点测试成绩	19级4次追踪出口数据 + 上线标签	LGCM / XGBoost	待补
[校级] E值矩阵 · 班级分型	各科均分/标准差	班级聚合统计(已可从作答得到)	E值(EA×EB)四象限	已有
[校级] Q值 · 选科组合有效性	各科达A/B率 + 选科组合	选科组合数据 + 历年组合出口常模	Q值分析	部分待补
[校级] 教师教学效能基线	班级起点-出口成绩	同一教师不同起点班级的出口数据	HLM 多层线性	待补
[校级] 弹性课时认证(非报告，但需训练)	在线时长/行为/佐证	有效学习系数权重标定 + 佐证质量评分模型	加权评分 + (可选)材料判别	规则可定

最关键的 5 项待补资料（优先级）

1. 双向细目表 / Q 矩阵（每科每卷）

题目→知识点→能力层级→核心素养的标注表。是认知诊断(CDM/DINA)、素养雷达、知识点热力图的前提。没有它，报告只能出总分/难度，出不了「学会了什么」。

2. 全省常模 + 升学线映射

分数↔全省排位 PR↔升学录取线(本科/重本/211·985) 的对照。决定「PR 与 1–5++ 升学定位」。需逐年招生计划与录取线。

3. 跨次锚题表 + 学号贯通

把不同年级/批次的卷放到同一能力量尺(垂直等值)，并能按学号追踪同一学生多次。决定「成长轨迹/趋势预测/动态达标线」。

4. 题库考点标签 + 学生×试题作答矩阵

每题的知识点/能力/难度标签 + 大规模逐题作答。决定「错题本变式推荐」(矩阵分解/协同过滤)与自适应出题。

5. 纵向追踪出口 + 上线标签（校级）

19 级等连续多次追踪到高考/出口的成绩与上线结果。决定校级「升学潜力预测/上线人数/教师增值(HLM)」。

已具备的底座：题目难度/区分度/信度(CTT)、2PL IRT 标定(a/b)、E值矩阵、逐题实际vs预期——这些此前的联考数据已能支撑。补齐上面 5 项后，即可实现「学生在前端作答 → 自动生成完整测评报告」的闭环。