【论文复现】基于图神经网络的知识追踪方法

2025-07-28 21:35:43

【论文复现】基于图神经网络的知识追踪方法 1.论文概述论文链接提出了一种基于图神经网络的知识追踪方法，称为基于图的知识追踪（GKT）。将知识结构构建为图，其中节点对应于概念，边对应于它们之间的关系，将知识追踪任务构建为图神经网络中的时间序列节点级分类问题。在两个开放数据集上的实证验证表明，方法可以更好地预测学生的表现，并且该模型比先前的方法具有更可解释的预测。贡献如下：（1）展示了知识追踪

【论文复现】基于图神经网络的知识追踪方法

1.论文概述

论文链接提出了一种基于图神经网络的知识追踪方法，称为基于图的知识追踪（GKT）。将知识结构构建为图，其中节点对应于概念，边对应于它们之间的关系，将知识追踪任务构建为图神经网络中的时间序列节点级分类问题。在两个开放数据集上的实证验证表明，方法可以更好地预测学生的表现，并且该模型比先前的方法具有更可解释的预测。贡献如下：（1）展示了知识追踪可以重新构想为图神经网络的应用。（2）为了实现需要输入模型的图结构，在许多情况下并不明确的情况下，我们提出了各种方法，并使用实证验证进行了比较。（）证明了所提出的方法比先前的方法更准确和可解释的预测。

本文所涉及的所有资源的获取方式：这里

2.论文方法

下面是本文提出GKT的体系结构。

2.1 聚合

模型聚合了回答的概念及其相邻概念的隐藏状态和嵌入。这种聚合使用隐藏状态、表示正确和错误答案的输入向量 xt，以及概念及其回答的嵌入矩阵Ex 和Ec 进行，

2.2 更新

接下来，模型根据聚集的特征和知识图结构更新隐藏状态。这一步骤确保模型融合了当前概念及其在知识图中的相邻节点的信息。

2. 预测

最后，模型输出学生在下一时间步正确回答每个概念的预测概率

. 实验

.1 数据集

使用了学生数学练习日志的两个开放数据集：ASSISTments 2009-2010“skill-builder”由在线教育服务 ASSISTments1（以下称为“ASSISTments”）提供和 Bridge to Algebra 2006-2007 [19] 用于KDDCup 教育数据挖掘挑战赛（以下简称“KDDCup”）。在这两个数据集中，每个练习都分配了人类预定义的知识概念标签。使用特定条件预处理每个数据集。对于ASSISTments，将同时回答的日志合二为一，随后提取与命名概念标签相关联的日志，最后提取与至少10次回答的概念标签相关联的日志。对于 KDDCup，将问题和步骤的组合视为一个答案，然后提取与命名且非哑元的概念标签相关联的日志，最后提取至少 10 次回答的概念标签相关联的日志。由于频繁同时出现的标签，将同时的回答日志组合成一组可以防止不公平的高预测性能。排除未命名或虚拟的概念标签可以消除噪音。用回答每个概念标签的次数对日志进行阈值处理，以确保有足够数量的日志来消除噪音。在使用上述条件对数据集进行预处理后，为 ASSISTments 数据集获得了 62, 955 个日志，由 1, 000 名学生和 101 项技能组成，并为 KDDCup 数据集获得了 98, 200 条日志，由 1, 000 名学生和 211 项技能组成。

.2 实验步骤

Step1:处理数据集

___

Step2:进行训练

. 实验结果

___

4.核心代码代码语言：javascript代码运行次数：0运行复制

class GKT(KTM):
    def __init__(self, ku_num, graph, hidden_num, net_params: dict = one, loss_params=one):
        super(GKT, self).__init__()
        self.gkt_model = GKTet(
            ku_num,
            graph,
            hidden_num,
            **(net_params if net_params is not one else {})
        )
        # self.gkt_model = GKTet(ku_num, graph, hidden_num)
        self.loss_params = loss_params if loss_params is not one else {}

    def train(self, train_data, test_data=one, *, epoch: int, device="cpu", lr=0.001) -> ...:
        loss_function = SLMLoss(**self.loss_params)
        trainer = Adam(self.gkt_model.parameters(), lr)

        for e in range(epoch):
            losses = []
            for (question, data, data_mask, label, pick_index, label_mask) in tqdm(train_data, "Epoch %s" % e):
                # convert to device
                question: torch.Tensor = (device)
                data: torch.Tensor = (device)
                data_mask: torch.Tensor = data_(device)
                label: torch.Tensor = (device)
                pick_index: torch.Tensor = pick_(device)
                label_mask: torch.Tensor = label_(device)

                # real training
                predicted_respe, _ = self.gkt_model(question, data, data_mask)

                loss = loss_function(predicted_respe, pick_index, label, label_mask)

                # back propagation
                trainer.zero_grad()
                loss.backward()
                trainer.step()

                losses.append(().item())
            print("[Epoch %d] SLMoss: %.6f" % (e, float((losses))))

            if test_data is not one:
                auc, accuracy = (test_data)
                print("[Epoch %d] auc: %.6f, accuracy: %.6f" % (e, auc, accuracy))

    def eval(self, test_data, device="cpu") -> tuple:
        self.gkt_()
        y_true = []
        y_pred = []

        for (question, data, data_mask, label, pick_index, label_mask) in tqdm(test_data, "evaluating"):
            # convert to device
            question: torch.Tensor = (device)
            data: torch.Tensor = (device)
            data_mask: torch.Tensor = data_(device)
            label: torch.Tensor = (device)
            pick_index: torch.Tensor = pick_(device)
            label_mask: torch.Tensor = label_(device)

            # real evaluating
            output, _ = self.gkt_model(question, data, data_mask)
            output = output[:, :-1]
            output = pick(output, pick_(output.device))
            pred = tensor2list(output)
            label = tensor2list(label)
            for i, length in enumerate(label_().tolist()):
                length = int(length)
                y_(label[i][:length])
                y_(pred[i][:length])
        self.gkt_()
        return roc_auc_score(y_true, y_pred), accuracy_score(y_true, np.array(y_pred) >= 0.5)

    def save(self, filepath) -> ...:
        torch.save(self.gkt_model.state_dict(), filepath)
        logging.info("save parameters to %s" % filepath)

    def load(self, filepath):
        self.gkt_model.load_state_dict(torch.load(filepath))
        logging.info("load parameters from %s" % filepath)

编程未来，从这里启航！解锁无限创意，让每一行代码都成为你通往成功的阶梯，帮助更多人欣赏与学习！

本文参与腾讯云自媒体同步曝光计划，分享自作者个人站点/博客。原始发表：2024-12-2，如有侵权请联系 cloudcommunity@tencent 删除日志数据神经网络论文模型

#感谢您对电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格的认可，转载请说明来源于"电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格

本文地址：http://www.dnpztj.cn/biancheng/1226636.html

本站网友智能工具	14分钟前发表
label_mask) # back propagation trainer.zero_grad() loss.backward() trainer.step() losses.append(().item()) print("[Epoch %d] SLMoss
本站网友广州海珠租房	21分钟前发表
length in enumerate(label_().tolist())
本站网友孕妇产后护理	14分钟前发表
label_mask) # back propagation trainer.zero_grad() loss.backward() trainer.step() losses.append(().item()) print("[Epoch %d] SLMoss
本站网友射洪二手房	1分钟前发表
本文所涉及的所有资源的获取方式：这里2.论文方法下面是本文提出GKT的体系结构
本站网友悦府山水	19分钟前发表
self).__init__() self.gkt_model = GKTet( ku_num
本站网友广州买房	9分钟前发表
dict = one
本站网友南京碧桂园凤凰城	15分钟前发表
dict = one
本站网友张国秋	8分钟前发表
边对应于它们之间的关系
本站网友脸形整形	8分钟前发表
将知识结构构建为图
本站网友利率对经济的影响	8分钟前发表
label_mask) in tqdm(train_data

【论文复现】基于图神经网络的知识追踪方法