ALEKS前首席数据科学家 Dan Bindman：多轨道的人工智能算法与智适应 -- 飞象网

近日，在2018全球AI智适应教育峰会上，来自国内外四大人工智能自适应教育机构的专家、学者对智适应教育的缘起以及前景、智适应平台的构建、以及人工算法等方面的技术等问题进行了友好的切磋和探讨。

智适应学习系统依赖于人工智能底层技术的发展，这方面来自ALEKS前首席数据科学家的 Dan Bindman有着自己独到的见解，并从技术角度解答了智适应学习系统构建的相关问题。他认为：“高质量的内容、智能AI给所有学生绘制知识转化的状态图谱，以及量身定做的选择材料”，是智适应学习系统的重要支撑点。

ALEKS前首席数据科学家Dan Bindman

Dan Bindman说：“最开始处理知识图表，要检查数据是否正确，系统是否奏效。当时真的是到了疯狂的地步，几千几万个链接，要看到每一个点、线连接绘图方面的问题。但是，这样的系统分年级却并不适用，所以需要我们建立一套模型，不完全依赖于知识点的知识图表，能够处理绘图中大部分能处理的问题。”

究竟什么样的算法模型最合适呢？Dan Bindman认为，与传统的IRT和KST等其他模型相比，多轨道模型更有优势，“通过对学生的知识状态PKS评估可以分析出学生的情况，确定他掌握知识的程度，并跟学生产生互动，继而产生的数据预测精准度就比较高。”“根据模型，可以了解在任何时候学生回答问题有三个因素，一个是学生在知识轨道的能力，二个是问题的权重，第三个是问题的中心概率值。我们通过等式就可以了解学生在某一个知识轨上，他掌握的问题权重，就可以得到他所回答的问题来。”由此看来，多轨道算法模型通过大数据、机器学习算出来的准确度更高，并且能够不断根据学生的成长度来调整学习状态，对智适应学习平台的构建具有十分重要的意义。

以下是 Dan Bindman演讲全文：

各位好！我会跟大家做一个报告，这个报告我给大家介绍一个多维的模式，用于知识评估和学习，我是来自于ALEKS的博士。

一、智·适应学习首先要有强大的内容才行，如果内容不够强大，智·适应系统就不会强。即使你体系别的内容是最好的，也不会够强大。

二、我们现在是智能AI，给所有学生绘制高知识转化的状态图谱，然后了解他们掌握了什么，没有掌握什么。

三、利用高清化图谱了解知识，这样给他量身定做选择学习素材。

在我报告当中会利用到一个新的模型，是解决第二、第三个内容。这里给到大家的模型，像可以提供代数一在线的学习，里面有成千上万的学生，这当中有很多问题在里面。这样有一个向量，可以了解学生在什么时候回答对问题，我们简称为学生的知识状态PKS，比如说有两个学生，两个学生的PKS在下面状态。学生1的PKS状态在回答问题是0.29到0.74；学生2在某一个时间回答第一个问题他的PKS0.53，到回答第四个问题时是PKS是0.35。

我们可以看到不同学生的PKS是不同的，通过对PKS的评估可以分析出学生的情况。在任何T点时，就可以了解到他们的状态。而且，不会是1数值。这是模型当中，学生对某一个问题掌握程度是部分掌握。他所得到的数值有可能比他猜到的数值高得多，这样就可以确定他掌握知识的程度，而且解析率非常高。学生的PKS可以完全反映，他对于知识掌握程度。这个里面的K是无法预先确定的知识，它有不同的知识轨，有可能是10个知识轨，也有可能是20个知识轨。要确定不同的知识轨，知识轨确定多少个？非常难，一般模型是用5个知识轨。5个知识轨问题之高，而且在这之间可以跟学生互动，在未来会产生数据，根据这些数据预测精准度就比较高。根据模型，可以了解在任何时候学生回答问题有三个因素，一个是学生在知识轨道的能力，二个是问题的权重，第三个是问题的中心概率值，就不详细解释了。这就是中心概率值，我们采用PKS-SDQ了解一个学生回答一个问题概率准确度，有一个等式来决定概率准确率。这当中有个累计的标准常态函数，这个点是向量产品。通过等式就可以了解学生在某一个知识轨上，他掌握的状态×问题权重，就可以得到他所回答的问题。

这是个5轨知识模型，学生在T点上想了解他的知识掌握怎么样？他是知识轨0.7，在知识轨2是0.4，知识轨3是-0.1，后面是0.3、0.1，这个问题权重是这样子，中心概率值是0.3，对学生来讲可以了解他的权重概率是0.3。知识轨1-知识轨3，他回答权重的问题，就可以通过这个了解。比如说他对问题4，回答的概率是负数的。就可以预测这名学生，在不同时间节点上，对问题1回答的准确度，就可以用下面这个获得PKS值。把不同的知识轨能力×问题权重，就得出最后的0.663，把它相乘时，它们对负0.2会带来影响，对于像0.1也会带来相关影响。对于知识轨4和知识轨5，所带来的有的是正面影响，有的是负面的影响。到最后，他的PKS是0.663，基于上述每一个指标，就可以了解这个学生在某一个时间节点上回答的问题准确概率是0.663。

这是另外一名学生，同样的学生给他提了不同的问题，首先看这是一个图谱，这个知识轨1和2是正值的，知识轨3和知识轨4带来的影响是负数，对于知识轨5影响很低。知识轨4的能力可以达到0.3，在对问题4的预测准确度大幅度上升。最终这个学生所得到的PKS×问题权重，就可以得到0.971个回答问题准确值。

这个PKS用起来很简单，这个教育产品有很多学生和很多数据整合在一起，一共有19000多个独特问题。采用两个东西来创建相关的问题，采用对于问题难度的估算分打分，分为1-5分。1分是最容易的，5分是最难的。然后，了解每个问题的颗粒度进行分析，主要分为五级之后，如果所有的问题属于同一类，这些问题的难度都是一样的，都是同一类的。我们还要估算这些问题的难度，这样就给它分组。在第二类耦合当中，采用五个分组，然后看看每一组的权重。这个权重在右边，可以看到五组问题权重各不相同。第一组知识轨1是0.2216，其他的组不同，知识轨2、知识轨3和知识轨5，第二个问题权重是属于负数，所以完全不同。每一组又是一致的，但是每组和每组之间的问题权重各不相同。第五组和另外这一组完全不相同，比如说第五组的知识轨2和知识轨3，我们的编排又是相耦合的。

做了很多耦合，采用更多组。到了第三层级耦合了第48组，颗粒度更多。到了第四层级耦合了142组，而且参数系数一共有850个系数进行耦合。到了第五层级一共有785组，采用1638个系数进行耦合。为什么做不同组进行耦合呢？主要采用前一组的结果耦合更高层一级的情况。

比如第三组的参数，主要是基于第二组的结果之上。在这个情况之上，都可以用估算的方式把每一组数据耦合起来。为了了解这个模型的精确程度，保留了76个学生相关的结果，一共回答了1500个问题，采用相关的参数来预测一下这些学生的PKS，来回答所有问题的程度。然后，再把数据分组，根据我们所分组的PKS进行分类。这就是前面第25行和后面25行的数据。

大家可以看到左边，是头25组学生的情况，右边是后25组，可以看到所有的答案在0-1之间，0.9546等等。他们的概率值非常耦合。第六组第25行学生当中，也可以预测到他们获得最高的概率。大家可以看到所有问题的预测，都是0.5以上，甚至高达0.99以上，所以是非常棒的数据结果。

我们会把这些分类的数据进行再一次划分，然后把它放到不同的组群里面，然后再一次进行看它可预测的PKS平均值，然后把第10组和第30组进行解释，在图表当中就可以看到具体结果。可以看到，每一组是由点构成的这些组数据是什么？右边这些Points点。我们可以看到蓝色实线的数据，就可以了解到第25组学生的数据值了。这个值R是等于0.99，是非常高的。可以看到我们进行了越来越多的预测，得到越来越多的数据。当然，也会把每一项进行耦合数据的预测，难度是非常相近的。一共有27项，这是通过1000个数据点选出的，同时通过同样的方法进行分类，分成10组同样的规模。在这里，大家可以通过上面的数据表看出来，50%获得正确的情况。也可以看到非常准确的结果，在右边蓝点图当中显示出来。

当然，在这里也会给大家展示最糟糕的数据结果。这是最糟糕的数据，可以看到它的蓝点分布情况。在这里的组其实也是非常小的，我会讲的快一点，我们如何使用PKS作为基本的衡量工具进行智·适应学习呢？可以做的是PKS会把所有学生进行比较，通过他们回答问题的方式，来比对他们的学习情况。

在这里，可以看到A有一个平均的PKS值是0.72，B学生平均的PKS值是0.68。然后我们进行比对，得出来的结论是A学生会比B学生的情况好一些。PKS是非常强大的工具来进行智·适应学习，刚才提供的方法就是为大家回答这些问题。可以了解到A学生的情况是0.72，B学生的情况是0.68，通过这样的比对可以了解到PKS有非常高的准确度和清晰度，这样可以有完整的课程知道哪些课程是A学生要学习的，哪些是B学生要进行学习的。然后A学生和B学生进行选择，进行选择之后进行优化，再进行一次PKS的问题问答环节。在这里，可以看到蓝色代表是太容易的，绿色代表最优化的，红色代表太难的。通过这种方法就可以了解到，对于A学生来说这个时间点他应该怎么样去选择。通过蓝色、红色的图表显示现在的情况，这一堂课的分布情况。比如说在这里A、B、C三门课，它的平均值是0.68、0.67、0.63，通过这一堂课有些问题是最难的，比如说这里有0.52、0.46，有些问题对于这些学生太容易了，比如说0.43。大家可以看到，C课程太难了，PKS平均值是0.43，大部分问题对于这个学生来说是没有办法回答的，红色部分特别多。不管什么原因，我们可以再继续努力，然后去解决，更多时间放在0.69到0.53这里面。我的时间到这里了，我们主要是让大家了解这个模型如何使用，以及它的技术有多强大，帮助我们去建立学生的智·适应系统。