首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|元宇宙|博客|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片报告|智慧城市|移动互联网|会展
首页 >> 技术 >> 正文

ALEKS前首席数据科学家 Dan Bindman:多轨道的人工智能算法与智适应

2018年4月26日 15:22  CCTIME飞象网  

近日,在2018全球AI智适应教育峰会上,来自国内外四大人工智能自适应教育机构的专家、学者对智适应教育的缘起以及前景、智适应平台的构建、以及人工算法等方面的技术等问题进行了友好的切磋和探讨。

智适应学习系统依赖于人工智能底层技术的发展,这方面来自ALEKS前首席数据科学家的 Dan Bindman有着自己独到的见解,并从技术角度解答了智适应学习系统构建的相关问题。他认为:“高质量的内容、智能AI给所有学生绘制知识转化的状态图谱,以及量身定做的选择材料”,是智适应学习系统的重要支撑点。

ALEKS前首席数据科学家Dan Bindman

Dan Bindman说:“最开始处理知识图表,要检查数据是否正确,系统是否奏效。当时真的是到了疯狂的地步,几千几万个链接,要看到每一个点、线连接绘图方面的问题。但是,这样的系统分年级却并不适用,所以需要我们建立一套模型,不完全依赖于知识点的知识图表,能够处理绘图中大部分能处理的问题。”

究竟什么样的算法模型最合适呢?Dan Bindman认为,与传统的IRT和KST等其他模型相比,多轨道模型更有优势,“通过对学生的知识状态PKS评估可以分析出学生的情况,确定他掌握知识的程度,并跟学生产生互动,继而产生的数据预测精准度就比较高。”“根据模型,可以了解在任何时候学生回答问题有三个因素,一个是学生在知识轨道的能力,二个是问题的权重,第三个是问题的中心概率值。我们通过等式就可以了解学生在某一个知识轨上,他掌握的问题权重,就可以得到他所回答的问题来。”由此看来,多轨道算法模型通过大数据、机器学习算出来的准确度更高,并且能够不断根据学生的成长度来调整学习状态,对智适应学习平台的构建具有十分重要的意义。

以下是 Dan Bindman演讲全文:

各位好!我会跟大家做一个报告,这个报告我给大家介绍一个多维的模式,用于知识评估和学习,我是来自于ALEKS的博士。

一、智·适应学习首先要有强大的内容才行,如果内容不够强大,智·适应系统就不会强。即使你体系别的内容是最好的,也不会够强大。

二、我们现在是智能AI,给所有学生绘制高知识转化的状态图谱,然后了解他们掌握了什么,没有掌握什么。

三、利用高清化图谱了解知识,这样给他量身定做选择学习素材。

在我报告当中会利用到一个新的模型,是解决第二、第三个内容。这里给到大家的模型,像可以提供代数一在线的学习,里面有成千上万的学生,这当中有很多问题在里面。这样有一个向量,可以了解学生在什么时候回答对问题,我们简称为学生的知识状态PKS,比如说有两个学生,两个学生的PKS在下面状态。学生1的PKS状态在回答问题是0.29到0.74;学生2在某一个时间回答第一个问题他的PKS0.53,到回答第四个问题时是PKS是0.35。

我们可以看到不同学生的PKS是不同的,通过对PKS的评估可以分析出学生的情况。在任何T点时,就可以了解到他们的状态。而且,不会是1数值。这是模型当中,学生对某一个问题掌握程度是部分掌握。他所得到的数值有可能比他猜到的数值高得多,这样就可以确定他掌握知识的程度,而且解析率非常高。学生的PKS可以完全反映,他对于知识掌握程度。这个里面的K是无法预先确定的知识,它有不同的知识轨,有可能是10个知识轨,也有可能是20个知识轨。要确定不同的知识轨,知识轨确定多少个?非常难,一般模型是用5个知识轨。5个知识轨问题之高,而且在这之间可以跟学生互动,在未来会产生数据,根据这些数据预测精准度就比较高。根据模型,可以了解在任何时候学生回答问题有三个因素,一个是学生在知识轨道的能力,二个是问题的权重,第三个是问题的中心概率值,就不详细解释了。这就是中心概率值,我们采用PKS-SDQ了解一个学生回答一个问题概率准确度,有一个等式来决定概率准确率。这当中有个累计的标准常态函数,这个点是向量产品。通过等式就可以了解学生在某一个知识轨上,他掌握的状态×问题权重,就可以得到他所回答的问题。

这是个5轨知识模型,学生在T点上想了解他的知识掌握怎么样?他是知识轨0.7,在知识轨2是0.4,知识轨3是-0.1,后面是0.3、0.1,这个问题权重是这样子,中心概率值是0.3,对学生来讲可以了解他的权重概率是0.3。知识轨1-知识轨3,他回答权重的问题,就可以通过这个了解。比如说他对问题4,回答的概率是负数的。就可以预测这名学生,在不同时间节点上,对问题1回答的准确度,就可以用下面这个获得PKS值。把不同的知识轨能力×问题权重,就得出最后的0.663,把它相乘时,它们对负0.2会带来影响,对于像0.1也会带来相关影响。对于知识轨4和知识轨5,所带来的有的是正面影响,有的是负面的影响。到最后,他的PKS是0.663,基于上述每一个指标,就可以了解这个学生在某一个时间节点上回答的问题准确概率是0.663。

这是另外一名学生,同样的学生给他提了不同的问题,首先看这是一个图谱,这个知识轨1和2是正值的,知识轨3和知识轨4带来的影响是负数,对于知识轨5影响很低。知识轨4的能力可以达到0.3,在对问题4的预测准确度大幅度上升。最终这个学生所得到的PKS×问题权重,就可以得到0.971个回答问题准确值。

这个PKS用起来很简单,这个教育产品有很多学生和很多数据整合在一起,一共有19000多个独特问题。采用两个东西来创建相关的问题,采用对于问题难度的估算分打分,分为1-5分。1分是最容易的,5分是最难的。然后,了解每个问题的颗粒度进行分析,主要分为五级之后,如果所有的问题属于同一类,这些问题的难度都是一样的,都是同一类的。我们还要估算这些问题的难度,这样就给它分组。在第二类耦合当中,采用五个分组,然后看看每一组的权重。这个权重在右边,可以看到五组问题权重各不相同。第一组知识轨1是0.2216,其他的组不同,知识轨2、知识轨3和知识轨5,第二个问题权重是属于负数,所以完全不同。每一组又是一致的,但是每组和每组之间的问题权重各不相同。第五组和另外这一组完全不相同,比如说第五组的知识轨2和知识轨3,我们的编排又是相耦合的。

做了很多耦合,采用更多组。到了第三层级耦合了第48组,颗粒度更多。到了第四层级耦合了142组,而且参数系数一共有850个系数进行耦合。到了第五层级一共有785组,采用1638个系数进行耦合。为什么做不同组进行耦合呢?主要采用前一组的结果耦合更高层一级的情况。

比如第三组的参数,主要是基于第二组的结果之上。在这个情况之上,都可以用估算的方式把每一组数据耦合起来。为了了解这个模型的精确程度,保留了76个学生相关的结果,一共回答了1500个问题,采用相关的参数来预测一下这些学生的PKS,来回答所有问题的程度。然后,再把数据分组,根据我们所分组的PKS进行分类。这就是前面第25行和后面25行的数据。

大家可以看到左边,是头25组学生的情况,右边是后25组,可以看到所有的答案在0-1之间,0.9546等等。他们的概率值非常耦合。第六组第25行学生当中,也可以预测到他们获得最高的概率。大家可以看到所有问题的预测,都是0.5以上,甚至高达0.99以上,所以是非常棒的数据结果。

我们会把这些分类的数据进行再一次划分,然后把它放到不同的组群里面,然后再一次进行看它可预测的PKS平均值,然后把第10组和第30组进行解释,在图表当中就可以看到具体结果。可以看到,每一组是由点构成的这些组数据是什么?右边这些Points点。我们可以看到蓝色实线的数据,就可以了解到第25组学生的数据值了。这个值R是等于0.99,是非常高的。可以看到我们进行了越来越多的预测,得到越来越多的数据。当然,也会把每一项进行耦合数据的预测,难度是非常相近的。一共有27项,这是通过1000个数据点选出的,同时通过同样的方法进行分类,分成10组同样的规模。在这里,大家可以通过上面的数据表看出来,50%获得正确的情况。也可以看到非常准确的结果,在右边蓝点图当中显示出来。

当然,在这里也会给大家展示最糟糕的数据结果。这是最糟糕的数据,可以看到它的蓝点分布情况。在这里的组其实也是非常小的,我会讲的快一点,我们如何使用PKS作为基本的衡量工具进行智·适应学习呢?可以做的是PKS会把所有学生进行比较,通过他们回答问题的方式,来比对他们的学习情况。

在这里,可以看到A有一个平均的PKS值是0.72,B学生平均的PKS值是0.68。然后我们进行比对,得出来的结论是A学生会比B学生的情况好一些。PKS是非常强大的工具来进行智·适应学习,刚才提供的方法就是为大家回答这些问题。可以了解到A学生的情况是0.72,B学生的情况是0.68,通过这样的比对可以了解到PKS有非常高的准确度和清晰度,这样可以有完整的课程知道哪些课程是A学生要学习的,哪些是B学生要进行学习的。然后A学生和B学生进行选择,进行选择之后进行优化,再进行一次PKS的问题问答环节。在这里,可以看到蓝色代表是太容易的,绿色代表最优化的,红色代表太难的。通过这种方法就可以了解到,对于A学生来说这个时间点他应该怎么样去选择。通过蓝色、红色的图表显示现在的情况,这一堂课的分布情况。比如说在这里A、B、C三门课,它的平均值是0.68、0.67、0.63,通过这一堂课有些问题是最难的,比如说这里有0.52、0.46,有些问题对于这些学生太容易了,比如说0.43。大家可以看到,C课程太难了,PKS平均值是0.43,大部分问题对于这个学生来说是没有办法回答的,红色部分特别多。不管什么原因,我们可以再继续努力,然后去解决,更多时间放在0.69到0.53这里面。我的时间到这里了,我们主要是让大家了解这个模型如何使用,以及它的技术有多强大,帮助我们去建立学生的智·适应系统。

编 辑:初夏
声明:刊载本文目的在于传播更多行业信息,本站只提供参考并不构成任何投资及应用建议。如网站内容涉及作品版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容。本站联系电话为86-010-87765777,邮件后缀为#cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
相关新闻              
 
人物
工信部张云明:大部分国家新划分了中频段6G频谱资源
精彩专题
专题丨“汛”速出动 共筑信息保障堤坝
2023MWC上海世界移动通信大会
中国5G商用四周年
2023年中国国际信息通信展览会
CCTIME推荐
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像