首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|元宇宙|博客|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片报告|智慧城市|移动互联网|会展
首页 >> 移动互联网旧 >> 正文

「Ta在」全球脑知识共享平台,实现更智能的知识共享和推荐

2019年5月21日 14:17  CCTIME飞象网  

  到了 5G 时代,ECI 算法将可以吸纳更多的知识与经验。凭借着低延迟和更快的传输速度,云服务器对数据的处理速度将能媲美本地 CPU。再加上可穿戴等 IOT 设备的普及,全球脑将能发挥更大的功力。「Ta 在」已经与多家中国出海团队展开合作,探讨如何将 ECI 算法嵌入这些团队的内容推荐、电商系统,从而提升转化。「怎么让人类变得更加聪明?」在面对人类第一颗原子弹爆炸的时候,「曼哈顿计划」的创始人范内瓦·布什(Vannevar Bush)却在思考这个问题。

  那是 1945 年的 7 月。在新墨西哥州的沙漠中,相当于 20000 吨 TNT 炸药的核武器,让一朵巨大的蘑菇云在距离地表近万米的地方爆裂开来,最终在沙漠中留下一个 10 米宽的大坑。一个月后,同样的大坑出现在广岛和长崎。二战结束。

  共有九位科学家参加了这次试爆。看到如此壮观的景象竟诞生于自己的双手,科学家们很难不发表点感想。然而在那个蘑菇云升起的 7 月,布什却将一封与原子弹毫无关系的信件投书给《大西洋月刊》。在这篇题为《诚如我思》(As We May Think)的文章中,布什提出了一个悲观的结论:「人类获取的经验正在以飞快的速度增长,而我们从知识迷宫中获取信息与知识的方法,却与过去造横帆船时一样工程浩大。」

  如此庞大的问题,源于布什管理曼哈顿计划时的经验。战争之前,科学家在实验室中单打独斗,挑战特定领域中的疑难问题。曼哈顿计划则反其道而行之:国家力量让物理、化学、材料等学科的科学家走到一起,分享自己领域中的前沿知识,并进行团队合作。布什担心的是,战争即将结束,这样的思维合作还能持续下去吗?

  生物通过合作进化出更高级的智能体,这并非美国人的首创,而是自然界亘古不变的规律。以蜜蜂为例:每个个体的 IQ 并不高,但通过群体协作却可以搭建一个完美的巢穴。因此在 19 世纪,著名科学家尼古拉•特斯拉就曾预言,有朝一日世界将实现全人类的头脑连接。地球成为一个大脑,每个人都是一个神经元。

比原子弹更重要的问题:计算机如何让人变得更聪明?

  预言终究是预言。凭借人脑中的生物电,信息在神经元之间传递。但如果想让信息脱离人脑,在不同人群、学科、话题之间自由地穿梭、流动,难度显然过大。在布什看来,无论是信息的获取、储存,还是连接,都存在非常深刻且具体的问题:最优质的信息并不能第一时间抵达最需要的人;而在信息的存储方面,我们仍然依赖古典的卡片抄写、百科全书。如果我们不重新思考人与信息的关系,借助计算机的力量改进上述环节的效率,全球脑的设想将成为空中楼阁。

  布什在《诚如我思》中提出的困惑,为整整一代计算机和互联网发明家们指明了奋斗目标。原子弹爆炸的 74 年后,我们已经让机器在信息的获取和储存方面扮演了重要角色。搜索引擎、内容分发算法、社交网络让每个人的空余时间迅速被各种信息填满。无论是圣母院大火还是明日限号,我们都知道的一清二楚。

  然而在信息的连接上,我们依然没有过多的突破。人类有自己的思维模式,头脑攫取一项信息后,会立即联想到另外一条信息。布什对此大加赞赏,并写道:「人类行为的速度,头脑轨迹的复杂性,想象的细致入微,这恰恰是机械化的索引做不到的......人类不能希望人工的完全复制精神过程,但是人类肯定能从这个过程中学到东西。」

比原子弹更重要的问题:计算机如何让人变得更聪明?

  当我们以此作为标准,回顾过去几十年互联网的变迁时,会发现它离「信息连接」的初衷越来越远。小部分人设定的、标签化的算法,束缚了人自由探索知识边界的能力。更多的内容,并没有让我们得到认知升级,反而因为信息过载而感到焦虑。

  为什么会出现这样的问题?

  社交媒体无法解决知识共享的问题

  如果我们把人与信息的互动分为三个环节:获取、储存、连接;计算机看似在前两个环节中做得不错,却在「连接」上无能为力。实际上,无能为力恰恰是因为计算机在帮助人类获取和储存信息方面,做得还不够好。

比原子弹更重要的问题:计算机如何让人变得更聪明?

  目前,用户从互联网上获取信息的途径有很多种,常见的包括知识系统(如维基百科、百度百科等)、推荐系统(今日头条、一点资讯等)和搜索系统(谷歌、百度等)等。不同系统的底层逻辑都不尽相同:

  - 知识系统基本是利用条目式系统来创建和维护词条和知识点

  - 推荐则更多的是根据内容或者用户之间的关联来选择用户可能感兴趣的内容

  - 搜索则本质上是基于关键词和内容间的匹配程度来呈现结果

  虽然上述几类系统各自都已经取得了巨大的成功,但也都遇到各自的问题和发展瓶颈。最主要的原因在于,这些系统由少部分人进行的、自上而下的知识传播,并没有动用到所有人的大脑。

  我们先来看包括知识系统和社交媒体在内的「知识网站」。它们的优点是信息颗粒度低,可以覆盖海量的内容。缺点也很明显,一个是层出不穷的新知识点的编制和维护非常艰巨繁琐,容易产生疏漏。其次就是它们都无法根据知识的变化、相互联系,进行进一步的演化、自组织。

  这一情况在实际使用中非常明显。维基百科不能发现、应对新的知识,只能靠用户去创建新的知识。而知乎则是被动吸取知识,需要有人来提出问题,才能建立新的知识点。这是因为由用户 UGC 生成的内容包含的意义千变万化,机器光是理解内容本身就很吃力,更遑论理解那些难以用语言清晰描述的意识和感觉层面的知识,再去抽象出知识之间的联系。

  除了知识网站之外,今天的许多用户还依靠类似今日头条的推荐系统获取信息。这类系统大部分采用的是一个固化的神经网络。为了建立人与机器的联系,算法会设立标签机制。内容被编辑手工或 NLP 模型打上标签,基于协同过滤的算法使得用户与标签产生映射关系。这种做法的问题是它依赖单维度的标签描摹用户,因此有时候出来的结果是不合常理、扭曲或者是失真的,常常会放大一个人对于特定内容的好恶。此外,很多高质量的内容可能本身并不包含清晰的标签,像是音频、视频、图片等更是难以用关键词进行描述。

  最后一类则是基于关系链的社交媒体,比如微博和 Facebook。这类产品仅依靠用户间的共同兴趣进行信息传递,但由于缺乏系统性的知识结构作为支撑,因此只能还原人与人基于人际关系链的物理链接,难以就个人思想与知识的表达做交流。

  举个例子,我想在微博上了解有关日本文化的信息,但唯一的途经就是关注一个「日本文化博主」。他的确会发很多我感兴趣的内容,但也经常会分享自己的个人生活——这部分对我来说就是信息过载。

  此外,受制于唯流量论,关注一个人越来越不是因为双方有共鸣,而是因为对方更有话语权。相较于「人人皆能振臂一呼」的 BBS,以 Facebook、微博为代表的社交网络用关联者、粉丝来限定信息的传播力,而这种传播力甚至可以用商业化的手段进行营销推广。这使得它们不再是一个公平的、以观点和内容传播的平台。当社交的属性发挥得越来越强的时候,知识的属性就会越来越弱。

  因此,我们可以总结出现有信息获取方式的几个问题:

  - 信息过度依赖(少部分)人传播,导致推荐质量下降

  - 缺乏自我演化能力,适应新信息较慢

  - 产品更关注关系链的稳定,而非知识传播的效率

  - 标签系统让人无法成为「互联网上的游牧民」,自由地在不同内容之间自由漫步,反而被一个个标签关在小格子里

  出于这些原因,现有的工具只能充当「信息源」的角色。它们在本质上是以机器为中心创造的,而不是以人为中心创造的,无法与我们有机的思维过程产生碰撞。无论是知乎还是维基百科,它们更像是一部由超高速 CPU 编纂的词典,是海量的「机械化索引」的聚合体。

  作为用户,我们希望工具代替我们去做搜索、查找之类的「脏活累活」,以便让我们有更多时间可以理解、消化新知。这就需要工具可以尽可能贴合人的思考模式,像人一样去寻找、剪辑、联想、思考。

  是否有一种可能,信息可以脱离人,自由地在互联网上进行传递,碰撞,连接?用户不再需要关注某人,就可以获得准确的信息。信息分发也不再需要被打上标签、被博主转发、被志愿者维护,而是由一个吸收群体智慧的「全球脑」决定。这个「全球脑」可以在每个人的帮助下,进行自主进化、生长,了解信息与信息之间的关系,做到真正的连接。

  KNS 知识网络

  2015 年开始,「Ta 在」团队就开始在美国创造一套全新的算法,为的就是解决上述问题。在这套名为 ECI 的演化群体智能算法下,人与人可以不基于认识等社交关系去连接,而是通过大脑的知识特征、兴趣属性自动建立连接,建立超越个体智慧的群体智能。在完成这套算法后,团队于 2018 年 11 月上线了世界首款以实现全球脑为目的的 KNS(Knowledge Network Services,知识关系服务)产品,「Ta 在」。

比原子弹更重要的问题:计算机如何让人变得更聪明?

  ECI 算法的一大优点就是自我演化。这是目前绝大多数信息获取方式都存在的软肋。举个例子:亚马逊与淘宝等电商是基于标签系统,根据用户看过的商品产生新推荐。这种做法更像是机器(及背后数量有限的程序员)对用户的购买行为进行范式识别,推测用户可能喜欢什么东西。这种机器逻辑有时可以导致非常糟糕的用户体验,比如会根据用户买过的商品,把所有同类产品都反复推荐给用户。

  而 ECI 算法的内容分发逻辑则是基于多人判断,而不是通过局部个体(如逻辑与内容审核人员)的好恶。它会学习大量用户的使用习惯,然后对单一用户进行信息分发,然后再根据用户的反应来矫正系统判断,推送给用户,如此反复学习。在长期的互相判断过程中,ECI算法持续演化,以达到增进群体智慧的目的。

  每个人都会享受到全平台所有人的判断贡献。最直观的例子,就是每个「Ta在」里的帖子下的相关推荐是动态的,根据群体的协同判断下长期演化并持续变化调整,从而越来越全面越来越精准。

比原子弹更重要的问题:计算机如何让人变得更聪明?

  与这种动态算法相对应的,是一种同样演化的知识分类。现有的 SNS 或依靠人工编辑去归类,或依靠内容发布者有意识去加标签归类。这显然是一种现实下的妥协之举:一部电影可以分出很多类别,且每个类别都非常复杂多样,因此依靠人工去精准认定标识显然是不可能的。

  「Ta在」则用 ECI 算法去标识内容。同一个内容可被分在多个标签维度(知识属性维度),且这种分类始终处于演化的状态。它杜绝了内容埋得过深,从而无法被发现、连接的问题。平台始终可以非常灵活地调取内容。

  最能充分利用这种演化分类优势的,是问答与知识检索产品。现有平台存在的最大缺点,在于一个问题的发起,要先找到对应问题具体分类下的回答者。这种做法无疑是违背直觉的。

  在 ECI 算法下,用户只要扔出问题或内容,算法就能自动根据内容与问题的特征属性,自动连接相应的内容或人,间接建立人和知识的连接,最终把知识传播给有相同爱好的人。谷歌与百度都无法做到这一点,因为它们现有的标签式算法无法通过它们穷尽人复杂多维的属性。

  当演化逐渐趋于稳定后,就会形成稳定的知识结构与人际结构。ECI 算法可以计算每个内容点、知识点与兴趣点与其它内容点知识点兴趣点之间有多大的关系?它们有多大的相似度?或彼此间有什么关联?当这种关系越来越分析精准清晰后,「Ta在」就会最终形成一个庞大的知识体系、知识图谱与知识库。

  那么,这个算法要进化到什么样子,才算得上够智能?为了解释这一点,「Ta 在」为自己的全球脑平台设定了一个名为 CIQ 的数值,用来描述平台的智力水平。目前,「Ta在」平台 CIQ 数值是 18,这说明相当于一个智商 18 的人。但即便如此,ECI 算法也已经发挥出了巨大的潜力。目前「Ta在」的问答帖回复率很高,说明算法将问题推送到了本身是对问题有兴趣、甚至是有经验的人那里。

  当 CIQ 达到 100 的时候,「Ta 在」平台的知识量就等同于知乎的量级。随着内容广度的增加,算法也可以更快速的对内容进行关联。当 CIQ 达到 1000 时,知识量就是谷歌的量级。一篇文章发出 10 - 20 秒后,瀑布流就会出现非常相近的其它内容推送。

  除了自主演化与混合智能(结合人和机器的判断)之外,ECI 算法最重要的一点就是可以充分利用用户规模化,持续提升用户体验。对于其他社交平台而言,用户增长对于用户的边际收益递减。用户与内容的量级越大,在点击内容后将有越大量级的垃圾的内容向你涌来。而在 ECI 算法下,用户量级越大,作为分发引擎的「全球脑」将可以学习更多用户使用习惯,提升智能,从而让推送给用户的内容将越是精确,垃圾内容会越少。

比原子弹更重要的问题:计算机如何让人变得更聪明?

  目前,「Ta 在」团队已经在自己的内容产品中验证了 ECI 算法的威力。根据团队的介绍,他们下一步希望将算法接入外部平台,用一种较轻的模式探索其在 ToB 场景下的潜力。

  我们在上面提到,现有的许多电商、内容平台,都利用了标签系统进行内容推荐,缺乏自我演化、学习的能力。这一方面让平台上的 B 端缺乏消费洞察,无法提升购买转化率,更让用户经常会接收到垃圾信息,造成信息过载。

  几年前,「骨灰盒」的新闻就在一定程度内引起轩然大波。某用户在淘宝上偶然搜了一次该款商品,但系统在之后的一段时间内就反复给他推荐同类商品。归根结底,这在于淘宝背后的推荐算法并不懂「骨灰盒」到底是一款什么样的商品:它的功能属性、使用频次到底是什么样的。

  ECI 算法就会避免这样的错误,因为它真的理解每款商品是什么,并能根据用户情况、兴趣进行推荐,让推荐引擎可以真的帮助用户,而不是垃圾信息的生产器,促进真的购买。随着购买量增加,电商平台电商平台又可以根据用户的消费心理得到更多的用户洞察,比如计算出从未有过的商品关系,并实现创新的商品推荐,更高效地刺激连带消费。换句话说,亚马逊上原来可能在尿片旁边只会推荐奶粉。然而根据 ECI 算法,它可能会推荐啤酒等奶爸感兴趣的产品。

  到了 5G 时代,ECI 算法将可以吸纳更多的知识与经验。凭借着低延迟和更快的传输速度,云服务器对数据的处理速度将能媲美本地 CPU。再加上可穿戴等 IOT 设备的普及,全球脑将能发挥更大的功力。

  以教育行业为例。我们在上面已经提过,ECI 算法让「Ta 在」产品中的问答模块活跃率非常高,因为它可以连接、拓宽知识点。这一路径也可以被应用到其他的教育产品中,成为 5G 时代的一个重要应用。

  众所周知,许多教育产品以视频为主要形态,而视频内容的结构化又非常困难,还停留在人工打标签、做目录系统的阶段。数据传输速度的加快,可以让视频被全球脑学习并分发。产品将可以真正打破现有千篇一律的教育大纲,在知识体系中做出横向探索,判断用户在学习过程中的兴趣以及主动性。由 ECI 驱动的问题搜索,不仅可以做到返回文字结果,更能返回相关的图片、视频等深度信息。这将大大有别于 4G 时代的体验。

  目前,「Ta 在」已经与多家中国出海团队展开合作,探讨如何将 ECI 算法嵌入这些团队的内容推荐、电商系统,从而提升转化。区别于之前全球脑产品「Ta 在」,这些外部合作将成为 ECI 算法的热启动。团队希望可以以技术入股、分红等较轻的模式,与外部产品展开合作。只有这样,才能让 ECI 算法进入到更大的世界中,吸收更多人的知识与经验,从而不断提升算法的智能。

  计算机科学家 Alan Kay 曾说过:「最好的工具,开始可以激发人类创作的灵感。」在懂得自我演化、学习的 ECI 算法帮助下,知识不再是毫无生气地被随意堆放在硬盘角落,而是可以自由流动、连接。这种连接必将为所有人创造更多的思维火花。到那个时候,「用计算机提升人类智力」的一天,终将到来。

编 辑:T01
声明:刊载本文目的在于传播更多行业信息,本站只提供参考并不构成任何投资及应用建议。如网站内容涉及作品版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容。本站联系电话为86-010-87765777,邮件后缀为#cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
相关新闻              
 
人物
工信部张云明:大部分国家新划分了中频段6G频谱资源
精彩专题
专题丨“汛”速出动 共筑信息保障堤坝
2023MWC上海世界移动通信大会
中国5G商用四周年
2023年中国国际信息通信展览会
CCTIME推荐
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像