首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|元宇宙|博客|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片报告|智慧城市|移动互联网|会展
首页 >> 移动互联网旧 >> 正文

​从一年到12秒,竹间智能助石油巨头科研效率提升千倍

2020年9月23日 15:55  CCTIME飞象网  

某大型石油国有企业在近期的科技转型中遇到了一个难题,难的不是科技项目研究本身,关键是如何避免与已有的2000多个科研项目重复立项而导致研究经费的浪费。靠员工的记忆?还是靠人工一篇篇的查看?

竹间智能通过Gemini平台赋能该企业,建立一套科技管理智能信息处理及查重服务,秒级间完成新文档与2000多份的历史项目文档的对比,解决了全量查重的问题,避免企业项目重复立项,最大化利用科研经费。

单靠人工查重真不靠谱

这家企业在原有的查重模式是通过员工的记忆加上人工查看的模式对已研或在研科技项目2000多份的历史资料进行科技项目查重,每年还会以400—500的数量在增加,而对科技项目查重的工作要求也逐年提高。平均一份项目文档有25页,近2万字,这样一份文档的查重至少需要一天的时间,每年500份的新增项目文档需要2个人花一整年的时间才能完成比对查重!如此的工作模式费时费力,查重遗漏和错误率都非常高。

通过竹间Gemini平台如何完成?

首先要将历史的2000多份文档整理入“库”进行标注和抽取,进行统一管理。对于新上传的项目书通过文档抽取工具完成文本转换及抽取,将文档抽取的转换的文本入查重库,对待查文档及历史文档进行语义分析、词句分析,计算相似结果。将查重结果汇总,供用户浏览或下载。

这一系列看似复杂的流程,而通过竹间智能的Gemini认知知识推理平台即可进行可视化操作。现在该企业进行新文档查重平均仅需12s,效率至少提高上千倍。对于员工来说只需进行一步操作——上传文档,即可查看详细查重结果。结果可精细至比对到哪些段落语义上有重复,相似率具体为多少。

竹间通过擅长的NLP技术,可对长文本进行自动实体识别抽取,实体发现,实体识别和比对。对文档的语义相似度进行匹配判断,而非简单的关键字对比。支持PDF、Word中字词句段章表格等各种非结构化文档的关键信息提取。待提取的文档类型、关键信息点可根据用户实际业务场景进行自定义配置。有别于直接将文档通过算法进行对比,平台操作化简单,结果可视拓展性也更强。

一个平台即可解决企业数据应用难题

竹间自研的一套全新模型语言——Gemini Script,内嵌可扩展的NLP深度学习模型,同时支持文档特征和语义特征识别,能够处理章节定位、抽取信息、计算、段落提炼。客户通过Gemini平台可以自主训练模型,根据客户的实际业务需求,结合竹间积累的行业数据,模型冷启动只需对3-5篇文章进行标注既可生成。并且通过自学习能力帮助文档抽取任务越变越准确,越来越聪明。客户通过Gemini平台可自主完成模型创建-训练-赋能生产的整个过程。

竹间的Gemini认知知识推理平台不仅可以进行文本的抽取和比对,还可以自动化构建知识图谱,处理大量非结构化数据,例如:产品文档、法规文档、财务报表等等,同时还可以持续不断地从数据挖掘、NLP和智能自动化中学习,从而帮助企业处理海量数据,帮助企业解决整个数据价值难题。

编 辑:T01
声明:刊载本文目的在于传播更多行业信息,本站只提供参考并不构成任何投资及应用建议。如网站内容涉及作品版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容。本站联系电话为86-010-87765777,邮件后缀为#cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
相关新闻              
 
人物
工信部张云明:大部分国家新划分了中频段6G频谱资源
精彩专题
专题丨“汛”速出动 共筑信息保障堤坝
2023MWC上海世界移动通信大会
中国5G商用四周年
2023年中国国际信息通信展览会
CCTIME推荐
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像