当前位置:首页 > 电子标准院 >

电子标准院:知识图谱助力防控和复工复产案例集

  • 2021年08月26日
  • 50 金币

知识图谱助力疫情防控和复工复产案例集(第一期) 知识图谱 院 助力疫情防控和复工复产案例集 究 (第一期) 研 化 准 标 术 技 子 电 国 中 主编单位:中国电子技术标准化研究院 二零二零年三月 I 牵头编写单位 中国电子技术标准化研究院 联合编写单位 案例1:大数据与知识图谱保障复工复产“一路畅行” 电科云(北京)科技有限公司 案例2:基于“交管云脑”的一体化疫情防控平台 院 究 研 海信集团 案例3:智能“分析师”助力疫情应急管理防控 化 拓尔思信息技术股份有限公司 准 标 案例4:远程智能诉讼推动司法领域复工复产 北京华宇软件股份有限公司 术 案例5:基于知识图谱的智能疫情监测服务平台 海乂知信息科技(南京)有限公司 技 案例6:基于知识图谱的产品追溯系统为医疗资源“保驾护航” 联想集团 子 案例7:“公安云脑+AI测温”筑牢疫情防控第一道防线 海信集团 电 案例8:疫情智能作战平台“精准致导”安全隐患 国厦门渊亭信息科技有限公司 案例9:智能问答小助手上线普及新冠肺炎防护知识 中南京柯基数据科技有限公司 案例10:传染病大数据防控系统“深度挖掘”潜在传播者 杭州依图医疗技术有限公司 II 案例11:打造医学智库全面服务新冠疫情防控 平安国际智慧城市科技股份有限公司 案例12:智能外呼机器人“打通”社区防控最后一公里 苏州思必驰信息科技有限公司 案例13:知识图谱疫情智能分析平台辅助“智慧防疫” 南京柯基数据科技有限公司 案例14:基于新冠知识图谱的疫情智能问答 院 究 研 小米科技有限责任公司 案例15:重点疫情人员图谱强化疫情防控管理 化 准 成都数联铭品科技有限公司(BBD) 案例16:知识图谱平台保障防控物资应急调度 标 浙江蚂蚁小微金融服务集团股份有限公司 术 案例17:疫情防控政务问答助手“一键即知”——有问必答 北京欧拉认知智能科技有限公司 技 案例18:知识图谱赋能疫期汽车线上智能营销新模式 北京车之家信息技术有限公司 子 电 国 中 III 编写组成员 中国电子技术标准化研究院 韦 莎 李瑞琪 李 佳 纪婷钰 电科云(北京)科技有限公司 张 超 刘昆鹏 周 颖 院 究 海信集团有限公司、海信网络科技有限公司 郝旭宁 王雯雯 张淯易 研 拓尔思信息技术股份有限公司 王亚强 岳 松 化 北京华宇软件股份有限公司 郭晓妮 徐敏霞 海乂知信息科技(南京)有限公司 准 标 张卓娅 联想集团 术 技 杨 帆 范雪琴 厦门渊亭信息科技有限公司 子 洪万福 王 彬 电 南京柯基数据科技有限公司 王虎斌 吴 刚 国杭州依图医疗技术有限公司 颜子夜 赵春昊 中平安国际智慧城市科技股份有限公司 倪渊 IV 苏州思必驰信息科技有限公司 缪庆亮 初 敏 小米科技有限责任公司 王献敏 刘作鹏 成都数联铭品科技有限公司(BBD) 任 渝 刘有元 浙江蚂蚁小微金融服务集团股份有限公司 李克鹏 施江敏 北京欧拉认知智能科技有限公司 院 究 研 化 王绪刚 北京车之家信息技术有限公司 准 杨 雷 石智中 标 术 富士康工业互联网股份有限公司 张学琴 技 山东舜网传媒股份有限公司 韩强 子 编辑组成员 电 李 佳 李瑞琪 国 中 V 前 言 当前,新型冠状病毒感染的肺炎疫情防控形势依然严峻复杂,复工复产 工作正在统筹推进。为了贯彻落实习近平总书记对疫情防控工作的重要指示精 神,工业和信息化部发出《充分发挥人工智能赋能效用 协力抗击新型冠状病毒 院 究 感染的肺炎疫情》倡议书,号召全国人工智能相关学(协)会、联盟、企事业 单位凝心聚力、众志成城,共同助力疫情防控和复工复产。 研 知识图谱作为机器认知智能实现的基础之一,是人工智能的重要组成部 分,在“抗疫”行动中赋能政府管理、公众健康、交通运输、公共安全等多个 化 领域共同助力疫情防控和复工复产。疫情监测服务平台、疫情态势感知与辅助 研判系统、密切接触者挖掘系统、医学智库、智能防疫知识问答系统、人口排 准 查及防控系统、物资应急调度平台、远程智能诉讼服务平台、智能外呼机器人 等一批知识图谱相关软件、系统、平台和解决方案等产品紧急上线支援“前 线”,并在实践中得到检验和应用。 标 术 中国电子技术标准化研究院依托IEEE知识图谱标准化工作组及知识图谱国 家标准编制工作组收集了18个优秀应用案例,从需求背景、技术框架、难点挑 技 战、成效意义、下一步工作计划等多个方向进行案例解读,旨在及时总结和宣 传推广一批好经验好做法,为全面支持疫情科学防控、加快企业复工复产和强 子 化服务保障工作提供知识图谱相关技术和服务支持。工作组后续将继续推动知 识图谱在疫情防控和复工复产应用案例征集和推广工作。 电 由于案例收集时间仓促,恐有纰漏或不严谨之处,敬请谅解。 国 中 VI 知识图谱标准化工作介绍 IEEE知识图谱标准化工作组和知识图谱国家标准编制工作组,由中国电 子技术标准化研究院牵头,联合多家知识图谱相关企事业单位、研究院所、高 校、机构,旨在运用标准化的理念、方法和技术梳理分析知识图谱领域核心标 院 究 准化需求,共同推动知识图谱关键标准的研制等工作,支撑知识图谱技术的高 质量推广与应用。目前,在研的IEEE标准、国家标准和已发布成果物如下: (一)在研标准 研 化 1. IEEE P2807系列标准 经IEEE标准协会批准,IEEE知识图谱标准化工作组(IEEE/C/SAB/KG_ 准 WG)于2019年8月正式成立,当前工作组在研标准如下: IEEE P2807 标 Framework of Knowledge Graph 《知识图谱架构》 IEEE P2807.1 术 Standard for technical requirements and evaluating knowledge graphs 《知识图谱技术要求与测试评估规范》 IEEE P2807.2 技 Guide for Application of Knowledge Graphs for Financial Services 《金融服务领域知识图谱应用导则》 子 链接:http://www.cesi.ac.cn/201908/5522.html 2. 国家标准 电 根据国家标准化管理委员会于2019年7月下达的2019年第二批国家标准制 修订计划(国标委发[2019]22号),《信息技术 人工智能 知识图谱技术框架》 国(国标计划号:20192137-T-469)正式获得立项。2019年12月国家标准启动会 成功召开,同期成立知识图谱国家标准编制工作组,开始研制工作。 中 链接:http://www.cesi.ac.cn/202001/5980.html VII (二)发布成果 2019年8月27日,《知识图谱标准化白皮书》于2019中国国际智能产业博 览会——第二届智能制造高峰论坛成功发布。白皮书根据当前知识图谱技术发 展情况及在多个领域的成功实践,从哲学、政策、产业、行业、技术、工具、 支撑等多个层面对知识图谱的实际需求、关键技术、面临的问题与挑战、标准 院 究 化需求、展望与建议等进行了梳理,涉及智慧金融、智慧医疗、智能制造、智 慧教育、智慧政务、智慧司法、智慧交通等十五个领域,并初步提出了知识图 研 谱技术架构和标准体系框架等,以期对未来知识图谱在更多行业的推广应用及 标准研制提供支撑。 链接:http://www.cesi.cn/201909/5588.html 化 准 标 术 技 子 电 国欢迎知识图谱相关的企事业单位、研究院所、高校、科研机构等相关组织 中加入我们,共同推进知识图谱标准化工作! 联系人: 李 佳 lijia@cesi.cn 李瑞琪 lirq@cesi.cn VIII 目 录 案例1 大数据与知识图谱保障复工复产“一路畅行” ……………… 1 … 01 案例背景 …………………………………………………………… 1 … 院 究 02 技术框架 …………………………………………………………… 1 … 03 难点与挑战 ………………………………………………………… 3 … 研 04 案例成效 …………………………………………………………… 3 … 化 05 案例意义 …………………………………………………………… 4 … 06 下一步工作计划 …………………………………………………… 5 … 准 案例2 基于“交管云脑”的一体化疫情防控平台 …………………… 6 … 标 01 案例背景 …………………………………………………………… 6 … 术 02 技术框架 …………………………………………………………… 6 … 03 难点与挑战 ………………………………………………………… 7 … 技 04 案例成效 …………………………………………………………… 7 … 05 案例意义 …………………………………………………………… 9 … 子 06 下一步工作计划 …………………………………………………… 9 … 电 案例3 智能“分析师”助力疫情应急管理防控 ………………… 11 … 国01 案例背景 ………………………………………………………… 11 … 02 技术框架 ………………………………………………………… 11 … 中 03 难点与考验 ……………………………………………………… 12 … 04 案例成效 ………………………………………………………… 12 … 05 案例意义 ………………………………………………………… 13 … IX 06 下一步工作计划 ………………………………………………… 14 … 案例4 远程智能诉讼推动司法领域复工复产 …………………… 15 … 01 案例背景 ………………………………………………………… 15 … 院 究 02 技术框架 ………………………………………………………… 15 … 03 难点与挑战 ……………………………………………………… 17 … 研 04 案例成效 ………………………………………………………… 17 … 05 案例意义 ………………………………………………………… 18 … 化 06 下一步工作计划 ………………………………………………… 19 … 准 案例5 基于知识图谱的智能疫情监测服务平台 ………………… 20 … 标 01 案例背景 ………………………………………………………… 20 … 02 案例技术框架 …………………………………………………… 20 … 术 03 难点与挑战 ……………………………………………………… 21 … 技 04 案例成效 ………………………………………………………… 22 … 05 案例意义 ………………………………………………………… 24 … 子 06 下一步工作计划 ………………………………………………… 24 … 电 案例6 基于知识图谱的产品追溯系统为医疗资源“保驾护航” … 26 … 国01 案例背景 ………………………………………………………… 26 … 02 技术框架 ………………………………………………………… 26 … 中03 难点与挑战 ……………………………………………………… 27 … 04 案例成效与意义 ………………………………………………… 28 … 05 下一步工作计划 ………………………………………………… 31 … X 案例7 “公安云脑+AI测温”筑牢疫情防控第一道防线 ………… 33 … 01 案例背景 ………………………………………………………… 33 … 02 技术框架 ………………………………………………………… 33 … 03 难点与挑战 ……………………………………………………… 36 … 院 04 案例成效 ………………………………………………………… 36 … 究 05 案例意义 ………………………………………………………… 37 … 研 06 下一步工作计划 ………………………………………………… 38 … 化 案例8 疫情智能作战平台“精准致导”安全隐患 ………………… 39 … 01 案例背景 ………………………………………………………… 39 … 准 02 技术框架 ………………………………………………………… 39 … 标 03 难点与挑战 ……………………………………………………… 44 … 04 案例成效与意义 ………………………………………………… 44 … 术 05 下一步工作计划 ………………………………………………… 44 … 技 案例9 智能问答小助手上线普及新冠肺炎防护知识 ……………… 47 … 子 01 案例背景 ………………………………………………………… 47 … 02 技术框架 ………………………………………………………… 47 … 电 03 难点与挑战 ……………………………………………………… 48 … 04 案例成效 ………………………………………………………… 49 国… 05 案例意义 ………………………………………………………… 51 … 中 06 下一步工作计划 ………………………………………………… 52 … 案例10 传染病大数据防控系统“深度挖掘”潜在传播者 ……… 53 … 01 案例背景 ………………………………………………………… 53 … XI 02 技术框架 ………………………………………………………… 54 … 03 难点与挑战 ……………………………………………………… 54 … 04 案例成效 ………………………………………………………… 55 … 05 案例意义 ………………………………………………………… 56 … 院 06 下一步工作计划 ………………………………………………… 56 … 究 研 案例11 打造医学智库全面服务新冠疫情防控 …………………… 57 … 01 案例背景 ………………………………………………………… 57 … 化 02 技术框架 ………………………………………………………… 58 … 准 03 难点与挑战 ……………………………………………………… 59 … 04 案例成效 ………………………………………………………… 60 … 标 05 案例意义 ………………………………………………………… 61 … 06 下一步工作计划 ………………………………………………… 61 … 术 技 案例12 智能外呼机器人“打通”社区防控最后一公里 ………… 63 … 01 案例背景 ………………………………………………………… 63 … 子 02 技术框架 ………………………………………………………… 64 … 03 难点与挑战 ……………………………………………………… 65 … 电 04 案例成效与意义 ………………………………………………… 65 … 国05 下一步工作计划 ………………………………………………… 66 … 中案例13 知识图谱疫情智能分析平台辅助“智慧防疫” ………… 68 … 01 案例背景 ………………………………………………………… 68 … 02 技术框架 ………………………………………………………… 69 … XII 03 难点与挑战 ……………………………………………………… 70 … 04 案例成效 ………………………………………………………… 70 … 05 案例意义 ………………………………………………………… 71 … 06 下一步工作计划 ………………………………………………… 72 … 院 究 案例14 基于新冠知识图谱的疫情智能问答 ……………………… 73 … 研 01 案例背景 ………………………………………………………… 73 … 02 技术框架 ………………………………………………………………… … 化 03 难点与挑战 ……………………………………………………… 74 … 准 04 案例成效 ………………………………………………………… 75 … 05 案例意义 ………………………………………………………… 75 … 标 06 下一步工作计划 ………………………………………………… 76 … 术 案例15 重点疫情人员图谱强化疫情防控管理 …………………… 77 … 技 01 案例背景 ………………………………………………………… 77 … 02 技术框架 ………………………………………………………… 77 … 子 03 难点与挑战 ……………………………………………………… 78 … 04 案例成效 ………………………………………………………… 78 … 电 05 案例意义 ………………………………………………………… 81 … 国06 下一步工作计划 ………………………………………………… 81 … 中 案例16 知识图谱平台保障防控物资应急调度 …………………… 83 … 01 案例背景 ………………………………………………………… 83 … 02 技术框架 ………………………………………………………… 83 … XIII 03 难点与挑战 ……………………………………………………… 84 … 04 案例成效与意义 ………………………………………………… 85 … 04 下一步工作计划 ………………………………………………… 86 … 院 案例17 疫情防控政务问答助手“一键即知”——有问必答 …… 87 究 … 01 案例背景 ………………………………………………………… 87 … 研 02 技术框架 ………………………………………………………… 87 … 03 难点与挑战 ……………………………………………………… 88 … 化 04 案例成效与意义 ………………………………………………… 88 … 准 05 下一步工作计划 ………………………………………………… 89 … 标 案例18 知识图谱赋能疫期汽车线上智能营销新模式 …………… 91 … 01 案例背景 ………………………………………………………… 91 … 术 02 技术框架 ………………………………………………………… 92 … 技 03 难点与挑战 ……………………………………………………… 92 … 04 案例成效 ………………………………………………………… 93 … 子 05 案例意义 ………………………………………………………… 94 … 06 下一步工作计划 ………………………………………………… 94 … 电 国 中 XIV 案例1 知识图谱助力疫情防控和复工复产案例集(第一期) 大数据与知识图谱保障复工复产 “一路畅行” 院 究 面向区域 全国各省市县区 案例类型 复工复产 服务领域 公众健康 政府管理 产品类型 研 复工复产通用 管理系统 01 案例背景 化 准 新型冠状病毒感染肺炎疫情的爆发给政府管理和企业经营工作带来 标 了巨大的困难与挑战。为解决国家在疫情防控和复工复产方面的迫切需 求,中国电子科技集团公司联合国务院办公厅电子政务办公室、国家卫 术 生健康委员会成立了疫情防控大数据攻关团队。基于国家卫生健康委员 会、交通运输部、铁路总公司和民航总局等多家部委提供的权威数据, 技 综合运用大数据、知识图谱等技术,研发了“一网畅行”复工复产通用 管理系统。系统能够提供个人密接情况查询、基层住户健康情况精准管 子 控、交通站点流动人员健康情况自动识别、企业员工健康状态掌握等功 能,为政府、企业以及个人的疫情防控和复工复产提供了重要依据。 电 02 技术框架 国本案例运用大数据和知识图谱技术进行数据采集汇总、知识抽取转 中 换、疫情关联查询等操作,将补充完善的疫情确诊信息和疑似数据存储 到知识库中以供应用开发,通用管理系统中知识图谱构建技术框架如图 1-1所示。 1 知识图谱助力疫情防控和复工复产案例集(第一期) 院 究 研 化 准 图1-1 “一网畅行”复工复产通用管理系统数据框架 标 本案例的数据来源包括:卫健委官方发布的权威数据(结构化数 据)、通过app采集到的群众举报信息(半结构化数据)以及涵盖确认病 术 例行动轨迹的相关信息(非结构化轨迹文本数据)。通过多方数据源的 链接消歧和对比印证,补充完善确诊病例的行为轨迹,并筛选出密切接 技 触的疑似数据。疫区、确诊人员信息、关联交通工具等确诊数据及疑似 数据将以关联知识网络的数据结构存储到图数据库中,支撑疫情领域知 子 识图谱的构建。 通过梳理病例人员、疫区、交通工具和活动等实体类别及其关联关 电 系,本案例实现了疫情图谱的本体构建。首先,借助结构化图谱构建工 具,完成基于卫健委提供的结构化数据源的实体抽取和关系构建,基本 国形成疫情知识图谱基本态。其次,通过app完成群众举报数据收集,并借 助实体融合工具,实现对举报数据的核验工作,补充完善疫情图谱。最 中 后,针对病例行为轨迹文本进行知识抽取。 本案例的开发过程涉及知识图谱相关的多项技术。通过网络爬虫技 术,完成病例轨迹的搜集和预处理工作;通过规则匹配以及自然语言处 理技术,识别确诊人员的移动轨迹;通过数据分析技术,筛选匹配轨迹 2 知识图谱助力疫情防控和复工复产案例集(第一期) 文本与图谱中确诊病例信息;对筛选结果进行人工判别,并补充存储到 疫情图谱中,完善确诊人员轨迹信息。 03 难点与挑战 数据来源多、分布广、结构复杂导致数据获取难度大。本案例涉及 院 究 的数据源包括:卫健委官方数据、群众举报数据、确诊病例的轨迹 文本数据。其中,确诊病例的轨迹文本数据有赖于通过市级微信公 研 众号、新浪微博等网络爬取获得,数据获取工作难度大。 化 文本格式多样、专有名词与通用名词混杂,导致数据消歧难度大。 本案例中确诊病例的轨迹数据存储在轨迹文本中,且轨迹文本格式 准 复杂多样,涉及各类交通工具、专有名称等,数据解析难度大。此 外,本案例需要考虑如何将每条轨迹文本准确的匹配到知识图谱 标 中,除人工校验工作外,海量信息过滤也是必备工作之一。 术 04 案例成效 实现了疫情态势分级展现、精细化管理。“一路畅行”复工复产通 技 用管理系统能够逐级展现出全国、省级、地级、县级四级管理门 户,自动构建四级指挥平台,实施对密切接触者、病人、疑似病 子 人、治愈者、死亡者数量及每日变化、县域风险等级的精细化管 理,搭建了劳务输入和劳务输出的对接平台,在无风险的地方招 电工,去无风险的地方工作,让无风险的人群自由流动。 国覆盖多类型用户和多领域场景的功能应用。在“一路畅行”复工复 产通用管理平台的网站上,部署了“密切接触者测量仪”、社区 中 (村镇)楼宇“小管家”、交通站点“小战士”、部门企业“小帮 手”、用工对接“小达人”五个软件APP,各级政府可根据需要扫码 下载,既可单独使用,又可组合成管理体系,快速帮助各级政府精 确管控。而且,用户仅需手动输入姓名、身份证号码即可查询自己 3 知识图谱助力疫情防控和复工复产案例集(第一期) 是不是密切接触者,也可以用于地方、部门、企业批量筛查风险人 群,做到心中有“数”,提供“密接态势”功能,为公众提供国家 卫健委权威发布的确诊、疑似病例地理分布和行动轨迹信息,提供 更加详细、具体的疫情发展提示和出行参考。 实现了广泛应用全面防疫。密切接触者测量仪系统自2月8日上线以 院 究 来得到了广泛应用,截止到2月17日,密切接触者测量仪累计查询 量已经超过1.5亿人次,自我发现的新冠肺炎病人密切接触者超过9 研 万人,为个人防护和政府企业防疫决策提供了重要依据,并先后被 《人民日报》、央视《朝闻天下》和《新闻直播间》等权威媒体报 道关注。 化 准 标 术 技 子图1-2 “一网畅行”复工复产通用管理系统功能界面展示 电 05 案例意义 国在新冠肺炎疫情防控的攻坚时刻,基于大数据和知识图谱的防疫通 用管理系统针对公众、企业、社区、交通等不同领域疫情防控提供了便 中 捷手段,为个人防护、政府企业防疫决策提供了重要依据。同时,系统 可在劳务用工对接、公共交通管理和学校等各行各业实现复制推广。 4 知识图谱助力疫情防控和复工复产案例集(第一期) 06 下一步工作计划 “一网畅行”复工复产通用管理系统包含了结构化数据、文本等 多类型数据,且面向全国范围,导致其数据量庞大,在病例轨迹精确解 析、图谱构建数据融合和应用数据加载等方面仍存在一定的优化空间。 未来,拟结合深度学习技术优化疫情图谱构建过程,采用数据压缩技术 院 优化应用数据加载效果。 究 企业简介 研 电科云(北京)科技有限公司 化 电科云(北京)科技有限公司是世界500强企业中国电子科技集团 有限公司全资控股的有限责任公司,成立于2019年1月,总部位于北京 准 市,在上海、成都、合肥、南京等地设有分公司。 公司面向国家治理体系和治理能力现代化,坚持“打造面向党政军 标 的自主安全云、做国家数据守护者”战略目标,聚焦“云+数+合规”主 责主业,具有“自主云、安全云、云上云”三大特征,为党政军客户提 术 供安全可靠的全方位、成体系、全流程的自主安全云产品和服务,以强 大的算力和数力推动新一代信息基础设施建设。知识图谱是公司数据产 技 品发展的重要方向之一,打造通用知识图谱构建平台产品的同时,致力 于军事指挥、情报研判等方向的领域知识图谱构建。 子 公司位列中国企业云科技服务商50强和中国科技创新企业100强, 获评国资委中央企业信息化应用最佳案例,为中关村高新技术企业,未 来将不断扩大团队规模,提升产品体系的完善和研发能力的提升,打 电 造行业领先的优势产品体系,将产品和解决方案继续广泛推广于电子政 务、国防军工、公共安全和智慧城市等多个领域。 国 中 5 案例2 知识图谱助力疫情防控和复工复产案例集(第一期) 基于“交管云脑”的一体化疫情防控平台 院 面向区域 全国各省市县区 案例类型 疫情防控 服务领域 交通运输 政府管理 究 产品类型 研 交通领域知识 图谱及应用平台 01 案例背景 化 为了有效防范新型冠状病毒扩散,各地政府、单位采取有力措施全 准 力保障广大人民群众的身体健康和生命安全。随着复工大潮的来临,各 标 个城市的高速路口都部署人员检查,确认车主体温以防控疫情。然而, 对尚处于潜伏期或无发热症状的新冠患者此举效果甚微。仅依靠回忆来 术 获取个人活动路径的方法,准确性和可靠性无法保障,这不利于城市内 部交通的监控与排查工作。因此,各地交通管理部门、交通干警及公众 技 等都亟需一种更为高效、安全的疫期交管手段。 子 02 技术框架 基于交管云脑的疫情防控一体化平台由“十个子系统、一个云脑 电 和五大应用”组成,具体如图2-1所示。其中,“十个子系统”由信号 控制、视频监控、电子警察等物联感知设备组成,用以获取道路与车 国辆的的信息的实时信息。平台借助交管云脑完成数据收集,利用交通 中 知识图谱、交通大数据分析和交管算法仓等技术模块,形成疫情态势 检测、车辆缉查布控、大数据分析研判、应急车辆保障和交通信息发 布五大应用。 6 知识图谱助力疫情防控和复工复产案例集(第一期) 院 究 研 图2-1 基于交管云脑的疫情防控一体化平台架构图 03 难点与挑战 化 准 多源异构数据的获取与快速整合难度大。交通大数据的实时、准 标 确、全面的收集与传输是智慧交通业务的核心,此次数据的来源包 括公安、交警、卫计、铁路、民航等各政府部门及企事业单位的数 术 据,由于缺乏统一的数据标准,数据接口、数据格式、数据内容定 义各不相同,且部分数据涉及隐私安全与法律条例问题,给数据前 技 期工作造成很大困难。 系统模型和算法专业性强。平台涉及的图谱模型需切实结合一线交 子 警等交通相关从业人员的实际经验,同时保证模型创建与使用要求 达到精准和高效。 电 04 案例成效 国疫情期间,海信根据多地项目需求快速响应。基于交管云脑的交通 中 知识图谱、交通大数据融合分析,充分挖掘数据价值,打造疫情防控一 体化平台,针对疫情车辆精确识别、精准排查和布控预警等开发相应功 能,给疫情防控提供了巨大帮助。 大数据分析与预警。针对特定省份、区域的车辆进出城情况、首次 7 知识图谱助力疫情防控和复工复产案例集(第一期) 入城车辆等大数据进行智能分析,建立全城疫情车辆风险监管体 系,识别与预警高危疫情车辆,并对其出行规律、轨迹、活跃度、 落脚点进行分析研判,支撑车辆的布控核查、现场检查站岗位部署 和应急时间的决策指挥。 院 究 研 化 准 标 图2-2 疫情防控一体化平台主界面 术 重点车辆精准排查防控。目前海信已具备亿级车辆的快速检索与分 技 析能力,可提供重点车辆实时拦截报警,实现高危疫情车辆的实时 子 电 国 中 图2-3 疫情重点车辆追踪系统图 8 知识图谱助力疫情防控和复工复产案例集(第一期) 追踪和行驶轨迹预测,并通过一键红灯堵控和视频追踪监控,安全 有效地拦截高危疫情车辆。 应急车辆交通保障。面向特殊医患出行、保障物资运输、突发事件 处置等应急车辆出行,提供车辆实时位置监测和沿线视频智能跟 踪,精准掌控车辆运行轨迹和行车状态,并提供全程信号灯绿灯放 院 究 行服务,保障应急车辆快速、安全同行。 交通信息发布。利用诱导屏、微博、微信、广播电台等发布方式, 研 制作并实时发布全市交通管控要求、限行政策、交管业务办理流 程、返程政策、安全贴士、高速收费站关闭通知、市内检查点等信 化 息,为交通出行者提供可靠、全面、便捷的信息服务。 05 案例意义 准 标 这次疫情对智能交通提供了大量的应用场景需求,带来了迫切的研 发难点与技术发展要求。2月4日,国家工信部特别发布《充分发挥人工 术 智能赋能效用 协力抗击新型冠状病毒感染的肺炎疫情倡议书》,倡议进 一步发挥人工智能赋能效用,组织科研和生产力量,把加快有效支撑疫 技 情防控的相关产品攻关和应用作为优先工作。本案例在非常时期可有效 对重点车辆进行监管、检索、追溯与预测路径等管控监察手段;此外还 子 可以解决城市日常的交通拥堵问题,提高出行效率与安全程度。 电 06 下一步工作计划 国目前,研发团队正在加紧研究车路协同,即依托“交管云脑”的智 能网联系统,可监测车辆是否按照预定路线行驶、是否有违法行为,并 中 根据车流量以及信号灯状态给出合理行驶时速,这也将有助于无人驾驶 尽快落地。结合现有的交通知识图谱与一体化平台中的技术积累,未来 将持续在城市化进程加快和精细化管理等智能交通场景中提供有力的帮 助。 9 知识图谱助力疫情防控和复工复产案例集(第一期) 企业简介 海信集团 海信集团成立于1969年,总部位于中国青岛,是国有独资企业。拥 有海信电器(600060)和海信家电(000921)两家在沪、深、港三地的 上市公司,持有海信、东芝电视、Gorenje、科龙和容声等多个商标。 主要业务涵盖多媒体、家电、通信、IT智能信息系统和现代服务业 院 究 等多个领域。以彩电为核心的B2C产业,海信始终处在全球行业前列; 在图像处理和显示技术领域,海信具有深厚积累并形成了ULED、OLED和 研 激光电视三大技术路线。在新兴的智能科技领域,海信在城市智能交通 市场占有率连续9年国内第一,产品和解决方案应用于全国100多个城 化 市,2015—2018年连续四年在城市智能交通千万级项目中标数量排名第 一,是国内智能交通领域拥有知识产权数量最多的企业。海信在智慧客 准 厅、智能卫浴、智能厨房等智慧家居解决方案以及从家庭到社区的“用 即购”、“信我家”等智慧社区场景产业均有丰富产业积累,且具备成 标 熟的产业化经验。还有智慧城市、公安安全、轨道交通、智慧建筑等多 个智能科技产业模块为青岛、长沙、贵阳等城市带来新的智能解决方案 术 支撑。在智慧交通、精准医疗和光模块等新动能B2B产业,对海信的利 润贡献已占据“半壁江山”。家电板块与科技板块相得益彰,海信正在 技 实现由传统“家电公司”向“高科技公司”的华丽转身。 子 电 国 中 10 案例3 知识图谱助力疫情防控和复工复产案例集(第一期) 智能“分析师”助力疫情应急管理防控 院 面向区域 全国各省市县区 案例类型 疫情防控 服务领域 公共安全 究 产品类型 研疫情应急 管理防控平台 01 案例背景 化 准 随着疫情发展,公众亟需一个应急管理防控平台,它可以实现实时疫 情形势分析与研判、辖区流入人员分析、病例实施追踪、确诊的接触人员 标 分析等功能,同时支持跟踪确诊、疑似、治愈及相关历史人员数据趋势研 判分析的功能。为准确及时决策指挥,提供全方位的支撑,本案例描述的 术 拓尔思疫情应急管理防控智能分析师平台支持公安、政府等部门针对疫情 等公共突发事件进行数据分析和采取应对措施,重点协助省、地市、区县 技 级公安部门,利用本地疫情数据及其他数据进行关联分析,快速处置疫情 事件及各种突发性公众事件,对人员流入、流出及时预警。 子 02 技术框架 电拓尔思疫情应急管理防控智能分析师架构如图3-1所示,通过汇聚 国确诊人员、疑似人员、轨迹数据、就诊医院等内外部信息,并将清洗整 理好的人员主题数据、专题库(关系库、轨迹库)及标签数据整合到知 中 识图谱库,结合确诊人员亲密接触情况进行关联分析拓展,第一时间发 现亲密接触者及可能的疑似人员,严防疫情扩散。同时,通过实现防疫 工作统一指挥,指令可准确下达到疫情发生区域,明确指示基层人员工 作,并进行现场采集和情况反馈。 11 知识图谱助力疫情防控和复工复产案例集(第一期) 院 究 研 化 图 3-1 拓尔思疫情应急管理防控智能分析师平台架构图 03 难点与考验 准 标 亟需实现快速实现数据整合。目前疫情数据采集方式灵活,电子化 程度不高,整合过程复杂,如何快速并安全的整合疫情数据,并与 术 公安、政府等内部数据串并是当前的重点。 亟需实现地址解析与自动打点。拓尔思疫情应急管理防控智能分析 技 师平台对各种带地址的数据支持自动提取地址经纬度信息,并支持 轨迹上图、管辖区的人员热力图等。 子 04 案例成效 电本系统通过快速整合实时疫情数据,有效利用疫情大数据对疫情防 国控工作提供技术支撑。 按照疫情防控工作指挥的思路,通过各个维度对疫情趋势、管辖区 中 域、人员流动等按照时间和空间的方式进行分析和研判,图3-2展示 了对管辖区域发现的疫情人员分布图。 利用大数据、知识图谱等技术,对确诊人员亲密接触人员及轨迹进 行关联分析拓展,第一时间发现亲密接触者及疑似人员,严防疫情 12 知识图谱助力疫情防控和复工复产案例集(第一期) 扩散,如图3-3所示。 院 究 研 图3-2 疫情分布热力图 化 准 标 术 技 子 电 图3-3 疫情人员亲密接触关联图 国05 案例意义 本案例实现了对本地疫情数据的获取,可在地图上直观地向指挥人 中 员展示管辖区域的疫情态势及疫情分布,并通过对确诊人员、疑似人员 的无限关联挖掘分析找到密切接触人员,绘制新增确诊人员和疑似人员 的趋势图,协助防疫指挥人员有效调度资源进行重点防控工作部署,并 快速发现确诊疫情人员接触关系。依托现有实践成果,本案例还可复制 13 知识图谱助力疫情防控和复工复产案例集(第一期) 推广拓展至突发公共应急事件的应对系统。 06 下一步工作计划 下一步,本案例将继续提升数据的实时性,加强防控数据安全性, 防止出现数据泄露等问题,并将对确诊人员的接触者及疑似人员的接触 院 究 者要进行全方位的关联。此外,系统还将继续对疫情线索数据进行跟 踪、对确诊人员及疑似人员关系人分析、结合公安数据实现对确认人员 研 的轨迹分析等,争取做到不漏一例接触者,为目前严峻的疫情防控工作 提供有力的技术支撑。 化 企业简介 准 拓尔思信息技术股份有限公司 拓尔思信息技术股份有限公司成立于1993年,2011年深交版上市 标 (股票代码300229),在广州成立拓尔思知识图谱研究院,主要对泛安 全行业、新闻媒体等垂直领域的知识图谱研究,拓尔思知识图谱研究专 术 家在各大媒体报刊发表多篇知识图谱相关研究论文。公司主要业务方向 面向政府、媒体、安全、金融、企业、知识产权、出版和网信等重点行 技 业市场,提供通用平台产品、行业应用解决方案和数据服务,采用云服 务+私有部署的服务模式,通过软件+数据和知识服务全面赋能企业级用 子 户,目前服务用户超5000家。 电 国 中 14 案例4 知识图谱助力疫情防控和复工复产案例集(第一期) 远程智能诉讼推动司法领域复工复产 院 面向区域 全国各省市县区 案例类型 复工复产 服务领域 司法 究 产品类型 研 司法领域知识图 谱及应用系统 01 案例背景 化 准 疫情防控期间,各行各业主要选择远程无接触办公的方式复工复产, 法律人也在抗击疫情的战斗中用多种途径维护特殊时期社会秩序的稳定。 标 法律科技行业全程助力紧急立案、开庭、调解等活动的线上进行。 为了保护人民群众的身体健康,华宇集团利用自身行业优势,提供 术 “远程咨询”、“远程调节”、“远程立案”、“远程庭审”等多项服 务,同时搜集整理全国法院网站、微信等多种便民服务渠道,以及各种 技 法律服务工具,为人民群众足不出户获取司法服务,避免聚集开展司法 服务的感染风险”改为“收集各种服务渠道,打造统一司法服务门户, 子 结合各种法律服务工具,为人民群众提供足不出户便可获取的司法服 务,避免集聚开展司法活动的感染风险。 电 02 技术框架 国远程智能诉讼服务平台,通过构建法律知识图谱,具备案件分析、 中 证据分析、知识辅助、类案推荐和文书服务等多种能力,从而可为各类 远程用户的各类场景提供智能化应用,平台技术框架如图4-1所示。 15 知识图谱助力疫情防控和复工复产案例集(第一期) 远程智能⽴案 远程智能审判 远程诉讼指引 ⽴案法官 当事⼈ 证据分析 案件分析 知识辅助 审判法官 类案推荐 ⽂书服务 ⽂书⾃动⽣成 ⽂书电⼦送达 法官助理 院 究 法律知识图谱智能平台 法律 认知 法律 逻辑 知识 挖掘 卷宗 识别 … … 研 化 图4-1 基于知识图谱的远程智能诉讼服务平台架构图 准 远程诉讼指引。该平台可为当事人提供各个案由下的规范诉讼指 引,依据当事人提供的案情要素,给出当事人案件的诉讼风险分析 标 以及相关提示,并推荐当事人进一步行动建议。通过互动式问答、 智能要素分析、交互式内容梳理,辅助当事人生成叙事简洁、条理 术 明晰的格式化起诉状。同时,还可提供远程法庭智能检测服务,支 持智能庭前检测,引导当事人预置规范化网上庭审环境,并支持在 技 线培训,保证当事人熟悉网上庭审流程和操作。 远程智能立案。该平台能够实现高度自动化的立案流转,并提供自 子 动立案数据质量检测、自动立案信息核实查证、自动立案文书生 电成、自动立案通知发送等功能。同时,支持多渠道材料上传、材料 自动分类及自动归目到电子卷宗功能,支持立案法官通过各网络平 国台批量立案。 远程智能审判。该平台可为法官提供网上证据交换与质证服务,实 中 现自动流转规范有序,通过人脸识别技术辅助核实当事人身份,还 可实现多方当事人接入的庭审视频界面自适应、语音识别庭审笔录 自动生成和实时展示、多方互动当庭质证和质证留痕、法庭纪律维 持及庭审进程控制等功能。此外,还可提供安全有效的庭审笔录确 16 知识图谱助力疫情防控和复工复产案例集(第一期) 认服务,通过人脸识别身份认证加多屏互动手写签名、可靠CA数字 认证加区块链数据固化等技术进行可信保障。 类案精准推荐。该平台基于法律知识图谱实现要素识别及相似案例 精准匹配,通过推送给当事人,当事人可以解到与所涉及案件类似 案件的审判结果,预判案件的裁判结果,从而指引采取进一步的行 院 究 动。同时,相似案例推送给办案法官,从而尽量避免类案不同判的 结果出现。 研 文书自动生成。法官在庭审完成后,裁判文书编写过程中,可根据 前置各个环节收集到的数据和材料,依据底层的文书生成逻辑,生 化 成一篇可输入到文书编写软件中的原始文稿,经法官稍加修改后即 可自动生成一篇逻辑完备、说理充分的裁判文书。 准 文书电子送达。该平台可实现送达方式全覆盖、送达服务全面化, 同时补充收集各网络平台中当事人的送达地址线索,实现文书智能 送达。 标 03 难点与挑战 术 技 数据获取:虽然法院行业已经积累了不同类型下的海量数据,但这 些数据是以不同的数据类型被存储,各自存储,各自维护,是一个 子 个的信息孤岛。这种数据物理上的孤立,导致数据获取、处理和深 度融合存在困难。 电技术攻关:法律知识图谱的构建中存在着机器对法言法语的理解难 度大、知识提取的准确度要求高、文书中语义关系的多样性等问 国题,因此,法律知识图谱的构建必须有大量有经验的法律专家做指 导,同时自然语言理解和机器学习方面的专家密切配合才能实现。 中 04 案例成效 基于知识图谱的远程智能诉讼服务平台在疫情防控期间,使得当事 17 知识图谱助力疫情防控和复工复产案例集(第一期) 人可以足不出户实现维权,法律人可以在居家隔离期间完成办案。该平 台是华宇“网上法院系统”的互联网端系统,围绕着诉讼服务,把线下 的诉讼活动搬到线上,实现了整个诉讼过程无接触、无纸化网上办理, 是全流程覆盖的网上诉讼业务系统。当事人、代理人通过互联网可以随 时随地连接法院、即时接收诉讼服务,也使得诉讼过程更开放、透明、 院 便民。智能诉讼服务平台界面如图4-2所示。 究 研 化 准 标 术 技图4-2 智能诉讼服务平台界面 子 05 案例意义 基于知识图谱的远程智能诉讼服务平台的使用,一方面为人民法 电 院在形势异常严峻的疫情防控期间,为诉讼活动顺利进行提供了有力保 障,切实解决了人民群众因疫情带来的线下诉讼不便,当事人足不出户 国即可在线参与诉讼,切实保障了人民群众的诉讼权利。另一方面,平台 所提供的智能化分析服务,支持法官在隔离要求下实现了远程在线开 中 庭,同时切实减少了办案人员查阅大量资料的时间、整理案件数据的时 间、分析案情的时间,使得大量案件顺利办理。 18 知识图谱助力疫情防控和复工复产案例集(第一期) 06 下一步工作计划 虽然当前网上诉讼服务已经涵盖网上立案、网上交费、网上提交证 据、网上质证、网上阅卷、在线审判、网上调解、电子送达等多元化诉 讼服务,但随着平台的逐步推广,更广大用户的需求也在动态的增加, 平台的服务范围和服务能力仍需进一步优化和挖掘。一是进一步拓宽服 院 究 务渠道和扩展应用场景,基于网上诉讼服务平台,依托微信小程序等多 种渠道提供便利服务;二是进一步完善和优化服务功能,更好地为社会 研 公众、当事人和代理人提供全流程一站式移动诉讼业务办理服务;三是 化 加强推广,让更多的当事人、法律人在疫情期间能够了解到该平台,并 为他们的远程诉讼和办案提供帮助。 企业简介 准 北京华宇软件股份有限公司 标 北京华宇软件股份有限公司成立于2001年6月18日,2011年10月26 术 日在深圳证券交易所创业板上市,多年来,华宇秉承“自强不息,厚德 载物”的企业精神,以“持续创新,成就客户”为使命,深入理解客户 需求,运用软件、数据、安全等技术,在法律科技、智慧教育、信息技 技 术应用创新、市场监管、智能数据、智慧协同等领域为政府部门和企事 业单位提供智慧的信息化服务。华宇旗下子公司北京华宇元典信息服务 子 有限公司,在知识图谱构建工作中投入数十名资深检察官、法官、律师 等法律业务专家和研究自然语言处理、机器学习等领域的人工智能专 电 家,打造了基于知识图谱的智能底层平台“元典睿核”,在此基础上, 为法律主体研发多种侧重方向的专属产品,为法院、检察院、政法委、 国监察委、律师律协、企业法务、公证鉴定等构成的法律生态圈提供全流 程全方位的智能法律服务解决方案。 中 19 案例5 知识图谱助力疫情防控和复工复产案例集(第一期) 基于知识图谱的智能疫情监测服务平台 院 面向区域 全国各省市县区 案例类型 疫情防控 服务领域 公共服务 究 产品类型 研 疫情监测 服务平台 01 案例背景 化 准 新冠肺炎疫情形势不断变化,在防治工作中,基于知识图谱的智能 疫情监测服务平台能够利用全面、有效、及时的数据和可视化技术准确 标 感知疫情态势和防控措施落实情况,为决策者、指挥者、管理人员提供 数据服务;通过确诊病例的亲属关系、工作关系以及生活轨迹,从中提 术 取有效信息,找出其密切接触者进行隔离观察,对于潜在感染者挖掘将 提供有力的支持;针对疫情数据获取,实时高效自动解答关于疫情常见 技 问题,帮助广大人民群众及时获取防控疫情工作动态,了解和掌握新冠 肺炎疫情的防控信息和手段。 子 02 案例技术框架 电如图5-1 所示,本平台基于知识图谱生命周期活动要素,通过多策略 国抽取机制对疫情数据进行抽取、映射、转换,形成疫情知识图谱,实现 医疗、百科、新闻、公告等多源数据汇聚,并提供各类可视化、统计、 中 问答应用。 20 知识图谱助力疫情防控和复工复产案例集(第一期) 院 究 图5-1 智能疫情监测服务平台技术框架 研 03 难点与挑战 化 准 疫情数据以非结构化文本信息为主,数据源主要是卫健委、各省市 部门、各权威媒体发布的公告、新闻、政策等,一方面从这些文本中提 标 取有效信息,另一方面基于结构化的信息构建面向用户的问答助手。具 体分析如下: 术 面向疫情新闻、公告、政策等文本数据的抽取。文本数据抽取的主 要难点在于需要针对大规模语料分析文本中的词法、句法、语法等 技 维度信息抽取特征,从而进行抽取模型的训练。同时为了保证构建 图谱的准确性,需要进行多轮的模型调优工作。对于此次疫情,主 子 要的文本数据包括各省市通报的通知公告、热点事件新闻、病毒百 电科介绍等,其面向的领域不同,结构各异且长短不一,因此需要针 对不同的目标文本设计对应的抽取方案。 国面向防疫措施、疫情统计、病毒百科等场景的问答技术。本次疫情 中主要涉及针对病毒、防治、事态发展等主要场景的各类问答。针 中 对用户输入的疫情相关自然语言问题,对其中的关键元素(概念、 实体、属性、各类运算符等)识别,结合子图匹配方法转化为计算 机可理解的查询意图,从而获得答案。难点在于不同用户的用词、 用句和表述方式均不相同,需要结合知识图谱、深度学习、迁移学 21 知识图谱助力疫情防控和复工复产案例集(第一期) 习等AI技术,实现用户意图的精准识别。 04 案例成效 运用病毒百科、临床、”新冠英雄“、疫情病例等多维度知识图 谱,面向企业、政府、普通民众等多类角色提供实时监测、统计分析、 院 究 智能问答等服务,主要包括: 面向政府、企业、民众提供区域疫情可视化分析。可对医院、城 研 市、省份的确诊、疑似、死亡、接触人数等关键指标和趋势分布进 化 行实时统计,进而对疫情状态进行实时监测并提供辅助决策。 准 标 术 技 子 图5-2 疫情实时监测示例 电面向政府提供区域病患关联图谱应用。本案例覆盖了超级传播者挖 国掘、关键节点发现、家庭聚集性传播分析、城市区域风险等级分析 等图谱分析应用。此外,系统可收集和管理区域病患信息,帮助快 中 速进行潜在感染者的排查和检测,最大限度避免高风险人员流动导 致的交叉感染。 面向普通民众提供疫情问问服务。针对用户输入的各类疫情问题, 进行基于知识图谱的自然语义理解,并为用户提供实时解答疫情防 22 知识图谱助力疫情防控和复工复产案例集(第一期) 院 究 研 图5-3 超级传播者挖掘 化 准 标 术 技 子 电 国 图5-4 家庭聚集性传播分析 中 护基础信息、疫情统计信息、发热门诊机构、新冠病毒的症状及就 医指导等。同时,普及防控知识,对新冠常见症状指引咨询,并提 供便捷的就诊信息。 23 知识图谱助力疫情防控和复工复产案例集(第一期) 面向企业,结合企业内部员工出行、住宿、高危小区、已确诊病例 及轨迹等多维数据,形成企业疫情监测平台,提供高危预警服务, 指导企业有序复工。 院 究 研 化 准 标 术图5-5 疫情问问应用示意图 技 子 电 国 中 图5-6 高危预警服务示意图 24 知识图谱助力疫情防控和复工复产案例集(第一期) 05 案例意义 工信部在2月4日发布《充分发挥人工智能赋能效用 协力抗击新型冠 状病毒感染的肺炎疫情倡议书》,倡议组织科研和生产力量,把加快有 效支撑疫情防控的相关产品攻关和应用作为优先工作。面对疫情的快速 传播,PlantData响应国家和社会需求,研发出用于全国相关政府部门开展 院 究 工作的基于知识图谱的智能疫情检测及应用方案,分析其传染关系及接 触关系非常有利于疫情防控,对疫后的研究分析可提供强有力的支持。 研 化 06 下一步工作计划 一方面由于很多数据之前是从互联网公开网站爬取,有些信息不太 准 准确,甚至是错误的,需要通过过滤筛选、信息抽取等技术进行验证; 另一方面疫情研究成果、防控措施与治疗方案不断更新,需要不断修正 标 和完善schema及图谱数据,从而提升图谱规模和质量,并有待基于当前 图谱数据探索更多的创新型应用形态。 企业简介 术 海乂知信息科技(南京)有限公司 技 海乂知信息科技(南京)有限公司是国内领先的知识图谱服务商, 子 自研KGMS知识图谱全生命周期平台,已服务国内众多大型企业如中国电 科、中船重工、中航工业、中国银行、华为、中信建投、新华社、国家 电 电网等,公司已完成松禾资本、动平衡资本、中航联创、盛宇投资等多 轮融资。 国 中 25 案例6 知识图谱助力疫情防控和复工复产案例集(第一期) 基于知识图谱的产品追溯系统为医疗资源 “保驾护航” 院 究 面向区域 全国各省市县区 案例类型 疫情防控 服务领域 医疗行业 研 产品类型 知识图谱 产品追溯系统 01 案例背景 化 准 随着疫情爆发,社会各界对医疗救助资源的需求持续增长,保障医 标 疗产品的稳定供应尤为重要。联想通过与国内药企业合作,构建了基于 知识图谱的医疗产品追溯系统。通过该追溯系统,可以保障疫情相关医 术 疗产品安全来源;掌握医疗产品的分布情况,合理调配医疗产品;支撑 国家相关部门严厉打击制售假劣药品、医疗器械、医用卫生材料等违法 犯罪行为。 技 子 02 技术框架 电本系统构建知识图谱的数据源包括: 医药企业自有数据、合作经销 商上报数据(包括进货数据、销售数据等)、互联网公开的相关数据。 国通过流式采集、文件导入、数据库迁移、网络爬虫等方式,将数据集成 到一起后,进行知识加工和图数据存储,形成了药品流通知识图谱。 中 如图6-1所示,图谱中包含生产厂、经销或分销商、销售终端、地 域、医疗产品(药品、医疗器械、医用卫生材料等)、疾病、症状等实 体类型,以及这些实体之间形成的交易、贩卖、治疗等关系。 26 知识图谱助力疫情防控和复工复产案例集(第一期) 院 究 研 化 准 标 图6-1 医疗产品流通知识图谱的技术框架 03 难点与挑战 术 技 数据质量的保障。数据的质量直接决定了本知识图谱的准确性。通 过与国内某医药巨头合作,本系统可以实时接入该医药集团关联的 子 经销机构进货和销售的实时数据,保障数据的及时有效。 命名实体的对齐。销售链路的构建,依赖于各级经销商、业务代表 电上报的数据。但对于同一个实体(尤其是医疗机构、医疗产品等实 体),由于口语化、缩略词、地方性简称等原因,不同经销商上报 国的名称大相径庭。例如,“浙江大学医学院附属第一医院”有“浙 大一院”、“浙医一院”、“浙一医”等10多种称谓。如果不能把 中 这多个名称归划到同一个实体,销售链路的准确性无法得到保障。 通过基于深度学习的自然语言处理算法,结合根据业务知识总结的 业务特征,完成命名实体对齐,构建了准确可靠的销售链路。 27 知识图谱助力疫情防控和复工复产案例集(第一期) 图谱的快速检索。数百万个结点(实体)、数千万的边(关系), 需要与用户实时交互、进行可视化展示,这要求有高可靠的海量数 据存储技术和高速图谱数据检索技术。融合图数据库、关系数据 库、及其它NoSQL数据库,本系统构建了多级复合存储体系,在满 足高可靠海量存储的前提下,可提供高速图谱数据检索与访问。 院 04 案例成效与意义 究 研 实现不合格药品、医疗器械、医用卫生材料的追踪和追溯。疫情期 化 间,保障防疫相关产品的品质至关重要。由于市场上各厂商、经销商 相互关系错综复杂且不断变化,这就使得数据整理及分析工作变得异 准 常困难,当市场上出现问题产品时,其追踪和溯源工作就难以有效开 展。但随着知识图谱的应用,这一难题可以得到有效的解决。如图 标 6-2所示,当某厂家的某批次产品因为不合格而需要召回时,在知识 图谱系统中输入该医药产品批次,从产品的生产厂家逐级查找出该 术 产品的销售下游(商家与商家的每次交易,在图谱中可以表示为一 条关系,关系的属性中带有交易时间、数量、商品等信息),找到 技 子 电 国 中 图6-2 不合格医疗产品追踪 28 知识图谱助力疫情防控和复工复产案例集(第一期) 最终经销商,防止劣质产品流入市场。同理,当市场中发现有不合 格产品时,也可根据最终的经销商,逐级溯源,最终找到产品的生 产厂家。 实现假冒产品的预警。图6-3为某一药品的流通途径,药品从某生产 商销售给各大分销商,最终流入到各省市。图中的箭头指向表示药 院 究 品从上游到下游的流向,粗细程度代表了流通数量大小,从中可以 发现某A经销商售出的此药品数量远大于其从正规渠道进货的数量, 研 即可得到警示:该经销商可能存在出售假冒产品的行为。 化 准 标 术 技 子 图6-3 假冒产品的预警 电实现疫情预警推断。多种与某疾病关联的医疗产品在某地区集中销 售。在“销量地图”模块中,添加需要分析的对象,查看它们在地 国图上的销量情况,地图可以精确到省份(如图6-4)或者城市(如图 6-5)。如图6-4所示,这些治疗感冒的药品在地图中的江西省、浙江 中 省有销量(颜色越深、销量越大),根据图中的销量情况,可以推 断江西省的感冒病情有可能比浙江省严重。 29 知识图谱助力疫情防控和复工复产案例集(第一期) 院 究 研 化 图6-4 疫情相关产品销量地图-省份 准 标 术 技 子 图6-5 疫情相关产品销量地图-城市 电实现商家囤货推断与医疗产品的调度。如图6-6所示为某一药品在经 国销商之间的流通情况,可以发现某B经销商只有该药品的流入,没有 流出,由此可分析出该经销商很可能有囤货,如若某地区出现该药 中 品告急情况,可联系该经销商进行医疗资源调配。 30 知识图谱助力疫情防控和复工复产案例集(第一期) 院 究 研 化 图6-6 囤货商的发现与医疗产品调度 05 下一步工作计划 准 标 由于国内医药公司较多,通过目前的合作伙伴,仅能涵盖部分医疗 产品(药品、器械、材料)的销售脉络。后续,希望与更多医药公司合 术 作,建立更全面的医疗产品分析,可以让本知识图谱发挥更大的价值。 此外,明确数据权益人和制订数据访问授权方式,也是正式运营本知识 技 图谱时需要考虑的工作。 子 电 国 中 31 知识图谱助力疫情防控和复工复产案例集(第一期) 企业简介 联想集团 联想集团(下称联想)是一家成立于中国、业务遍及180个市场的 全球化科技公司。作为全球领先ICT科技企业,秉承“智能,为每一个可 能”的理念,为用户与全行业提供整合了应用、服务和最佳体验的智能 终端,以及强大的云基础设施与行业智能解决方案。 院 究 目 前 , 联 想 下 分 智 能 设 备 集 团 ( I D G ) 、 数 据 中 心 业 务 集 团 (DCG)、联想创投集团(LCIG)、数据智能业务集团(DIBG)四大业务 研 集团。联想数据智能业务集团前身——联想大数据,于2011年成立,8 年来专注于大数据、物联网、人工智能、边缘计算和云计算等新一代使 化 能技术的研发应用与行业实践,服务于联想内部的智能化转型。 2016年,联想大数据开启外向型发展之路,凭借联想丰厚的IT基 准 础,自身的数字化转型经验及多年积累的行业Knowhow,形成了覆盖企 业全价值链的智能化转型的服务及交付能力,同时,拥有完整的产品布 标 局、成熟的行业解决方案,以及专业的数字化转型咨询团队。2019年开 始,为加速联想的智能化变革,实施联想行业智能战略,联想集团在原 术 联想大数据团队和业务的基础上,成立数据智能业务集团,旨在大力推 动产业的智能化升级,成为智能变革的引领者和赋能者。 技 子 电 国 中 32 案例7 知识图谱助力疫情防控和复工复产案例集(第一期) “公安云脑+AI测温”筑牢疫情防控第一道防线 院 面向区域 全国各省市县区 案例类型 疫情防控 服务领域 公共安全 究 产品类型 研 公安知识图谱 及应用平台 01 案例背景 化 准 全国新型冠状病毒感染肺炎疫情形势严峻,疫情联防联控需求迫 切,对密切接触者精准快速定位、体温异常人员快速识别、疫情态势实 标 时掌控等具有极大需求。密切接触者指与确诊人员或疑似人员出现同 住、同乘、同食等同行行为的人。密切接触者分析依赖于对用户的大量 术 出行数据进行深入分析与挖掘,如手机、车辆卡口、人脸卡口、公交地 铁监控、火车长途车票务信息、网吧酒店登记信息、旅店住宿信息等。 技 如仅靠各地公安干警人工定位,将导致好市场、人员投入大、效率低等 问题,因此公安业务中亟需一种智能化的防控系统平台。 子 02 技术框架 电基于公安云脑的疫情防控系统整体架构如图7-1所示,该系统具备基 国于“AI+热成像”体温异常人员监测识别、疫情防控库快速构建、疫情态 势趋势分析与可视化展现、基于知识图谱的辅助研判分析决策等多种能 中 力,具体如下: “AI+热成像”监测识别体温异常人员。系统能够满足快速发现体温 异常人员的需求,利用“人脸识别+口罩识别+人体测温”技术,实 现人体温度快速初筛和疑似高温精确告警,并对未戴口罩人员进行 33 知识图谱助力疫情防控和复工复产案例集(第一期) 院 究 研 化 图7-1 基于公安云脑的疫情防控系统整体架构图 准 预警,及时发现、劝导,消除疫情传播隐患。此外,通行闸机场景 可实现戴口罩下的人脸识别,快速确认人员身份。 标 快速构建疫情防控库,全面监控排查,信息一键上报。针对疫情数 据更新速度快、要求时效性高、数据种类多、人工填报复杂等难 术 题,海信基于公安云脑的全息档案功能,依据最新疫情数据,整合 疫情人员身份、出行方式、居住地址等40余类关键信息,具备人员 技 基础数据表的导入、动态汇总、数据查重和清洗、统计分析、组合 查询和分项列表导出等功能,各级用户当日信息填报核对后,只需 子 一键确认即可完成提交上报。同时,配合公开渠道发布的信息链接 及扫码申报,还可实现社区居民涉及疫情的健康状况自主直报,为 电防疫部门动态掌握一线疫情信息和组织管控、救助提供有效的技术 手段。 国“疫情态势一张图”,全面掌控整体趋势。基于电子地图的空间展 现和基于时间的动态趋势展示,系统通过“一张图”即可全面展现 中 疫情人员地址热力图、隔离期人数、交通方式、不同人员类型占 比、防控措施占比等多维数据,实现现有疫情数据分析统计和辖区 总体疫情态势评估,支撑疫情防控工作的科学决策。 “疫情图谱分析”,助力研判分析决策。基于海信公安云脑的人像 34 知识图谱助力疫情防控和复工复产案例集(第一期) 聚类、知识图谱强大分析能力,系统可生成重大疫情人员的关系图 谱,分析家庭成员关系、出行记录、疫情接触史等关键信息,并对 密切接触者进行深入挖掘,助力疫情快速排查、溯源和防控。同 时,利用精准追踪实现目标快速轨迹再现和定位,进一步通过同行 分析,锁定密切接触和伴随人员,帮助公安等相关部门实现高风险 院 究 人群的及时发现、跟踪、管控,支撑疫情管控的快速分析研判。 图7-2描述了公安知识图谱架构。针对密切接触者涉及的多源异 研 构数据,系统先采用结构化分析、数据清洗、数据转换等数据治理 方式,抽取信息数据,然后将数据进行融合关联分析,构建知识图 化 谱,进一步的挖掘出密切接触者。从模型构建角度而言,可理解为 先确认确诊者出行轨迹,再定位哪些人的轨迹与上述轨迹重叠,多 准 处重叠即为密切接触者。按照接触时间和次数,还可进行不同接触 程度的划分。 标 术 技 子 电 国 中 图7-2 公安知识图谱架构 35 知识图谱助力疫情防控和复工复产案例集(第一期) 03 难点与挑战 数据内容定义千差万别,内容涉密获取困难。数据的准确性、及时 性、全面性是良好效果的保障,此次数据来源包括公安、交警、卫 计、铁路、民航、旅店等各政府部门、企事业单位的数据,由于无 统一数据标准,数据接口、数据格式、数据内容定义千差万别,且 院 部分数据牵扯到隐私和安全问题,接入获取困难。 究 研 数据需要人工抽取且专业性强。由于系统涉及的数据除结构化数据 外,还包括视频监控、卡口图片等非结构化数据,此类数据需要经 化 过专业的结构化信息抽取才可进行进一步的数据融合,导致专业性 强、对人员要求高。 准 系统中涉及的模型需融合公安研判专家、科技工作者等相关经验构建, 而且模型构建还需进行反复验证的修改,迭代更新压力大。 标 04 案例成效 该系统基础功能已在青岛城阳等地开始部署使用,对疫情防控工作 术 起到了良好的支撑作用。使用基于公安云脑的疫情防控系统辅助青岛公 安和政府卫生部门快速定位市内各区疫情人员和态势的统计及分析。并 技 利用知识图谱将与疫情人员接触的人、车、住宿记录和列车出行等记录 子 关联起来,用于防控与追踪。图7-3、图7-4和图7-5分别给出了疫情防控 库、疫情防控态势展示、疫情防控图谱分析等功能示意图。 电 国 中 图7-3 疫情防控库示例 36 知识图谱助力疫情防控和复工复产案例集(第一期) 院 究 图7-4 疫情防控态势示例 研 化 准 标 术 技 子 图7-5 疫情防控图谱分析示例 电 国05 案例意义 系统利用智能化、信息化科技手段,使疫情防控工作变得更加高 中 效,大大提高了患者识别、隔离监控、疑情预警等环节的工作效率。其 中,运用知识图谱及时发现、追踪并观察密切接触者有助于“高危群 体”第一时间得到护理和治疗,并防止病毒进一步扩散,是控制疫情大 规模爆发的有效手段之一。 37 知识图谱助力疫情防控和复工复产案例集(第一期) 06 下一步工作计划 围绕当前系统实践中遇到的新问题、新需求,还将在数据接入、业 务功能完善等方面继续假大投入。在数据接入方面,现有系统仅接入的 部分身份信息、居住信息、出行数据等,从数据源和数据规模上都有进 一步扩大的空间。在业务功能完善方面,随着接入数据种类和规模的提 院 究 高,相关模型需要进一步调整优化;在现有功能上,针对疫情防疫的工 研 作,仍然有很多功能可以完善,如超级传播源的挖掘、疫情态势关键节 点的发现等。 企业简介 海信集团 化 准 海信集团成立于1969年,总部位于中国青岛,是国有独资企业。拥 有海信电器(600060)和海信家电(000921)两家在沪、深、港三地的 标 上市公司,持有海信、东芝电视、Gorenje、科龙和容声等多个商标。主 要业务涵盖多媒体、家电、通信、IT智能信息系统和现代服务业等多个 术 领域。以彩电为核心的B2C产业,海信始终处在全球行业前列;在图像 处理和显示技术领域,海信具有深厚积累并形成了ULED、OLED和激光电 技 视三大技术路线。 在新兴的智能科技领域,海信在城市智能交通市场占有率连续9年 子 国内第一,产品和解决方案应用于全国100多个城市,2015—2018年连 续四年在城市智能交通千万级项目中标数量排名第一,是国内智能交通 电 领域拥有知识产权数量最多的企业。海信在智慧客厅、智能卫浴、智能 厨房等智慧家居解决方案以及从家庭到社区的“用即购”、“信我家” 国等智慧社区场景产业均有丰富产业积累,且具备成熟的产业化经验。还 有智慧城市、公安安全、轨道交通、智慧建筑等多个智能科技产业模块 中为青岛、长沙、贵阳等城市带来新的智能解决方案支撑。在智慧交通、 精准医疗和光模块等新动能B2B产业,对海信的利润贡献已占据“半壁 江山”。家电板块与科技板块相得益彰,海信正在实现由传统“家电公 司”向“高科技公司”的华丽转身。 38 案例8 知识图谱助力疫情防控和复工复产案例集(第一期) 疫情智能作战平台“精准致导”安全隐患 院 面向区域 全国各省市县区 案例类型 疫情防控 服务领域 政府管理、公共安 全、公众健康等 究 产品类型 疫情智能 研分析平台 01 案例背景 化 准 2020年2月4日,工信部发布《充分发挥人工智能赋能效用 协力抗击 新型冠状病毒感染的肺炎疫情倡议书》,要求加大科研攻关力度,尽快 标 利用人工智能技术补齐疫情管控技术短板,快速推动产业生产与应用服 务,在疫情发现、预警、防治等方面有所作为。面对疫情的快速传播, 术 为保障各地企业复工复产,避免人员出行存在的交叉感染风险,认知智 能服务厂商渊亭科技积极响应国家和社会需求,经过仔细梳理与深入分 技 析技术实现路径,研发出了一套适用于全国相关政府部门开展工作的 “疫情智能作战平台”。 子 02 技术框架 电疫情智能作战平台基于智能画像分析、知识图谱挖掘等关键技术,通 过疫情相关大数据实时采集、知识关联与融合分析,能够高效追踪人群流 国动方向和地点、挖掘可疑病毒携带者的行动轨迹、及时发现“高危群体” 中 和超级传播源。可以帮助防控相关部门准确识别各阶段需要重点关注的关 键节点(如重点防控区域等),并能够生成内容丰富的可视化分析报告, 支撑各疫情防控工作的跨域跨部门协同。 39 知识图谱助力疫情防控和复工复产案例集(第一期) 院 究 研 化 准 图8-1 渊亭疫情智能作战平台总架构图 标 在传染病发生发展和传播的过程中,及时找到具有传染风险的人, 术 是确保疫情防控工作有力有序开展的关键。疫情智能作战平台可以快速 挖掘以下四类关键人群,即“超级传播者”、“处于传播网络中心地位 技 的病毒携带者”、“密切接触者(一度、二度、三度传播人群)”、 “无症状感染者”,帮助防控部门从根源阻断病毒传播途径。具体解决 子 方案如下: 超级传播源挖掘。作战平台提供了一套“疫情图谱快速构建与分析 电工具”,可基于平台的图谱构建端将出行、线下社交等接触性数据 以知识图谱形式进行表征,然后基于平台的图谱分析端提供的图挖 国掘算法直接完成出入度分析及网络模式识别,快速分析出图谱网络 中的“超级传播者”。在此基础上,能够生成“潜在的病毒感染人 中 员名单”,为医务防护快速隔离提供重要的线索和依据。 关键节点发现。依托全面、合理地判定的传播中关键节点,对动态疫 情事件进行监测、预警成为此次疫情防控的关键之一。为解决这一问 题,作战平台提供了基于动态传播图谱的关键节点角色分析功能,完 40 知识图谱助力疫情防控和复工复产案例集(第一期) 院 究 研 化 图8-2 超级传播者定位界面 准 标 术 技 子 电 图8-3 关键节点传播分析界面 国成动态图谱下的阶段性关键节点挖掘,帮助防控部门准确识别各阶段 需要重点关注的关键节点,以此进行区别性重点隔离与防控。 中 基于同行关系的高危群体防控。作战平台提供了从接触者识别、关 系网络图谱构建、到跟踪监测的全流程能力支持。通过快速集成铁 路(铁科院)、航班(中航信)等交通数据,构建接触性人员关系 网络图谱,分析已知与潜在感染关系的可能性并进行可视化展示。 41 知识图谱助力疫情防控和复工复产案例集(第一期) 图8-4 渊亭动态图谱关键节点挖掘操作流程图 院 究 对于发现确诊的病人,结合其乘坐的某班次高铁/航班信息和 交通信息图谱,利用渊亭的图谱关系挖掘算法可快速分析出直接同 研 行人(一度传播人群)以及潜在的二度、三度传播人群。进而,通 知同行人所在地防疫办(可通过车厢或航班的位置远近设置严重程 化 度),按照具体环境条件进行不同程度的隔离与观测,定位病毒源 准 头的常驻人群,并追踪这些高危人群后续的行为轨迹,精准联系到 其密切接触的具体人员,完成接触者识别和跟踪。 标 术 技 子 电 国 图8-5 疫情传播扩散图 中 基于聚集信息群体性传染防控。作战平台提供基于聚集信息快速构 建接触性人员关系网络的能力,可对进出地铁、商场等公共场所的 人员进行实时的病毒携带可能性挖掘(即获得观测对象潜在的携带 画像),弥补了当前仅凭实时体症检测的不足。当观测对象出现在 42 知识图谱助力疫情防控和复工复产案例集(第一期) 监测区域时,检测人员不仅可以对其进行实时的体征检测,而且可 以基于平台提供的图谱分析挖掘能力,根据确诊病人和高风险人 群,对接触性人员关系网络进行潜在关系的碰撞分析,得到观测 对象潜在携带病毒的可能性,并提供图谱网络方式的可能性解释, 即:通过传播路径分析推测出其携带的可能性。 院 究 研 化 准 标 术图8-6 疫情重点传播区域分析 技 子 电 国 中 图8-7 基于传播关系的人员携带可能性分析 43 知识图谱助力疫情防控和复工复产案例集(第一期) 03 难点与挑战 需强化与国家有关部门的联系并提供数据支撑。通过持续加强与各地 有关疫情防控部门对接,主动收集各地政府需求,提高疫情溯源和监 测、疫情情况分析、疫情态势研判和疫情防控部署等方面准确率。 需加强平台及解决方案的复制推广。渊亭科技目前已为福建等地疫 院 究 情防控部门提供技术支持,疫情防控初见成效。为快速缓解疫情, 消除隐患,保障各地企业复工复产,还需进一步扩大“疫情智能作 战平台”及其解决方案在全国的应用范围。 研 04 案例成效与意义 化 准 目前,依托疫情智能作战平台及提供的工具已实现了超级传播与挖 掘、关键节点发现、基于同行关系的高危群体防控、基于聚集信息群体 标 性传染防控等解决方案,并在福建等地防疫部门取得了初步成效。疫情 面前,时间就是金钱。渊亭技术中台的所有能力均采用模块化的开发方 术 式,还可以按照不同的病毒特点进行应用逻辑的灵活组合,快速满足疫 情期间不同场景的应用需求,为后续疫情防控措施持续优化升级做好了 技术保障。 技 子 05 下一步工作计划 电面对疫情,我国政府迅速做出了正确的决策和措施,并在阻断传 染病传播措施中分别对传染病的三要素进行控制。然而在大数据人工智 国能时代,我国大力投入建设的大数据中心、云计算中心、智慧城市系统 等基础设施,及各方的交通数据、运营商数据、摄像数据等重要基础数 中 据如何发挥更大的作用,并通过数据分析辅助防疫决策,充分发挥数据 价值,将是平台后续建设升级的方向。未来,在传统的防疫手段的基础 上,疫情作战平台还需做到提前防控的辅助能力,使防疫更加迅速、更 加高效。 44 知识图谱助力疫情防控和复工复产案例集(第一期) 平台将围绕未来各疫情防控相关主管部门数据的大集成或联合建模 需求,着力发挥数据联合集中的优势,构建更加精准的大数据画 像,并结合成熟的算法模型分析,为政府部门做好疫情防控提供决 策支撑。 平台将探索基于集成数据的情报体系构建,并且建设分级授权措施 院 究 及机制。在统一的情报网络基础上,保障数据的统一性、完整性、 时效性、权威性、安全性,为各部门防疫工作提供了便捷、高效、 研 精准、安全的情报支持。 平台将推动分级诊疗大数据平台的构建,以解决医疗资源集中和紧 化 张的局面。通过整合地区各医疗单位资源,实行网上预约、分级诊 疗,避免人群扎堆及交叉感染。同时,基于地图服务商、运营商等 准 数据实现智能诊所推荐,分区接诊合理利用医疗资源;基于医疗单 位流量数据、地区患者比例等数据,通过机器学习模型估算各单位 标 对医疗资源的需求,辅助各部门对医疗资源的分配安排。 平台将着力打造疫情综合信息服务平台,不断统一信息出口。将与 术 疫情相关的涉及百姓的衣食住行等方面资源信息进行整合,推动各 平台配合逻辑与机制,发挥政府的权威优势,合理调度社会资源, 技 掌握舆情走向。 子 电 国 中 45 知识图谱助力疫情防控和复工复产案例集(第一期) 企业简介 厦门渊亭信息科技有限公司 厦门渊亭信息科技有限公司成立于2014年,主要办公地点在厦门 (总部)和北京(运营中心),现有人员160+人,研发人员比例超过 90%,是一家专注于认知智能、致力于“AI+行业”解决方案的创新型公 院 司。 究 公司秉承“连接万物、全景计算、认知推理、深度赋能”的使命, 自主研发了通用知识图谱技术工具(DataExa-Sati认知智能平台)、自 研 动化AI中台(DataExa-Insight人工智能中台)、DataExa-Maya 智能问答 平台、DataExa-Kamala 自然语言处理平台、DataExa-Rama搜索平台、 化 DataExa-TagForge人工智能数据标注平台、DataExa-Seraph分布式图数据 库、图计算等一系列数据智能产品。 准 渊 亭 科 技 联 手 国 内 优 秀 的 高 校 和 研 究 机 构 ( 清 华 大 学 、 中 科 院 等),开展前沿人工智能技术领域研究,包括人工智能可解释性、人工 标 智能对抗攻击、通用智能决策引擎等,为人工智能的大规模应用落地建 立坚实的理论基础和实践体系。目前,在认知计算、知识图谱、机器学 术 习、数据挖掘等领域拥有核心技术优势与领先的工程化能力,聚焦金 融、政务、国防三大行业,目前已服务了中国人民银行、建设银行、广 技 发证券、国家军委科技委、国家战略支援部队等知名企业与政府机关。 子 电 国 中 46 案例9 知识图谱助力疫情防控和复工复产案例集(第一期) 智能问答小助手上线普及新冠肺炎 防护知识 院 面向区域 全国各省市县区 案例类型 疫情防控 服务领域 公众健康 公共服务 究 产品类型 研知识智能 问答平台 化 01 准 案例背景 当前,新冠肺炎疫情防控正处于关键时期。如何科学地认识新冠肺 标 炎,了解防控知识,做好自我防护,是全社会最关心的话题。为权威、及 时、高效、精准地解答公众关于疫情及疫情相关的健康疑问,提高自我防 术 护能力,降低不必要的就医带来的交叉感染风险,同时减少相关谣言的传 播,由南京柯基数据科技有限公司联合中国疾病预防控制中心慢病中心紧 技 急打造的“新冠肺炎智能问答助手”火速上线。智能问答助手通过中国疾 控慢病中心的公众号访问,可为普通人群、患者、医生等不同用户提供肺 子 炎疫情相关知识的问答服务。 电 02 技术框架 国新冠肺炎防护智能助手业务架构如图9-1所示,平台实现主要包括以下 流程。 中 获取数据。数据源有两类渠道,一是来自国家卫监委、中国疾控中 心等官方发布的权威信息;二是由医疗行业中的专业文献和词库数 据构成。 知识处理、建模和训练。基于专家知识对相关的知识进行内容分类 47 知识图谱助力疫情防控和复工复产案例集(第一期) 和schema审核,形成包括知识来源或附件等形式在内的便于运维的 标准问答对。在经过初步的知识覆盖以后,进行模型训练和测试, 根据测试结果完成调优、语料扩充、同义词补充、缩写覆盖、标注 优化等。多轮训练达到满意测试准确率指标后,问答知识平台发布 上线。 院 究 知识积累与反馈优化。上线后对问答平台的运行情况进行监控,收 集所有问答过程数据,对于用户反馈不满意以及无法给出答案的提 研 问重点关注。通过不断补充知识内容、优化问题答案查找,提升平 台提供知识的问答准确度,实现平台的迭代优化。 化 准 标 术 技 子 图9-1 新冠肺炎防护智能助手业务架构 电 03 难点与挑战 高质量的问答需求。由于本产品应用于疫情防控,问答质量要求 国高,因此十分考验知识图谱构建的合理性和算法的准确率。由于建 设时间紧迫,只有通过快速迭代才能实现质量的稳步提升,从而提 中 供优质的防控知识服务。 不间断的运维优化。在问答平台的使用过程中,要能够持续运维优 化。本次建设过程中,项目团队规划了详细的运维优化工作安排, 实现问题快速收敛与版本迭代,让运维过程可以稳定可靠地进行下 48 知识图谱助力疫情防控和复工复产案例集(第一期) 去。目前,问答平台可以保证每天发布一个版本的知识更新。 平台访问压力阈值高。由于问答平台使用的服务器资源比较有限, 在上线前的技术方案讨论中,技术团队对产品进行了多次研究和优 化,同时对于上线后的压力情况进行了分析,最终通过异地部署的 两台云服务器负载均衡的方式承担了万人在线访问的支持。 院 04 案例成效 究 研 基于柯基数据智能问答平台开发的新冠肺炎防护智能问答助已于2月 化 3日在中国疾控慢病中心的公众号正式上线。下图9-2为新冠肺炎防护智能 助手所在的慢性病防控与健康公众号以及访问问答助手的微信二维码, 可以快速扫描使用。 准 标 术 技 子 电 国 图9-2 慢病中心公众号及新冠肺炎防护智能助手二维码 新冠肺炎防护智能助手在疫情防护知识的普及方面取得了显著成 中 效,具体包括: 提供了便捷高效的疫情防护知识平台,及时、高效、稳定地为公众 提供权威的疫情防护知识。截止到目前,平台平均每天为万名网友 解决了近十万的问题。 49 知识图谱助力疫情防控和复工复产案例集(第一期) 带动多方共同响应助力疫情防控。自智能助手上线以来,得到了各 地政府、相关机构及大量药企的关注,例如:江苏省软协在第一时 间在当地居民社区进行了智能助手的宣传推广,如图9-3所示。赛诺 菲、勃林格、西安杨森、复星医药等众多知名药企均接入了该智能 问答助手。 院 究 研 化 准 标 术 技 子图9-3 新冠肺炎防护智能助手宣传页进入小区推广 电问答质量实时分析监控,不断优化提升。平台每一版知识上线都会 国进行严格的自动化测试,目前平台问答的准确率已达到95%以上。在 平台中前端客户可以对问答效果进行评价,后端会进行问答过程的 中 监控。最终,通过实时的数据分析,及时“查缺补漏”,提高平台 智能化水平。 新冠肺炎防护智能助手的前端问答页面及柯基数据智能问答平台的 后台运维监控平台截图分别如图9-4、图9-5所示。 50 知识图谱助力疫情防控和复工复产案例集(第一期) 院 究 研 化 准 标 图9-4 新冠肺炎防护智能助手问答页面 术 技 子 电 国 图9-5 新冠肺炎防护智能助手后台运维监控页面 中05 案例意义 新冠肺炎防护智能助手的快速成功上线具有多项重要意义。一方 面,解决了疫情时期的公众信息需求的主要问题;另一方面,体现了知 识图谱技术在智能问答应用方面的价值,而且在运维成本可控的前提 51 知识图谱助力疫情防控和复工复产案例集(第一期) 下,本案例仅用了5天时间上线提供较高质量的智能问答服务,也说明南 京柯基数据知识图谱智能问答平台具有较高的成熟度。针对案例复制推 广价值,该智能问答产品可与各种业务平台、公众服务平台对接,并应 用于医药、教育、政府、金融、农业、保险等行业的产品和服务介绍、 问题解答、推广宣传等多种业务场景。 院 06 下一步工作计划 究 研 接入渠道的进一步拓展。目前平台接入的渠道还比较有限,下一步 化 计划联合外部资源加大宣传,进行渠道开拓,让更多的公众受益。 问答模式的发掘与创新。可以考虑和各类硬件设备连接,通过语音 准 的形式提供知识回答服务,创造更多的应用场景。 技术产品的发展衍生。根据企业诉求,可采用私有化部署并融入企 标 业数据,衍生出企业个性化定制知识问答平台,结合企业自身的应 用场景提升业务的智能化水平。 企业简介 术 南京柯基数据科技有限公司 技 南京柯基数据科技有限公司成立于2015年,是荣获江苏省“创聚工 子 程”和“创业南京”两项称号的创新型高科技企业,公司已获得授权及 在申请的核心自主知识产权将近30项,技术覆盖了从数据采集到数据清 电 洗、知识提取、知识表示、知识推理、动态本体建模、图存储、可视化 关联分析、智能问答、语义检索等知识图谱全技术链。公司于2017年在 国北京中关村成立了北京知识图谱科技有限公司,负责公司的产品和市场 推广。 中 公司开发了全周期的知识图谱平台产品和认知智能应用产品,公司 产品在药企、医疗机构、军工院所、科技情报及出版等领域服务了十余 家大客户,积累了丰富的行业知识图谱运用开发经验。 52 案例10 知识图谱助力疫情防控和复工复产案例集(第一期) 传染病大数据防控系统“深度挖掘” 潜在传播者 院 面向区域 全国各省市县区 案例类型 疫情防控 服务领域 公众健康 究 产品类型 研 基于知识图谱的人 口排查及防控系统 化 01 准 案例背景 为控制疫情传播,对潜在传播者的挖掘和控制是控制本次疫情的关 标 键。由于人类的活动行为不确定、活动范围较大,人传人传染病会有传 播速度快、范围广的特点,且相对较难控制。传统手段下传染病防治的 术 痛点是潜在感染者发现困难。一旦无法及时找到潜在感染者进行诊断和 隔离,则随着潜在感染者的活动,疾病容易进一步大规模扩散。控制疫 技 情传播的难点在于: 感染者隐瞒接触史:在传统手段下,只能通过问询的方式了解感染者 子 去过哪里、接触过哪些人,很容易遗漏潜在感染者。 感染者行动轨迹不完整:传统信息化系统只记录了少数实名登记的出 电行,比如火车、飞机等,而类似散步、买菜等行为未被有效监测。 潜在感染者过多:如果感染者在感染或携带病菌的状态下进行了大 国范围的活动(或乘坐过多个交通工具),则与其间接接触的人员是 众多的。这些人员难以被一一排查到,更有可能被排查之前也进行 中 了大范围活动,使得病菌二次传播,疫情扩散。 为解决上述问题,急需通过数据综合推理服务来实现传染病的防控。 53 知识图谱助力疫情防控和复工复产案例集(第一期) 02 技术框架 多源异构大数据分析 轨迹全⾯ 实时分析 准确度⾼ 公安&政务数据 场所名称 场所地点 登记⼈员明细 ⻋辆数据 ⼿机数据 社会关系数据 人脸数据 交通⼯具出⾏数据 登记场所⻋辆轨迹 ⼿机轨迹 通联数据 …… 输⼊ 知识图谱 含⼈员、场所、物品三种实体之间的关系 传染概率指数 相关实体条件: •  确诊人员名单 •  确诊时间 院 输⼊ 关系类型和发生时间约束: •  传染病传播方式 •  传染病潜伏期 •  传播时空范围 究 输出 研 中心实体条件: •  有否流行病学史(如近期是否 去过疫区、是否接触过确诊者 等) •  症状匹配度(如是否有发热、 潜在传播者及已被传染的概率 确诊 ⼈员 在潜伏期内 有直接或间接接触 潜在传 症状匹配 播者 体温异常 乏力、咳嗽等表现) 化•  体温是否异常(如体温是否持 续一段时间超过38度等) 准 (相关实体) (关系) (中⼼实体) 图10-1 传染病大数据防控系统技术架构图 标 如图10-1所示,该系统输入包含来自公安、政务的场景数据,及传 术 染病传播特征、患病人员的医疗信息,通过多源异构大数据分析,构建 出覆盖有人员、场所、物品三种实体之间关系的知识图谱,实现潜在传 技 播者的挖掘和传染概率的预测,具备轨迹全面、实时分析、准确度高等 特点。 03 子 难点与挑战 电构建潜在新冠肺炎传播者发现模型和图谱模型。潜在传播者涉及的 国人员流动和疾病传播特性两类信息间差异度大,一次构建出的知识 图谱以人员和场所为点,并以存在空间接触的关系为边;对于潜在 中 传播者的发现,根据确诊人员信息,运用模型计算人员传染概率。 构建起精准、动态、闭环和高效的社区网格化防控体系。在发现潜 在传播者基础上,利用健康管理APP、人口管理系统、社区网格管 理人员等渠道,为传染病大数据防控系统提供数据,实现对潜在传 54 知识图谱助力疫情防控和复工复产案例集(第一期) 播者的精准隔离和动态防控。 社区网格化防控 院 究 研 基本信息核对/申报 每⽇健康申报(图要改,问题不好) 化传染病筛查 / 健康科普 准 图10-2 系统网格化防控和传染病筛查 04 案例成效 标 术 基于知识图谱对潜在传播者发现,利用防控网络实现了对人员的精 准控制,有效地将疾病的传播范围限定在有限范围内。 技 在人员发现方面:利用该系统可以覆盖小区、办公楼、旅馆、餐 厅、菜市场、超市、街道、娱乐场所等全部区域,在发现通常的同 子 住、同行、同火车、同飞机等存在空间接触的关系之外,还能建立 起人与地之间的居住、登记入住关系,进一步可挖掘到访客、途径 电等随机性的事件。 在潜在传播者辨别及确诊方面:利用人员接触指数(直接接触关 国系、二阶接触关系)、症状匹配度等,系统每日发出新增潜在感染 者预警,帮助管理者定向排查,督促就诊。同时对场所进行预测, 中 系统每日输出高危场所及危险程度,帮助管理者根据场所指数选择 相应措施。 若假设人员1在1月3日确诊新冠肺炎,系统可根据模型作出判断: 55 知识图谱助力疫情防控和复工复产案例集(第一期) 人员2在过去14天与人员1存在同火车关系,虽暂无症状出现,但仍为可 能的潜在传播者,需进行隔离观察;人员3与其在24小时内到访过同一场 所,已有一定症状,已感染可能性高,需提醒就诊并隔离;人员4虽与人 员1近期去过同一场所,由于到访时间在人员1之前且暂无症状,暂不需 要就诊或隔离。 院 05 案例意义 究 研 通过利用特定信息构建的知识图谱,实现对潜在传播者的识别和控 化 制,对于抗击当前疫情具有重要意义。而且,对于特定人群的识别,还 可进一步推广到安防、疾控等多个领域,适用范围也可覆盖全国到医院 等具体单一场所。 准 标 06 下一步工作计划 未来,将建立长期的传染病大数据防控系统,实现传染病预测、预 术 警、预防、精准打击和动态管控。同时,利用国家医学数据库等数据来 源,丰富多种疾病的传播特征,实现持续为多种传染疾病的防控发挥作 技 用,消灭传播源头并控制传染范围。 子 企业简介 杭州依图医疗技术有限公司 电杭州依图医疗技术有限公司隶属于依图科技,主要从事医学人工 国智能、医疗影像分析、病历自然语言处理等相关技术研究和推广应用业 务。在AI图像处理算法上有深厚积累,对人工智能在医疗领域的研究应 中 用有着丰富的经验。目前已开发了包括智能影像诊断系统,智能门诊系 统、单病种科研数据库平台等多个医学AI项目,并已在多家医院进行临 床验证。 56 案例11 知识图谱助力疫情防控和复工复产案例集(第一期) 打造医学智库全面服务新冠疫情防控 院 面向区域 全国各省市县区 案例类型 疫情防控 服务领域 医疗 究 产品类型 医学智库及 研问答服务 01 案例背景 化 准 随着疫情的迅速蔓延,谣言层出不穷。由于缺乏认知和可靠的信息 来源,群众难以分辨真伪,容易引起恐慌。此外,城乡基层抗疫一线由 标 于缺乏专业的诊断和防护知识,容易漏筛疑似人员,形成防控盲点。 为了满足疫情期间群众对疫情信息了解的需求,提升基层医务工 术 作着的诊疗水平和防护知识,平安智慧医疗基于自有的五大医疗数据库 和全球最大的中文医疗知识图谱,打造新型疫情防控服务管理平台。其 技 中,广大居民可通过“公众服务”及时了解官方疫情信息和权威疫情知 识,并通过智能化的“疫情自诊和问答服务”,及时获得健康评估和专 子 业指导。“AskBob医学智库”融合了《新型冠状病毒感染的肺炎诊疗方 案(试行第六版)》可为医务工作者提供首个基于循证医学的一站式搜索工 电 具,并为医务人员提供临床决策支持、医疗百科查询、科学研究辅助、 教育考试辅导、资讯个性化推送等全方位支持。 国 中 57 知识图谱助力疫情防控和复工复产案例集(第一期) 02 技术框架 院 究 研 化 准 图11-1 AskBob医学智库(疫情版)框架 标 图11-1展示了AskBob医学智库(疫情版)的整体架构。从应用驱 动出发,首先,案例针对性地收集了与疫情相关的五大医疗知识库,其 术 中疾病知识库包含了疫情相关疾病的临床症状、诊断方法、鉴别诊断、 治疗方法、预后等相关信息;药品知识库包含药品相关的适应症、禁忌 技 症、用法用量等信息;处方/治疗库包含来自权威指南、专家共识、医学 文献中推荐的治疗方案及相关的医学证据;健康知识库收集了针对大众 子 的科普文章、常见问答信息;医生及医疗机构库收集了疫情相关的定点 医院、发热门诊信息及对应的医生信息。 电基于收集到的疫情相关知识库,本案例利用实体关系抽取等知识图 谱构建技术从非结构化的医学知识中抽取核心的医学实体及关系,并对 国不同来源的实体进行对齐,形成了最终的疫情知识图谱。疫情知识图谱 的样例如图11-2所示。 中 58 知识图谱助力疫情防控和复工复产案例集(第一期) 院 究 研 化 准 图11-2 疫情知识图谱样例 标 基于该疫情知识图谱,并利用自然语言处理相关技术,如意图识 术 别、语义匹配等,可针对医生和大众居民分别提供其所需服务。针对医 生,可基于知识图谱的相关症状、鉴别诊断、相关检查检验及治疗方案 技 等信息提供诊疗决策支持;同时,针对于复杂的案例,可提供基于知识 图谱的医学文献语义查找,帮助医生找到精准的医学文献。针对大众居 子 民,可基于知识图谱的症状及疾病的关系,提供疫情自查功能,并进一 步推荐相应的防护方法或者就诊医院信息;同时,针对居民的健康咨 电 询,可基于知识图谱的问答技术及基于图谱的语义匹配技术提供智能疫 情问答服务。 国 中03 难点与挑战 AskBob医学智库(疫情版)的构建主要面临以下挑战: 多渠道医学知识的获取。基于平安积累的五大医疗知识库以及互联 网上的公开信息,通过快速整理并收集疫情相关的医学知识,覆盖 59 知识图谱助力疫情防控和复工复产案例集(第一期) 相关疾病、药品、检查检验、医学文献等。 在少量训练样本下的高精度实体关系抽取。利用平安在医疗领域已 构建的基于深度学习的实体关系抽取算法,并利用少量新增样本进 行迁移学习,本案例快速构建了高质量的疫情知识图谱。 精准的语义理解技术。针对用户的自然语言输入,本案例利用深度 院 究 学习方法,构建了医疗领域的意图理解及语义匹配模型,为用户提 供精准的医学知识。 04 案例成效 研 化 新型防控服务管理平台最终既能够为群众提供精细化的服务,也 准 为医护工作者提供技术的支撑,还可为管理者提供决策的支持。自平台 上线以来帮助广大居民及时获得了健康评估和专业指导,并通过线上辅 标 助疫情自查指导就诊,大幅缓解线下医院压力,有效降低了交叉感染风 险。此外,还帮助基层医生及时获得新型肺炎疑似病例提示及诊疗建 术 议。 目前,平台已在重庆市、湖北省、黑龙江省、辽宁省、北京市、山 技 东省、福建省、江苏省、广东省等地200多个官方新媒体平台上线。重庆 市“渝快办”、“在渝中”等APP陆续上线了平安智慧医疗的系列防疫E 子 功能,根据重庆市政府办公厅相关人士评价,平安智慧城市的疫情速递 专栏信息更新准确及时,不仅有疫情数据展示,还有疫情分析、科普答 电 疑、患者行程查询、自助问诊服务等功能,提供了丰富、专业的内容。 平安疫情速递在华山医院、国家广电总局和国家政务公众号中的示例图 国如图11-3所示。 中 60 知识图谱助力疫情防控和复工复产案例集(第一期) 院 究 研 化 图11-3 平安疫情速递上线华山医院、国家广电总局和国家政务公众号 05 案例意义 准 标 新型疫情防控服务管理平台基于知识图谱、智能问答、深度学习等 人工智能技术,从多维度满足基层医生和广大市民抗击疫情的需 术 求,提供了更智能、更便利、更有效的疫情防控新技术。 新型疫情防控服务管理平台提升了基层医生应对新冠病毒的诊疗水 技 平。AskBob医学智库基于专业的医学知识图谱和自然语言处理技 术,快速分析用户症状,提供基于循证的决策支持,为基层医务人 子 员提供全方位的支持,节约信息搜索的时间。 新型疫情防控服务管理平台提升了大众的防护技能,减少了恐慌情 电绪的形成与传播。平台不仅提供实时的全国新冠肺炎疫情数据、防 护问答和科普知识,还结合专业的医学知识图谱和自然语言处理技 国术,快速分析用户症状,提供专业的智能分诊筛查服务,减少了不 必要的医院就诊,为居民提供居家预防隔离建议。 中 61 知识图谱助力疫情防控和复工复产案例集(第一期) 06 下一步工作计划 医学知识将根据新的研究成果而持续更新,未来相应的疫情知识 图谱也需持续更新。下一步,将持续收集新增的疫情相关知识,并探索 知识图谱的自动更新技术,进而保证疫情知识图谱的快速迭代更新。此 外,还将基于前期积累的数据,进一步优化机器学习模型,提升语义理 院 解的准确度。 究 企业简介 研 平安国际智慧城市科技股份有限公司 化 平安国际智慧城市科技股份有限公司(简称“平安智慧城市”)是 平安集团旗下专注于新型智慧城市建设的科技公司,也是平安智慧城市 准 生态圈的主要建设载体。 平安智慧城市以“智慧、智理、智效”为建 设理念,依托人工智能、区块链、云计算等核心技术,构建了“1+N” 标 智慧城市平台体系,以1套“智慧城市云”平台有力支撑N个智慧城市板 块,包括智慧生活、政务、交通、教育、卫健、医院、食安、环保、养 术 老、法律、口岸、社区等。 平安智慧医疗中文医疗知识图谱基于海量就诊数据、几千万的医 技 学文献和权威临床指南来构建,包括五大知识库,即药品库、疾病库、 处方库、风险因子库和医疗资源库,集纳了海量的知识,并将知识之间 子 建立关联,构建最大的中文医学知识图谱,形成一个完整的知识体系。 目前平安已经基于该医疗知识图谱开发出多个智能服务的应用场景。比 电 如,智能辅助诊疗系统,为医生提供诊断和治疗推荐;智能慢病管理, 可以为患者提供诊前的分诊导诊,诊后的智能患者随访、教育和问答服 国务。 中 62 案例12 知识图谱助力疫情防控和复工复产案例集(第一期) 智能外呼机器人“打通”社区防控 最后一公里 院 面向区域 全国各省市县区 案例类型 疫情防控 服务领域 政府管理、 公众健康、公共服务 究 产品类型 研 智能外呼机器人 化 01 准 案例背景 新冠肺炎疫情发生后,举国上下、万众一心,打响疫情防控阻击 标 战。作为专业的对话式人工智能平台公司,思必驰首先将关注重点锁定 在阻击疫情兵力最为紧缺的基层“第一线”,决定为基层社区打造一款 术 外呼机器人,来替代繁重的人工电话、逐户走访排查及统计梳理等工 作。经深入分析,疫情防控机器人的主要功能包括: 技 居民回访:及时开展信息互动,做好辖区居民的健康提醒和随访服 务,针对外来人口的排查、健康监测和防护建议,针对重点人群的 子 疫情信息记录和定期跟踪。 信息通知:提供信息传播沟通渠道,为疫情防控的一线人员,如医 电务人员、公益组织成员、街道(乡镇)和社区(村)干部等,第一时间推 送疫情防控知识和培训信息。 国除此之外,机器人还具备疫情筛查、信息通知、重点追踪、知识问 中 答等能力。 63 知识图谱助力疫情防控和复工复产案例集(第一期) 02 技术框架 院 究 研 化 准 标 图12-1 疫情防控机器人系统核心技术框架 术 疫情防控机器人核心技术框架如图12-1所示,包括数据支撑层、运营 技 支撑层、对话引擎层、接入管理层、呼叫中心层,同时还可以和企业IT系 统进行关联。其中,知识图谱位于对话引擎层,知识图谱涵盖人员知识 子 图谱和疫情知识图谱。 疫情防控机器人利用人员知识图谱中的联系方式拨打电话,通过 电 语音识别技术将对话内容转换成文本,然后基于知识挖掘技术从对话文 本中挖掘重要信息并更新人员知识图谱,比如体温、疫区接触史等。同 国时,基于知识推理模型统计梳理出需重点关注的人员,完成重点人群的 疫情信息记录和定期跟踪。此外,通话过程中,机器人经常会被问及疫 中 情知识相关问题,例如:“新型肺炎的传播距离有多远?”。针对上述 情况,机器人运用知识问答技术从疫情知识图谱中找到正确答案。目 前,疫情知识图谱已包括3万多条静态知识,可以覆盖80%以上的常见问 题。 64 知识图谱助力疫情防控和复工复产案例集(第一期) 03 难点与挑战 方言理解:方言问题较为突出,其中,粤语、四川话、上海话等方 言的识别难度大,而且口语的意图理解和关键槽位信息的抽取有赖 同步实现。 对话定制:面向个性化需求的对话定制能力不足。由于对话过程中 院 究 话题的不断改变,随时可能导致服务过程被打断进而影响成功率, 因此还需保障对话的鲁棒性。 研 知识定制:在保证知识完备性、及时性、权威性和可靠性条件下, 化 完成静态知识挖掘和动态知识更新的难度攀升。 准 标 术 技 子 图12-2 “疫情防控机器人”应用成效 电 04 案例成效与意义 国以苏州工业园区斜塘街道冬韵社区为例,作为思必驰“疫情防控机 器人”服务的首个基层单位,辖区内约有居民7000余人,然而社区仅有 中 3部电话。如按照8小时工作时间,即使在一线工作人员拼尽全力的情况 下,也无法完成巨量的筛查工作。经部署“疫情防控机器人”后,社区 工作者仅耗时2个多小时就取得了机器人外呼情况的详细报告。其中, 详细记录了各次通话的接听情况,并将“有武汉接触史”和“有发热症 65 知识图谱助力疫情防控和复工复产案例集(第一期) 状”的人员进行特殊标注,提示工作人员保持进一步追踪。 截至 2 月 21 日,思必驰“疫情防控机器人”已在江苏、山东、湖 北、北京、上海等 121 个地市的近 700 个基层社区上岗,并覆盖湖北、 河南、山东、广东等疫情较为严重的区域。累计呼出量已逾 510 万,其 中互动式访谈通话 260 万通,接通成功率达75.6%。防控机器人作为网 院 究 格地毯式排查的人工智能利器之一,大幅减轻了基层工作者人工拨打电 话的负担,节省了宝贵的工作时间并为其他重要疫情防控工作留下了空 研 间。此外,机器人通过收集与汇总居民有外出记录、发热等信息还可帮 助工作人员在进一步入户摸排前做好充分的个人防护,防止交叉感染。 05 下一步工作计划 化 准 标 术 技 子 电 国 图12-3 防控机器人问答功能示例 中 依托知识图谱开发的疫情问答对话技术赋能更多的AIoT(人工智能 物联网)智能硬件。针对企业合作的 音箱、电视、手机、车载产品等 AIoT 智能硬件终端产品,思必驰 DUI 平台下一步将推出免费 AI 技能服 务,为上亿用户提供更便捷、更多样化的防疫周边服务,包括肺炎科普 66 知识图谱助力疫情防控和复工复产案例集(第一期) 信息、疫情动态查询等。 加紧研发基于知识图谱的辅助心理干预系统。为应对疫情带来的 心理影响,思必驰联合上海市公共卫生中心、上海精神卫生中心正在加 紧研发智能辅助心理干预系统,并向各大疫区尤其是重灾区提供健康宣 教、心理量表测量、互动式心理干预等多种服务。 院 企业简介 苏州思必驰信息科技有限公司 究 研 苏州思必驰信息科技有限公司(以下简称“思必驰”),成立于 化 2007 年英国剑桥,2008 年回国落户苏州,在北京、深圳、上海成立分 公司。思必驰是国内专业的对话式人工智能平台公司,拥有全链路智能 准 语音语言技术,自主研发了人机对话操作系统(DUI)和人工智能芯片 (TH1520);为车联网、IOT、以及众多行业场景合作伙伴提供自然语言 标 交互解决方案。 思必驰拥有近千项知识产权,是国际上极少数拥有中英文综合语音 术 技术(语音识别及合成、自然语言理解、智能决策、声纹识别、情绪识 别等)的公司之一。2012 年,思必驰与上海交大建立智能人机交互实 验室,并于 2017 年携手苏州市人民政府成立上海交大苏州人工智能研 技 究院。目前思必驰已入选国家队,参与近 20 项国家级行业标准制定, 并获批 10+项国家级项目。 子 在智能终端市场,思必驰与众多知名公司达成合作,包括阿里、 腾讯、小米、富士康、联想、360、京东、海尔等,树立了包括天猫精 电 灵、美的空调、云米冰箱、海信电视、OPPO 手机等诸多精品案例。在企 业服务市场,思必驰推出定制平台“会话精灵”,服务于政务、金融、 国快递等领域,推出启发式对话技术和复杂结构知识管理技术,通过口语 /文字等交互方式,帮助企业快速定制专属服务助手,实现企业和用户 中 之间的无缝无碍交流。 67 案例13 知识图谱助力疫情防控和复工复产案例集(第一期) 知识图谱疫情智能分析平台辅助 “智慧防疫” 院 面向区域 全国各省市县区 案例类型 疫情防控 服务领域 政府管理 究 产品类型 研 疫情智能分析平台 化 01 准 案例背景 关于疫情防控工作, 一方面,“早发现、早隔离”是有效的疫情防 标 控手段。由于病毒有潜伏期,在确诊之前病人因为正常的工作和生活需 求,会接触大量的人,这加大了病毒传播的风险,而被感染的人又可能 术 会在确诊前传染给更多人,“人传人”的扩散很容易让感染人数呈指数 级增长。因此快速准确的找到确诊病例的活动轨迹的“接触圈”,圈定 技 可能的扩散群体和区域,采取必要的针对性措施十分关键。 另一方面,从国家和地方政府的角度,既要打赢疫情阻击战,又要 子 考虑疫情对经济发展、百姓就业的冲击程度,这也是在疫情还没有结束 的情况下各地陆续组织企业复工的原因。经济行为需要人的活动,同时 电 人的活动是疫情传播的前提,两个相互制约因素的平衡,这让各级部门 的疫情防控工作更加依赖科学的决策和有力的执行。国家在疫情防控方 国面也提出了要充分利用大数据、人工智能技术,加强疫情溯源和监测。 中 在人工智能技术中,知识图谱作为认知智能的关键技术可以发现数据中 的关联关系并构建实体关系网络,具有基于关系进行推理计算的特长,可 以辅助政府部门、相关机构等进行防控措施的分析决策。 南京柯基数据科技有限公司依托自身在知识图谱技术方面的积累, 68 知识图谱助力疫情防控和复工复产案例集(第一期) 打造了覆盖知识图谱构建全生命周期的知识图谱平台。这个平台可以方 便的和大数据平台的数据源进行对接,实现知识图谱构建,同时提供访 问知识图谱的对外开放API接口,方便数据分析展示平台获取结果,实现 大屏展示和交互。 院 究 02 技术框架 以确诊病例为关键节点,构建以人为节点、接触关系为边的疫情防 研 控知识图谱,从疫情防控知识图谱中分析需要关注的接触人员名单、传 播链条等,如图13-1所示。 化 准 标 术 技图13-1 基于知识图谱的疫情精准防控业务架构 子 构建疫情防控知识图谱,需要采集确诊病例的LBS定位数据、流行 电 病学调查数据、户籍数据、活动数据(公共交通、就医、购物、工作、 聚会、网约车、外卖等),这些数据通过柯基数据知识图谱平台构建成 国病例1的密切接触者(以下成为“密接”),其中密接1是和病例1聚餐接 触;密接2是和病例1同程接触;确诊病例2是病例1的家人;这些人形成 中 了病例1的1度接触。密接1、密接2的密切接触者是病例1的2度接触者1和 2;病例2的密切接触者是病例3;病例3的密切接触者也是确诊病例4。基 于这个图谱可以得出“病例1->病例2->病例3->病例4”的病毒传播链条, 也能看出病例1的2度范围内所有的密切接触者。按照这个方式可以通过 69 知识图谱助力疫情防控和复工复产案例集(第一期) 获取病例2、病例3、病例4的数据,补充完善这个图谱,在图谱中可以发 现超级传播者并提供接触人员名单,用于政府、疾控、医院、社区等进 行筛查、隔离和治疗等防控工作。 03 难点与挑战 院 究 在构建疫情防控知识谱过程中,有如下两方面的挑战: 数据获取难度大。构建疫情防控知识图谱需要获取确诊人群及相关 研 人群的活动数据,但是这些数据往往散落在各个不同的应用或者系 化 统中,而且某些系统缺少实名认证机制,比如公交车找到同乘车人 就很苦难,火车需要12306的购票上车人员数据,飞机需要航空公司 准 的机票购买人员数据,还需要接入视频监控,外卖数据需要美团或 者饿了么的送货人数据等,所以如何在保护个人隐私的同时又能获 标 取有用数据难度不小,需要政府层面的资源协调和相关法律保障。 海量多源异构数据的知识图谱构建难度大。目前非结构化数据的自 术 动获取准确率提升往往需要根据实际情况进行数据训练和算法完 善,因此构建过程中间还需要大量人员进行数据修正、图谱优化迭 技 代,这大大增加了知识图谱构建所需资源。 04 案例成效 子 目前在疫情防控方面利用大数据进行了一些总体情况的展示,也能 够分析一些疫情的趋势和分布,但是利用柯基数据知识图谱平台构建疫 电 情防控知识图谱可以提供基于关系的精准防控分析,内容分析内容包括 国如下五个主要方面: 超级传播者识别:按照世卫组织标准,将病毒传染给十人以上的病 中 人是超级传播者,早期发现、及时诊断和严格管理超级传播者对于 传染病的防控非常重要,所以这个分析将有助于疾病防控人员及早 发现并处理。 确诊病例间传播特征分析:通过知识图谱直观展示确诊病例之间的 70 知识图谱助力疫情防控和复工复产案例集(第一期) 接触关系,例如同住(多为家人或者酒店)、同行(公共交通工 具)、购物(购物场所)、游玩(公园等游乐场所)、就医(医 院)等。方便流行病学调查人员研判疫情传播途径、传播能力,为 疫情的隔离措施、公众防护提供指导。 确诊病例传播方向冲突检测:在确诊病例中,传播途径只能是从一 院 究 个病例传给另一个病例,不存在一个病例从两个病例传入的情况, 即如果图谱中发现一个病人有两个及两个以上入度,即可认为这个 研 确诊病例图谱中该病人的相关传播时序有错误,可以提醒流行病学 调查人员进行补充调查,直到图谱中不存在冲突的错误为止。 化 疫情传播的本地扩散分析:在疫情传播中,可以把传播超过2度(例 如前面图1所示的“病例1->病例2->病例3->病例4”的传播为3度)的 准 情况突出显示出来,因为传播链条长,显示本地的疫情防控措施薄 弱,需要本地防控部门及早发现问题,堵住漏洞。(早发现、早隔 标 离) 隔离人群和区域分析:以确诊病例为中心,可以把所有接触的人进 术 行划分,1度的密切接触人,密切接触人的2度接触人,以及其它更 多度的接触人,可以根据疫情防控的需要对不同级别的人群采取不 技 同的隔离措施,同时对于确认病例及1、2度接触人所在的小区进行 子 不同等级的消毒、防护措施。有助于精准施策,降低疫情防控对老 百姓生活的影响。 电 05 案例意义 国柯基数据知识图谱平台基于确诊病例的活动数据、接触人员及关系 数据进行知识图谱构建,可以用于各级政府和相关机构的疫情精准防控 中 分析,或者与各应急指挥平台对接,为应急指挥的各类灾害或者突发事 件构建应急响应处置措施知识图谱,提供应急处置分析服务。 71 知识图谱助力疫情防控和复工复产案例集(第一期) 06 下一步工作计划 将柯基数据的知识图谱平台用于政府部门的疫情防控一线,通过构 建疫情防控知识图谱,摸清数据底数,补充基层防控部门上报数据的途 径,完善数据采集系统,以图谱构建的应用需求促进数据标准化,发挥 人工智能在疫情精准防控工作中的作用。 院 究 研 企业简介 南京柯基数据科技有限公司 成立于2015年,是荣获江苏省“创聚工程”和“创业南京”两项称 化 号的创新型高科技企业,公司已获得授权及在申请的核心自主知识产权 将近30项,技术覆盖了从数据采集到数据清洗、知识提取、知识表示、 准 知识推理、动态本体建模、图存储、可视化关联分析、智能问答、语义 检索等知识图谱全技术链。公司于2017年在北京中关村成立了北京知识 标 图谱科技有限公司,负责公司的产品和市场推广。 公司开发了全周期的知识图谱平台产品和认知智能应用产品,公司 术 产品在药企、医疗机构、军工院所、科技情报及出版等领域服务了十余 家大客户,积累了丰富的行业知识图谱运用开发经验。 技 子 电 国 中 72 案例14 知识图谱助力疫情防控和复工复产案例集(第一期) 基于新冠知识图谱的疫情智能问答 院 面向区域 全国各省市县区 案例类型 疫情防控 服务领域 公众服务 究 产品类型 研 知识问答与 应用服务 01 案例背景 化 准 小爱同学是小米公司推出的虚拟人工智能助理,通过搭载小爱同学 的智能硬件,如智能音箱,用户可以简单到通过一句话了解新冠知识和 标 疫情状态。从小爱同学的日志统计来看,在用户所咨询的问题中和“肺 炎、疫情”相关的问题每天可达近百万。通过分析小爱同学新冠知识类 术 数据,可以快速获悉用户有获取实时疫情、新冠知识、病毒防控、肺炎 治疗等知识和信息的需求。为了向用户传递更加准确的知识和信息,小 技 米知识图谱团队与OpenKG的专家们一起构建了新冠知识图谱,覆盖了新 冠百科图谱、新冠科研图谱、新冠临床图谱、新冠英雄图谱和新冠热点 子 事件图谱等。最终以知识可视化形式展示和输出给小爱同学的用户,通 过技术手段助力疫情防控,为用户答疑解惑。 电 国02 技术框架 整体架构介绍。基于数据挖掘、关系抽取等知识图谱关键技术,通 中 过对疫情相关数据采集、schema定义、知识关联把不同来源的新冠 知识、疫情新闻等信息按照一定规则构建成新冠图谱,帮助小爱同 学丰富疫情问答内容,并且通过事件图谱的推理能力对一些辟谣进 行事理佐证和热点预测。 73 知识图谱助力疫情防控和复工复产案例集(第一期) 院 究 图14-1 新冠知识图谱架构图 研 化 事件图谱构建。新冠事件图谱通过从人民日报、丁香医生多源获取 准 数据,规范schema定义、抽取事件实体并结合知识融合技术构建而 成。新冠热点事件图谱包含了疫情发生以来一系列的重大事件的知 标 识,并在事件之间遵循顺承关系,从发生时间、信息来源、标题、 事件内容简介等各个维度来揭示疫情。 术 技 子 电 国 图14-2 事件图谱可视化schema 中03 难点与挑战 即时性的数据获取是事件图谱构建过程中最大挑战。像疫情这种突 发性的事件,很多不同的消息源会短时间提供大量的相关数据,由 于这些消息更新非常迅速,需要非常及时地甚至秒级地更新机制, 74 知识图谱助力疫情防控和复工复产案例集(第一期) 这对目前的数据获取系统形成了非常大的工程挑战。 事件之间的Causal Inference还处在开放的研究阶段。目前事件图谱 中,有比较明确解决方案的是事件之间的顺承关系。但事件图谱作 为事理推论基础,如能建立比较完备的因果关系,会产生更大的应 用价值,但对应的方案还处于研究阶段。 院 04 案例成效 究 研 新冠知识图谱可帮助小爱提升用户对新型冠状病毒知识80%的问题需 化 求。可支持的问答类型有:肺炎介绍、疫情什么时候结束、感染症 状、病毒潜伏期、肺炎症状、疑似病例的诊断标准有哪些等。 准 事件图谱已可支持查询事件之间遵循顺承关系,图14-3展示了事件顺 承关系示例。 标 术 技图14-3 事件顺承关系示例图 05 子 案例意义 新冠图谱数据已经在疫情问答上实现,为用户解答肺炎疑惑。除此 电 之外,新冠图谱对知识可以起到普及作用,通过事件和百科、英雄关联 结合,可让用户更好地了解疫情和热点事件的来龙去脉,并佐证事件的 国真伪,预测事件的结果。 中 75 知识图谱助力疫情防控和复工复产案例集(第一期) 06 下一步工作计划 未来,小米知识图谱除帮助小爱同学丰富疫情问答知识外,在事件 图谱构建上将会精细化事件之间的关联(除顺承以外),如分支、因果 等,最终构建事理图谱。进而,基于明确的事理做预测和分析,对一些 辟谣进行事理佐证等。另外,还将不断扩展产品形态,在小爱知识类问 院 究 答、医药知识问答、推荐、搜索等多场景中探索应用,推动事理图谱的 构建和应用,推动用户更直接更自然地获取知识。 研 化 企业简介 小米科技有限责任公司 小米科技有限责任公司成立于2010年4月,是一家以手机、智能硬 准 件和IoT平台为核心的互联网公司,始终坚持做“感动人心、价格厚道” 的产品,专注于智能手机、智能家居、互联网电视等产品的科技创新。 标 2019年1月11日,雷军宣布小米在本年度正式启动“手机+AIoT”双引擎 战略。人工智能部是小米核心平台技术部门,由小爱团队、AI实验室、 术 AI生态、AI虚拟助手等团队组成。为公司相关业务提供AI技术支撑,打 造AI产品。人工智能部目前拥有计算机视觉、声学、语音、NLP、知识图 技 谱、机器学习等6大技术方向。 知识图谱团队主要研究知识图谱的构建和应用技术。目前建立的知 子 识图谱包含13个行业,高质量关系数量超百亿,已经广泛应用到智能问 答、智能客服、广告、信息流等产品中。团队还开发了通用域和专业域 电 知识问答系统。前者回答了每天来自小爱同学用户的百万级问题,后者 在小米的智能客服和销售助手等场景中取得了非常好的效果。未来我们 国将不断把知识图谱技术广泛应用到各行各业,助力企业和人们更智能的 获取知识。 中 76 案例15 知识图谱助力疫情防控和复工复产案例集(第一期) 重点疫情人员图谱强化疫情防控管理 院 面向区域 贵州省 案例类型 疫情防控 服务领域 政府管理 公共服务 究 产品类型 研疫情人员 防控管理平台 01 案例背景 化 准 新冠肺炎的防疫工作有赖于区域性信息采集、重点疫情人员发现与 预警等多方面措施的配合,通过线上识别可以为疫情防控线下举措的规 标 划与协同提供精准、有效的论据,并落实“防输入、防扩散”地整体工 作部署。在疫情防控期间,贵州省建立了疫情采集汇集的协调机制,对 术 部分“重点人员”进行身份识别、信息收集、位置追踪等工作。 02 技术框架 技 子 电 国 中 图15-1 新冠肺炎重点疫情人员防控图谱示例 77 知识图谱助力疫情防控和复工复产案例集(第一期) 本案例围绕新型冠状病毒的传播特点及国家卫生健康委员会发布的 各项防扩散措施建议等信息,通过构建疫情人员防控知识图谱从海量数 据中碰撞、挖掘、分析潜在感染人群,分析研判家庭聚集性传播和社区 聚集性传播为主的病毒传播模式等,为区域性疫情防控提供传播途径及 预警,新冠肺炎重点疫情人员防控图谱示例如图15-1所示。 院 03 难点与挑战 究 研 在贵州省大数据局统筹下,云上贵州联合腾讯、BBD、优特云等团 化 队经过6个昼夜奋战实现全省统一数据、统一标准,助力贵州抗疫“管 点、控线、畅面”,加快社会经济生产快速恢复。 准 依托前期统一的政务数据标准,实现了疫情应急领域知识图谱短时 构建,提高了疫情应急领域应用“敏捷性”开发的效率。此外,政府与 标 企业及多企业团队间的协调难度大、疫情防控管理平台上线时间紧、精 准防控要求高均增加了疫情平台开发的难度。 04 案例成效 术 技 子 电 国 中 图15-2 贵州新冠肺炎重点疫情人员防控管理平台界面 78 知识图谱助力疫情防控和复工复产案例集(第一期) 本案例通过微信扫码方式,可完成人员的个人实名资料采集、地 理位置信息采集,并快速验证并识别进入贵州的“重点人员”,提升了 信息采集与识别的时效性,并大幅降低了一线防疫人员的劳动强度。此 外,按照预设异常逻辑,可向指定人员触发语音和短信提示与告警,以 指导“线下”疫情防控举措,强化“线上”与“线下”信息与措施间的 院 究 联动协同,贵州新冠肺炎重点疫情人员防控管理平台界面如图15-2所示。 具体操作示例如下: 研 扫描“贵州省重点人群疫情防控二维码”,呼起小程序,用户允许 授权手机号后需填写“姓名”、“身份证号码”、“居住地址”进 行实名验证。 化 准 标 术 技 图15-3 “健康码”识别进入贵州的「重点人员」采集与识别 子 电 国 中 图15-4 疫情防控期间的个人数据采集 79 知识图谱助力疫情防控和复工复产案例集(第一期) 实名认证后,通过小程序“扫一扫”,进行位置信息授权,用户 “允许”后,呼起摄像头,进行扫码识别后,后台向小程序返回人 群标签,用户可查看健康卡类别。 院 究 研 化 准 图15-5 疫情防控期间的个人健康情况分级分类 标 用户进行每日健康打卡,根据后台设定的“异常逻辑”,在用户定 术 位异常时,发送告警语音与短信。 技 子 电 国 中 图15-6 疫情防控期间的健康打卡与个人预警 80 知识图谱助力疫情防控和复工复产案例集(第一期) 05 案例意义 精准识别疫情防控重点人群,揭示疫情发展态势。通过利用动态本 体图谱对重点人员精准画像,在重点城市基本单元等应用场景采取 分级分类管控措施,一旦发现异常情况动态预警。同时,通过宏观 呈现疫情发展态势,监测疫情拐点,做好疫情防控精准施策和疫情 院 究 研判的好参谋和晴雨表。 深度挖掘潜在感染人群,推动全面复工复产复学。通过知识图谱从 研 海量数据中碰撞、挖掘、分析潜在感染人群,利用桥梁点和码头点 化 锁定超级传播者及其传播代际和传播社群分布,分析研判家庭聚集 性传播和社区聚集性传播为主的病毒传播模式等。在全面复工复产 准 复学的阶段,做到“管点、控线,畅面”一盘棋 ,用大数据助力打 赢疫情防控狙击战、全面战、主动战。 06 下一步工作计划 标 术 目前,系统已在贵州省域上线,持续为疫情以及公共应急事件提供 来自大数据、知识图谱领域的技术支撑,并有望进一步推广到各疫情防 技 控区域。重点实体对象的大数据精准识别,与重点实体对象的知识图谱 关联关系发现,已经成为大数据技术与知识图谱的重要方法论,这一方 子 法论使用产生了各类领域知识的应用场景,重点疫情人员防控将持续在 公共卫生与应急领域深入拓展,为后续疫情结束提供有效识别、预警与 电 预测的数据和图谱论据。 国 中 81 知识图谱助力疫情防控和复工复产案例集(第一期) 企业简介 数联铭品(BBD) 数联铭品(BBD),是国内最早探索和实践大数据技术和数字经济 产业发展的高新技术企业之一,拥有完整的大数据综合服务产品线和丰 富的行业解决方案,同时搭建了国内领先的企业数据库和模型库,具备 强大的数据治理和建模能力,致力于打造“全球领先的大数据金融科技 院 究 和政府治理智库服务机构”。 围绕一带一路、数字中国等国家战略,BBD构建了面向政府、企 研 业、金融市场三大主体的业务体系和商业模式,形成价值叠加、功能联 动的服务通链,覆盖信用体系建设、政府监管、金融风控、宏观经济、 化 公共安全等多个领域。事实与预测,是我们为客户提供的两种核心价 值,助力政府、企业和金融机构提升决策效力。 准 标 术 技 子 电 国 中 82 案例16 知识图谱助力疫情防控和复工复产案例集(第一期) 知识图谱平台保障防控物资应急调度 院 面向区域 全国各省市县区 案例类型 疫情防控 服务领域 物流 究 产品类型 研物资应急 调度平台 01 案例背景 化 准 在疫情防控中,为了保障口罩、防护服等物资的应急调度,需快 速、准确地接入和掌握疫情救援期间等重点关注的救援物资生产经营企 标 业的动态信息,并根据企业特征和安全生产规定采取有针对性的监管措 施。围绕上述需求,通过将所有相关知识沉淀起来并形成知识图谱,可 术 实现防疫物资企业的安全生产监督及防疫物资的应急调度,最终保障疫 情防控物资的安全顺畅运转,推动我国疫情防控工作的有序推进。 02 技术框架 技 子 本案例的技术框架如图16-1所示,依托蚂蚁技术基础平台上已开发的 电 机器学习引擎、图计算引擎、图存储引擎等基础引擎,并借助AI一体化 研发平台,融合知识图谱各项关键技术,构建企业知识图谱、财富知识 国图片、保险医疗知识图谱、服务内容图谱、自然人图谱等各类相关知识 图谱,并基于上述图谱搭建疫情防控物资应急调度平台,支持物资应急 中 调度、企业风险控制、企业安全生产等各类应用。 83 知识图谱助力疫情防控和复工复产案例集(第一期) 院 究 研 化 图16-1 物资应急调度平台技术框架 准 知识建模: 业务图谱本体化的抽象过程,目标是把业务信息转换成知 标 识的形式化表达; 知识抽取: 通过NLP + OCR + ETL等能力的组装,将原始数据抽取成 术 图谱标准知识的过程,方便图谱高效的知识构建; 知识融合: 知识融合包括实体归一、子图融合两个方面,目标是降低 技 知识冗余,提升知识的准确率; 知识推理: 知识推理是存量图谱数据的应用过程,通过对存量图谱做 子 规则迭代或模型表示发现新的知识; 知识应用: 将知识图谱推理、知识服务以服务化的形式为业务输出, 电并支持自定义应用开发。 国03 难点与挑战 中 知识建模复杂度高,需实现物资应急调度及监督管控相关各类型、 各部门结构化数据到语义逻辑知识化的精炼,比如防疫物资属性实例 化等。 知识融合与推理规模大,需实现基于本体构建的跨图谱知识融合并 84 知识图谱助力疫情防控和复工复产案例集(第一期) 实现所有实体归一管理和数据互通,还需进一步在图计算引擎上实 现大规模一体化图谱推理的能力。 04 案例成效与意义 目前,蚂蚁金服知识图谱技术已成功应用于政府部门大数据平台项 院 究 目,并结合风报产品成功帮助政府部门了解疫情物资企业的企业画像及 预测风险,疫情实时动态查询页面示例如图16-2所示。本案例在本次疫情 防控期间具有以下两方面的意义: 研 化 准 标 术 技 子 图16-2 疫情实时动态查询页面示例 电有效保障了防疫物资的安全生产。从物资保障维度进一步完善疫情 国救援期间口罩、防护服等重点关注的救援物资生产经营企业的动态 信息,根据企业特征和安全生产规定采取有针对性的监管措施,保 中 障疫情防控和安全生产。 有效保障了防疫物资的应急调度。通过帮助银行、政府等部门了解 更多更全面的信息,对本次抗疫行动作出精准预判、精准决策和精 准救援。此外,辅助政府部门统筹应急力量建设和物资储备并在救 85 知识图谱助力疫情防控和复工复产案例集(第一期) 灾时统一调度,在特殊时期全面管理防护口罩、防护服等防疫物资 的调度。 05 下一步工作计划 在本次知识图谱构建及系统开发过程中,数据格式、构建关键技 院 究 术、业务框架及知识图谱生命周期等方面标准空白问题突出,亟需建设 体系化的标准来指导行业的发展。未来,将联合业界知识图谱的厂商, 研 共同制定和完善知识图谱的国家或行业标准,指导行业的发展,促进知 化 识图谱在疫情防控、复工复产、金融科技等各方面中的应用。 企业简介 蚂蚁金服 准 标 蚂蚁金服是一家旨在为世界带来普惠金融服务的创新型科技企业。 蚂蚁金服金融知识图谱平台,将蚂蚁的所有知识沉淀成一张图,提升了 术 业务的智能化,助力业务快速从感知智能迈入认知智能时代。目前,蚂 蚁金融知识图谱平台已经广泛应用在蚂蚁内部以及合作伙伴的微贷、智 技 能理赔、智能理财、疫情防控等业务领域中。 子 电 国 中 86 案例17 知识图谱助力疫情防控和复工复产案例集(第一期) 疫情防控政务问答助手 “一键即知”——有问必答 院 究 面向区域 山东济南 案例类型 复工复产 服务领域 政府管理 研产品类型 问答/搜索类知识 疫情防控 化图谱及产品 01 准 案例背景 疫情期间为有序做好企业复工复产,促进经济平稳健康发展和社会 标 大局稳定工作,国家各级政府部门和各个行业积极主动应对,相继出台 了一系列惠民惠企政策和预防措施。为了更好地帮助市民和企业和及时 术 准确地了解最新的防控法规、复工措施及相关扶持政策,北京欧拉认知 智能科技有限公司联合济南日报报业集团旗下舜网传媒公司,通过整合 技 济南市大数据局的权威疫情数据和互联网公开的数据信息,共同开发了 疫情防控政务问答平台——“一键即知”,并依托舜网融媒体平台进行 子 权威发布和推广。平台通过对惠民惠企政策、复工措施数据及预防措施 信息的收集处理,借助人机对话式问答的方式,对用户提出的问题进行 电 快速、有效地定位,并将相关疫情防控政策等信息返回给用户。 国02 技术框架 中 如图17-1所示,“一键即知”疫情防控政务问答平台架构基于欧拉认 知智能的知识发现能力,通过“舜网”防疫问答机器人平台,整合济南 市大数据局、媒体报道、互联网、等渠道的相关数据(异构数据),进 行问答知识图谱构建。通过图分析和计算引擎及各类关系模型,可以精 87 知识图谱助力疫情防控和复工复产案例集(第一期) 准识别用户搜索和问答意图,并通过定位推送实现了“有问必答,有答 必准”。 院 究 研 化 图17-1 疫情防控政务问答助手“一键即知”知识问答架构 03 难点与挑战 准 标 信息分散、格式不统一:多个数据来源,缺少结构化信息和统一的 术 表达。 用户意图多样:普通用户缺少专业引导或培训,因此需要结合图谱 技 的行业语义对用户的输入意图进行推测,并不断学习和适应用户的 输入。 子 时间紧迫且数据更新频度高:由于本次疫情属于突发事件,网络上 的信息实时更新频率很快,因此需要借助认知智能平台相关工具高 电效地完成基础数据的治理。 国04 案例成效与意义 中 实时便捷、即问即答。通过这个便捷绿色平台,用户可以随时了解 济南市权威企业复工和扶持政策相关信息。同时,疫情防控政策和 知识的普及在一定程度上可以缓解公众的焦虑和恐慌。 上线后已收获高使用率和好评率。截至2月23日中午,平台浏览量近 88 知识图谱助力疫情防控和复工复产案例集(第一期) 达150万次、点赞数136万次,不仅受到市委领导的点名表扬,还得 到了人民网的重点推介。 院 究 研 化 准 标 术 图17-2 疫情防控政务问答助手“一键即知”功能界面 技 05 下一步工作计划 子 由于时间关系,本案例目前只实现了针对某些特定场景的问答,对 于复杂度高的多样性提问性暂时不能一一应答。在更加细颗粒度的原子 电 知识和底层实体的融合准确度等方面还有一定的欠缺和不足,这也是下 一步计划增强的技术点。此外通过知识的适应性调整后,可以对平台进 国行复制推广,辅助其它省市政府部门,共同打赢疫情阻击战。 中 89 知识图谱助力疫情防控和复工复产案例集(第一期) 企业简介 北京欧拉认知智能科技有限公司 北京欧拉认知智能科技有限公司,基于其独创的新一代认知智能平 台和“知识即服务”模式,利用语义化数据治理方式和图分析框架,链接 分散的异构数据,通过实时搜索的方式,实现知识发现,知识推理,探索 洞察和实时决策等应用。帮助大型政企和组织,实现认知智能升级。 院 究 联合单位:山东舜网传媒股份有限公司(简称舜网传媒),系新三 板挂牌企业。 其主办单位为济南日报报业集团,立足于知识图谱技术 研 和问答应用,舜网正在加速发展融媒体到智媒体的升级,通过人工智能 能力服务百姓,服务大众,成为山东省和济南市政府服务的重要门户。 化 准 标 术 技 子 电 国 中 90 案例18 知识图谱助力疫情防控和复工复产案例集(第一期) 知识图谱赋能疫期汽车线上智能 营销新模式 院 究 面向区域 全国各省市县区 案例类型 复工复产 服务领域 汽车营销 研产品类型 汽车智能 服务平台 化 01 准 案例背景 受疫情影响,中国汽车产业从生产与营销均受到了较大影响,主要 标 体现在开工疫情防控难度大、员工到岗不足、供应商供应难保障、交通 运输限制、现金流紧张、终端销量不景气、用户购车意愿下降和海外订 术 单难履行等方面。其中由于疫情大幅抑制了消费,导致经销商最先受到 冲击而且受影响最大。据中国汽车流通协会渠道分会调查数据显示,春 技 节假期,只有不足30%的门店有零星的购车需求。与家用电器、食品等部 门门类相比,客户很难在网络上完成汽车这样大宗消费品的全部交易, 子 通常需要去线下实体店确认后才会购买。这无疑会拉长了交易的时间, 增加更多的不确定性,从而导致经销商无法有效地锁单。 针对疫情期间主机厂和经销商面临的获客少、锁单难的问题,汽车 电 之家通过VR远程看车和卖车直播的营销应用,打造“实景展厅+虚拟展 国厅”,实现个性化形象展示,让用户足不出户逛店选车。同时,基于汽 中 车行业知识图谱为用户提供专业汽车知识解答,解决用户在购车过程的 问题,辅助用户购车决策,把用户购车意愿的不确定性转变成确定性, 进而帮助主机厂、经销商在复工复产后正常开展经营活动。 91 知识图谱助力疫情防控和复工复产案例集(第一期) 02 技术框架 院 究 研 化 图 18-1 基于知识图谱驱动的汽车疫情营销应用技术框架图 准 图18-1描述了基于知识图谱驱动的汽车疫情营销应用的技术框架。 该框架的底层是利用汽车之家海量的行业数据,通过知识图谱相关技术 (如知识抽取、知识建模、知识融合等),构建出汽车行业知识图谱; 标 在知识图谱基础上,研制了一系列AI应用服务(如智能问答、语义搜 术 索、个性化推荐等);针对疫情环境下汽车营销受抑制的现状,充分发 技 挥AI服务的智能问答、意图理解、个性化推荐等技术优势,搭建了VR远 程看车和在线直播卖车的营销应用,实现车型VR展示、虚拟店铺、购车 子 咨询、卖点介绍、在线促销等功能;满足用户的看车、买车、用车等需 求,经销商的在线销售、降价促销、线索采集等需求,汽车厂商的市场 电 调研、竞品分析、广告投放等需求。 国03 难点与挑战 本案例在实施过程中的难点和挑战主要包括以下两方面。 中 提高用户在线购买成功率。对于用户来说,一般都会去线下实体店完 成汽车的购买,在线完成全部购车流程的意愿很低,如何通过VR+直 播实现提高用户在线购买的成功率便是本案例中的难点之一。 92 知识图谱助力疫情防控和复工复产案例集(第一期) 有效转化潜在购车用户。疫情的管制,使得VR远程看车、直播和在 线问答等吸引了众多汽车爱好者、潜在购车用户和其他普通用户, 如何在众多用户中,有效地将潜在的购车用户挖掘出来并成功转化 为线上线索也是本案例的难点之一。 院 究 04 案例成效 本案例部署效果如图18-2所示,其成效主要体现在以下两个方面: 研 化 准 标 术 技 子 电 国 中 图18-2 国内首次车企高管直播卖车 93 知识图谱助力疫情防控和复工复产案例集(第一期) 疫情期间,汽车之家访问量和停留时长的大幅提升。通过深度整合 汽车之家的数据资源,充分调用汽车之家内容和经销商的渠道优 势,每天10至22点,一周7天不间断直播,为用户带来车市资讯和精 品内容,使得相关厂商和经销商在汽车之家页面的访问量平均提升 了25%,停留量平均提升35%。 院 究 经销商获客率和销售线索增加。通过与车企、经销商进行深度合 作,在线上直播卖车和VR远程看车过程中:一方面,引入知识图 研 谱驱动的智能助手,回答用户询价、车型配置、车型对比、维修 保养、贷款方案、经销商信息等常见问题,减轻了人工客服的工 化 作量,大幅提升获客效率和质量;另一方面,通过累积的历史对话 (人工和机器),能够辅助理解用户购车需求,挖掘更多潜在的销 准 售线索,并更好地指导厂商和经销商后续的促销活动。 05 案例意义 标 术 本案例的意义主要体现在未来线上化、移动化、数据化和智能化模 式探索,对汽车营销起到助推作用。此次疫情的出现和本案例的成功实 技 践,将使得整个行业的营销手段更加丰富和贴近客户需求。同时,知识 图谱作为行业知识数字化的沉淀和认知智能的核心,也将发挥越来越重 子 要的作用。 电 06 下一步工作计划 国本案例目前仍存在的问题在于目前智能助手和用户对话过程缺乏 有效引导,理解用户真正意图较为困难,从而导致销售线索的挖掘仍有 中 较大提升空间。针对存在问题,下一步计划基于用户画像对用户进行分 群,根据所属不同人群,设计相应的对话策略来引导人机对话。在可控 对话场景下,充分挖掘用户意图,并通过实时修正获取线索方式以提升 整体效果。 94 知识图谱助力疫情防控和复工复产案例集(第一期) 企业简介 北京车之家信息技术有限公司 成立于2005年,是中国最大的汽车互联网平台,于2013年在纽交 所上市。2016年,加入世界500强平安集团,开启战略转型之路。之家 在汽车行业优势巨大,用户覆盖量全网最大,DAU为4350万,同时在线 交流人数为100万,年度1亿多条线索,转化率全网最高,为市场贡献近 院 究 一半的成交量。助力汽车产业中95%的主机厂商和经销商实现其营销价 值,掌握中国最大量的汽车消费数据,用户声量占全网80%。 研 结合汽车之家全站内容优势,构建了汽车行业的知识图谱,具备 规模大、内容全、准确性高、更新快等特点,涵盖汽车配置、口碑、报 化 价、车辆推荐、百科、资讯、故障、保养、汽车金融、经销商信息、用 户手册等各类汽车行业知识。目前该汽车行业知识图谱已经成为整个汽 准 车之家的认知智能中台,为汽车之家提供“理解”、“思考”、“推 理”和“表达”等AI能力,赋能汽车之家各业务线,并支撑聊天机器 标 人、行业数据分析、车机问答和智能营销等应用。 术 技 子 电 国 中 95 知识图谱助力疫情防控和复工复产案例集(第一期) 院 究 研 化 准 标 术 技 子 电 国 中 IEEE知识图谱标准化工作组 & 知识图谱国家标准编制工作组 联系方式:lijia@cesi.cn lirq@cesi.cn 96

  • 关注微信

猜你喜欢