悦数图数据库

OPPO: 大规模知识图谱在智能问答中的应用

运用悦数图数据库构建知识图谱,提升智能问答机器人回答的准确度和覆盖率

业务挑战:业务数据不断增长,使用现有数据库无法满足业务要求

小布助手是 OPPO 旗下有趣贴心、无处不在的 AI 助手,搭载在 OPPO 手机、OnePlus、Realme 以及如智能手表等 IoT 智能硬件上。它可以为用户提供系统应用、生活服务、影音娱乐、信息查询、智能聊天等服务,进而挖掘潜在的用户价值、营销价值和技术价值。

随着知识图谱等业务数据的不断增长,现有的图数据库应对已经比较吃力,导入时间已经无法满足业务的要求。因此寻找性能更好的图数据库产品已经成为了当前迫切要做的事情。

选择 悦数图数据库:更好的性能,带来更多业务可能

经过调研,悦数的图数据库产品在导入性能、响应时间以及稳定性均符合需求,支持数据切分,使用的企业也多,中文文档全面,是图数据库的理想选择。

OPPOx悦数图数据库-架构图

接下来为大家介绍 OPPO 知识图谱的整体架构。如上图所示,它由三大部分组成。最底层是通用的数据处理平台和图数据库相关框架。我们具体选取 「悦数图数据库」来存储图数据。中间层包含数据获取、图谱构建和图谱管理模块。最顶层涵盖了 OPPO 图谱各种应用场景,包括智能问答、搜索推荐、内容理解、安全风控、智慧健康等。

应用场景

应用场景1:智能问答

通过构建多领域知识图谱,对问题进行解析并链接图谱中的实体,利用图谱中的实体关联关系生成问题的答案。在使用图谱后,小布助手支持基于知识库的问答 (KBQA),在 What、When 等事实性问题的准确率和覆盖率大幅度提升。

智能问答

例如:xxx的老婆是?xxx奥特曼的体重是多少?北京的面积是多少?

除了事实性问答,小布助手还可以利用图谱的推理能力实现一些复杂问答。

例如:OPPO发布的第一款手机是什么?xxx和xxx是什么关系?出生在xx的双子座明星有哪些?

应用场景2:内容推荐

通过对于影视类视频打上内容标签,将演员、导演、影视节目、扮演角色等构造成一个影视娱乐图谱,当有新的影视类短视频发布时,可以通过视频中人脸识别出演员、标题或字幕中识别出影视角色,并利用图谱快速推理出对应的影视作品名,从而达到给用户精准推荐的效果。

应用场景 3:数据血缘

在数仓中,经常需要运行各种 ETL Job,数据表和任务非常多,如何直观的观察数据表上下游与任务之间的关系变成一个亟需解决的问题。

使用关系型数据库处理多层级的关联查询非常麻烦,不仅开发工作量大,而且查询性能极慢。而使用图数据库,不仅大大减少了开发工作量,而且能够快速的查出表的上下游关系,便于直观观察数据的血缘关系。

数据血缘

应用场景3:服务架构拓扑

在服务资源管理中,业务资源会分为多个层级,每个层级下面有对应的服务器、服务和管理人员,如果使用关系数据库来处理,当需要展示多级资源的时候,查询会很麻烦,性能会很差。这个时候,可以将资源、管理人员、服务器、业务层级之间的关系放到图数据库中,展示的时候,一条查询语句就能搞定,查询速度还很快。

服务架构拓扑

使用收益:图数据库性能大幅度提升,为未来更多业务场景提供可能

小布助手之前只支持基于文档的问答 (DBQA),使用图谱后可以支持基于知识库的问答 (KBQA),还能利用图谱的推理能力实现一些复杂问答。悦数图数据库能够支持 10 亿节点 100 亿边的大规模图谱,全量导入时间也不超过 10h,二度查询平均响应时间不超过 50ms,QPS 能够达到 5000+。

目前,OPPO 已经构建了数亿实体和数十亿关系的高质量通用知识图谱,每天支持线上数百万次的小布问答请求。下一步,OPPO 正将通用知识图谱逐渐扩展到商品图谱、健康图谱、风控图谱等多个垂类。

用户评价

图数据库在最近这几年发展很快,Gartner 发布的报告指出:到 2025 年,图技术将促进全球 30% 企业的快速决策场景化。图技术应用的年增长率超过 100%。随着 5G 和物联网的普及,相信图数据库将成为处理关系的基础设施。

--- OPPO 高级后端工程师 Qirong

logo

公司介绍

OPPO 是一家全球移动互联网智能终端设备制造商,业务遍及 50 多个国家和地区,拥有 40 多万个销售网点及 2500 个服务中心。「小布助手」是 OPPO 智能手机和 IoT 设备上内置的 AI 智能问答助手,包含语音、建议、指令、识屏和扫一扫等功能模块。目前,OPPO 将悦数图数据库用于基于知识图谱构建的智能问答平台。