CN111950621A

CN111950621A - 基于人工智能的目标数据检测方法、装置、设备及介质

Info

Publication number: CN111950621A
Application number: CN202010797367.6A
Authority: CN
Inventors: 张宪桐
Original assignee: Ping An Life Insurance Company of China Ltd
Current assignee: Ping An Life Insurance Company of China Ltd
Priority date: 2020-08-10
Filing date: 2020-08-10
Publication date: 2020-11-17
Anticipated expiration: 2040-08-10
Also published as: CN111950621B

Abstract

本发明涉及人工智能，提供一种基于人工智能的目标数据检测方法、装置、设备及介质，能够对目标数据集进行扩展，使模型更加准确，将扩展数据集输入至自编码器，输出衍生特征，以支持海量数据且耗时短，满足更多预测场景下对于特征的要求，以衍生特征训练预设神经网络得到检测模型进行检测，整合检测结果为目标的数据作为目标数据，进而能够以人工智能的方式自动进行目标数据的检测及筛选，解决了筛选效率低、出错率高，且可靠性欠佳的问题，同时也解决了传统的分类模型无法处理海量数据，特征提取困难且耗时较长，以及难易寻找时间序列或者多数据集的联合特征的问题。本发明还涉及区块链技术，检测模型及目标数据可存储于区块链。

Description

基于人工智能的目标数据检测方法、装置、设备及介质

技术领域

本发明涉及人工智能技术领域，尤其涉及一种基于人工智能的目标数据检测方法、装置、设备及介质。

背景技术

目前，随着保险行业的飞速发展，代理人的队伍也日渐壮大，部分代理人存在代做或者代刷数据的情况(如：利用他人的设备做题等)，进而产生大量虚假数据，这些虚假数据会造成较大的数据噪声，降低数据质量，进而由于真实性较低而影响数据的可用性，因此，如何进行快速且准确地目标数据检测成为了亟待解决的问题。针对上述情况，业内通常采用的解决方式是以预先设置的规则进行数据的筛选，例如：人为设置筛选原则，保留符合该原则的数据，并删除不符合该原则的数据。该方式仅依赖于人为定义的规则进行数据统计，不仅筛选效率低，且极易出错，导致最终的检测结果可靠性欠佳。

另外，只利用传统的分类模型进行筛选会受限于分类模型自身的特点，进而可能导致无法处理海量数据，特征提取困难且耗时较长，以及难易寻找时间序列或者多数据集的联合特征等问题。

发明内容

鉴于以上内容，有必要提供一种基于人工智能的目标数据检测方法、装置、设备及介质，能够以人工智能的方式自动进行目标数据的检测及筛选，解决了筛选效率低、出错率高，且可靠性欠佳的问题，同时还解决了传统的分类模型无法处理海量数据，特征提取困难且耗时较长，以及难易寻找时间序列或者多数据集的联合特征等问题。

一种基于人工智能的目标数据检测方法，所述基于人工智能的目标数据检测方法包括：

响应于接收到的目标数据检测指令，确定目标标签；

获取与待检测用户对应的待检测数据；

根据所述目标标签从所述待检测数据中选择数据构建目标数据集；

对所述目标数据集进行扩展处理，得到扩展数据集；

将所述扩展数据集输入至预先训练的自编码器，输出衍生特征；

以所述衍生特征训练预设神经网络，得到检测模型；

将所述待检测数据输入至所述检测模型，输出检测结果，其中，所述检测结果包括目标及非目标；

整合检测结果为目标的数据作为目标数据。

根据本发明优选实施例，所述确定目标标签包括以下一种或者多种方式的组合：

解析所述目标数据检测指令的方法体，得到所述目标数据检测指令所携带的数据，获取预设标签，以所述预设标签在所述目标数据检测指令所携带的数据中进行匹配，并将匹配的数据确定为所述目标标签；或者

获取历史目标数据，识别所述历史目标数据的关键字作为第一关键字，并计算所述第一关键字的出现频率，获取出现频率最高的第一关键字作为所述目标标签。

根据本发明优选实施例，所述根据所述目标标签从所述待检测数据中选择数据构建目标数据集包括：

识别所述待检测数据中每个数据的关键字作为第二关键字；

将所述待检测数据中带有相同的第二关键字的数据划分为一类，并以所述相同的第二关键字命名每个类别；

配置每个类别在对应的数据中的权重；

将权重大于或者等于配置权重的类别确定为对应的数据的目标类别；

以所述目标类别定义对应的数据的标签；

以所述目标标签在定义的标签中进行匹配，并获取与所述目标标签匹配的标签所对应的数据构建所述目标数据集。

根据本发明优选实施例，所述对所述目标数据集进行扩展处理，得到扩展数据集包括：

获取预先定义的至少一个子标签，并从所述待检测数据中选择与每个子标签对应的数据构建与每个子标签对应的至少一个子数据集；

计算所述目标数据集与所述至少一个子数据集的交集，得到至少一个子交集；

整合所述至少一个子交集中的数据，得到所述扩展数据集。

根据本发明优选实施例，在将所述扩展数据集输入至预先训练的自编码器前，所述基于人工智能的目标数据检测方法还包括：

将所述扩展数据集中的数据输入至初始自编码器进行编码处理，得到中间层；

对所述中间层的数据进行解码处理，并将解码处理后的数据传递至输出层；

对比所述初始自编码器的输入数据与输出数据，直至所述输入数据与所述输出数据相同，停止训练，得到所述自编码器；

获取所述自编码器的中间层的数据作为所述衍生特征。

根据本发明优选实施例，在以所述衍生特征训练预设神经网络，得到检测模型后，所述基于人工智能的目标数据检测方法还包括：

从所述目标数据集中随机获取数据构建验证集；

将所述验证集中的数据输入至所述检测模型中，输出第一检测结果；

获取所述第一检测结果为目标的数据，并计算获取的数据在所述验证集中所占的比例；

当所述比例大于或者等于配置比例时，确定所述检测模型通过验证，并将所述检测模型保存至区块链；或者

当所述比例小于所述配置比例时，确定所述检测模型未通过验证，更新所述至少一个子标签，并根据更新后的至少一个子标签更新所述至少一个子数据集，以所述至少一个子数据集对所述检测模型进行优化训练。

根据本发明优选实施例，在整合检测结果为目标的数据作为目标数据后，所述基于人工智能的目标数据检测方法还包括：

计算所述目标数据在所述待检测数据中的占比；

当所述占比低于配置占比时，根据所述占比生成警告信息；

确定所述待检测用户的关联用户；

将所述警告信息发送至所述待检测用户的终端设备及所述关联用户的终端设备。

一种基于人工智能的目标数据检测装置，所述基于人工智能的目标数据检测装置包括：

确定单元，用于响应于接收到的目标数据检测指令，确定目标标签；

获取单元，用于获取与待检测用户对应的待检测数据；

选择单元，用于根据所述目标标签从所述待检测数据中选择数据构建目标数据集；

扩展单元，用于对所述目标数据集进行扩展处理，得到扩展数据集；

输入单元，用于将所述扩展数据集输入至预先训练的自编码器，输出衍生特征；

训练单元，用于以所述衍生特征训练预设神经网络，得到检测模型；

所述输入单元，还用于将所述待检测数据输入至所述检测模型，输出检测结果，其中，所述检测结果包括目标及非目标；

整合单元，用于整合检测结果为目标的数据作为目标数据。

一种电子设备，所述电子设备包括：

存储器，存储至少一个指令；及

处理器，执行所述存储器中存储的指令以实现所述基于人工智能的目标数据检测方法。

一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一个指令，所述至少一个指令被电子设备中的处理器执行以实现所述基于人工智能的目标数据检测方法。

由以上技术方案可以看出，本发明能够响应于接收到的目标数据检测指令，确定目标标签，获取与待检测用户对应的待检测数据，根据所述目标标签从所述待检测数据中选择数据构建目标数据集，对所述目标数据集进行扩展处理，得到扩展数据集，通过数据扩展，使后续模型的训练更加准确，将所述扩展数据集输入至预先训练的自编码器，输出衍生特征，通过所述自编码器提取特征，不仅能够支持海量数据，同时特征提取的过程耗时短，且能够提取出时间序列或者多数据集的联合特征，以满足更多的预测场景下对于特征的要求，进一步以所述衍生特征训练预设神经网络，得到检测模型，将所述待检测数据输入至所述检测模型，输出检测结果，其中，所述检测结果包括目标及非目标，整合检测结果为目标的数据作为所述目标数据，进而能够以人工智能的方式自动进行目标数据的检测及筛选，解决了依赖人为定义的规则进行数据统计所造成的筛选效率低、出错率高，且可靠性欠佳的问题，同时也解决了传统的分类模型无法处理海量数据，特征提取困难且耗时较长，以及难易寻找时间序列或者多数据集的联合特征等问题。

附图说明

图1是本发明基于人工智能的目标数据检测方法的较佳实施例的流程图。

图2是本发明基于人工智能的目标数据检测装置的较佳实施例的功能模块图。

图3是本发明实现基于人工智能的目标数据检测方法的较佳实施例的电子设备的结构示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚，下面结合附图和具体实施例对本发明进行详细描述。

如图1所示，是本发明基于人工智能的目标数据检测方法的较佳实施例的流程图。根据不同的需求，该流程图中步骤的顺序可以改变，某些步骤可以省略。

所述基于人工智能的目标数据检测方法应用于一个或者多个电子设备中，所述电子设备是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(Application Specific IntegratedCircuit，ASIC)、可编程门阵列(Field－Programmable Gate Array，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。

所述电子设备可以是任何一种可与用户进行人机交互的电子产品，例如，个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant，PDA)、游戏机、交互式网络电视(Internet Protocol Television，IPTV)、智能式穿戴式设备等。

所述电子设备还可以包括网络设备和/或用户设备。其中，所述网络设备包括，但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(CloudComputing)的由大量主机或网络服务器构成的云。

所述电子设备所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network，VPN)等。

S10，响应于接收到的目标数据检测指令，确定目标标签。

在本发明的至少一个实施例中，所述目标数据检测指令可以由指定人员触发，以便根据实际需要执行。

当然，所述目标数据检测指令也可以被配置为周期性触发，以便定期筛选目标数据，避免其他相关业务场景在利用数据执行任务时，由于非目标数据产生噪声而影响任务的执行效果。

在本实施例中，当一个数据带有所述目标标签时，即可将该数据确定为目标数据。例如：所述目标标签可以为：执行过导入通讯录的操作等。

在本发明的至少一个实施例中，所述确定目标标签包括，但不限于以下一种或者多种方式的组合：

解析所述目标数据检测指令的方法体，得到所述目标数据检测指令所携带的数据，获取预设标签，以所述预设标签在所述目标数据检测指令所携带的数据中进行匹配，并将匹配的数据确定为所述目标标签。

通过上述实施方式，能够在所述目标数据检测指令中携带有所述目标标签时，以预设标签直接提取所述目标标签，既节约了数据处理的时间，又保证了所述目标标签的准确性。

或者获取历史目标数据，识别所述历史目标数据的关键字作为第一关键字，并计算所述第一关键字的出现频率，获取出现频率最高的第一关键字作为所述目标标签。

通过上述实施方式，能够在所述目标数据检测指令中没有携带所述目标标签时，通过历史目标数据确定所述目标标签。

当然，在其他实施例中，还可以采用其他方式确定所述目标标签，本发明不限制。

例如：接收用户上传的标签作为所述目标标签。

S11，获取与待检测用户对应的待检测数据。

在本实施例中，获取所述待检测用户的账号，并获取与所述账号对应的所有数据，将获取的数据确定为所述待检测数据。

可以理解的是，与所述账号对应的数据并不一定为所述待检测用户产生的数据，如果存在其他人登录所述待检测用户的账号进行操作，则所产生的数据并非所述待检测用户的实际数据，可被视为代刷或者代做的数据，即为非目标数据，而所述待检测用户的实际数据即为目标数据。

S12，根据所述目标标签从所述待检测数据中选择数据构建目标数据集。

在本实施例中，由于所述目标数据集中的数据都带有所述目标标签，因此，所述目标数据集中的数据均为目标数据。

在本发明的至少一个实施例中，所述根据所述目标标签从所述待检测数据中选择数据构建目标数据集包括：

识别所述待检测数据中每个数据的关键字作为第二关键字；

配置每个类别在对应的数据中的权重；

以所述目标类别定义对应的数据的标签；

所述配置权重可以根据实际需求进行自定义配置，本发明不限制。

其中，在以所述相同的关键字命名每个类别后，还需要给每个类别赋一定的权重，用来区分不同类别的重要程度，具体地，在确定权重时可以综合考虑多种数据指标，如：面谈次数、吸引面谈次数等。

S13，对所述目标数据集进行扩展处理，得到扩展数据集。

可以理解的是，数据量越多，数据间的关系及特征也就越明确，越有利于后续的特征提取及模型的训练，因此，本实施方式还需要对所述目标数据进行扩展。

具体地，所述对所述目标数据集进行扩展处理，得到扩展数据集包括：

整合所述至少一个子交集中的数据，得到所述扩展数据集。

其中，所述至少一个子标签属于对所述目标标签的扩展。

例如：所述至少一个子标签可以包括，但不限于：执行过AI面谈、有考勤记录。

需要说明的是，构建与每个子标签对应的至少一个子数据集的方式与构建所述目标数据集的方式类似，在此不赘述。

并且，同时带有所述至少一个子标签及所述目标标签的数据可以被确定为目标数据，因此，执行交集处理后得到的所述至少一个子交集中的数据均属于目标数据。

通过上述实施方式，能够在目标数据集的基础上进一步执行数据的扩展，以获取到充足的数据，为后续特征的提取及模型的训练提供数据基础。

S14，将所述扩展数据集输入至预先训练的自编码器(Autoencoder)，输出衍生特征。

其中，所述衍生特征是指在所述至少一个子交集的基础上，以所述自编码器进行处理后所得到的特征，通过所述自编码器提取特征，不仅能够支持海量数据，同时特征提取的过程耗时短，且能够提取出时间序列或者多数据集的联合特征，以满足更多的预测场景下对于特征的要求。

在本发明的至少一个实施例中，在将所述扩展数据集输入至预先训练的自编码器前，所述基于人工智能的目标数据检测方法还包括：

获取所述自编码器的中间层的数据作为所述衍生特征。

相较于传统的特征加工方式，本实施例利用自编码器进行特征的提取，通过不断地训练自编码器，使中间层的数据特征不仅能够充分地表达原始输入层的数据特征，同时还能得到更多的特征，使后续训练的模型更加准确、可靠。

S15，以所述衍生特征训练预设神经网络，得到检测模型。

其中，所述预设神经网络是指具有分类功能的网络，如：支持向量机网络(SupportVector Machine,SVM)、多层神经网络(Multi-Layer Perceptron，MLP)、径向基神经网络(Radial Basis Function，RBF)等。

在本实施例中，由于所述衍生特征的数据量充足，且特征表达充分，因此，以所述衍生特征训练所述预设神经网络，能够使所述预设神经网络的训练效果更好，进而提升了模型检测的准确度。

需要说明的是，本实施例对所述预设神经网络的训练方式不做限制。

在本发明的至少一个实施例中，在以所述衍生特征训练预设神经网络，得到检测模型后，所述基于人工智能的目标数据检测方法还包括：

从所述目标数据集中随机获取数据构建验证集；

当所述比例大于或者等于配置比例时，确定所述检测模型通过验证，并将所述检测模型保存至区块链；

所述配置比例可以根据实际需求进行自定义配置，本发明不限制。

通过上述实施方式，能够以少量的目标数据对所述检测模型进行验证，以确保所述检测模型的可用性。

同时，将所述检测模型保存至区块链，以进一步保证所述检测模型的安全性。

或者当所述比例小于所述配置比例时，确定所述检测模型未通过验证，更新所述至少一个子标签，并根据更新后的至少一个子标签更新所述至少一个子数据集，以所述至少一个子数据集对所述检测模型进行优化训练。

通过上述实施方式，能够在所述检测模型未通过验证时，及时调整相应的标签优化训练所述检测模型，以增强所述检测模型的适应性，同时提高了所述检测模型的灵活性。

S16，将所述待检测数据输入至所述检测模型，输出检测结果，其中，所述检测结果包括目标及非目标。

具体地，当所述检测结果为第一标识(如：1或Y)时，确定所述检测结果为目标；或者当所述检测结果为第二标识(如：0或N)时，确定所述检测结果为非目标。

通过上述实施方式，能够以人工智能的方式自动进行目标数据的检测及筛选，解决了现有技术中依赖人为定义的规则进行数据统计所造成的筛选效率低、出错率高，且可靠性欠佳的问题。

S17，整合检测结果为目标的数据作为目标数据。

通过上述实施方式，能够结合人工智能手段自动从所述待检测数据中筛选出所有的目标数据，相较于传统的方式更加高效，且不易出错，实用性更强。

需要说明的是，为了防止数据被篡改，还可以将所述目标数据保存至区块链。

在本发明的至少一个实施例中，在整合检测结果为目标的数据作为目标数据后，所述基于人工智能的目标数据检测方法还包括：

计算所述目标数据在所述待检测数据中的占比；

当所述占比低于配置占比时，根据所述占比生成警告信息；

确定所述待检测用户的关联用户；

其中，所述警告信息用于警示所述待检测用户当前产生的非目标数据过多。

所述配置占比可以根据实际需求进行自定义配置，本发明不限制。

其中，所述关联用户可以包括，但不限于：所述待检测用户的上级领导、考勤管理人员。

通过上述实施方式，将所述警告信息发送至所述待检测用户的终端设备，能够起到对所述待检测用户的警示作用，避免再次出现违规行为，同时，将所述警告信息发送至所述关联用户的终端设备，能够引起相关人员的重视，并在出现问题时及时处理，避免问题扩大化，起到及时止损的作用。

由以上技术方案可以看出，本发明能够响应于接收到的目标数据检测指令，确定目标标签，获取与待检测用户对应的待检测数据，根据所述目标标签从所述待检测数据中选择数据构建目标数据集，对所述目标数据集进行扩展处理，得到扩展数据集，通过数据扩展，使后续模型的训练更加准确，将所述扩展数据集输入至预先训练的自编码器，输出衍生特征，通过所述自编码器提取特征，不仅能够支持海量数据，同时特征提取的过程耗时短，且能够提取出时间序列或者多数据集的联合特征，以满足更多的预测场景下对于特征的要求，进一步以所述衍生特征训练预设神经网络，得到检测模型，将所述待检测数据输入至所述检测模型，输出检测结果，其中，所述检测结果包括目标及非目标，整合检测结果为目标的数据作为所述目标数据，进而能够以人工智能的方式自动进行目标数据的检测及筛选，解决了现有技术中依赖人为定义的规则进行数据统计所造成的筛选效率低、出错率高，且可靠性欠佳的问题，同时也解决了传统的分类模型无法处理海量数据，特征提取困难且耗时较长，以及难易寻找时间序列或者多数据集的联合特征等问题。

如图2所示，是本发明基于人工智能的目标数据检测装置的较佳实施例的功能模块图。所述基于人工智能的目标数据检测装置11包括确定单元110、获取单元111、选择单元112、扩展单元113、输入单元114、训练单元115、整合单元116。本发明所称的模块/单元是指一种能够被处理器13所执行，并且能够完成固定功能的一系列计算机程序段，其存储在存储器12中。在本实施例中，关于各模块/单元的功能将在后续的实施例中详述。

确定单元110响应于接收到的目标数据检测指令，确定目标标签。

在本发明的至少一个实施例中，所述确定单元110确定目标标签包括，但不限于以下一种或者多种方式的组合：

例如：接收用户上传的标签作为所述目标标签。

获取单元111获取与待检测用户对应的待检测数据。

选择单元112根据所述目标标签从所述待检测数据中选择数据构建目标数据集。

在本发明的至少一个实施例中，所述选择单元112根据所述目标标签从所述待检测数据中选择数据构建目标数据集包括：

识别所述待检测数据中每个数据的关键字作为第二关键字；

配置每个类别在对应的数据中的权重；

以所述目标类别定义对应的数据的标签；

扩展单元113对所述目标数据集进行扩展处理，得到扩展数据集。

具体地，所述扩展单元113对所述目标数据集进行扩展处理，得到扩展数据集包括：

整合所述至少一个子交集中的数据，得到所述扩展数据集。

其中，所述至少一个子标签属于对所述目标标签的扩展。

输入单元114将所述扩展数据集输入至预先训练的自编码器(Autoencoder)，输出衍生特征。

在本发明的至少一个实施例中，在将所述扩展数据集输入至预先训练的自编码器前，将所述扩展数据集中的数据输入至初始自编码器进行编码处理，得到中间层；

获取所述自编码器的中间层的数据作为所述衍生特征。

训练单元115以所述衍生特征训练预设神经网络，得到检测模型。

在本发明的至少一个实施例中，在以所述衍生特征训练预设神经网络，得到检测模型后，从所述目标数据集中随机获取数据构建验证集；

所述输入单元114将所述待检测数据输入至所述检测模型，输出检测结果，其中，所述检测结果包括目标及非目标。

整合单元116整合检测结果为目标的数据作为目标数据。

在本发明的至少一个实施例中，在整合检测结果为目标的数据作为目标数据后，计算所述目标数据在所述待检测数据中的占比；

当所述占比低于配置占比时，根据所述占比生成警告信息；

确定所述待检测用户的关联用户；

如图3所示，是本发明实现基于人工智能的目标数据检测方法的较佳实施例的电子设备的结构示意图。

所述电子设备1可以包括存储器12、处理器13和总线，还可以包括存储在所述存储器12中并可在所述处理器13上运行的计算机程序，例如基于人工智能的目标数据检测程序。

本领域技术人员可以理解，所述示意图仅仅是电子设备1的示例，并不构成对电子设备1的限定，所述电子设备1既可以是总线型结构，也可以是星形结构，所述电子设备1还可以包括比图示更多或更少的其他硬件或者软件，或者不同的部件布置，例如所述电子设备1还可以包括输入输出设备、网络接入设备等。

需要说明的是，所述电子设备1仅为举例，其他现有的或今后可能出现的电子产品如可适应于本发明，也应包含在本发明的保护范围以内，并以引用方式包含于此。

其中，存储器12至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如：SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器12在一些实施例中可以是电子设备1的内部存储单元，例如该电子设备1的移动硬盘。存储器12在另一些实施例中也可以是电子设备1的外部存储设备，例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)等。进一步地，存储器12还可以既包括电子设备1的内部存储单元也包括外部存储设备。存储器12不仅可以用于存储安装于电子设备1的应用软件及各类数据，例如基于人工智能的目标数据检测程序的代码等，还可以用于暂时地存储已经输出或者将要输出的数据。

处理器13在一些实施例中可以由集成电路组成，例如可以由单个封装的集成电路所组成，也可以是由多个相同功能或不同功能封装的集成电路所组成，包括一个或者多个中央处理器(Central Processing unit，CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。处理器13是所述电子设备1的控制核心(Control Unit)，利用各种接口和线路连接整个电子设备1的各个部件，通过运行或执行存储在所述存储器12内的程序或者模块(例如执行基于人工智能的目标数据检测程序等)，以及调用存储在所述存储器12内的数据，以执行电子设备1的各种功能和处理数据。

所述处理器13执行所述电子设备1的操作系统以及安装的各类应用程序。所述处理器13执行所述应用程序以实现上述各个基于人工智能的目标数据检测方法实施例中的步骤，例如图1所示的步骤。

示例性的，所述计算机程序可以被分割成一个或多个模块/单元，所述一个或者多个模块/单元被存储在所述存储器12中，并由所述处理器13执行，以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述所述计算机程序在所述电子设备1中的执行过程。例如，所述计算机程序可以被分割成确定单元110、获取单元111、选择单元112、扩展单元113、输入单元114、训练单元115、整合单元116。

上述以软件功能模块的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机、计算机设备，或者网络设备等)或处理器(processor)执行本发明各个实施例所述基于人工智能的目标数据检测方法的部分。

所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指示相关的硬件设备来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。

其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)。

进一步地，计算机可用存储介质可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序等；存储数据区可存储根据区块链节点的使用所创建的数据等。

本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的目标性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

总线可以是外设部件互连标准(peripheral component interconnect，简称PCI)总线或扩展工业标准结构(extended industry standard architecture，简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示，在图3中仅用一根箭头表示，但并不表示仅有一根总线或一种类型的总线。所述总线被设置为实现所述存储器12以及至少一个处理器13等之间的连接通信。

尽管未示出，所述电子设备1还可以包括给各个部件供电的电源(比如电池)，优选地，电源可以通过电源管理装置与所述至少一个处理器13逻辑相连，从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等，在此不再赘述。

进一步地，所述电子设备1还可以包括网络接口，可选地，所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等)，通常用于在该电子设备1与其他电子设备之间建立通信连接。

可选地，该电子设备1还可以包括用户接口，用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard))，可选地，用户接口还可以是标准的有线接口、无线接口。可选地，在一些实施例中，显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode，有机发光二极管)触摸器等。其中，显示器也可以适当的称为显示屏或显示单元，用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。

应该了解，所述实施例仅为说明之用，在专利申请范围上并不受此结构的限制。

图3仅示出了具有组件12-13的电子设备1，本领域技术人员可以理解的是，图3示出的结构并不构成对所述电子设备1的限定，可以包括比图示更少或者更多的部件，或者组合某些部件，或者不同的部件布置。

结合图1，所述电子设备1中的所述存储器12存储多个指令以实现一种基于人工智能的目标数据检测方法，所述处理器13可执行所述多个指令从而实现：

响应于接收到的目标数据检测指令，确定目标标签；

获取与待检测用户对应的待检测数据；

对所述目标数据集进行扩展处理，得到扩展数据集；

以所述衍生特征训练预设神经网络，得到检测模型；

整合检测结果为目标的数据作为目标数据。

具体地，所述处理器13对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述，在此不赘述。

在本发明所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。

因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。

此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称，而并不表示任何特定的顺序。

最后应说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或等同替换，而不脱离本发明技术方案的精神和范围。

Claims

1.一种基于人工智能的目标数据检测方法，其特征在于，所述基于人工智能的目标数据检测方法包括：

响应于接收到的目标数据检测指令，确定目标标签；

获取与待检测用户对应的待检测数据；

对所述目标数据集进行扩展处理，得到扩展数据集；

以所述衍生特征训练预设神经网络，得到检测模型；

整合检测结果为目标的数据作为目标数据。

2.如权利要求1所述的基于人工智能的目标数据检测方法，其特征在于，所述确定目标标签包括以下一种或者多种方式的组合：

3.如权利要求1所述的基于人工智能的目标数据检测方法，其特征在于，所述根据所述目标标签从所述待检测数据中选择数据构建目标数据集包括：

识别所述待检测数据中每个数据的关键字作为第二关键字；

配置每个类别在对应的数据中的权重；

以所述目标类别定义对应的数据的标签；

4.如权利要求1所述的基于人工智能的目标数据检测方法，其特征在于，所述对所述目标数据集进行扩展处理，得到扩展数据集包括：

整合所述至少一个子交集中的数据，得到所述扩展数据集。

5.如权利要求1所述的基于人工智能的目标数据检测方法，其特征在于，在将所述扩展数据集输入至预先训练的自编码器前，所述基于人工智能的目标数据检测方法还包括：

获取所述自编码器的中间层的数据作为所述衍生特征。

6.如权利要求1所述的基于人工智能的目标数据检测方法，其特征在于，在以所述衍生特征训练预设神经网络，得到检测模型后，所述基于人工智能的目标数据检测方法还包括：

从所述目标数据集中随机获取数据构建验证集；

7.如权利要求1所述的基于人工智能的目标数据检测方法，其特征在于，在整合检测结果为目标的数据作为目标数据后，所述基于人工智能的目标数据检测方法还包括：

计算所述目标数据在所述待检测数据中的占比；

当所述占比低于配置占比时，根据所述占比生成警告信息；

确定所述待检测用户的关联用户；

8.一种基于人工智能的目标数据检测装置，其特征在于，所述基于人工智能的目标数据检测装置包括：

获取单元，用于获取与待检测用户对应的待检测数据；

整合单元，用于整合检测结果为目标的数据作为目标数据。

9.一种电子设备，其特征在于，所述电子设备包括：

存储器，存储至少一个指令；及

处理器，执行所述存储器中存储的指令以实现如权利要求1至7中任意一项所述的基于人工智能的目标数据检测方法。

10.一种计算机可读存储介质，其特征在于：所述计算机可读存储介质中存储有至少一个指令，所述至少一个指令被电子设备中的处理器执行以实现如权利要求1至7中任意一项所述的基于人工智能的目标数据检测方法。