CN109636568A - 电话号码的风险检测方法、装置、设备及存储介质 - Google Patents
电话号码的风险检测方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN109636568A CN109636568A CN201811248852.7A CN201811248852A CN109636568A CN 109636568 A CN109636568 A CN 109636568A CN 201811248852 A CN201811248852 A CN 201811248852A CN 109636568 A CN109636568 A CN 109636568A
- Authority
- CN
- China
- Prior art keywords
- telephone number
- address
- indirect
- risk
- company
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000001514 detection method Methods 0.000 claims abstract description 9
- 230000005540 biological transmission Effects 0.000 claims description 8
- 238000012552 review Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 abstract description 12
- 238000012098 association analyses Methods 0.000 abstract description 5
- 238000004458 analytical method Methods 0.000 description 61
- 230000000875 corresponding effect Effects 0.000 description 42
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000005611 electricity Effects 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000012502 risk assessment Methods 0.000 description 2
- 238000013475 authorization Methods 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Telephonic Communication Services (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明提供一种电话号码的风险检测方法、装置、设备及存储介质,以“关系”的方式将贷款申请者的公司电话号码与其它信息(包括贷款申请者的信息和历史信贷信息)进行整合和关联,有利于确定公司电话号码与其它信息之间的联系;并结合染黑(或染灰)的处理逻辑对公司电话号码的风险性进行分析和检测,从而基于大数据关联分析处理方式对潜在信贷欺诈风险进行了有效预测,提高了信贷风险检测的准确性,能够更有效地对潜在风险进行预警,可尽早地发现并规避风险和降低贷款坏账率。
Description
技术领域
本发明涉及大数据领域,尤其涉及一种电话号码的风险检测方法、装置、设备及存储介质。
背景技术
随着社会和金融行业的快速发展,信贷业务活跃于市场。信贷机构在向贷款申请者进行放款前,会要求贷款申请者提供相关的资料信息,以根据这些资料信息进行风险检测,确定其欺诈风险性;而在信贷机构所审核的资料信息中,包括有公司电话号码。传统的检测方法在对公司电话号码进行审核时,通常是通过电话回访的方式对公司电话信息的真实性进行验证,但在这种方法忽略了公司电话与其它信贷信息之间的关联性,增大了风险漏判率,从而降低了公司电话风险检测的准确性。
发明内容
本发明的主要目的在于提供一种电话号码的风险检测方法、装置、设备及可读存储介质,旨在提高信贷风险检测的准确性。
为实现上述目的,本发明提供一种电话号码的风险检测方法,所述电话号码的风险检测方法包括:
在接收到贷款终端发送的信贷请求时,获取所述信贷请求对应信贷申请者的公司电话号码、及所述信贷申请者的基本地址;
根据所述公司电话号码查询得到间接公司特征,并根据所述间接公司特征包括的间接公司地址、所述基本地址和预设关联规则、在所述公司电话号码与所述基本地址之间建立关联;
根据所述间接公司特征在预设信贷记录库中查询与所述间接公司特征匹配的历史信贷件,并在所述公司电话号码与所述历史信贷件之间建立关联;
根据预设关系度公式计算所述公司电话号码与各关联信息之间的关系度,其中所述各关联信息包括所述基本地址和所述历史信贷件;
当所述关联信息属于黑名单信息时,判断所述关系度是否大于预设关系阈值;
若所述关系度大于预设关系阈值,则确定所述公司电话号码为风险号码。
此外,为实现上述目的,本发明还提供一种电话号码的风险检测装置,所述电话号码的风险检测装置包括:
请求接收模块,用于在接收到贷款终端发送的信贷请求时,获取所述信贷请求对应信贷申请者的公司电话号码、及所述信贷申请者的基本地址;
第一关联模块,用于根据所述公司电话号码查询得到间接公司特征,并根据所述间接公司特征包括的间接公司地址、所述基本地址和预设关联规则、在所述公司电话号码与所述基本地址之间建立关联;
第二关联模块,用于根据所述间接公司特征在预设信贷记录库中查询与所述间接公司特征匹配的历史信贷件,并在所述公司电话号码与所述历史信贷件之间建立关联;
关系度计算模块,用于根据预设关系度公式计算所述公司电话号码与各关联信息之间的关系度,其中所述各关联信息包括所述基本地址和所述历史信贷件;
关系度判断模块,用于当所述关联信息属于黑名单信息时,判断所述关系度是否大于预设关系阈值;
号码确定模块,用于若所述关系度大于预设关系阈值,则确定所述公司电话号码为风险号码。
此外,为实现上述目的,本发明还提供一种电话号码的风险检测设备,所述电话号码的风险检测设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的风险检测程序,其中所述风险检测程序被所述处理器执行时,实现如上述的电话号码的风险检测方法的步骤。
此外,为实现上述目的,本发明还提供一种存储介质,所述存储介质上存储有风险检测程序,其中所述风险检测程序被处理器执行时,实现如上述的电话号码的风险检测方法的步骤。
本发明以“关系”的方式将贷款申请者的公司电话号码与其它信息(包括贷款申请者的信息和历史信贷信息)进行整合和关联,有利于确定公司电话号码与其它信息之间的联系;并结合染黑(或染灰)的处理逻辑对公司电话号码的风险性进行分析和检测,从而基于大数据关联分析处理方式对潜在信贷欺诈风险进行了有效预测,提高了信贷风险检测的准确性,能够更有效地对潜在风险进行预警,可尽早地发现并规避风险和降低贷款坏账率。
附图说明
图1为本发明实施例方案中涉及的电话号码的风险检测设备的硬件结构示意图;
图2为本发明电话号码的风险检测方法第一实施例的流程示意图;
图3为图2所示实施例涉及的信息关联示意图;
图4为本发明电话号码的风险检测装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例涉及的电话号码的风险检测方法主要应用于电话号码的风险检测设备,该电话号码的风险检测设备可以是个人计算机(personal computer,PC)、笔记本电脑、服务器等具有数据处理功能的设备。
参照图1,图1为本发明实施例方案中涉及的电话号码的风险检测设备的硬件结构示意图。本发明实施例中,电话号码的风险检测设备可以包括处理器1001(例如中央处理器Central Processing Unit,CPU),通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信;用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard);网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真WIreless-FIdelity,WI-FI接口);存储器1005可以是高速随机存取存储器(random access memory,RAM),也可以是稳定的存储器(non-volatile memory),例如磁盘存储器,存储器1005可选的还可以是独立于前述处理器1001的存储装置。本领域技术人员可以理解,图1中示出的硬件结构并不构成对本发明的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
继续参照图1,图1中作为一种计算机可读存储介质的存储器1005可以包括操作系统、网络通信模块以及风险检测程序。在图1中,网络通信模块可用于连接贷款终端,与贷款终端进行数据通信;而处理器1001可以调用存储器1005中存储的风险检测程序,并执行本发明实施例提供的电话号码的风险检测方法。
本发明实施例提供了一种电话号码的风险检测方法。
参照图2,图2为本发明电话号码的风险检测方法第一实施例的流程示意图。
本实施例中,所述电话号码的风险检测方法包括以下步骤:
步骤S10,在接收到贷款终端发送的信贷请求时,获取所述信贷请求对应信贷申请者的公司电话号码、及所述信贷申请者的基本地址;
随着社会和金融行业的快速发展,信贷业务活跃于市场。信贷机构在向贷款申请者进行放款前,会要求贷款申请者提供相关的资料信息,以根据这些资料信息进行风控分析,确定其欺诈风险性;而在信贷机构所审核的资料信息中,包括有公司电话号码。传统的方法在对公司电话号码进行审核时,通常是通过电话回访的方式对公司电话信息的真实性进行验证,但在这种分析方法忽略了公司电话与其它信贷信息之间的关联性,从而降低了公司电话分析的准确性。对此,本实施例中提出一种电话号码的风险检测方法,基于大数据关联分析处理方式对潜在信贷欺诈风险进行了有效预测,提高了信贷风险检测的准确性,能够更有效地对潜在风险进行预警,可尽早地发现并规避风险和降低贷款坏账率。
本实施例中的电话号码的风险检测方法是由电话号码的风险检测设备实现的,该电话号码的风险检测设备以分析服务器为例进行说明。本实施例中,贷款申请者在需要进行信贷申请时,可在贷款终端(如个人电脑PC、笔记本电脑、手机、平板电脑等)上进行信贷操作,贷款终端则根据贷款申请者的操作向分析服务器发送对应的信贷请求。分析服务器在接收到贷款终端发送的信贷请求时,首先要获取贷款申请者的所在公司(企业)的公司电话号码,该公司电话号码为贷款申请者提供的,例如可以是分析服务器在接收到该信贷请求时向贷款终端发送公司电话询问信息,以使贷款申请者根据该公司电话询问信息在贷款终端中手动录入的公司电话号码并发送至分析服务器;当然也可以是贷款申请者在通过贷款终端进行信贷操作时直接手动录入公司电话号码,由贷款终端将该公司电话号码添加至信贷请求中一起发送至分析服务器。
本实施例中,分析服务器在根据信贷请求获取信贷申请者的公司电话号码的同时,还将获取贷款申请者的其它基本信息,包括有贷款申请者在进行贷款申请时主动提供的个人信息,还包括有分析服务器检测到的环境信息。对于个人信息,包括有家庭地址、工作地址、单位地址、银行账户、手机号、常用联系人等,这些个人信息也可以是贷款申请者在通过贷款终端在网络上提出贷款申请时,自行录入至贷款终端,并由贷款终端发送至分析服务器中。对于环境信息,则包括有贷款终端的GPS地址、贷款终端的IP地址(InternetProtocol Address,互联网协议地址)等;当然这些环境信息可能是需要得到贷款申请者的授权后分析服务器才可进行获取。在得到贷款申请者的基本信息时,分析服务器将会根据这些基本信息获取到对应的基本地址,例如家庭地址、工作地址、IP地址所属地等。
步骤S20,根据所述公司电话号码查询得到间接公司特征,并根据所述间接公司特征包括的间接公司地址、所述基本地址和预设关联规则、在所述公司电话号码与所述基本地址之间建立关联;
在正常情况下,贷款申请者所提供的公司电话号码,是对应有一个真实存在的公司,该公司具有一系列的公司特征信息,包括公司名称、公司地址、公司类型、法人名单、股东名单等;对此,在获取到贷款申请者的公司电话号码时,分析服务器将对公司电话号码进行反向查询和确定其对应的公司特征信息;而对于根据公司电话号码查询得到的公司特征信息,为描述方便,在后续描述中以“间接公司特征”进行说明。
其中,对于间接公司特征查询的过程,可以分析服务器通过爬虫技术或其它手段从相关的网页中爬取已知公司特征信息,并预先建立已知公司特征库(该已知公司特征库中包括有公司名称及该公司对应的地址、电话、类型等内容),然后分析服务器再根据步骤S10获取到的公司电话号码查询到匹配的间接公司特征。具体的,分析服务器可向网络上的黄页站点、百科服务站点等发送特征获取请求(Request),等待站点服务器响应;如果站点服务器能正常响应,将向分析服务返回一个请求回复(Response),回复包括有已知公司特征;分析服务若在该预设时间接收到了站点返回的请求回复,即可根据该请求回复得到已知公司特征,并形成已知公司特征库;分析服务器在获取到贷款申请者的公司电话号码时,即可根据该公司电话号码查询该已知公司特征库,查找到具有相同的电话号码的已知公司,并获取该已知公司的已知公司特征信息作为间接公司特征。值得说明的是,分析服务器从黄页站点(或百科站点等)爬取已知公司特征时,对于黄页站点所返回的请求回复,其回复格式可能包括多种类型,如超文本标记语言html、Json字符串、二进制数据(如图片)等类型;分析服务器在得到该请求回复时,首先需要对请求回复进行相应的解析,以获得其中的已知公司特征。具体的,分析服务器中可预先设置有不同回复类型所对应的解析规则,例如对于html格式,可以是通过正则表达式和/或网页解析库的方式进行解析;对于Json格式,则可以转化为Json对象解析,如通过eval函数、又或者通过JSON.parse()方法进行解析;对于二进制数据,则可以是直接进行存储(或是进行其它处理)。当然,也可以是分析服务器与工商管理系统连接,在获得公司电话号码时,直接向工商管理系统发送电话归属查询请求,以查询该公司电话号码对应的公司名称、公司地址、公司类型等。
本实施例中,分析服务器所得到的间接公司特征包括有间接公司地址,该间接公司地址可以看作是公司电话号码的一个地址属性;此时分析服务器将会基于预设关联规则、该间接公司地址、以及步骤S10中获得的基本地址、在公司电话号码和基本地址之间建立关联,从而将贷款申请者提供的公司电话号码与贷款申请者提供的其它地址信息联系起来,形成地址关联网络;在该地址关联网络中,贷款申请者的公司电话号码也可以是看作一个地址(间接公司地址),此时该地址关联网络中至少包括两个地址(一个间接公司地址和至少一个基本地址)。而对于公司电话号码与基本地址的关联,则可以是根据多种方式建立的。
可选地,对于公司电话号码与基本地址的关联,可以是通过距离匹配的方式建立的距离匹配关联。具体的,分析服务器首先将确定各基本地址所对应的真实位置,然后确定公司电话号码所对应的间接公司地址与基本地址的真实距离;当该真实距离小于预设距离阈值时,即可在公司电话号码与该基本地址之间建立距离匹配关联。例如,根据公司电话号码查询得到的间接公司地址为X省Y市a区,而贷款申请者直接提供的工作单位地址为X省Y市c区,两者的真实地址距离为1000米,小于预设距离阈值5000米,则可在两者之间建立距离匹配关联。通过距离匹配的关联方式,可从实际距离的维度将公司电话号码与基本地址进行关联,以进行后续的欺诈分析。
可选地,对于公司电话号码与基本地址的关联,还可以是通过地址文本模糊匹配的方式建立的模糊匹配关联,即计算间接公司地址与基本地址之间的地址文本匹配度,若该地址文本匹配度大于预设地址阈值,即可在公司电话号码与该基本地址之间建立模糊匹配关联。具体的,分析服务器首先根据一定量化规则分别将间接公司地址和基本地址量化为对应的第一地址字符组D1和第二地址字符组D2,地址字符组的形式可以为(省,市,区),当然该规则和地址字符组的形式也可以根据实际情况进行设置;在量化完成时,分析服务器对第一地址字符组D1和第二地址字符组D2进行并集运算得到全字符组D(该全字符组中不含有重复的元素);随后,分析服务器将分别根据全字符组D的各字符在第一地址字符组D1和第二地址字符组D2中出现频率、确定对应的第一地址频率组DD1和第二地址频率组DD2;在得到第一地址频率组DD1和第二地址频率组DD2时,即可将第一地址频率组DD1和第二地址频率组DD2代入至预设地址匹配公式中计算间接公司地址与基本地址之间的地址文本匹配度,该预设地址匹配公式为:
其中,sim(DD1,DD2)为所述间接公司地址与所述基本地址之间的地址文本匹配度;n为所述第一地址频率组DD1或所述第二地址频率组DD2的元素数量;DD1i为所述第一地址频率组DD1第i个元素,DD2i所述第二地址频率组DD2第i个元素,0<i≤n,且i为整数。若该地址文本匹配度大于预设地址阈值,即可在公司电话号码与该基本地址之间建立模糊匹配关联。通过模糊匹配的关联方式,可从地址文本的维度将公司电话号码与地址文本相似的基本地址进行关联,以进行后续分析。
值得说明的是,若公司电话号码无法与任何一个基本地址建立关联,说明该公司电话号码具有较大的信息孤立性,此时可直接认为公司电话号码是可疑的,并将该公司电话号码确定为风险号码。
步骤S30,根据所述间接公司特征在预设信贷记录库中查询与所述间接公司特征匹配的历史信贷件,并在所述公司电话与所述历史信贷件之间建立关联;
本实施例中,在将公司电话号码与基本地址建立关联的同时,分析服务器还可根据步骤S20所得的间接公司特征(包括间接公司名称、间接公司地址)查询预设的信贷记录库,以确定是否曾有人以该间接公司特征作为历史贷款资料进行过信贷申请;若有,则分析服务器将会获取与该间接公司特征对应的历史信贷件,该历史信贷件中也可包括有包括电话号码、银行卡号、地址(包括多种地址)、证件号等历史信贷信息。例如,分析服务器根据贷款申请人本次(18年3月)申请所提供的公司电话号码,查询的间接公司名称为X省Y市ZL商贸有限公司;对于该间接公司名称,分析服务器在信贷记录库中查询到曾有人在17年3月以相同的公司名称进行信贷申请(有可能是两次的贷款申请者是属于同一家公司的员工),此时分析服务器将获取到该17年3月的历史信贷件,并在该公司电话号码与历史信贷件之间建立关联。
进一步的,分析服务器在根据间接公司特征查询屁屁的历史信贷件的过程中,可以是根据多种间接公司特征进行查询的,例如通过间接公司地址、间接公司股东、间接公司名称等。而对于不同类型的间接公司特征,其匹配规则也可以不同;例如对于间接公司地址的匹配,可以是采用上述步骤S20中所述的距离匹配和/或地址文本模糊匹配的方式进行;对于间接公司股东,可以是采用人名精确匹配的方式进行(即贷款申请者的公司具有相同的公司股东);对于间接公司名称的匹配,可以是采用精确匹配(即公司名称完全一致)或名称文本模糊匹配的方式进行。
再进一步,对于公司名称的名称文本模糊匹配,其规则与步骤S20中的地址文本模糊匹配具有相似之处。具体的,分析服务器首先根据一定的公司名称量化规则将间接公司名称和历史公司名称(历史信贷件的公司名称)量化为对应的第一名称字符组S1和第二名称字符组S2,对于名称字符组的形式为(行政区域,关键字,行业属性,公司形式),例如对于X省Y市ZL商贸有限公司则量化为(X省Y市,ZL,商贸,有限公司),对于X省Y市SZ五金厂则量化为(X省Y市,SZ,五金,厂),当然该公司名称量化规则和字符组的形式也可以根据实际情况进行设置;在量化完成时,分析服务器对第一名称字符组S1和第二名称字符组S2进行并集运算得到全名称字符组S(该全名称字符组中不含有重复的元素);随后,分析服务器将分别根据全名称字符组S的各字符在第一名称字符组S1和第二名称字符组S2中出现频率、确定对应的第一名称频率组SS1和第二名称频率组SS2;在得到第一名称频率组SS1和第二名称频率组SS2时,即可将第一名称频率组SS1和第二名称频率组SS2代入至预设名称文本匹配公式中计算两个名称的名称文本匹配度,该预设名称文本匹配公式为:
上式中sim(SS1,SS2)为两个名称之间的名称文本匹配度,p为第一名称频率组SS1或第二名称频率组SS2的元素数量;SS1i为所述第一名称频率组SS1第i个元素,SS2i所述第二名称频率组SS2第i个元素,0<i≤n,且i为整数。在计算得到两个名称的名称文本匹配度时,可将名称文本匹配度与一预设的名称阈值比较;若该名称文本匹配度大于该预设名称阈值,则两个名称匹配。
当然,在实际中,还可以根据实际情况设置不同的匹配规则。
值得说明的是,对于本实施例中与公司电话号码进行直接关联的基本地址和历史信贷件,可称为一次关联信息;而对于一次关联信息,还可能会与其它的信息具有关联,例如基本地址中的工作地址与该地址的单位实体(如单位类型、单位股东等)关联,基本地址中家庭地址与该地址的小区信息(如小区房价、小区物业信息等)关联,又例如历史信贷件与该历史信贷件的偿还情况、贷款人等关联;对于这些与一次关联信息关联的其它信息,为描述方便,可称为二次关联信息,这些二次关联信息可看作与公司电话号码间接关联;一次关联信息与二次关联信息统称为关联信息,公司电话号码与关联信息均具有关联关系(直接关联或间接关联)。依此类推,公司电话号码还可以与三次关联信息、四次关联信息等进行关联,从而以公司电话号码为起点,建立信息关联图谱(信息关联网络),以进行后续的风险分析。
步骤S40,根据预设关系度公式计算所述公司电话号码与各关联信息之间的关系度,其中所述各关联信息包括所述基本地址和所述历史信贷件;
本实施例中,在公司电话号码与基本地址、历史信贷件建立关联后,分析服务器将根据预设关系度公式计算公司电话号码与各关联信息之间的关系度,其中这些关联信息包括基本地址和历史信贷件。而对于公司电话号码与关联信息之间的关系度,则可看作是公司电话号码与关联信息之间联系紧密的表征;关系度越大,两者的联系越紧密。其中预设关系度公式为:
其中f为公司电话号码与关联信息之间的关系度;
m为公司电话号码与关联信息之间的最短关联路径上的路径信息数量(或称为关系链上的信息数量,关系链的两个端点分别为公司电话号码和关联信息),可根据公司电话号码与关联信息之间的关联关系确定,且路径信息包括公司电话号码和关联信息,m≥2;值得说明的是,当公司电话号码所关联的关联信息包括一次关联信息、二次关联信息、三次关联信息等时,若计算的是一次关联信息与公司电话号码的关系度,则m=2,若计算的是二次关联信息与公司电话号码的关系度,则m=3,依此类推;
k0为与关联信息的信息类型对应的预设距离系数,0<k0;对于各类关联信息的k0,可以是分析服务器中预先设置,如分析服务器中预先存储有信息系数表,信息系数表中记录有类各关联信息所对应的k0值,分析服务器可根据要计算的关联信息的信息类型查询该信息系数表从而确定出k0值;
x0为与关联信息的信息类型对应的预设强度系数,0<x0;对于上述的信息系数表,还记录有类各关联信息所对应的x0值,分析服务器可根据要计算的关联信息的信息类型查询该信息系数表从而确定出x0值;
ki为最短关联路径上各路径信息各自对应的关联距离系数,0<ki;ki可根据路径信息与关联信息之间的最短关联路径的关联距离di(即最短关系链中的关系数)与预设关联距离公式确定,且在预设关联距离公式中ki与di呈负相关的关系,di越大,ki越小;当然预设关联距离公式可以是根据实际情况进行设置,例如ki=di -1;
xi为最短关联路径上各路径信息各自对应的关系强度系数,0<xi;xi与路径信息的信息类型有关,例如家庭地址的关系强度系数大于单位地址的关系强度系数;对于上述的信息系数表,还记录有类各路径信息所对应的xi值,分析服务器可根据要计算的路径信息的信息类型查询该信息系数表从而确定出xi值;
ui为最短关联路径上各路径信息各自对应的衰减因子系数,0<ui≤1;,ui与路径信息的信息类型有关,例如家庭地址的衰减因子系数小于单位地址的衰减因子系数;对于上述的信息系数表,还记录有类各路径信息所对应的xi值,分析服务器可根据要计算的路径信息的信息类型查询该信息系数表从而确定出xi值。
具体的,在计算公司电话号码与某一关联信息的关联度时,首先根据要计算的关联信息的信息类型查询信息系数表,获取该关联信息的预设距离系数k0和预设强度系数x0;然后根据公司电话号码与该关联信息的关联关系确定两者的计算关系路径,其中若公司电话号码与该关联信息之间有多条关系路径,则选择关系数最少的一条作为计算关系路径(即最短关系路径);在确定计算关系路径时,将要确定该计算关系路径上的所有路径信息(包括公司电话号码与该关联信息),并根据计算关系路径的所有路径信息分别与关联信息的关联距离、各路径信息的信息类型、关联强度等确定各路径信息对应的关联距离系数ki、衰减因子系数ui和关联强度系数xi,再将各参数代入至上述公式中,即可计算出公司电话号码与该关联信息的关系度。分析服务器在计算得公司电话号码与该关联信息之间的关系度时,还可生成对应的信息关联图并标注关系度,如图3所示,图3中关联信息包括家庭地址(关系度73)、手机归属地(关系度80)、历史信贷件20173xx(关系度58)。
步骤S40,当所述关联信息属于黑名单信息时,判断所述关系度是否大于预设关系阈值;
本实施例中,分析服务器在得到公司电话号码与该关联信息之间的关系度时,即可通过染黑逻辑(或染灰逻辑)对公司电话号码进行欺诈风险分析。具体的,当某一关联信息属于黑名单信息(或者该关联信息确认为虚假)时,如手机归属地为黑名单区域(欺诈多发区)、历史信贷件逾期等,分析服务器将判断信公司电话号码与该关联信息之间的关系度是否大于预设阈值,即通过两者之间的关系紧密程度关联分析公司电话号码的风险性。
步骤S50,若所述关系度大于预设关系阈值,则确定所述公司电话号码为风险号码。
本实施例中,若公司电话号码与该黑名单关联信息之间的关系度大于预设阈值,则可认为公司电话号码也是可疑的,并将该公司电话号码确定为风险号码。
进一步的,在确定公司电话号码为风险号码时,分析服务器还可以根据关系度给出相关的处理建议。例如分析服务器中设置有预设复核阈值,其中预设复核阈值大于预设关系阈值;当确定公司电话号码为风险号码时(公司电话号码与该黑名单关联信息之间的关系度大于预设阈值),还将判断公司电话号码与该黑名单关联信息之间的关系度是否大于预设复核阈值;若该关系度大于预设复核阈值,则分析服务器将输出拒绝放款的建议;若该关系度小于或等于预设复核阈值,则分析服务器将输出人工复核的建议。通过这样的方式,可在提高信贷风险分析的准确性的同时,降低误判率。
再进一步的,分析服务器在对公司电话号码的风险性进行分析之后,还可以生成对应的分析报告,分析报告的内容可以包括公司电话号码与基本地址、历史信贷件建立关联的建立过程(包括计算过程)、信息关联图、关系度计算和判断过程等,以供分析人员查看。
在接收到贷款终端发送的信贷请求时,获取所述信贷请求对应信贷申请者的公司电话号码、及所述信贷申请者的基本地址;根据所述公司电话号码查询得到间接公司特征,并根据所述间接公司特征包括的间接公司地址、所述基本地址和预设关联规则、在所述公司电话号码与所述基本地址之间建立关联;根据所述间接公司特征在预设信贷记录库中查询与所述间接公司特征匹配的历史信贷件,并在所述公司电话号码与所述历史信贷件之间建立关联;根据预设关系度公式计算所述公司电话号码与各关联信息之间的关系度,其中所述各关联信息包括所述基本地址和所述历史信贷件;当所述关联信息属于黑名单信息时,判断所述关系度是否大于预设关系阈值;若所述关系度大于预设关系阈值,则确定所述公司电话号码为风险号码。通过以上方式,本实施例以“关系”的方式将贷款申请者提供的公司电话号码与其它信息(包括贷款申请者的信息和历史信贷信息)进行整合和关联,有利于确定公司电话号码与其它信息之间的联系;并结合染黑(或染灰)的处理逻辑对公司电话号码的风险性进行分析和检测,从而基于大数据关联分析处理方式对潜在信贷欺诈风险进行了有效预测,提高了信贷风险检测的准确性,能够更有效地对潜在风险进行预警,可尽早地发现并规避风险和降低贷款坏账率。
此外,本发明实施例还提供一种电话号码的风险检测装置。
参照图4,图4为本发明电话号码的风险检测装置第一实施例的功能模块示意图。
本实施例中,所述电话号码的风险检测装置包括:
请求接收模块10,用于在接收到贷款终端发送的信贷请求时,获取所述信贷请求对应信贷申请者的公司电话号码、及所述信贷申请者的基本地址;
第一关联模块20,用于根据所述公司电话号码查询得到间接公司特征,并根据所述间接公司特征包括的间接公司地址、所述基本地址和预设关联规则、在所述公司电话号码与所述基本地址之间建立关联;
第二关联模块30,用于根据所述间接公司特征在预设信贷记录库中查询与所述间接公司特征匹配的历史信贷件,并在所述公司电话号码与所述历史信贷件之间建立关联;
关系度计算模块40,用于根据预设关系度公式计算所述公司电话号码与各关联信息之间的关系度,其中所述各关联信息包括所述基本地址和所述历史信贷件;
关系度判断模块50,用于当所述关联信息属于黑名单信息时,判断所述关系度是否大于预设关系阈值;
号码确定模块60,用于若所述关系度大于预设关系阈值,则确定所述公司电话号码为风险号码。
其中,上述电话号码的风险检测装置的各虚拟功能模块存储于图1所示电话号码的风险检测设备的存储器1005中,用于实现风险检测程序的所有功能;各模块被处理器1001执行时,可实现将公司电话号码与多种信息进行整合和关联,并结合染黑(或染灰)的处理逻辑对公司电话号码进行风险分析的功能。
进一步的,所述电话号码的风险检测装置还包括:
回复接收模块,用于向所述预设黄页站点发送特征获取请求,并接收所述预设黄页站点返回的请求回复;
特征库形成模块,用于根据所述请求回复的回复格式获取对应的解析规则,并根据所述解析规则对所述请求回复进行解析,得到已知公司特征,以形成已知公司特征库;
所述第一关联模块20包括:
特征获取模块,用于根据所述公司电话号码查询所述已知公司特征库,获取与所述公司电话号码匹配的间接公司特征。
进一步的,所述第一关联模块20还包括:
距离判断单元,用于确定所述间接公司地址与所述基本地址之间的真实距离,并判断所述真实距离是否小于预设距离阈值;
第一关联单元,用于若所述真实距离小于预设距离阈值,则在所述公司电话号码与所述基本地址之间建立关联。
进一步的,所述第一关联模块20还包括:
匹配度计算单元,用于基于预设地址匹配规则计算所述间接公司地址与所述基本地址的地址文本匹配度;
匹配度判断单元,用于判断所述地址文本匹配度是否大于预设地址阈值;
第二关联单元,用于若所述地址文本匹配度大于所述预设地址阈值,则在所述公司电话号码与所述基本地址之间建立关联。
进一步的,所述匹配度计算单元,具体用于基于预设量化规则分别将所述间接公司地址和所述基本地址量化为对应的第一地址字符组D1和第二地址字符组D2,并对所述第一地址字符组D1和所述第二地址字符组D2进行并集运算,获得对应的全地址字符组D;根据所述全地址字符组D中各地址字符分别在所述第一地址字符组D1和第二地址字符组D2中的出现频率、确定第一地址字符组D1对应的第一地址频率组DD1和第二地址字符组D2对应第二地址频率组DD2;根据预设地址匹配度公式、所述第一地址频率组DD1和所述第二地址频率组DD2计算所述间接公司地址与所述基本地址之间的地址文本匹配度,所述预设地址匹配度公式为:
其中,sim(DD1,DD2)为所述间接公司地址与所述基本地址之间的地址文本匹配度;
n为所述第一地址频率组DD1或所述第二地址频率组DD2的元素数量;
DD1i为所述第一地址频率组DD1第i个元素,DD2i所述第二地址频率组DD2第i个元素,0<i≤n,且i为整数。
进一步的,所述电话号码的风险检测装置还包括:
建议输出模块,用于据所述关系度与预设复核阈值的大小关系输出对应的处理建议,其中所述预设符合阈值大于所述预设关系阈值。
进一步的,所述预设关系度公式为:
其中,f为所述公司电话号码与所述关联信息之间的关系度;
m为所述公司电话号码与所述关联信息之间的最短关联路径上的路径信息数量,所述路径信息包括所述公司电话号码和所述关联信息,所述m≥2;
k0为与所述关联信息的信息类型对应的预设距离系数,0<k0;
x0为与所述关联信息的信息类型对应的预设强度系数,0<x0;
ki为所述路径信息各自对应的关联距离系数,0<ki;
ui为所述路径信息各自对应的衰减因子系数,0<ui≤1;
xi为所述路径信息各自对应的关联强度系数,0<xi。
其中,上述电话号码的风险检测装置中各个模块的功能实现与上述电话号码的风险检测方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
此外,本发明实施例还提供一种存储介质。
本发明存储介质上存储有风险检测程序,其中所述风险检测程序被处理器执行时,实现如上述的电话号码的风险检测方法的步骤。
其中,风险检测程序被执行时所实现的方法可参照本发明电话号码的风险检测方法的各个实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种电话号码的风险检测方法,其特征在于,所述电话号码的风险检测方法包括:
在接收到贷款终端发送的信贷请求时,获取所述信贷请求对应信贷申请者的公司电话号码、及所述信贷申请者的基本地址;
根据所述公司电话号码查询得到间接公司特征,并根据所述间接公司特征包括的间接公司地址、所述基本地址和预设关联规则、在所述公司电话号码与所述基本地址之间建立关联;
根据所述间接公司特征在预设信贷记录库中查询与所述间接公司特征匹配的历史信贷件,并在所述公司电话号码与所述历史信贷件之间建立关联;
根据预设关系度公式计算所述公司电话号码与各关联信息之间的关系度,其中所述各关联信息包括所述基本地址和所述历史信贷件;
当所述关联信息属于黑名单信息时,判断所述关系度是否大于预设关系阈值;
若所述关系度大于预设关系阈值,则确定所述公司电话号码为风险号码。
2.如权利要求1所述的电话号码的风险检测方法,其特征在于,所述根据所述公司电话号码查询得到间接公司特征的步骤之前,还包括:
向所述预设黄页站点发送特征获取请求,并接收所述预设黄页站点返回的请求回复;
根据所述请求回复的回复格式获取对应的解析规则,并根据所述解析规则对所述请求回复进行解析,得到已知公司特征,以形成已知公司特征库;
所述根据所述公司电话号码查询得到间接公司特征的步骤包括:
根据所述公司电话号码查询所述已知公司特征库,获取与所述公司电话号码匹配的间接公司特征。
3.如权利要求1所述的电话号码的风险检测方法,其特征在于,所述根据所述公司电话号码查询得到间接公司特征,并根据所述间接公司特征包括的间接公司地址、所述基本地址和预设关联规则、在所述公司电话号码与所述基本地址之间建立关联的步骤包括:
确定所述间接公司地址与所述基本地址之间的真实距离,并判断所述真实距离是否小于预设距离阈值;
若所述真实距离小于预设距离阈值,则在所述公司电话号码与所述基本地址之间建立关联。
4.如权利要求1所述的电话号码的风险检测方法,其特征在于,所述根据所述公司电话号码查询得到间接公司特征,并根据所述间接公司特征包括的间接公司地址、所述基本地址和预设关联规则、在所述公司电话号码与所述基本地址之间建立关联的步骤包括:
基于预设地址匹配规则计算所述间接公司地址与所述基本地址的地址文本匹配度;
判断所述地址文本匹配度是否大于预设地址阈值;
若所述地址文本匹配度大于所述预设地址阈值,则在所述公司电话号码与所述基本地址之间建立关联。
5.如权利要求4所述的电话号码的风险检测方法,其特征在于,所述基于预设地址匹配规则计算所述间接公司地址与所述基本地址的地址文本匹配度的步骤包括:
基于预设量化规则分别将所述间接公司地址和所述基本地址量化为对应的第一地址字符组D1和第二地址字符组D2,并对所述第一地址字符组D1和所述第二地址字符组D2进行并集运算,获得对应的全地址字符组D;
根据所述全地址字符组D中各地址字符分别在所述第一地址字符组D1和第二地址字符组D2中的出现频率、确定第一地址字符组D1对应的第一地址频率组DD1和第二地址字符组D2对应第二地址频率组DD2;
根据预设地址匹配度公式、所述第一地址频率组DD1和所述第二地址频率组DD2计算所述间接公司地址与所述基本地址之间的地址文本匹配度,所述预设地址匹配度公式为:
其中,sim(DD1,DD2)为所述间接公司地址与所述基本地址之间的地址文本匹配度;
n为所述第一地址频率组DD1或所述第二地址频率组DD2的元素数量;
DD1i为所述第一地址频率组DD1第i个元素,DD2i所述第二地址频率组DD2第i个元素,0<i≤n,且i为整数。
6.如权利要求1所述的电话号码的风险检测方法,其特征在于,所述若所述关系度大于预设关系阈值,则确定所述公司电话号码为风险号码的步骤之后,还包括:
根据所述关系度与预设复核阈值的大小关系输出对应的处理建议,其中所述预设符合阈值大于所述预设关系阈值。
7.如权利要求1至6中任一项所述的电话号码的风险检测方法,其特征在于,所述预设关系度公式为:
其中,f为所述公司电话号码与所述关联信息之间的关系度;
m为所述公司电话号码与所述关联信息之间的最短关联路径上的路径信息数量,所述路径信息包括所述公司电话号码和所述关联信息,所述m≥2;
k0为与所述关联信息的信息类型对应的预设距离系数,0<k0;
x0为与所述关联信息的信息类型对应的预设强度系数,0<x0;
ki为所述路径信息各自对应的关联距离系数,0<ki;
ui为所述路径信息各自对应的衰减因子系数,0<ui≤1;
xi为所述路径信息各自对应的关联强度系数,0<xi。
8.一种电话号码的风险检测装置,其特征在于,所述电话号码的风险检测装置包括:
请求接收模块,用于在接收到贷款终端发送的信贷请求时,获取所述信贷请求对应信贷申请者的公司电话号码、及所述信贷申请者的基本地址;
第一关联模块,用于根据所述公司电话号码查询得到间接公司特征,并根据所述间接公司特征包括的间接公司地址、所述基本地址和预设关联规则、在所述公司电话号码与所述基本地址之间建立关联;
第二关联模块,用于根据所述间接公司特征在预设信贷记录库中查询与所述间接公司特征匹配的历史信贷件,并在所述公司电话号码与所述历史信贷件之间建立关联;
关系度计算模块,用于根据预设关系度公式计算所述公司电话号码与各关联信息之间的关系度,其中所述各关联信息包括所述基本地址和所述历史信贷件;
关系度判断模块,用于当所述关联信息属于黑名单信息时,判断所述关系度是否大于预设关系阈值;
号码确定模块,用于若所述关系度大于预设关系阈值,则确定所述公司电话号码为风险号码。
9.一种电话号码的风险检测设备,其特征在于,所述电话号码的风险检测设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的风险检测程序,其中所述风险检测程序被所述处理器执行时,实现如权利要求1至7中任一项所述的电话号码的风险检测方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有风险检测程序,其中所述风险检测程序被处理器执行时,实现如权利要求1至7中任一项所述的电话号码的风险检测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811248852.7A CN109636568A (zh) | 2018-10-25 | 2018-10-25 | 电话号码的风险检测方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811248852.7A CN109636568A (zh) | 2018-10-25 | 2018-10-25 | 电话号码的风险检测方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109636568A true CN109636568A (zh) | 2019-04-16 |
Family
ID=66066656
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811248852.7A Pending CN109636568A (zh) | 2018-10-25 | 2018-10-25 | 电话号码的风险检测方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109636568A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110348998A (zh) * | 2019-06-27 | 2019-10-18 | 上海淇馥信息技术有限公司 | 基于黄页数据的用户欺诈风险预测的方法及装置 |
CN110795466A (zh) * | 2019-09-18 | 2020-02-14 | 平安银行股份有限公司 | 基于大数据处理的反欺诈方法、服务器及计算机可读存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8484132B1 (en) * | 2012-06-08 | 2013-07-09 | Lexisnexis Risk Solutions Fl Inc. | Systems and methods for segmented risk scoring of identity fraud |
CN107066478A (zh) * | 2016-12-14 | 2017-08-18 | 阿里巴巴集团控股有限公司 | 一种虚假地址信息识别的方法及装置 |
TWM552129U (zh) * | 2017-08-31 | 2017-11-21 | Ctbc Bank Co Ltd | 自動化驗證系統 |
CN107578331A (zh) * | 2017-09-19 | 2018-01-12 | 马上消费金融股份有限公司 | 一种贷后风险监控的方法和系统 |
CN108596638A (zh) * | 2018-04-27 | 2018-09-28 | 深圳市零度智控科技有限公司 | 基于大数据的反欺诈识别方法及系统、终端及存储介质 |
-
2018
- 2018-10-25 CN CN201811248852.7A patent/CN109636568A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8484132B1 (en) * | 2012-06-08 | 2013-07-09 | Lexisnexis Risk Solutions Fl Inc. | Systems and methods for segmented risk scoring of identity fraud |
CN107066478A (zh) * | 2016-12-14 | 2017-08-18 | 阿里巴巴集团控股有限公司 | 一种虚假地址信息识别的方法及装置 |
TWM552129U (zh) * | 2017-08-31 | 2017-11-21 | Ctbc Bank Co Ltd | 自動化驗證系統 |
CN107578331A (zh) * | 2017-09-19 | 2018-01-12 | 马上消费金融股份有限公司 | 一种贷后风险监控的方法和系统 |
CN108596638A (zh) * | 2018-04-27 | 2018-09-28 | 深圳市零度智控科技有限公司 | 基于大数据的反欺诈识别方法及系统、终端及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110348998A (zh) * | 2019-06-27 | 2019-10-18 | 上海淇馥信息技术有限公司 | 基于黄页数据的用户欺诈风险预测的方法及装置 |
CN110795466A (zh) * | 2019-09-18 | 2020-02-14 | 平安银行股份有限公司 | 基于大数据处理的反欺诈方法、服务器及计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Alrubaian et al. | Reputation‐based credibility analysis of Twitter social network users | |
TWI734466B (zh) | 針對隱私資料洩漏的風險評估方法及裝置 | |
US10567366B2 (en) | Systems and methods of user authentication for data services | |
US20110238566A1 (en) | System and methods for determining and reporting risk associated with financial instruments | |
JP2012504289A (ja) | オンラインビジネストランザクションデータを使用するローンアクセスの評価 | |
CN109831459B (zh) | 安全访问的方法、装置、存储介质和终端设备 | |
CN108805694A (zh) | 信贷咨询服务方法、装置、设备及计算机可读存储介质 | |
CN109636570A (zh) | 手机号的风险分析方法、装置、设备及可读存储介质 | |
CN108182627A (zh) | 一种根据用户行为实现用户信用评估的系统 | |
CN109657900A (zh) | 工作单位信息的风险检测方法、装置、设备及存储介质 | |
CN111489255A (zh) | 数据的授信方法、装置、设备及计算机可读存储介质 | |
CN118469298A (zh) | 基于大数据分析的业务风险预测方法及系统 | |
Liu et al. | Mobile E‐Commerce Information System Based on Industry Cluster under Edge Computing | |
Andrione‐Moylan et al. | (De‐) politicization Discourse Strategies: The Case of Trade | |
US20140180765A1 (en) | Web-based survey verification | |
CN109636580A (zh) | 基于大数据的风险检测方法、装置、设备及存储介质 | |
CN109636568A (zh) | 电话号码的风险检测方法、装置、设备及存储介质 | |
CN109636578B (zh) | 信贷信息的风险检测方法、装置、设备及可读存储介质 | |
CN109636577A (zh) | Ip地址分析方法、装置、设备及计算机可读存储介质 | |
CN113657902B (zh) | 基于图数据库的金融安全管理方法、系统及存储介质 | |
CN109636574B (zh) | 信贷信息的风险检测方法、装置、设备及存储介质 | |
CN113327161A (zh) | 一种用于信贷业务的智能风控决策系统 | |
CN109636573A (zh) | 信贷分析方法、装置、设备及可读存储介质 | |
KR20010090362A (ko) | 통합 인터넷 대출 조회 시스템 및 이를 이용한 대출 조회방법 | |
CN116318974A (zh) | 站点风险识别方法、装置、计算机可读介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190416 |