目前对于人类通话行为的研究还相对较少,本文总共做了5类统计,分别从通话时间频率分布,通话时间间隔分布,同一对象通话次数频率分布,通话周期和通话间隔相关性研究诈骗用户行为,每一类图都在具体的章节里面进行说明。
2用户行为分析
Tab(1): 本文涉及的统一符号说明
数字代号 代表含义
46 RAM
47 汇接
48 出网关
49 发送短信
50 接收短信
165 主叫
166 被叫
all 主叫+被叫
数据相关说明:
(1) 所有数据前的编号均来自原始数据中的编号;
(2) 刘霞芳并无本机号,故以123456789代替。
数据存在的问题:
(1) 数据存在大量的异常,一个人在同一秒中会有不同的行为。比如刘霞芳2014-06-0115:39:55存在2条记录,同一秒同一个号码打其他人3秒一个是打另外一个电话59秒,该问题存在于很多数据中,数据越长此问题越严重;
(2) 一个人同时拥有很多号码,是否应该将这些数据合并处理;源^自·751|文\论]文'网[www.751com.cn
(3) 刘霞芳的童话存在独有的特性,她的电话多数集中于凌晨时间,不知道是否是数据本身的问题。
2.1通话时间频率分布图
通话时间频率分布图是对具体一个人的通话时长的统计结果,首先获得用户的通话时长的列表,通话时长(以秒为单位)出现的次数作为y,通话时长作为x.对每一个人用户都进行了统计,总共21张图,过滤了记录数据少于300的用户。图表的名字是用户的号码。