统计信息生成系统和统计信息生成方法

文档序号:6360221阅读:120来源:国知局
专利名称:统计信息生成系统和统计信息生成方法
技术领域
本发明涉及统计信息生成系统和统计信息生成方法。
背景技术
以往,公知有取得便携终端的位置信息并根据该位置信息分析便携终端的用户的人口分布的装置(参照以下专利文献1、2)。通过这样使用便携终端的位置信息,与人口调查等所得到的人口统计数据进行比较,能够得到反映了用户的移动趋势的人口分布。例如,专利文献I中记载的装置利用存储了关于各个便携终端的位置信息的数据库,对与目标地域和目标层对应的人口分布进行合计。此外,专利文献2中记载的装置公开了按照每个基站生成接收了终端确认信号的终端的响应信号的合计结果作为人口密集度信息的技术。、在这种以往的人口分布的统计处理中,利用了用于向便携终端的利用者提供电信服务的数据即便携终端的位置数据或利用者的属性数据等的运用数据。对这些运用数据进行合计等统计处理,由此,能够得到“人数分布”、“移动人数”、“人数结构”等关于人口动态的估计值。此处,“人数分布”是指在各区域中分布的人数,“移动人数”是指在各区域间移动的人数,“人数结构”是指以性别或年龄层来区分的人数分布或移动人数。现有技术文献专利文献专利文献I :日本特开2003-30373号公报专利文献2 日本特开2005-286657号公报

发明内容
发明所要解决的问题然而,在上述以往的统计处理中,由于并不是合计对象的所有人口正持有便携终端,因此,仅取得便携终端的位置数据的总和不能得到正确的人口动态。为了得到正确的人口动态,需要将从便携终端得到的位置数据与该便携终端的签约者的每个属性的签约率的倒数相乘,取得加权的总和等,由此来估计包含了合计对象中未持有便携终端的人的全体人口。因此,当通过以往的统计处理的技术进行人口动态的估计时,会产生以下的问题。具体而言,是关于隐匿的问题。通过进行统计处理,关于各个便携终端的信息失去,合计结果中只示出作为集团的统计的趋势,但是,如果在统计处理的过程中以过于细致的合计范围来生成合计信息,则会产生在统计数据中会不会出现个人的识别性的担心。另一方面,如果以过于粗略的合计范围来生成合计信息,则会丧失估计数据的有效性。针对该问题,在以往的公知的统计处理等中,有时在统计结果数据中实施被称为“隐匿处理”的处理。即,在合计表中的数值低于某固定的值(称为隐匿基准)的情况下,进行不显示该合计结果或表示为零等的处理。然而,如上所述,在利用了来自便携电话网络的位置数据的人口估计中,求出乘以与每个签约者的属性不同的加权而得到的加权总和,因此,通过简单地比较估计值与隐匿基准的大小,不能判定是否需要隐匿。因此,本发明正是鉴于该课题而完成的,其目的在于,提供一种在利用了从便携电话网络得到的位置数据的情况下,可以隐匿统计数据中的个人的识别性的统计信息生成系统和统计信息生成方法。用于解决问题的手段为了解决上述课题,本发明的统计信息生成系统具有第I输入单元,其输入位置信息蓄积数据,该位置信息蓄积数据包含识别移动通信终端的第I识别信息、关于该移动通信终端的位置的位置信息以及关于取得该位置信息的时刻的时刻信息;第2输入单元,其输入属性信息蓄积数据,该属性信息蓄积数据包含识别移动通信终端的第2识别信息和关于该移动通信终端的签约者的属性信息;条件输入单元,其用于输入针对位置信息蓄积数据和属性信息蓄积数据的检索条件信息;提取单元,其根据检索条件信息,提取位置信息蓄积数据和属性信息蓄积数据的一部分;放大系数赋予单元,其对由提取单元提取出的属 性信息蓄积数据赋予放大系数,该放大系数是与属性信息蓄积数据中包含的属性信息对应的系数,表示对统计对象的数值的放大程度;统计单元,其使用由所述提取单元提取出的所述位置信息蓄积数据、由所述提取单元提取的具有与所述位置信息蓄积数据中包含的所述第I识别信息对应的所述第2识别信息的所述属性信息蓄积数据、以及向该属性信息蓄积数据赋予的所述放大系数,计算并输出关于人口的统计数据;合计单元,其对由提取单元提取的位置信息蓄积数据的数据数进行合计;判定单元,其通过比较由合计单元合计的数据数与预定值来判定数据数的大小;以及输出单元,其在判定单元判定为数据数较大的情况下,输出统计数据,在判定单元判定为数据数较小的情况下,隐藏统计数据中包含的数值,进行输出。或者,本发明的统计信息生成方法具有以下步骤第I输入步骤,第I输入单元输入位置信息蓄积数据,该位置信息蓄积数据包含识别移动通信终端的第I识别信息、关于该移动通信终端的位置的位置信息、以及关于取得该位置信息的时刻的时刻信息;第2输入步骤,第2输入单元输入属性信息蓄积数据,该属性信息蓄积数据包含识别移动通信终端的第2识别信息和关于该移动通信终端的签约者的属性信息;条件输入步骤,条件输入单元输入针对位置信息蓄积数据和属性信息蓄积数据的检索条件信息;提取步骤,提取单元根据检索条件信息,提取位置信息蓄积数据和属性信息蓄积数据的一部分;放大系数赋予步骤,放大系数赋予单元对由提取单元提取的属性信息蓄积数据赋予放大系数,该放大系数是与属性信息蓄积数据中包含的属性信息对应的系数,表示对统计对象的数值的放大程度;统计步骤,统计单元使用由所述提取单元提取出的所述位置信息蓄积数据、由所述提取单元提取的具有与所述位置信息蓄积数据中包含的所述第I识别信息对应的所述第2识别信息的所述属性信息蓄积数据、以及向该属性信息蓄积数据赋予的所述放大系数,计算并输出关于人口的统计数据;合计步骤,合计单元对由提取单元提取的位置信息蓄积数据的数据数进行合计;判定步骤,判定单元通过比较由合计单元合计的数据数与预定值来判定数据数的大小;以及输出步骤,输出单元在判定单元判定为数据数较大的情况下,输出统计数据,在判定单元判定为数据数较小的情况下,隐藏统计数据中包含的数值,进行输出。根据这种统计信息生成系统或统计信息生成方法,根据位置信息蓄积数据和属性信息蓄积数据,基于检索条件,计算考虑了对统计对象的数值的放大程度的人口统计数据。此外,不仅是考虑了对应属性的便携终端的签约率等的人口的估计值即估计数据,还一并对作为用于生成估计数据的位置数据的真正个数的数据数进行合计,由此,赋予用于判断是否需要统计数据的隐匿的材料的信息。此外,根据如上所述合计的数据数,判定所估计出的统计数据是否是根据“少数的集团”生成的信息,根据该判断结果对统计数据进行隐匿。仅根据统计数据中的统计数无法进行是否是根据“少数的集团”生成的判断。这是因为,统计数是通过基于按属性区分的不同便携终端的签约率的放大估计而导出的。因此,通过使用合计的上述数据数,可以正确地进行合计数据是否是根据“少数的集团”生成的判断。其结果为,能够对根据位置信息蓄积数据或属性信息蓄积数据估计出的统计数据中的个人的识别性进行隐匿。 发明效果根据本发明,能够在利用了从便携电话网络得到的位置数据的情况下,对统计数据中的个人的识别性进行隐匿。


图I是本发明优选的一个实施方式的统计信息生成系统的概略结构图。图2是示出输入到图I的第I输入部的位置信息蓄积数据的数据结构的图。图3是示出输入到图I的第2输入部的属性信息蓄积数据的数据结构的图。图4是示出图I的统计信息生成系统的动作的流程图。图5是用于说明本实施方式的终端数估计的考虑方法的图。图6是用于说明本实施方式的终端数估计的计算方法的图。图7是示出本实施方式的加入终端数(入込端末数)估计处理的流程图。图8是用于说明本实施方式的估计停留期间的计算方法的图。图9是用于说明本实施方式的位置数据的提取方法的图。图10是示出本实施方式的隐匿处理的一例的流程图。
具体实施例方式下面,详细说明附图以及本发明的统计信息生成系统和统计信息生成方法的优选的实施方式。另外,在附图的说明中,对相同的要素标注相同的标号,省略重复的说明。图I是本发明的优选的一个实施方式的统计信息生成系统I的概略结构图。图I所示的统计信息生成系统I是计算机系统,其利用用于在移动通信网NW中向多个便携终端2等移动通信终端提供电信服务的数据即位置信息,生成包含关于人口动态的估计值的统计数据。该统计信息生成系统I由包含非识别化信息生成装置11、合计装置21以及信息隐匿装置31在内的多个信息处理装置构成,可以经由无线基站3和移动通信网NW与便携终端2或和移动通信网NW连接的通信装置之间相互进行数据通信。另外,统计信息生成系统I可以由I台信息处理装置构成,也可以由任意台数的信息处理装置构成。上述便携终端2具有使用利用了 GPS的定位、或利用了来自无线基站3的电波的定位等各种定位运算方式来取得本身的位置信息的功能。此外,该定位运算的结果得到的便携终端2的位置信息可以从便携终端2或与移动通信网NW连接的通信装置被发送到统计信息生成系统I。以下,详细地对统计信息生成系统I的结构进行说明。非识别化信息生成装置11由第I输入部(第I输入单元)12、第2输入部(第2输入单元)13、钥匙管理部(钥匙管理单元)14、单向运算部(单向运算单元)15、非识别化位置数据生成部(非识别化位置数据生成单元)16以及非识别化属性数据生成部(非识别化属性数据生成单元)17构成。第I输入部12从移动通信网NW等外部接收位置信息的输入,蓄积到位置信息蓄积数据中。如图2所示,位置信息蓄积数据包含线路号码等作为识别便携终端2的信息的第I识别信息“090-XXXX-XXXX”、以及纬度/经度信息或接收到便携终端2的位置登记信号的无线基站3的识别信息等关于该便携终端2的位置的信息即位置信息“XI、Y1”、以及取得位置信息的时刻“2010/5/30 12:24”。此外,第I输入部12将蓄积的位置信息蓄积数据输出到非识别化位置数据生成部16。、第2输入部13从移动通信网NW等外部接收表示便携终端2的属性的属性数据的输入,蓄积到属性信息蓄积数据中。如图3所示,属性信息蓄积数据包含线路号码等作为识别便携终端2的信息的第2识别信息“090-XXXX-XXXX”、以及表示由第2识别信息识别的便携终端2的签约者,即,第2识别信息是线路号码的情况下的与该线路的签约者有关的属性的属性信息等。作为这种属性信息,可以举出住所“东京都新宿区”、性别“男”以及年龄“三十多岁”等信息作为典型例子。另外,对于同一便携终端2,第I识别信息和第2识别信息被赋予相同的数据值。此外,第2输入部13将蓄积的属性信息蓄积数据输出到非识别化属性数据生成部17。返回图1,钥匙管理部14保持有预定的电子钥匙信息。期望严格管理该电子钥匙信息,以便不泄露到钥匙管理单元的外部。单向运算部15从非识别化位置数据生成部16和非识别化属性数据生成部17分别被输入第I识别信息和第2识别信息,使用钥匙管理部14保持的电子钥匙信息,对第I识别信息和第2识别信息应用单向函数,由此,分别输出第I非识别化信息和第2非识别化信息。例如,单向运算部15使用SHA(Secure Hash Algorithm :安全哈希算法)-256等哈希函数作为单向性函数,通过输出针对第I识别信息或第2识别信息与钥匙信息的连接的哈希值等的运算处理,输出第I非识别化信息或第2非识别化信息。非识别化位置数据生成部16从位置信息蓄积数据中删除第I识别信息,通过将向单向运算部15输入第I识别信息而生成的第I非识别化信息附加于位置信息蓄积数据,由此来生成非识别化位置信息蓄积数据。此处,非识别化位置数据生成部16优选对位置信息还施加增加适当的噪音而增加位置等的、额外的数据加工处理。此外,非识别化位置数据生成部16将生成的非识别化位置信息蓄积数据交给合计装置21。非识别化属性数据生成部17从属性信息蓄积数据中删除第2识别信息,将通过向单向运算部15输入第2识别信息而生成的第2非识别化信息附加于属性信息蓄积数据,由此来生成非识别化属性信息蓄积数据。此处,优选非识别化属性数据生成部17进行通过将属性信息抽象化而生成抽象化属性信息并将属性信息置换为抽象化属性信息的处理。作为这种抽象化处理的例子,可以举出将“年龄”修整为“年龄层”、或删除住址的详细部分、或除去姓名等具有个人识别性的信息等处理。此外,非识别化属性数据生成部17将生成的非识别化属性信息蓄积数据交给合计装置21。统计信息生成系统I的合计装置21由存储部22、条件输入部(条件输入单元)23、提取部(提取单元)24、放大系数赋予部(放大系数赋予单元)25、统计部(统计单元)26以及合计部(合计单元)27构成。存储部22存储非识别化信息生成装置11生成的非识别化位置信息蓄积数据和非识别化属性信息蓄积数据。条件输入部23从统计处理的要求者接收针对非识别化位置信息蓄积数据和非识别化属性信息蓄积数据的检索条件的输入。关于这种检索条件的输入,可以直接输入到统计信息生成系统1,也可以经由移动通信网NW等的通信网络接收。例如,当要求者想要估计“在时刻t处于A地域的男性的人数”时,接收相当于“时刻=t,位置信息e A地域,性别=男性”的信息的输入作为检索条件。此外,条件输入部23将接收到的检索条件传送提取部24。 提取部24从存储部22中存储的非识别化位置信息蓄积数据和非识别化属性信息蓄积数据中,提取符合从条件输入部23传送的检索条件的部分数据集合。例如,在得到上述检索条件的情况下,提取部24提取符合“时刻=t,位置信息e A地域”的非识别化位置信息蓄积数据的集合、和符合“性别=男性”的非识别化属性信息蓄积数据的集合。而且,提取部24将提取的各个数据集合作为对象,将第I非识别化信息和第2非识别化信息作为钥匙(key)信息,执行关系代数中的连接(join)运算。由此,可以得到连接了符合“时刻=t,位置信息e A地域,性别=男性”的位置信息与属性信息的数据集合。这里,提取部24在核对检索条件与非识别化位置信息蓄积数据的结果的、针对检索条件的一致率作为概率值而得到的情况下,可以对非识别化位置信息蓄积数据赋予表示该概率值的概率信息。例如,在以概率的方式被提供了是否“位置信息e A地域”的情况下,可以将该概率赋予所提取的集合。此外,提取部24在非识别化属性信息蓄积数据中包含的属性信息被置换为抽象化属性信息的情况下,通过核对抽象化位置信息与检索条件来提取非识别化属性信息蓄积数据。例如,在抽象化属性信息被设定为“年龄五十多岁”的情况下,判断为适合检索条件“年龄=二十多岁以上五十多岁以下”。放大系数赋予部25根据包含与非识别化位置信息蓄积数据连接的非识别化属性信息蓄积数据在内的属性信息,依照预定的步骤,取得作为数值的放大系数,将该放大系数赋予给连接后的数据集合。该放大系数是表示针对统计对象的人口数值的放大程度的系数。例如,放大系数赋予部25预先保存有“三十多岁男性”、“二十多岁女性”等每个年龄层和性别的组合的便携电话的签约率,对包含某年龄和性别的组合作为属性信息的数据集合,赋予相应的签约率的倒数并输出。更具体而言,在“三十多岁男性”的签约率保存为50% (=0. 5)的情况下,对属性信息“35岁,男性”输出“O. 5”的倒数即放大系数“2. O”。统计部26使用连接了由提取部24提取出的非识别化位置信息蓄积数据和非识别化属性信息蓄积数据的数据集合、以及由放大系数赋予部25赋予的放大系数,计算关于人口估计数的统计数据。具体而言,统计部26针对数据集合中包含的各个信息,从该属性信息中提取年龄和性别,调用放大系数赋予部25而得到相应的放大系数。此外,统计部26将数据集合中包含的全部数据记录(数据要素)的放大系数的总和计算作为估计人数。此处,在对数据集合中包含的部分数据记录附加了表示符合检索条件的概率值的概率信息的情况下,统计部26取得该概率信息与放大系数相乘得到的值的总和,由此能够计算出统计人数。此外,统计部26将计算出的统计数据输出至信息隐匿装置31。合计部27对由提取部24提取的数据集合的数据记录(数据要素)的数据数量进行合计,将该合计值作为合计人数输出到信息隐匿装置31。此处,在合计人数的计算中不考虑放大系数和概率信息。其理由为,信息隐匿装置31应基于“是根据多少人的便携终端2的用户的集团估计出的信息?”来判定是否要隐匿统计数据,因此,需要在实施基于放大系数或概率信息的加权处理前的纯粹的数据要素数。统计信息生成系统I的信息隐匿装置31由判定部(判定单元)32和输出部(输出单元)33构成。判定部32对合计部27合计出的数据数量与预定值进行比较,判定数据数量的大 小。例如,在预先得到“10”作为具体的基准值的情况下,判定部32判定合计部27所合计的人数是否为“10”以上。判定部32在判定的结果为10以上的情况下,判断为合计人数较多,在小于10的情况下,判断为合计人数较少。然后,判定部32将判定结果传送给输出部33。输出部33根据判定部32的判定结果,决定是否直接输出包含合计装置21所估计出的估计人数的统计数据,输出最终的统计数据。该统计数据可以被输出至统计信息生成系统I中直接设置的显示装置等的输出装置,也可以经由移动通信网NW等通信网络而被输出至便携终端2等远程装置。具体而言,在判定为合计人数较多的情况下,输出部33直接输出统计数据中包含的估计人数。另一方面,在判断为合计人数较少的情况下,输出部33将估计人数置换为预定的数值或符号并输出,由此隐藏估计人数。例如,将估计人数输出为“0”,或者用表示被隐藏的符号即“X”置换估计人数并进行输出。另外,即便在判定为合计人数较多的情况下,考虑残差值的明确指示等的可能性,将估计人数修整为具有一定数值间隔的粗略值,或者将加上随机数后的值等输出为估计值也是合适的。以下,参照图4,对统计信息生成系统I的动作进行说明,并且,对统计信息生成系统I中的统计信息生成方法进行详细叙述。图4是示出统计信息生成系统I的统计信息生成时的动作的流程图。首先,非识别化信息生成装置11接收位置信息的输入,蓄积到位置信息蓄积数据(步骤S101)。接着,非识别化信息生成装置11的非识别化位置数据生成部16从位置信息蓄积数据中删除第I识别信息并将其输入到单向运算部15而得到了第I非识别化信息,将该得到的第I非识别化信息附加于位置信息蓄积数据,由此生成非识别化位置信息蓄积数据,并存储在合计装置21的存储部22中(步骤S102)。然后,非识别化信息生成装置11接收属性信息的输入,蓄积到属性信息蓄积数据(步骤S103)。接着,非识别化信息生成装置11的非识别化属性数据生成部17从属性信息蓄积数据中删除第2识别信息并将其输入到单向运算部15而得到了第2非识别化信息,将得到的第2非识别化信息属性信息附加到蓄积数据,由此生成非识别化属性信息蓄积数据,并存储在合计装置21的存储部22中(步骤S104)。此外,合计装置21的条件输入部23接收决定统计处理的条件的检索条件的输入(步骤S105)。例如,条件输入部23接收相当于“时刻=t,位置信息e A地域,性别=男性”的信息的输入,作为用于估计“在时刻t处于A地域的男性的人数”的检索条件。与此对应,提取部24从存储部22提取符合接收到的检索条件的非识别化位置信息蓄积数据和非识别化属性信息蓄积数据的集合(步骤S106)。具体而言,提取部24从存储部22分别提取符合“时刻=t,位置信息e A地域”的非识别化位置信息蓄积数据的集合、以及符合“性别=男性”的非识别化属性信息蓄积数据的集合。此外,提取部24将提取的各个集合作为对象,将第I非识别化信息和第2非识别化信息作为钥匙(key),执行连接运算(步骤S107)。其结果是,提取部24得到符合检索条件的数据集合。接着,统计部26从由提取部24提取出的数据集合的构成要素中提取属性信息的一部分例如年龄和性别,赋予给放大系数赋予部25,由此取得针对各个构成要素的放大系数(步骤S108)。然后,统计部26计算放大系数的总和,将得到的结果作为估计人数(步骤S109)。此外,合计部27计算由提取部24提取出的数据集合的要素数量,将取得的结果作为合计人数(步骤SI 10)。例如,假定通过提取部24得到了以下那样的由分别包含数据项目“位置、时刻、年、龄、性别”的4个数据要素构成的数据集合。要素I: (A,t,23,男性)要素2: (A,t,33,男性)要素3: (A,t,31,男性)要素4: (A,t,85,男性)此处,假设放大系数赋予部25保持有以下信息作为针对年龄层与性别的组的签约率。(二十多岁,男性)40%(=0· 4)(三十多岁,男性)50%(=0.5)(八十多岁,男性)5%(=0.05)该情况下,当放大系数为签约率的倒数时,对各个要素赋予以下放大系数。要素I: (A,t,23,男性)2.5要素2: (A, t, 33,男性)2· O要素3: (A,t,31,男性)2. O要素4: (A, t, 85,男性):20. O此外,在上述例子中,由统计部26估计出的估计人数为“26. 5”,由合计部27计算出的合计人数为“4”。再次参照图4,然后,信息隐匿装置31的判定部32判定由合计部27计算出的合计人数是否为预定值以上(步骤S111)。当假设将“10”作为具体的基准值时,在上述例子中,合计人数为“4”,因此判定为合计人数较少。最后,输出部33根据判定部32中的判定决定是否直接输出估计人数,并输出最终的估计值。即,在判定为合计人数较多的情况下(步骤Slll ;是),输出部33直接输出估计人数作为估计值(步骤S112)。另一方面,在判定为合计人数较少的情况下(步骤Slll ;否),将估计人数置换为预定的特定的数值或符号,由此来隐匿估计人数并进行输出(步骤S113)。在上述例子中,由于判定为合计人数较少,因此,估计值例如输出为“O”。根据以上说明的统计信息生成系统I和统计信息生成方法,从通过第I识别信息和第2识别信息而相互对应的位置信息蓄积数据和属性信息蓄积数据中,分别除去第I识别信息和第2识别信息后,提供了第I非识别化信息和第2非识别化信息。该第I非识别化信息和第2非识别化信息通过将预先保持的电子钥匙信息和第I识别信息及第2识别信息带入单向性函数而得到,不能从非识别化信息对识别信息进行逆运算。此外,即便单向性函数已经被公开,只要电子钥匙的值被保密,那么即便识别信息全部被猜中(総当& ” )并输入到单向性函数,也无法得知识别信息与非识别化信息的对应关系。此外,根据附加了非识别化信息的非识别化位置信息蓄积数据和非识别化属性信息蓄积数据,基于检索条件,计算考虑了针对统计对象的数值的放大度的人口统计数据。此处,由于识别信息被置换为非识别化信息,因此,能够将通过提供使用了识别信息的检索条件而实施使特定个人的行动公开的统计处理防患于未然。此外,不仅是考虑了与属性对应的便携终端的签约率等的人口的估计值即估计数据,还一并对作为用于生成估计数据的位置数据的真正的个数的数据数量进行合计,由此提供作为用于判断是否需要隐匿统计数据的材料的信息。此外,根据如上所述合计的数据数量,判断估计出的统计数据是否是根据“少数的 集团”生成的信息,根据该判断结果对统计数据进行隐匿。仅根据统计数据中的统计数无法进行是否是根据“少数的集团”生成的判断。这是因为,统计数是通过基于按属性区划的不同的便携终端的签约率的放大估计而导出的。因此,通过使用合计的上述数据数量,可以正确地判断合计数据是否是根据“少数的集团”生成的。结果是,能够防止根据位置信息蓄积数据和属性信息蓄积数据中包含的识别信息对个人进行识别,并且,能够对所估计出的统计数据中的个人的识别性进行隐匿。在上述统计信息生成系统I中,属性信息蓄积数据中包含的属性信息被置换为将信息抽象化后的抽象化属性信息,通过将该抽象化属性信息与检索条件信息进行核对,提取非识别化属性信息蓄积数据的一部分。因此,通过得到将抽象化的属性信息单位化的统计数据,能够大体地了解人口动态。此外,通过将统计数据概略化,能够使基于统计数据的个人的识别较困难。此外,对非识别化位置信息蓄积数据赋予概率信息,通过将概率信息与放大系数相乘来计算统计数据,因此,在位置信息与检索条件的一致率作为概率被得到的情况下,能够得到反映了该概率的统计数据,能够得到反映了全体的人口动态趋势的统计数据。例如,在位置信息作为区域中的概率分布被得到的情况下,能够得到反映了该概率分布的统计数据。另外,本发明不限定于前述实施方式。例如,在统计信息生成系统I中处理的位置信息蓄积数据和属性信息蓄积数据中,包含线路号码作为第I和第2识别信息,统计信息生成系统I将该线路号码作为识别便携终端2的信息进行了处理。与此相对,统计信息生成系统 I 也可以将 IMSI(International Mobile Subscriber Identity :国际移动用户识别码)等识别便携终端 2 的用户的号码、或 IMEI (International Mobile Equipment Identity 国际移动设备识别)等识别便携终端2的设备的号码等来代替线路号码作为识别便携终端2的信息进行处理。此外,合计装置21的提取部24从存储部22存储的非识别化位置信息蓄积数据和非识别化属性信息蓄积数据中提取了符合检索条件的一部分数据集合。也可以是,提取部24在通过对非识别化位置信息蓄积数据与非识别化属性信息蓄积数据进行连接运算而将它们连接后,将概率信息附加到连接后的数据集合,在该数据集合中提取符合检索条件的一部分数据集合。此外,还可以提取赋予概率信息之前的数据集合,也可以提取通过放大系数赋予部25赋予了放大系数的数据集合。此外,合计装置21的统计部26对由提取部24提取出的数据集合中包含的各数据记录的放大系数的总和进行了计算,但是,也可以按照每个属性计算数据集合中包含的数据记录的总和,并将该总和与对应于相应的属性的放大系数相乘。例如,首先计算符合数据集合中包含的属性“三十多岁男性”的数据记录的总数或概率值的总和,将该总数或总和与对应于属性“三十多岁男性”的放大系数“2. O”相乘,由此能够计算与该属性对应的统计人数。此外,在上述实施方式中,信息隐匿装置31的输出部33根据由合计装置21的条件输入部23接收的输入的检索条件,输出与检索条件对应的全体的统计人数,但是,该统计人数也可以按属性区划而进行输出。例如,当接收到“时刻=t,位置信息e A地域,年龄 =三十几岁”的检索条件时,输出部33可以按照性别输出统计人数,也可以按照年龄输出统计人数,还可以按照年龄和性别输出统计人数。此外,在合计装置21中,按照以下的步骤,通过提取部24,对连接了位置信息和属性信息的数据(以下,简称为“位置数据”。)赋予与关于由便携终端2生成的位置信息的估计生成密度对应的信息即特征量wi j,通过统计部26可以对该位置数据的集合进行合计,由此进行在服务区内的数量的估计。此处所述的“估计生成密度”是指,生成该位置信息的终端在该位置信息的生成时刻附近每单位时间生成的信号数的估计值。首先,说明终端数的估计的考虑方法和计算方法。如图5所示的模型那样,在某个观测期间(长度T)内,η个终端ai、a2、…、an通过无线基站3的扇区S,将各终端%在观测期间内在扇区S的停留时间设为^ (0< ^Τ)ο此时,处于扇区S的终端数m (实际上处于扇区S的终端数m的观测期间内的平均值)由以下的式(I)表示。式IIn=^tiZT (I)
1=1g卩,将各终端ai在观测期间内在扇区S的停留时间\的总和除以观测期间的长度T得到结果估计为终端数m。但是,虽然不能观测终端ai在观测期间内在扇区S的停留时间\的真正值,但是,各终端%发送位置信息的信号(例如,位置登记信号,以下简称为“信号”。),并且那些信号可以观测。将终端ai在观测期间内在扇区S发送的信号按时刻顺序设为式2
Qji Qi2> · · · ,Cxi是终端ai在观测期间内在扇区S发送的信号的总数),终端数的估计只能根据观测到的信号qu (j为I以上xi以下的整数)来估计m值。下面,根据图6来说明终端数估计的计算方法。将从终端%发送的信号qu的密度(即,每单位时间的信号数)设为Pi。此时,如果信号发送的概率独立于扇区,则终端Bi在观测期间内在扇区S中发送的信号的总数Xi的期望值E (Xi)为E (Xi)AiXpi,因此,关于终端%在观测期间内在扇区S的停留时间\的期望值E Cti),以下式(2)成立。E Cti) =X1Zp1(2)此处,当将信号qu的发送时刻设为Uij时,信号qu的密度Pij由以下式(3)给出。Pij=2/ (Ui (H1)-Ui (j—D)(3)此处,如果将信号qu作为求出特征量Wu的对象的位置数据(第I位置数据)的信号,则信号Qiu-D相当于包含与该第I位置数据相同的识别信息的位置数据中的、紧邻该第I位置数据之前的位置数据(第2位置数据)的信号,信号qi (j + 1)相当于包含与该第I位置数据相同的识别信息的位置数据中的、紧接在该第I位置数据之后的位置数据(第3的位置数据)的信号。在本实施方式中,将第2位置数据的信号qi(H)的发送时刻uiQ_D与第3的位置数据的信号Qi (J+1)的发送时刻Ui (j + n之差,即,上述式(3)的Ui (J+1)-Ui _),作为关于第I位置数据的特征量Wijtl因此,上述式(3)变为下式。即,可以与密度Pij的倒数对应关联地计算特征量Wijt5Pij=2/ Cui (J^1)-Ui =2/ψ^(4)合计装置21的提取部24对合计对象的全部的位置数据附加特征量wu。此时密度Pi由式3
权利要求
1.一种统计信息生成系统,其特征在于,该统计信息生成系统具有 第I输入单元,其输入位置信息蓄积数据,该位置信息蓄积数据包含识别移动通信终端的第I识别信息、关于该移动通信终端的位置的位置信息以及关于取得该位置信息的时刻的时刻信息; 第2输入单元,其用于输入属性信息蓄积数据,该属性信息蓄积数据包含识别移动通信终端的第2识别信息和关于该移动通信终端的签约者的属性信息; 条件输入单元,其输入针对所述位置信息蓄积数据和所述属性信息蓄积数据的检索条件信息; 提取单元,其根据所述检索条件信息,提取所述位置信息蓄积数据和所述属性信息蓄积数据的一部分; 放大系数赋予单元,其对由所述提取单元提取出的所述属性信息蓄积数据赋予放大系 数,该放大系数是与所述属性信息蓄积数据中包含的属性信息对应的系数,表示对统计对象数值的放大程度; 统计单元,其使用由所述提取单元提取出的所述位置信息蓄积数据、由所述提取单元提取的具有与所述位置信息蓄积数据中包含的所述第I识别信息对应的所述第2识别信息的所述属性信息蓄积数据、以及向该属性信息蓄积数据赋予的所述放大系数,计算并输出关于人口的统计数据; 合计单元,其对由所述提取单元提取出的所述位置信息蓄积数据的数据数进行合计; 判定单元,其通过比较由所述合计单元合计的所述数据数与预定值来判定所述数据数的大小;以及 输出单元,其在所述判定单元判定为所述数据数较大的情况下,输出所述统计数据,在所述判定单元判定为所述数据数较小的情况下,隐藏所述统计数据中包含的数值而进行输出。
2.根据权利要求I所述的统计信息生成系统,其特征在于, 所述合计单元将由所述提取单元提取出的位置信息蓄积数据中的唯一的所述第I识别信息的个数合计为所述数据数。
3.根据权利要求2所述的统计信息生成系统,其特征在于, 所述合计单元将每个区域划分的唯一的所述第I识别信息的个数合计为所述数据数,其中所述区域划分是所述统计单元的合计单位。
4.根据权利要求I至3中任意一项所述的统计信息生成系统,其特征在于,所述统计信息生成系统还具有 钥匙管理单元,其保持预定的电子钥匙信息; 单向运算单元,其被输入所述第I识别信息和所述第2识别信息,对所述第I识别信息和所述第2识别信息分别应用使用了所述钥匙管理单元保持的所述电子钥匙信息的单向函数,输出第I非识别化信息和第2非识别化信息; 非识别化位置数据生成单元,其从所述位置信息蓄积数据中删除所述第I识别信息,并且将由所述单向运算单元输出的所述第I非识别化信息作为所述第I识别信息附加于所述位置信息蓄积数据,生成位置信息蓄积数据;以及 非识别化属性数据生成单元,其从所述属性信息蓄积数据中删除所述第2识别信息,并且将由所述单向运算单元输出的所述第2非识别化信息作为所述第2识别信息附加于所述属性信息蓄积数据,生成属性信息蓄积数据。
5.根据权利要求4所述的统计信息生成系统,其特征在于, 所述非识别化属性数据生成单元将所述属性信息蓄积数据中包含的属性信息置换为将信息抽象化后 的抽象化属性信息, 所述提取单元将该抽象化后的抽象化属性信息与所述检索条件信息进行核对,由此来提取所述非识别化属性信息蓄积数据的一部分。
6.根据权利要求I至5中任意一项所述的统计信息生成系统,其特征在于, 所述提取单元对所述位置信息蓄积数据赋予表示与检索条件信息的一致率的概率信息, 所述统计单元将赋予给所述位置信息蓄积数据的所述概率信息与所述放大系数相乘,由此计算所述统计数据。
7.根据权利要求I至5中任意一项所述的统计信息生成系统,其特征在于, 所述提取单元根据所述位置信息蓄积数据,估计与关于由所述移动通信终端生成的所述位置信息的估计生成密度对应的值,作为特征量赋予, 所述统计单元将赋予给所述位置信息蓄积数据的所述特征量与所述放大系数相乘,由此计算所述统计数据。
8.一种统计信息生成系统,其特征在于,该统计信息生成系统具有 第I输入单元,其输入位置信息蓄积数据,该位置信息蓄积数据包含识别移动通信终端的第I识别信息、关于该移动通信终端的位置的位置信息以及关于取得该位置信息的时刻的时刻信息; 第2输入单元,其输入属性信息蓄积数据,该属性信息蓄积数据包含识别移动通信终端的第2识别信息和关于该移动通信终端的签约者的属性信息; 钥匙管理单元,其保持有预定的电子钥匙信息; 单向运算单元,其被输入所述第I识别信息和所述第2识别信息,对所述第I识别信息和所述第2识别信息分别应用使用了所述钥匙管理单元保持的所述电子钥匙信息的单向函数,输出第I非识别化信息和第2非识别化信息; 非识别化位置数据生成单元,其从所述位置信息蓄积数据中删除所述第I识别信息,并且将由所述单向运算单元输出的所述第I非识别化信息附加于所述位置信息蓄积数据,生成非识别化位置信息蓄积数据; 非识别化属性数据生成单元,其从所述属性信息蓄积数据中删除所述第2识别信息,并且将由所述单向运算单元输出的所述第2非识别化信息附加于所述属性信息蓄积数据,生成非识别化属性信息蓄积数据。
条件输入单元,其输入针对所述非识别化位置信息蓄积数据和所述非识别化属性信息蓄积数据的检索条件信息; 提取单元,其根据所述检索条件信息,提取所述非识别化位置信息蓄积数据和所述非识别化属性信息蓄积数据的一部分; 放大系数赋予单元,其对由所述提取单元提取的所述非识别化属性信息蓄积数据赋予放大系数,该放大系数是与所述非识别化属性信息蓄积数据中包含的属性信息对应的系数,表示对统计对象数值的放大程度; 统计单元,其使用由所述提取单元提取出的所述非识别化位置信息蓄积数据、由所述提取单元提取的具有与所述非识别化位置信息蓄积数据中包含的所述第I非识别化信息对应的所述第2非识别化信息的所述非识别化属性信息蓄积数据、以及向该非识别化属性信息蓄积数据赋予的所述放大系数,计算并输出关于人口的统计数据; 合计单元,其对由所述提取单元提取出的所述非识别化位置信息蓄积数据的数据数进行合计; 判定单元,其通过比较由所述合计单元合计的所述数据数与预定值来判定所述数据数的大小;以及 输出单元,其在所述判定单元判定为所述数据数较大的情况下,输出所述统计数据,在所述判定单元判定为所述数据数较小的情况下,隐藏所述统计数据中包含的数值而进行输 出。
9.一种统计信息生成方法,其特征在于,该统计信息生成方法包含以下步骤 第I输入步骤,第I输入单元输入位置信息蓄积数据,该位置信息蓄积数据包含识别移动通信终端的第I识别信息、关于该移动通信终端的位置的位置信息以及关于取得该位置信息的时刻的时刻信息; 第2输入步骤,第2输入单元输入属性信息蓄积数据,该属性信息蓄积数据包含识别移动通信终端的第2识别信息和关于该移动通信终端的签约者的属性信息; 条件输入步骤,条件输入单元输入针对所述位置信息蓄积数据和所述属性信息蓄积数据的检索条件信息; 提取步骤,提取单元根据所述检索条件信息,提取所述位置信息蓄积数据和所述属性信息蓄积数据的一部分; 放大系数赋予步骤,放大系数赋予单元对由所述提取单元提取出的所述属性信息蓄积数据赋予放大系数,该放大系数是与所述属性信息蓄积数据中包含的属性信息对应的系数,表示对统计对象数值的放大程度; 统计步骤,统计单元使用由所述提取单元提取出的所述位置信息蓄积数据、由所述提取单元提取的具有与所述位置信息蓄积数据中包含的所述第I识别信息对应的所述第2识别信息的所述属性信息蓄积数据、以及向该属性信息蓄积数据赋予的所述放大系数,计算并输出关于人口的统计数据; 合计步骤,合计单元对由所述提取单元提取出的所述位置信息蓄积数据的数据数进行合计; 判定步骤,判定单元通过比较由所述合计单元合计的所述数据数与预定值来判定所述数据数的大小;以及 输出步骤,输出单元在所述判定单元判定为所述数据数较大的情况下,输出所述统计数据,在所述判定单元判定为所述数据数较小的情况下,隐藏所述统计数据中包含的数值而进行输出。
全文摘要
该统计信息生成系统(1)具有条件输入部(23);提取部(24),其提取非识别化位置数据和非识别化属性数据;放大系数赋予部(25),其对非识别化属性数据赋予放大系数;统计部(26),其使用非识别化位置数据、非识别化属性数据及放大系数,计算统计数据;合计部(27),其对非识别化位置数据进行合计;判定部(32),其判定所合计的数据数的大小;以及输出部(33),其隐藏统计数据并进行输出。
文档编号G06F17/30GK102859547SQ20118001985
公开日2013年1月2日 申请日期2011年4月6日 优先权日2010年4月23日
发明者寺田雅之, 冈岛一郎, 大薮勇辉 申请人:株式会社Ntt都科摩
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1