JP6174802B2 - Information processing apparatus and information processing system - Google Patents
Information processing apparatus and information processing system Download PDFInfo
- Publication number
- JP6174802B2 JP6174802B2 JP2016530777A JP2016530777A JP6174802B2 JP 6174802 B2 JP6174802 B2 JP 6174802B2 JP 2016530777 A JP2016530777 A JP 2016530777A JP 2016530777 A JP2016530777 A JP 2016530777A JP 6174802 B2 JP6174802 B2 JP 6174802B2
- Authority
- JP
- Japan
- Prior art keywords
- column
- information
- information amount
- columns
- record
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000010365 information processing Effects 0.000 title claims description 28
- 238000004364 calculation method Methods 0.000 claims description 23
- 238000000034 method Methods 0.000 claims description 19
- 238000003672 processing method Methods 0.000 claims description 12
- 238000003860 storage Methods 0.000 claims description 9
- 238000009826 distribution Methods 0.000 description 9
- 235000019580 granularity Nutrition 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 241001122767 Theaceae Species 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は情報処理装置および情報処理システムに関する。より具体的には、テーブル形式のデータに対して、分析を支援する情報処理装置および情報処理システムに関する。 The present invention relates to an information processing apparatus and an information processing system. More specifically, the present invention relates to an information processing apparatus and an information processing system that support analysis of data in a table format.
近年、企業で蓄積されてきた業績に関するビッグデータを活用し、業績向上に繋がる要因を分析するシステムの開発が盛んに行われている。分析者は様々な情報を含む大量のデータに対して、条件を絞ることで要因を限定して目的との関係性を調べる。このとき、どの程度の粒度で条件を絞るかが重要である。ある店舗の売上向上について分析する場合を例に挙げる。例えば顧客の推移を時間ごとに絞って調べる場合、1分ごと、1時間ごと、6時間ごとのように、絞る時間の粒度によって分析結果が大きく異なる。このように分析者は、様々な条件、粒度にデータを加工する、または関係性を使って分析する。しかし分析するデータのサイズが大きくなるにつれ、こうしたデータの加工や関係性の発見を分析者が人手で行うことは困難になってきた。そこでこのような分析を支援するシステムの開発が求められている。 In recent years, the development of systems for analyzing factors that lead to improvement of business performance by utilizing big data related to business performance accumulated by companies has been actively performed. The analyst examines the relationship with the purpose by limiting the conditions for a large amount of data including various information by narrowing down the conditions. At this time, it is important to narrow down the conditions at what granularity. Take the case of analyzing the sales improvement of a certain store as an example. For example, when examining customer transitions by time, analysis results vary greatly depending on the granularity of time to be narrowed, such as every minute, every hour, and every six hours. In this way, the analyst processes the data into various conditions and granularities, or analyzes it using relationships. However, as the size of the data to be analyzed has increased, it has become difficult for analysts to manually process such data and discover relationships. Therefore, development of a system that supports such analysis is required.
本願発明に先駆けて、本願発明者らは、背景技術で述べたデータの粒度について、特に収集したデータ中におけるカラム間の粒度関係を抽出することを検討した。 Prior to the invention of the present application, the inventors of the present application examined the extraction of the granularity relationship between columns in the collected data, particularly regarding the granularity of data described in the background art.
図1に、分析対象として扱うテーブルの具体例、及び、カラム間の粒度関係についての具体例を示す。テーブル001において、一つのサンプルを表すテーブルの各行をレコードと呼び、「顧客ID」002、「年齢」003、「入店時刻」004のようなテーブルの各列をカラムと呼ぶ。 FIG. 1 shows a specific example of a table handled as an analysis target and a specific example of a granularity relationship between columns. In the table 001, each row of the table representing one sample is called a record, and each column of the table such as “customer ID” 002, “age” 003, and “entry time” 004 is called a column.
ここで、テーブル中のカラムには、格納されるレコードの粒度が異なるカラムが存在することがある。例えば、「商品分類」005は、「商品名」006の辞書的な上位概念であるため、「商品名」006を包含する。また、「年齢」003は、どの顧客も1つの年齢の値を持ち、同一年齢の顧客が複数人居る可能性があるため、「顧客ID」002を情報量的に包含する。 Here, the columns in the table may include columns having different granularities of stored records. For example, “product classification” 005 is a lexicographic concept of “product name” 006, and therefore includes “product name” 006. Further, “age” 003 includes “customer ID” 002 in terms of information amount because every customer has one age value and there may be a plurality of customers of the same age.
このように、より粒度の細かい「商品名」006や「顧客ID」002を子カラム、粗い「商品分類」005や「年齢」003を親カラムと呼ぶ。すなわち、テーブル001において包含関係があるカラムの具体例は、「商品名」006と「商品分類」005、「顧客ID」002と「年齢」003である。一方、包含関係がないカラムの具体例は、例えば「商品分類」005と「気温」008等である。予め包含関係を見つけることができれば、分析の際にその情報を活用できる。 In this way, the “product name” 006 and “customer ID” 002 with finer granularity are called child columns, and the coarse “product classification” 005 and “age” 003 are called parent columns. That is, specific examples of columns having an inclusion relationship in the table 001 are “product name” 006, “product classification” 005, “customer ID” 002, and “age” 003. On the other hand, specific examples of columns having no inclusion relationship are “product classification” 005 and “temperature” 008, for example. If an inclusive relationship can be found in advance, the information can be used for analysis.
包含関係を抽出する技術の一例として、特許文献1には、所定の単語の同義語や上位概念となる単語などの概念階層に関する情報を予めシソーラス辞書に登録しておき、検索に際して単語間の概念階層を考慮した検索方法を提供する技術が記載されている。
As an example of a technique for extracting an inclusion relationship,
特許文献1に記載の技術は、シソーラス辞書に、同義語や上位概念となる単語に関する情報が保存されている単語については、単語と単語の概念関係を知ることができる。しかしながら、例えば「年齢」は通常のシソーラス辞書においては、「顧客ID」の上位概念とは登録されない。さらに、今回対象とするテーブルにおけるカラム名は、テーブルの作成者が自由に割り当てることができるものである。そのため、商品の名前カラムのカラム名が、例えば「Label」、「Product Name」、「pro_name」、「商品名」のようにテーブルの作成者によって異なり、その結果、シソーラス辞書に登録されていない単語になることが当然にあり得る。これらの場合、特許文献1に記載の技術を用いて上位概念の単語を検索する方法は適用できない。
The technique described in
以上を踏まえ、本願発明の目的は、テーブル形式のデータに対して、カラム間の包含関係の抽出をより容易とする技術を提供することにある。 Based on the above, an object of the present invention is to provide a technique that makes it easier to extract inclusion relations between columns for table-format data.
本願発明による課題を解決する手段のうち代表的なものを例示すれば、情報処理方法であって、第1のカラムおよび第2のカラムが含まれる入力テーブルに対し、第1のカラムの情報量である第1の情報量と、第2のカラムの情報量である第2の情報量と、を算出する第1の工程と、第1の情報量と第2の情報量の大小関係を比較する第2の工程と、第2のカラムに対する第1のカラムの情報量である第1の条件付き情報量を算出する第3の工程と、第1の条件付き情報量に基づいて第1のカラムと第2のカラムの包含関係を判定する第4の工程と、を有することを特徴とする。 A representative example of means for solving the problems according to the present invention is an information processing method, which is an information amount of the first column with respect to an input table including the first column and the second column. The first step of calculating the first information amount and the second information amount of the second column are compared with the magnitude relationship between the first information amount and the second information amount. A second step of calculating, a third step of calculating a first conditional information amount which is an information amount of the first column with respect to the second column, and a first step based on the first conditional information amount And a fourth step of determining an inclusion relationship between the column and the second column.
または、情報処理システムであって、第1のカラムおよび第2のカラムが含まれる入力テーブルを記憶する記憶部と、第1のカラムの情報量である第1の情報量と第2のカラムの情報量である第2の情報量と、を算出し、第1の情報量と第2の情報量の大小関係を比較する情報量計算処理部と、第2のカラムに対する第1のカラムの情報量である、第1の条件付き情報量を算出し、第1の条件付き情報量に基づいて、第1のカラムと第2のカラムの包含関係を判定する包含関係計算処理部と、を有することを特徴とする。 Alternatively, in the information processing system, the storage unit that stores the input table including the first column and the second column, the first information amount that is the information amount of the first column, and the second column An information amount calculation processing unit that calculates a second information amount, which is an information amount, and compares the magnitude relationship between the first information amount and the second information amount, and information on the first column relative to the second column An inclusion relation calculation processing unit that calculates a first conditional information quantity, which is a quantity, and determines an inclusion relation between the first column and the second column based on the first conditional information quantity It is characterized by that.
本願発明によれば、テーブル形式のデータにおいて、カラム間の包含関係を抽出することがより容易となる。 According to the present invention, it is easier to extract inclusion relations between columns in table format data.
以下、本発明の一実施形態を、図面を参照して説明する。図2は、本発明のシステム全体のハードウェア構成を示すブロック図である。本実施例に係る情報処理システム100は、中央処理装置101および記憶装置102を含む情報処理装置100、入力装置103及び出力装置104を有する。
Hereinafter, an embodiment of the present invention will be described with reference to the drawings. FIG. 2 is a block diagram showing the hardware configuration of the entire system of the present invention. An
中央処理装置101は、記憶装置102に格納されたプログラムを実行するプロセッサであり、情報量計算処理部105、包含関係計算処理部106等を有する。記憶装置102は、例えば磁気記憶装置、フラッシュメモリ等の大容量かつ不揮発性の記憶装置であり、入力テーブル107、出力テーブル108、包含関係情報テーブル109等を記憶する。入力装置103は、キーボード、マウスなどのユーザインターフェースであり、出力装置104は、ディスプレイ装置、プリンタなどのユーザインターフェースである。ここで、情報処理装置100と、入力装置103および出力装置104とはネットワークを介して接続されている構成としたが、この点は特に限定されない。本システムは物理的に一つの計算機上に構築されても、物理的には一つ又は複数の計算機上に構成された論理区画上に構築されてもよい。情報量計算処理部105は、例えば図4で後述する、各カラムの情報量を計算する。包含関係計算処理部106は、例えば図5で後述する、子カラムに対する親カラムの条件付き情報量を計算する。
The
次に、情報処理システム100がテーブル形式のデータに対してカラム間の包含関係を抽出する方法を、図3を用いて説明する。図3は、中央処理装置101における処理を示したフロー図である。図3のフローにおいて、入力となるデータは、入力テーブル110および子カラム情報203である。入力テーブル110は、図7上段のような、例えば店舗の売上と顧客に関する情報が格納されているテーブルであり、テーブルの各列(顧客ID、年齢、入店時刻、…)のそれぞれにデータが含まれる。以下、このテーブルの各列を「カラム」と呼ぶ。また、テーブルの各行はレコードと呼ばれ、それぞれ一つのサンプルを表す。子カラム情報203が示す「子カラム」とは、図7下段の「商品分類」のように、入力テーブル110から任意に選択された一つのカラムである。図3では、子カラムを「商品分類」に固定した場合のフローを説明し、全カラムを子カラムの対象とするフローについては図6で説明する。
Next, a method by which the
まず、ステップ301において、入力テーブル110に含まれるカラムから、親カラム候補となるカラムを一つ選択し、親カラム情報302を生成する。図7下段に親カラム情報302の例を示す。親カラム候補は、子カラム情報203のカラムと親フラグテーブル309においてフラグが立っているカラム以外のカラムを対象として、入力テーブル110から順に選択される。ここで、親フラグテーブル309は包含関係が既知であるフラグ関係を示すテーブルである。このテーブルを用いることで、親カラムとして調べる必要のない組み合わせを除くことができる。親フラグテーブル309の具体例を図9に示す。親フラグテーブル309では、例えば「商品名」と「商品分類」が包含関係にあるとしてフラグが立っている。
First, in
次に、ステップ303において、親カラム情報302のカラムの情報量H(X)と子カラム情報203のカラムの情報量H(Y)を算出する。ここで、情報量が大きいほどカラムのユニークなレコード数が多いことを示している。ユニークなレコード数とは、重複を許さないカラムのレコード数である。
Next, in
次に、ステップ304では、情報量の比較を行い、0<H(親カラム)<H(子カラム)を満たす時Yesと判定する。全てのレコードが同じ値を持つカラムは情報量が0となり、必ずH(親カラム)<H(子カラム)を満たすが、意味のない関係であるため、0<H(親カラム)を条件に加えてこのようなカラムを除いている。
Next, in
ステップ304でYesと判定された場合は、ステップ305において、親カラム情報302と子カラム情報203に対し、子カラムに対する親カラムの条件付き情報量H(X|Y)を算出する。
If it is determined Yes in
次に、ステップ306で、子カラムによる親カラムの包含判定を行う。このステップは、カラム間の情報量の観点から見た包含関係を判定するステップであり、上記H(X|Y)が0である場合にYesと判断する。また、カラム内のデータにノイズが含まれた場合を考慮して、0に十分近い値所定の閾値α(例えば0.1)未満であるとき、Yesと判定する。
Next, in
ステップ307では、以上の判定の結果を包含関係情報テーブル109に登録する。ステップ306でYesと判定された場合には、カラム名および対応する親カラム名を包含関係情報テーブル109に登録する。
In
次に、ステップ308で親フラグテーブル309を更新し、ステップ310で、包含関係情報テーブル109を更新する。
Next, the parent flag table 309 is updated in
ここで図4を用いて、図3のステップ303の詳細を説明する。まず、ステップ401で、親カラム情報302と、子カラム情報203を入力としNullを含むレコードを除いた親カラム情報、子カラム情報を出力する。このとき、親カラム情報302のレコードと子カラム情報203のレコードはペアで扱うため、いずれかがNullを含む場合は両方のレコードが除かれる。以上の具体例を図10に示す。例えば入力テーブル110から、親カラム情報302として「商品分類」カラムが、子カラム情報203として「商品名」カラムが選択されている。これに対しステップ401を実行すると、「商品名」カラムにおける5番目のレコードには「スリッパ」が入っているが、「商品分類」カラムにおける5番目のレコードはnullであるため、5番目のレコードが削除された、親カラム情報701および子カラム情報702が出力される。その後、変数Zを初期化し(ステップ402)、各カラム中のユニークなレコードを抽出してXに格納する(ステップ403)。
Here, the details of
次に、ステップ404で、X中の各レコードxに対して情報量を、以下の(1)により算出する。
Next, in
ここで、
x:カラムの各ユニークなレコード
X:レコードxの集合
p(x):カラムのレコードがxである確率
H(X):カラムの情報量
である。この計算を、ステップ405において親カラムの全てのxに対して行う。そして、ステップ406および408〜410で、子カラムに対して同様の計算を行うことで、親カラムおよび子カラムについて情報量が算出できる(ステップ407)。here,
x: Each unique record in the column
X: Set of records x
p (x): Probability that the column record is x
H (X): column information amount. This calculation is performed for all x in the parent column in
具体的な演算は以下の通りである。まず、親カラム情報701に対して、情報量を算出する。親カラム情報701において、「商品分類」カラムのレコード数は9である。その中で、「商品分類」中の「文房具」であるレコードに注目すると、レコード数は3であるのでx=「文房具」である確率はp(x)=3/9である。同様にx=「食べ物」のときp(x)=4/9、x=「キッチン」のときp(x)=2/9であるため、X=「商品分類」カラムの情報量は、以下の式(2)よりH(X)=1.53と計算される。 The specific calculation is as follows. First, the amount of information is calculated for the parent column information 701. In the parent column information 701, the number of records in the “product classification” column is nine. Among them, paying attention to the record “stationery” in “product classification”, since the number of records is 3, the probability that x = “stationery” is p (x) = 3/9. Similarly, when x = “food”, p (x) = 4/9, and when x = “kitchen”, p (x) = 2/9, so the amount of information in the X = “product classification” column is From the equation (2), H (X) = 1.53 is calculated.
ここで、
x:「商品分類」カラムの各ユニークなレコード
X:レコードxの集合
p(x):「商品分類」カラムのレコードがxである確率
H(X):「商品分類」カラムの情報量
である。同様に、子カラム情報702に対して情報量を算出と、式(3)より情報量はH(Y)=2.95と計算される。here,
x: Each unique record in the “Product Classification” column
X: Set of records x
p (x): Probability that the record in the “product classification” column is x
H (X): Information amount in the “product classification” column. Similarly, when the amount of information is calculated for the
ここで、
y:「商品名」カラムの各ユニークなレコード
Y:レコードyの集合
p(y):「商品名」カラムのレコードがyである確率
H(Y):「商品名」カラムの情報量
である。従って、0<H(X)<H(Y)であるため、後段のステップ304でYesと判定されることとなる。すなわち、本具体例では、「商品分類」カラムより「商品名」カラムの方が大きな情報量を持つカラムである。言い方を変えると、「商品分類」カラムより「商品名」カラムの方がユニークなレコード数が大きい。ユニークなレコード数とは重複を許さないカラムのレコード数である。here,
y: Each unique record in the “Product Name” column
Y: Set of records y
p (y): Probability that the record in the “Product Name” column is y
H (Y): Information amount in the “product name” column. Therefore, since 0 <H (X) <H (Y), it is determined as Yes in the
次に図5を用いて、図3のステップ305の詳細を説明する。図4と同様に、Nullを含むレコードを除いた親カラム情報、子カラム情報を出力し(ステップ401)、Zを初期化し(ステップ501)、各カラム中のユニークなレコードを抽出してX、Yに格納する(ステップ502)。
Next, details of
次に、ステップ503から505で、X、Y中の各レコードx、yについて、子カラムに対する親カラムの条件付き情報量506を算出する。ステップ503における、条件付き情報量の計算は、以下の式(4)によって行う。
Next, in
x:親カラムの各ユニークレコード
y:子カラムの各ユニークレコード
X:レコードxの集合
Y:レコードyの集合
p(y) :子カラムのレコードがyである確率
p(x、y):親カラムのレコードがxかつ子カラムのレコードがyである確率
H(X|Y):子カラムのレコードが決まったとき親カラムのレコードに残る情報量
以上の計算を、図10の親カラム情報701および子カラム情報702を引き続き用いて説明する。以下、各記号の意味は以下の通りである。
x:「商品分類」カラムの各ユニークレコード
y:「商品名」カラムの各ユニークレコード
X:レコードxの集合
Y:レコードyの集合
p(y):「商品数」カラムのレコードがyである確率
p(x、y):「商品分類」カラムのレコードがxかつ「商品名」カラムのレコードがyである確率
H(X|Y):「商品名」カラムのレコードが決まったとき「商品分類」カラムのレコードに残る情報量
まず、x=「文房具」、y=「ペン」とすると、「商品名」カラムのレコード数は9、「商品名」カラムが「ペン」であるレコード数は1、「商品名」カラムが「ペン」かつ「商品分類」が「文房具」であるレコード数は1であるので、p(y)=1/9であり、p(x、y)=1/9である。同様にしてx=「食べ物」、y=「お茶」のときp(y)=2/9、p(x、y)=2/9である。x: Each unique record in the parent column
y: Each unique record in the child column
X: Set of records x
Y: Set of records y
p (y): Probability that the child column record is y
p (x, y): Probability that the record in the parent column is x and the record in the child column is y
H (X | Y): Amount of information remaining in parent column record when child column record is determined The above calculation will be described with reference to parent column information 701 and
x: Each unique record in the “Product Classification” column
y: Each unique record in the “Product Name” column
X: Set of records x
Y: Set of records y
p (y): Probability that the record in the “Product Count” column is y
p (x, y): Probability that the record in the “product classification” column is x and the record in the “product name” column is y
H (X | Y): The amount of information that remains in the record in the “Product Classification” column when the record in the “Product Name” column is determined. The number of records is 9, the number of records whose "product name" column is "pen" is 1, the number of records whose "product name" column is "pen" and "product classification" is "stationery" is 1, p (y) = 1/9 and p (x, y) = 1/9. Similarly, when x = “food” and y = “tea”, p (y) = 2/9 and p (x, y) = 2/9.
以上の要領で、全てのレコードについてp(y)とp(x、y)を用いて、X=「商品分類」カラムの全レコードに対するY=「商品名」カラムの全レコードの条件付き情報量は式(5)よりH(X|Y)=0と計算される。 With the above procedure, using p (y) and p (x, y) for all records, X = all records in the “Product Classification” column, Y = conditional information amount of all records in the “Product Name” column Is calculated as H (X | Y) = 0 from Equation (5).
ここで、ステップ306では、H(X|Y)<αを満たす場合にYesと判定される。ここでαは、0≦α<0.1程度の範囲を持つ閾値である。具体例では条件を満たすためYesと判定され、これは言い換えると「商品分類」カラムは「商品名」カラムに包含されていると判定される。仮にXとYを入れ替え、「商品分類」カラムに対する「商品名」カラムの条件付き情報量H(Y|X)を計算したものを式(6)に示す。
Here, in
式(6)よりH(Y|X)=1.42となるが、これはH(Y|X)>αであるため、包含関係判定部306でNoと判定される値である。言い換えると、「商品名」カラムは「商品分類」カラムに包含されていないと判定される。つまり「商品分類」カラムは「商品名」カラムの親カラムであるが、逆は成り立たないことを示している。なお、以上の計算は説明のためのものであり、式(6)の計算は本願発明の実施に必須ではないことに留意されたい。
From equation (6), H (Y | X) = 1.42, but since H (Y | X)> α, this is a value determined as No by the inclusion
このように、ステップ306では、片方のカラムのレコードが決まったとき、もう片方のカラムのレコードが唯一に決まる傾向にあるか判定している。入力テーブル110の具体例で説明すると、「商品名」が「ペン」であるとき「商品分類」は必ず「文房具」であるし、「商品名」が「お茶」であるとき「商品分類」は必ず「食べ物」であるため、「商品分類」カラムは「商品名」カラムの親カラムである。一方で「商品分類」が「文房具」であるとき、「商品名」は「ペン」「鉛筆」「消しゴム」のいずれかであり唯一に決まらないため、「商品名」は「商品分類」の親ではない。以上のように、情報量判定部304でYesかつ包含関係判定部306でYesと判定された親カラム情報302のカラムと子カラム情報203のカラムは包含関係にあるカラムである。
As described above, in
以上で、子カラムを「商品分類」に固定した場合の、包含関係の抽出が完了した。次に、全カラムを子カラムとするフローを図6で説明する。 This completes the extraction of the inclusion relationship when the child column is fixed to “product classification”. Next, a flow in which all columns are child columns will be described with reference to FIG.
まず、ステップ202で、入力テーブル110中の任意の一つのカラムを子カラムとして選択し、子カラム情報203を出力する。次に、ステップ204で、図3〜5にて説明した一連のフローを実行することで、カラム間の包含関係情報を抽出し、包含関係情報テーブル109を更新する。ステップ205で、ステップ204の処理を全てのカラムに対して実行する。
First, in
ステップ205で、全てのカラムに対してステップ204の処理を実行したことを確認すると、必要に応じてステップ206で直近度計算処理を実行し、包含関係情報テーブル109を更新する。以上で、入力テーブル110に含まれる全カラムについて、包含関係が自動で算出できる。ここで、直近度603とは、カラム名601と親カラム名602に格納されるカラム間の包含関係の近さを示す値であり、カラム名601が同一のレコードについて、親カラム名602のレコード中に格納されているカラムについて、そのカラムのユニークなレコード数が多い順に番号が与えられる。直近度603の具体例は図17で説明する。
If it is confirmed in
本実施例におけるテーブルとは、一般的なデータベースにおけるテーブルと同一の概念であると考えて問題ないが、本発明はテーブルがデータベース内のテーブルに限定されるものではなく、プログラム上のメモリ領域に格納されている形態でも良いし、テキストファイル形式、CSVファイル形式などあらゆる形態のデータに置き換えても良い。 The table in this embodiment has no problem considering that it is the same concept as a table in a general database, but the present invention is not limited to the table in the database, and the table is not limited to the memory area on the program. A stored form may be used, or data in any form such as a text file format or a CSV file format may be replaced.
図8は、包含関係情報テーブル109の具体例である。カラム名601には、図7の入力テーブル110において包含関係を算出した子カラムのカラム名が格納される。親カラム名602には、カラム名601のカラムに対して親カラムが存在する場合、親カラムのカラム名が格納される。例えば、図3のステップ307において、レコード604に親カラム情報302のカラムである「商品分類」と子カラム情報203のカラムである「商品名」が登録されている。
FIG. 8 is a specific example of the inclusion relationship information table 109. The
図9は親フラグテーブル309の具体例である。親フラグテーブル309は、行と列に同じ要素を持つ正方行列である。正方行列の中で、斜線を引いた場所は使用しない。親フラグテーブル309の初期状態は空のテーブルである。入力テーブル110から、ステップ307において「商品名」カラムと「商品分類」カラムが包含関係にあると登録されると、ステップ308によって親フラグテーブル309の「商品名」「商品分類」に対応する場所にフラグ1が格納される。同様に包含関係にあると判定されたカラムの組み合わせに対応する場所にフラグが格納される。
FIG. 9 is a specific example of the parent flag table 309. The parent flag table 309 is a square matrix having the same elements in rows and columns. Do not use the shaded area in the square matrix. The initial state of the parent flag table 309 is an empty table. When it is registered from the input table 110 that the “product name” column and the “product classification” column are in an inclusive relationship in
このように、本実施例に係る情報処理方法は、第1のカラム(親カラム)および第2のカラム(子カラム)が含まれるテーブル110を入力とし、第1のカラムの情報量である第1の情報量H(X)および第2のカラムの情報量である第2の情報量H(Y)を求める工程303と、第1の情報量と第2の情報量を比較する工程304と、第2のカラムに対する第1のカラムの情報量である第1の条件付き情報量H(X|Y)を求める工程305と、第1の条件付き情報量に基づいて、第1のカラムと第2のカラムの包含関係を判定する工程306とを有することを特徴とする。また、本実施例に係る情報処理システムは、第1のカラムおよび第2のカラムが含まれる入力テーブルを記憶する記憶部102と、第1のカラムの情報量である第1の情報量と第2のカラムの情報量である第2の情報量と、を算出し、第1の情報量と第2の情報量の大小関係を比較する情報量計算処理部105と、第2のカラムに対する第1のカラムの情報量である第1の条件付き情報量を算出し、第1の条件付き情報量に基づいて第1のカラムと第2のカラムの包含関係を判定する包含関係計算処理部106と、を有することを特徴とする。
As described above, the information processing method according to the present embodiment uses the table 110 including the first column (parent column) and the second column (child column) as an input, and is the information amount of the first column. A
係る特徴により、本実施例に係る情報処理方法および情報処理システムは、テーブル形式のデータに対して、カラム間の包含関係を抽出することがより容易となる。特に、この情報処理方法は、データの情報量に基づき包含関係を抽出する方法であるため、シソーラス辞書等は当然に不要であり、さらに、作成者が任意のカラム名を付与していたとしても問題なく実施が可能となる。 With such a feature, the information processing method and the information processing system according to the present embodiment can more easily extract the inclusion relation between the columns with respect to the data in the table format. In particular, since this information processing method is a method of extracting inclusion relations based on the amount of data information, a thesaurus dictionary is naturally unnecessary, and even if the creator has given an arbitrary column name Implementation is possible without problems.
図11は実施例2における情報処理システム100のフロー図であり、実施例1の図6に対応するものである。実施例1との違いは、子カラム情報203によって入力される子カラムの型によって動作を変え、親カラムを自動生成する機能が追加されている点である。これにより、入力テーブル110中に子カラムの親カラムが存在しない場合でも親カラムを生成できる。
FIG. 11 is a flowchart of the
図11では、ユーザから入力テーブル110に加え、全カラムの情報テーブル801を入力とする。全カラムの情報テーブル801には、入力テーブル110に関する全てのカラムの情報が格納されている。全カラムの情報テーブル801の具体例を図12に示す。入力テーブル110からステップ202によってカラムが一つ選択され、子カラム情報203が出力される。子カラムの情報203と全カラムの情報テーブル801を入力として、ステップ802において子カラム情報203のカラムの型を、「時刻型」「数値型」「文字列型」の三種類のいずれかに判定し、選択された型に応じて、それぞれステップ805、ステップ803、ステップ204が実行される。ステップ802では、全カラムの情報テーブル801に格納されている、子カラム情報203のカラムの型名を元に型が判定される。型の判定する型の分類について図13に示す。
In FIG. 11, in addition to the input table 110 from the user, the information table 801 for all columns is input. The all column information table 801 stores information on all the columns related to the input table 110. A specific example of the information table 801 for all columns is shown in FIG. One column is selected from the input table 110 in
ステップ802において時刻型と判定されると、ステップ805が実行され、時刻テーブル807が出力される。時刻テーブル生成処理部805の詳細なフローを図14に、時刻テーブル807の具体例を図16に示す。
If the time type is determined in
ステップ802において数値型と判定されると、ステップ803が実行され、子カラム情報203のカラム中の各レコードについて頻度分布が算出される。そして、得られた結果を用いてステップ804において、数値型として扱うか文字列型として扱うか判定される。具体的には、例えば頻度分布が一様分布に従う場合はNo、正規分布やその他の分布に従う場合はYesと判定するというように、子カラム情報203におけるカラムの要素がIDとして扱われている数値なのか、値として扱われている数値なのか判定する。ステップ804でYesと判定されると、ステップ806が実行され、自動生成テーブル808が出力される。自動生成テーブル生成処理部806の詳細を図15に、自動生成テーブルの具体例を図16に示す。
If it is determined in
ステップ802において文字列型と判定されると、ステップ204が実行される。ステップ204の詳細は図3〜5で説明したものと同様である。
If it is determined in
その後、入力テーブル110と時刻テーブル807または自動生成テーブル808を入力として、ステップ809によりテーブルが結合される。この結合は、入力テーブル110が一般的なリレーショナルデータベースにおけるテーブルの場合、結合クエリーであるinner joinを用いて行われ、テキスト形式など他の形式の場合も同等の処理で行われる。結合の際にキーとなるカラムは、子カラム情報テーブルのカラムである。ステップ810では、包含関係情報を包含関係情報テーブル812に格納する。包含関係情報テーブル812の具体例を図17に示す。
Thereafter, the input table 110 and the time table 807 or the automatic generation table 808 are input, and the tables are joined in
ステップ205においてYesと判定されると、出力テーブル108と包含関係情報テーブル812が出力され、必要に応じてステップ206により包含関係情報テーブル812が更新される。出力テーブル108の具体例を図18に示す。今回は選択された子カラムに対して初めに型の判定を行ったが、初めにステップ204を実行し、親カラムが見つからなかった場合に型の判定を行い、ステップ805やステップ806を実行することも可能である。
If it is determined Yes in
図12は全カラムの情報テーブル801の具体例を示している。全カラムの情報テーブル801はカラム名、型名、閾値を格納する。カラム名は入力テーブル110の各カラムの名前、型名は一般的なリレーショナルデータベースにおける型名のことであり、int、float、double、decimal、bit、boolean、char、string、time、date、datetime等が挙げられる。閾値は、ユーザもしくはシステムから与えられる数値である。 FIG. 12 shows a specific example of the information table 801 for all columns. The information table 801 for all columns stores column names, model names, and threshold values. The column name is the name of each column in the input table 110, the type name is the type name in a general relational database, such as int, float, double, decimal, bit, boolean, char, string, time, date, datetime, etc. Is mentioned. The threshold value is a numerical value given from the user or the system.
図13は型の分類テーブル902を示している。ステップ802では、型の分類テーブル902のとおりに判定される。ここに上げた型以外の型についても同様にして型分類を定義して判定する。
FIG. 13 shows a type classification table 902. In
図14は、ステップ805の詳細なフロー図を示している。この処理では、時刻型である子カラムに対して粒度を様々に変えたカラムを生成する。子カラム情報203を入力としてステップ1001でカラム中のレコードの開始日時と終了日時を、レコードの最大最小値を求めることで取得する。次に、ステップ1002では、開始日時から終了日時までの範囲で時刻テーブル807を生成する。時刻テーブル807の具体例を図16に示す。
FIG. 14 shows a detailed flowchart of
図15は、ステップ806の詳細なフロー図を示している。この処理では、子カラムに対して粒度を様々に変えたカラムを生成する。子カラム情報203を入力としてステップ1101でカラム中のレコードの最大値と最小値を取得し、その他にも、カラム中のレコードの頻度分布情報等を取得する。次に、ステップ1101で求めた子カラムの情報を元に、ステップ1102において自動生成テーブル808を生成する。ステップ1102では、全カラムの情報テーブル801から取得した閾値で最大値と最小値の範囲を分割した値を持つテーブルや、子カラムの頻度分布を元にテーブルを生成できる。自動生成テーブル808の具体例を図16に示す。
FIG. 15 shows a detailed flowchart of
図16は、時刻テーブル807と自動生成テーブル808の具体例である。ステップ1001により得られた開始の日時と終了の日時を元に時刻テーブル807が生成される。このとき生成される時刻テーブルは、10分刻みの時刻をレコードに持つカラム、1時間刻みの時刻をレコードに持つカラムなど様々な刻み幅の時刻カラムである。同様に、ステップ1101により得られた最大値と最小値を元に自動生成テーブル808が生成される。ここで「ReCalc_気温」カラム1506には、全カラムの情報テーブル801におけるカラム名中のレコード「気温」カラムに対応する「閾値」カラムのレコード「2」によって、入力テーブル110における「気温」カラムのレコードの最大値と最小値の範囲を2分割した値が格納されている。また、最大値と最小値を閾値で分割する方法以外にも、頻度分布情報抽出1102で抽出した頻度分布情報を元にして、頻度が均等になるように閾値で分割したカラムを生成することも可能である。
FIG. 16 is a specific example of the time table 807 and the automatic generation table 808. A time table 807 is generated based on the start date and time and the end date and time obtained in
図17は、包含関係情報テーブル812の具体例である。カラム名601には、入力テーブル110における全てのカラムのカラム名が格納される。親カラム名602には、カラム名601のカラムに対して親カラムが存在する場合、親カラムのカラム名が格納される。直近度603は、カラム名601と親カラム名602に格納されるカラム間の包含関係の近さである。カラム名601のレコードが同じ親カラム名602のレコード中に格納されているカラムについて、そのカラムのユニークなレコード数が大きい順に番号が与えられる。レコード1201では、「気温」の親カラムとして自動生成テーブル生成処理部806により生成された「ReCalc_気温」が登録されている。レコード1208と1209では、カラム間の包含関係情報抽出処理部204により「顧客ID」の親カラムとして「年齢」、「商品名」の親カラムとして「商品分類」が抽出され登録されている。これらのレコードは、一つの子カラムに対して一つの親カラムしか存在しないため、直近度には1が格納されている。
FIG. 17 is a specific example of the inclusion relation information table 812. The
これに対しレコード1202、1203、1204では、時刻テーブル807が生成されたため、「10分ごとの時刻」「1時間ごとの時刻」「6時間ごとの時刻」が親カラムとしてそれぞれ登録されている。ここで「入店時刻」は親カラムを三つ持つため、各親カラムについてユニークなレコード数が大きい順に直近度603を求める。ここでは「10分ごとの時刻」「1時間ごとの時刻」「6時間ごとの時刻」の順にユニークなレコード数が大きいため、この順に直近度に順位が格納される。また「10分ごとの時刻」に対して「1時間ごとの時刻」「6時間ごとの時刻」、「1時間ごとの時刻」に対して「6時間ごとの時刻」が親カラムであるため、それぞれレコード1205、1206、1207に登録される。レコード1210のように親カラムが存在しない場合、親カラム名や直近度には何も格納されない。以上のようにして包含関係情報テーブル812が得られる。
On the other hand, in the
図18は、出力テーブル108の具体例である。入力テーブル110に対して、ステップ805やステップ806で生成された時刻テーブル807や自動生成テーブル808がステップ809で結合され、出力テーブル108が出力される。出力テーブル108には、ステップ805によって、「入店時刻」カラム1301に対する親カラムとして「10分ごとの時刻」カラム1302、「1時間ごとの時刻」カラム1303、「6時間ごとの時刻」カラム1304が生成され、結合されている。また自動生成テーブル生成処理部806によって、「気温」カラム1305に対する親カラムとして「ReCalc_気温」カラム1306が生成され、結合されている。人工的に生成されたカラムを含むカラム間の包含関係情報は、包含関係情報テーブル812に格納されている。このように、本実施例に係る発明によって出力された出力テーブル108とカラムの包含関係情報テーブル812を用いることで、入力テーブル中のあらゆる型のカラムに対して包含関係を抽出することができる。
FIG. 18 is a specific example of the output table 108. The time table 807 and the automatic generation table 808 generated in
110:情報処理システム、101:中央処理装置、102:記憶装置、103:入力装置、104:出力装置、105:情報量計算処理部、106:包含関係計算処理部、107:入力テーブル、108:出力テーブル、109:包含関係情報テーブル、110:入力テーブル、202, 204, 205, 206, 301, 303, 304, 305, 306, 307, 308, 401, 402, 403, 404, 405, 406, 501, 502, 503, 504, 505, 802, 803, 804, 805, 806, 809, 810, 1001, 1002, 1101, 1102:ステップ、203, 702:子カラム情報、302, 701:親カラム情報、309:親フラグテーブル、407:情報量、506:条件付き情報量、601:カラム名、602:親カラム名、603:直近度、604, 1201〜1210:レコード、801:全カラムの情報テーブル、807:時刻テーブル、808:自動生成テーブル、812:包含関係情報テーブル、902:型の分類テーブル、1301〜1306:カラム。 110: Information processing system, 101: Central processing unit, 102: Storage device, 103: Input device, 104: Output device, 105: Information amount calculation processing unit, 106: Inclusion relation calculation processing unit, 107: Input table, 108: Output table, 109: Inclusion relationship information table, 110: Input table, 202, 204, 205, 206, 301, 303, 304, 305, 306, 307, 308, 401, 402, 403, 404, 405, 406, 501 , 502, 503, 504, 505, 802, 803, 804, 805, 806, 809, 810, 1001, 1002, 1101, 1102: Step, 203, 702: Child column information, 302, 701: Parent column information, 309 : Parent flag table, 407: Information amount, 506: Conditional information amount, 601: Column name, 602: Parent column name, 603: Proximity, 604, 1201 to 1210: Record, 801: Information table for all columns, 807 : Time table, 808: Automatic generation table, 812: Inclusion relation information table, 902: Type classification table, 1301-1306: Column.
Claims (10)
前記第1のカラムの情報量である第1の情報量と、前記第2のカラムの情報量である第2の情報量と、を算出する第1の工程と、
前記第1の情報量と前記第2の情報量の大小関係を比較する第2の工程と、
前記第2のカラムに対する前記第1のカラムの情報量である、第1の条件付き情報量を算出する第3の工程と、
前記第1の条件付き情報量に基づいて、前記第1のカラムと前記第2のカラムの包含関係を判定する第4の工程と、
を有することを特徴とする情報処理方法。 For an input table that includes a first column and a second column,
A first step of calculating a first information amount that is an information amount of the first column and a second information amount that is an information amount of the second column;
A second step of comparing a magnitude relationship between the first information amount and the second information amount;
A third step of calculating a first conditional information amount, which is an information amount of the first column with respect to the second column;
A fourth step of determining an inclusion relationship between the first column and the second column based on the first conditional information amount;
An information processing method characterized by comprising:
前記第2の工程において、前記第1の情報量が0より大きく前記第2の情報量より小さい場合に、前記第3の工程を実行することを特徴とする情報処理方法。 In claim 1,
In the second step, the third step is executed when the first information amount is larger than 0 and smaller than the second information amount.
前記第4の工程において、前記第1の条件付き情報量が、0以上所定の閾値未満の場合に、前記第1のカラムが前記第2のカラムを包含すると判定することを特徴とする情報処理方法。 In claim 1,
In the fourth step, when the first conditional information amount is 0 or more and less than a predetermined threshold value, it is determined that the first column includes the second column. Method.
前記第2のカラムに含まれるレコードの型を、時刻型、数値型または文字列型のどれであるか判定する第5の工程をさらに有することを特徴とする情報処理方法。 In claim 1,
The information processing method further comprising a fifth step of determining whether a type of a record included in the second column is a time type, a numeric type, or a character string type.
前記第5の工程において前記第2のカラムの型が時刻型であると判定された場合に、前記第2のカラムに含まれるレコードの刻み幅を変更した複数のカラムを生成する第6の工程をさらに有することを特徴とする情報処理方法。 In claim 4,
A sixth step of generating a plurality of columns in which the step size of the record included in the second column is changed when it is determined in the fifth step that the type of the second column is a time type; An information processing method characterized by further comprising:
前記第5の工程において前記第2のカラムの型が数値型であると判定された場合に、前記第2のカラムに含まれるレコードを、数値型として扱うか文字列型として扱うかを判定する第7の工程をさらに有することを特徴とする情報処理方法。 In claim 4,
When it is determined in the fifth step that the type of the second column is a numeric type, it is determined whether a record included in the second column is handled as a numeric type or a character string type An information processing method further comprising a seventh step.
前記第7の工程において前記第2のカラムを数値型として扱うと判定した場合に、前記第2のカラムのレコードの範囲を所定の閾値で分割した複数のカラムを生成する第8の工程をさらに有することを特徴とする情報処理方法。 In claim 6,
An eighth step of generating a plurality of columns obtained by dividing the record range of the second column by a predetermined threshold when it is determined in the seventh step that the second column is handled as a numerical type; An information processing method comprising:
前記入力テーブルは、第2のカラムを包含すると判定される第3のカラムをさらに有し、
前記情報処理方法は、前記第1、第2、および第3のカラムの包含関係を格納する包含関係テーブルに、前記第1および第3のカラムに含まれるユニークなレコード数が大きい順を示す直近度を格納する第9の工程をさらに有することを特徴とする情報処理方法。 In claim 3,
The input table further includes a third column determined to include the second column;
In the information processing method, the inclusion relation table storing the inclusion relations of the first, second, and third columns indicates the latest order in which the number of unique records included in the first and third columns is large. An information processing method further comprising a ninth step of storing the degree.
前記第1のカラムまたは前記第2のカラムにNullであるレコードが含まれている場合に、当該レコードを削除する第10の工程をさらに有することを特徴とする情報処理方法。 In claim 1,
An information processing method, further comprising: a tenth step of deleting the record when the first column or the second column includes a null record.
前記第1のカラムの情報量である第1の情報量と、前記第2のカラムの情報量である第2の情報量と、を算出し、前記第1の情報量と前記第2の情報量の大小関係を比較する情報量計算処理部と、
前記第2のカラムに対する前記第1のカラムの情報量である、第1の条件付き情報量を算出し、前記第1の条件付き情報量に基づいて、前記第1のカラムと前記第2のカラムの包含関係を判定する包含関係計算処理部と、を有することを特徴とする情報処理システム。 A storage unit for storing an input table including a first column and a second column;
A first information amount that is an information amount of the first column and a second information amount that is an information amount of the second column are calculated, and the first information amount and the second information are calculated. An information amount calculation processing unit for comparing magnitude relations of amounts;
A first conditional information amount that is an information amount of the first column with respect to the second column is calculated, and the first column and the second column are calculated based on the first conditional information amount. An information processing system comprising: an inclusion relation calculation processing unit that determines an inclusion relation of columns.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2014/067856 WO2016002062A1 (en) | 2014-07-04 | 2014-07-04 | Information processing device and information processing system |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2016002062A1 JPWO2016002062A1 (en) | 2017-04-27 |
JP6174802B2 true JP6174802B2 (en) | 2017-08-02 |
Family
ID=55018660
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016530777A Expired - Fee Related JP6174802B2 (en) | 2014-07-04 | 2014-07-04 | Information processing apparatus and information processing system |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6174802B2 (en) |
WO (1) | WO2016002062A1 (en) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3651550B2 (en) * | 1998-02-23 | 2005-05-25 | 三菱電機株式会社 | Attribute compression apparatus and method |
JP4456456B2 (en) * | 2004-10-12 | 2010-04-28 | ヤフー株式会社 | Document search support apparatus, method thereof, document search apparatus, and program thereof |
JP5282522B2 (en) * | 2008-10-22 | 2013-09-04 | 富士通株式会社 | Information management apparatus, information management method, and information management program |
US8560505B2 (en) * | 2011-12-07 | 2013-10-15 | International Business Machines Corporation | Automatic selection of blocking column for de-duplication |
-
2014
- 2014-07-04 JP JP2016530777A patent/JP6174802B2/en not_active Expired - Fee Related
- 2014-07-04 WO PCT/JP2014/067856 patent/WO2016002062A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
JPWO2016002062A1 (en) | 2017-04-27 |
WO2016002062A1 (en) | 2016-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11734233B2 (en) | Method for classifying an unmanaged dataset | |
TWI718643B (en) | Method and device for identifying abnormal groups | |
US8185509B2 (en) | Association of semantic objects with linguistic entity categories | |
CN104346419B (en) | Database analysis device and method | |
US20210216578A1 (en) | Interactive patent visualization systems and methods | |
US20150006528A1 (en) | Hierarchical data structure of documents | |
US11977722B2 (en) | Interactive patent visualization systems and methods | |
CN116848490A (en) | Document analysis using model intersection | |
CN106796618A (en) | Time series forecasting device and time sequence forecasting method | |
JP6242540B1 (en) | Data conversion system and data conversion method | |
US9996529B2 (en) | Method and system for generating dynamic themes for social data | |
Firlia et al. | Analysis of new features on the performance of the Support Vector Machine algorithm in classification of natural disaster messages | |
Angeli et al. | Stanford’s distantly supervised slot filling systems for KBP 2014 | |
CN107729518A (en) | The text searching method and device of a kind of relevant database | |
Zaman et al. | Knowledge Mapping for Research Papers | |
JP6174802B2 (en) | Information processing apparatus and information processing system | |
CN117371450A (en) | NLP-based event text feature association analysis method, system and medium | |
JP6763967B2 (en) | Data conversion device and data conversion method | |
JP2010267017A (en) | Document classification apparatus, document classification method, and document classification program | |
Lee et al. | Automatic stop word generation for mining software artifact using topic model with pointwise mutual information | |
Setiawan et al. | An Integrated Approach for Sentiment Analysis and Topic Modeling of a Digital Bank in Indonesia using Naïve Bayes and Latent Dirichlet Allocation Algorithms on Social Media Data | |
CN115048536A (en) | Knowledge graph generation method and device, computer equipment and storage medium | |
US11860876B1 (en) | Systems and methods for integrating datasets | |
JP5903372B2 (en) | Keyword relevance score calculation device, keyword relevance score calculation method, and program | |
Sinha et al. | Cerebro: Novelty detection in product reviews |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161026 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161026 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170620 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170706 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6174802 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |