FFTを用いた繰り返しパターン発見手法の提案 - 九大コレクション

＜会議発表論文＞
FFTを用いた繰り返しパターン発見手法の提案

作成者	著者識別子 K000012 作成者名中藤, 哲也 Nakatoh, Tetsuya 所属機関所属機関名九州大学情報基盤センター Computing and Communications Center, Kyushu University
作成者	著者識別子 K000008 作成者名廣川, 佐千男 Hirokawa, Sachio 所属機関所属機関名九州大学情報基盤センター Computing and Communications Center, Kyushu University
本文言語	日本語
出版者	情報処理学会
発行日	2003-07
収録物名	情報処理学会研究報告 : データベースシステム
巻	2003
号	71
開始ページ	311
終了ページ	318
出版タイプ	Accepted Manuscript
アクセス権	open access
権利関係	ここに掲載した著作物の利用に関する注意本著作物の著作権は（社）情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」に従うことをお願いいたします。
関連DOI	情報処理学会研究報告 : データベースシステム \|\| 2003(71) \|\| p311-318
関連DOI	http://matu.cc.kyushu-u.ac.jp/
関連URI	情報処理学会研究報告 : データベースシステム \|\| 2003(71) \|\| p311-318
関連URI	http://matu.cc.kyushu-u.ac.jp/
関連情報	情報処理学会研究報告 : データベースシステム \|\| 2003(71) \|\| p311-318
関連情報	http://matu.cc.kyushu-u.ac.jp/
概要	半構造テキスト中から自明でない情報を取り出す技術である，データマイニング，あるいはテキストマイニングは，拡大するWWW上の情報を取り扱う上で非常に重要である．その技術の一つとして，対象のデータに繰り返し出現するパターンを発見する問題がある．発見されたパターンを用いることで，そのデータを加工する，あるいはデータから新たな情報を抽出する事が可能となる．繰り返しパターンを発見する方法として，対象となるデ...ータをそれ自身のコピーと位置をずらして重ね，一致部分を見つける素朴な方法が考えられる．しかしこの方法は，テキストサイズnに対して計算量がO(n2)となり，大きなデータに対しては現実的ではない．本研究では，我々が提唱しているFFTを用いた効率的な近似文字列照合アルゴリズムを適用し，O(nlogn)の計算量で繰り返しパターンを発見する手法について提案する． Data-Mining or Text-Mining, that is technique to extract non-obvious information from semi-structured texts, has been very important technologies when we handle expanding information in WWW. One of them is to discover patterns that appear in the data repetitively. Using the patterns, we can process the data and can extract from the data. To discover them, we can think about the naive method, i.e. the method of aligning data with that own shifted copy data, and compare them. However, when the size of the text is n, time complexity of this method becomes O(n^2), and it isn't efficient for big data. In this paper, we propose the technique to reduce time complexity of the method to O(n log n) using our string matching algorithm with mismatches.続きを見る

本文ファイル

ファイル	ファイルタイプ	サイズ	閲覧回数	説明
2003_b_3	pdf	742 KB	420

詳細

レコードID	2964
査読有無	査読無
主題	繰り返しパターン発見
	マイニング
	半構造データ
	近似文字列照合
	検索エンジン
	FFT
	Finding Repetitive Patterns
	Mining
	Semi-structured Text
	String Matching with Misamatches
	Search Engine
	FFT
	パターン発見と抽出
注記	情報処理学会研究会報告(DBWS2003),2003.07
タイプ	会議発表論文
登録日	2009.04.22
更新日	2017.01.19

この情報を出力する

このページのリンク

他の検索サイト

利用統計

＜会議発表論文＞ FFTを用いた繰り返しパターン発見手法の提案

本文ファイル

詳細

この資料を見た人はこんな資料も見ています

＜会議発表論文＞
FFTを用いた繰り返しパターン発見手法の提案