部分文字列増幅法による共通パタン発見アルゴリズム - 九大コレクション

＜会議発表論文＞
部分文字列増幅法による共通パタン発見アルゴリズム

作成者	著者識別子 100021285 作成者名池田, 大輔 Ikeda, Daisuke 所属機関所属機関名九州大学情報基盤センター
	著者識別子 L002646 作成者名山田, 泰寛 Yamada, Yasuhiro 所属機関所属機関名九州大学大学院システム情報科学府
	著者識別子 K000008 作成者名廣川, 佐千男 Hirokawa, Sachio 所属機関所属機関名九州大学情報基盤センター
本文言語	日本語
出版者	情報処理学会
発行日	2003-12
収録物名	情報処理学会研究報告 : 数理モデル化と問題解決
巻	2003
号	122
開始ページ	45
終了ページ	48
出版タイプ	Accepted Manuscript
アクセス権	open access
権利関係	ここに掲載した著作物の利用に関する注意本著作物の著作権は（社）情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」に従うことをお願いいたします。
関連DOI	情報処理学会研究報告 : 数理モデル化と問題解決 \|\| 2003(122) \|\| p45-48
関連DOI	http://matu.cc.kyushu-u.ac.jp/
関連URI	情報処理学会研究報告 : 数理モデル化と問題解決 \|\| 2003(122) \|\| p45-48
関連URI	http://matu.cc.kyushu-u.ac.jp/
関連情報	情報処理学会研究報告 : 数理モデル化と問題解決 \|\| 2003(122) \|\| p45-48
関連情報	http://matu.cc.kyushu-u.ac.jp/
概要	複数の文字列に共通な部分列を見つける問題をテンプレート発見問題として定式化する．テンプレート以外の文字列の頻度分布はベキ分布に従うことを仮定する．最長の共通部分列を探す問題はNP 完全であることが知られているが，(1) 問題の再定式化，(2) 部分文字列の集合によるテンプレート表現，(3) 部分文字列の頻度と総出現数から共通部分を発見する手法により，テンプレート発見問題を平均的にほぼ入力長に...線形で解くアルゴリズムを構築する．さらに，このアルゴリズムがノイズに対し頑健であることと，複数のテンプレートが混在する場合でも有効であることを，Web 上の実データに適用することで実証した． We define the problem to find a subsequence common to given strings as the template discovery problem. We assume that the frequency distribution of substrings on non-template parts follows the power-law distribution. Although the longest common subsequence problem is well-known to be NP-complete, we show that the template discovery problem can be solved in almost linear in the total length due to the following our contributions: reformulation of the problem, using a set of substrings to express a template, and using string frequency and all occurrences to find substrings common to input strings. Moreover, using data on the Web, we show noise robustness and effectiveness for the case that input strings are generated by different patterns続きを見る

本文ファイル

ファイル	ファイルタイプ	利用条件	サイズ	閲覧回数	説明
2003_c_3	pdf	なし	237 KB	565	発表論文
20031212MPS47	pdf	なし	5.43 MB	571	発表資料

詳細

レコードID	2969
査読有無	査読無
主題	n-gramの頻度によるパターン発見
注記	第47回情報処理学会数理モデル化と問題解決研究会, December, 2003. 産業技術総合研究所生命情報科学研究センター
タイプ	会議発表論文
登録日	2009.04.22
更新日	2017.01.19

この情報を出力する

このページのリンク

他の検索サイト

利用統計

＜会議発表論文＞ 部分文字列増幅法による共通パタン発見アルゴリズム

本文ファイル

詳細

＜会議発表論文＞
部分文字列増幅法による共通パタン発見アルゴリズム