close
1.
雑誌論文
Kyushu Univ. Production 九州大学成果文献
Cover image of Automatic Wrapper Generation for Multilingual Web Resources
Yamada, Yasuhiro; 山田, 泰寛; Ikeda, Daisuke ... [ほか]
出版情報: Lecture Notes in Computer Science. 2534, pp. 107-113, 2002-11. Springer
本文を見る:
概要: We present a wrapper generation system to extract contents of semi-structured documents which contain instances of a record. The generation is done automatically using general assumptions on the structure of instances. It outputs a set of pairs of left and right delimiters surrounding instances of a field. In addition to input documents, our system also receives a set of symbols with which a delimiter must begin or end. Our system treats semi-structured documents just as strings so that it does not depend on markup and natural languages. It does not require any training examples which show where instances are. We show experimental results on both static and dynamic pages which are gathered from 13 Web sites, markuped in HTML or XML, and written in four natural languages. In addition to usual contents, generated wrappers extract useful information hidden in comments or tags which are ignored by other wrapper generation algorithms. Some generated delimiters contain whitespaces or multibyte characters. 続きを見る
2.
雑誌論文
Kyushu Univ. Production 九州大学成果文献
Cover image of Eliminating Useless Parts in Semi-structured Documents Using Alternation Counts
Ikeda, Daisuke; 池田, 大輔; Yamada, Yasuhiro ... [ほか]
出版情報: Lecture Notes in Computer Science. 2226, pp. 113-127, 2001-11. Springer
本文を見る:
概要: We propose a preprocessing method for Web mining which, given semi-structured documents with the same structure and style, distinguishes useless parts and non-useless parts in each document without any knowledge on the documents. It is based on a simple idea that any -gram is useless if it appears frequently. To decide an appropriate pair of length and frequency , we introduce a new statistic measure alternation count. It is the number of alternations between useless parts and non-useless parts. Given news articles written in English or Japanese with some non-articles, the algorithm eliminates frequent -grams used for the structure and style of articles and extracts the news contents and headlines with more than 97% accuracy if articles are collected from the same site. Even if input articles are collected from different sites, the algorithm extracts contents of articles from these sites with at least 95% accuracy. Thus, the algorithm does not depend on the language, is robust for noises, and is applicable to multiple formats. 続きを見る
3.
雑誌論文
Kyushu Univ. Production 九州大学成果文献
Cover image of マッシュアップを簡単に実現するメタCGIとそのアーキテクチャ — A meta-CGI for light-weight implementations of Mashups and its architecture
森, 雅生; Mori, Masao; 中藤, 哲也 ... [ほか]
出版情報: 2007-05-31.
本文を見る:
概要: 複数の異なるコンテンツやサービスから新たなウェブサービスを再構成して展開するマッシュアッ プが注目されている.これはXML データ取り扱いやPerl,PHP,JavaScript などの専門的な技術 を駆使して実装される.本稿はウェブサービスの検索に重点をおいたマッシュアップをサーバサイド で簡単に実行できるアーキテクチャを提案する. 続きを見る
4.
雑誌論文
Kyushu Univ. Production 九州大学成果文献
Cover image of マッシュアップ・リソースとマッシュアップ・グルー
森, 雅生; 中藤, 哲也; 廣川, 佐千男 ... [ほか]
出版情報: WebDB forum. 2008, 2008-12-01.
本文を見る:
概要: 近年,店舗や駅などの検索結果と地図情報とを融合するサービスの実現手法としてマッシュアップが利用されるようになど,実用的で興味深いマッシュアップの例が多数見られるようになった.しかし,手元ににあるデータとWeb 上のサービスを組み合わせて簡単な処理を施し結果をまとめることや,それらの処理プログラムを試行錯誤して実務者が開発するといったような,実務的作業の能率をあげるといった観点でのマッシュアップ開発は少ない.本稿ではまず,マッシュアップを,対象(mashupresouce) と結合法(mashup glue) という二つの観点で捉えるプログラミング・スタイルを提案する.マッシュアップ対象は,API や検索サイト,そして手元のCSV ファイルなどであり,入力型と出力型が規定された機械としてとらえる.マッシュアップ結合法は,出力と入力の単純結合の他に,マージ,ソート,CGI リンク,各種グラフ表示などのフィルター機能からなる.さらに,ブラウザ上で開発できるマッシュアップ開発環境を構築した. 続きを見る
5.
雑誌論文
Kyushu Univ. Production 九州大学成果文献
Cover image of COMBINATORY LOGIC AND $ lambda $-CALCULUS FOR CLASSICAL LOGIC
Baba, Kensuke; Kameyama, Yukiyoshi; Hirokawa, Sachio ... [ほか]
出版情報: Bulletin of informatics and cybernetics. 32, (2), pp. 105-122, 2000-12. 統計科学研究会
本文を見る:
概要: Since Griffin's work in 1990, classical logic has been an attractive target for extracting computational contents. However, the classical principle used in Griffin's type system is the double-negation-elimination rule, which prevents one to analyze the intuitionistic part and the purely classical part separately. By formulating a calculus with $ mathrm{J} $ (for the elimination rule of falsehood) and $ mathrm{P} $ (for Peirce formula which is concerned with purely classical reasoning) combinators, we can separate these two parts. This paper studies the $ lambda mathrm{PJ} $ calculus with $ mathrm{P} $ and $ mathrm{J} $ combinators and the $ lambda mathrm{C} $ calculus with $ mathrm{C} $ combinator(for the double-negation-elimination rule). We also propose two $ lambda $-calculi which correspond to $ lambda mathrm{PJ} $ and $ lambda mathrm{C} $. We give four classes of reduction rules for each calculus, and systematically study their relationship by simulating reduction rules in one calculus by the corresponding one in the other. It is shown that, by restricting the type of $ P $, simulation succeeds for several choices of reduction rules, but that simulating the full calculus $ lambda mathrm{PJ} $ in $ lambda mathrm{C} $ succeeds only for one class. Some programming examples of our calculi such as encoding of conjunction and disjunction are also given. 続きを見る
6.
雑誌論文
Kyushu Univ. Production 九州大学成果文献
Cover image of A Template Discovery Algorithm by Substring Amplification
Ikeda, Daisuke; 池田, 大輔; Yamada, Yasuhiro ... [ほか]
出版情報: DOI Technical Report. 220, 2003-12. 九州大学大学院システム情報科学研究院情報理学部門
本文を見る:
概要: In this paper, we consider to find a set of substrings common to given strings. We define this problem as the template discovery problem which is, given a set of strings generated by some fixed but unknown pattern, to find the constant parts of the pattern. A pattern is a string over constant and variable symbols. It generates strings by replacing variables into constant strings.We assume that the frequency distribution of replaced strings follow a power-law distribution. Although the longest common subsequence problem, which is one of the famous common part discovery problems, is well-known to be NP-complete, we show that the template discovery problem can be solved in linear time with high probability. This complexity is achieved due to the following our contributions: reformulation of the problem, using a set of substrings to express a string, and counting all occurrences $ F( f ) $ with frequency $ f $ instead of just frequency $ f $. We demonstrate the effectiveness of the proposed algorithm using data on the Web. Moreover, we show noise robustness and effectiveness even when input strings are generated by a union of patterns and pattern with the iterate operation. 続きを見る
7.
雑誌論文
Kyushu Univ. Production 九州大学成果文献
Cover image of リポジトリのアクセスログ解析 — Access Log Analysis for Institutional Repository
馬場, 謙介; 伊東, 栄典; 廣川, 佐千男 ... [ほか]
出版情報: 九州大学附属図書館研究開発室年報. 2010/2011, pp. 5-8, 2011-08. 九州大学附属図書館
本文を見る:
概要: 機関リポジトリは,セルフアーカイビングによる研究成果へのオープンアクセス実現のひとつの手段である. しかし,多くの機関リポジトリにおいて,登録されている文献の数は,その機関の研究成果の数に比べて非常に 少ない.登録文献数が少ない理由のひとつは,ほとんどの研究者にとって研究成果を登録する動機がない,つま り,機関リポジトリの効果が明らかでないことだと考えられる.本稿の著者らは,機関リポジトリに研究成果を 登録した研究者へのフィードバックシステムを開発している.本稿では,機関リポジトリのアクセスログからの 知識発見を試みている.「誰が,いつ,どんな文献を利用したか」という情報は,機関リポジトリの利用者への文 献の推薦に利用できる.本稿は,より高度な解析へ向けての準備として,九州大学の機関リポジトリのアクセス ログについて単純な共起解析を行った結果を示している. 続きを見る
8.
雑誌論文
Kyushu Univ. Production 九州大学成果文献
Cover image of 大学機関リポジトリのアクセスログに現れる検索語と論文題名との関係について
木下, 仁; 馬場, 謙介; 伊東, 栄典 ... [ほか]
出版情報: 情報処理学会火の国情報シンポジウム2011. pp. B-3-2-, 2011-03. 情報処理学会
本文を見る:
概要: 近年、研究成果公開とアーカイブのために機関レポジトリが充実してきている。 自分の論文のアクセス状況は、研究者にとっても意味のある情報といえる。本 発表では、アクセスログに現れる検索語と論文題名の関係について分析結果を 紹介する。
9.
雑誌論文
Kyushu Univ. Production 九州大学成果文献
Cover image of 特許情報を用いた研究体制とイノベーションの関連性解析 — A Case Study on R&D Structure for Promotion of Innovation using Patent Information
飯野, 由里江; 廣川, 佐千男; Iino, Yurie ... [ほか]
出版情報: 第5回シンポジウム「日本の技術革新―経験蓄積と知識基盤化―」研究論文発表会論文集. pp. 85-90, 2009-12-15. 特定領域研究「日本の技術革新―経験蓄積と知識基盤化―」総括班
本文を見る:
概要: イノベーーション促進に有効な組織のあり方を,特許明細書における発明者や技術分類の共起情報を用いることで考察した.近年出願件数が伸びている花王株式会社の食品関連の特許群を分析事例として,下記のような事項が確認できた.・技術融合度の変化と発明者グループの変化からイノベーションの状況をとらえられる.・特許出願が急激に増えた技術分野では異分野人材の融合がある.・技術開発の変遷により技術融合度合が変化し,発明者グループも変化する.・最大の発明者グループの活動状況がイノベーション促進に関係する. 続きを見る
10.
雑誌論文
Kyushu Univ. Production 九州大学成果文献
Cover image of 自己学習型トピッククローラーの構築と評価
冨山, 北斗; 伊東, 栄典; 廣川, 佐千男 ... [ほか]
出版情報: 電子情報通信学会 第17回データ工学ワークショップ(DEWS 2006). 2006-01-06. 電子情報通信学会
本文を見る:
概要: Web上の情報量は、個人が必要とする情報量をはるかに上回っている。利用者の情報収集を支援する、GoogleやYahoo等の汎用的な検索エンジンが開発されている。しかし汎用的な検索エンジンでは、特定の分野について網羅的に収集し、情報をまとめるといった要求には応えられない。著者らは、特定分野のWeb ページ収集を効率的に行なうトピッククローラーの研究開発を行なっている。トピッククローラーでは、トピックに関するページの判定精度も必要であるが、トピックページへ早く辿りつく速度も重要である。著者らは、One man & his dogシステムと呼ぶトピック判定とリンク選出戦略機能を連携させるシステムを試作した。また、2つのトピックについての収集実験を行い本論文の手法の効率性を調査した。 続きを見る