Creating Open Data for New Scholarship : HathiTrust Research Center Case

Views: 103
Downloads: 60
このエントリーをはてなブックマークに追加

Creating Open Data for New Scholarship : HathiTrust Research Center Case

Format:
Other
Kyushu Univ. Production Kyushu Univ. Production
Title(Other Language):
新しい研究に向けたオープンデータの構築 : HathiTrustリサーチセンターの事例
Responsibility:
Downie, J. Stephen(School of Information Sciences, University of Illinois at Urbana-Champaign : Associate Dean for Research and Professor)
Language:
English
Publication info:
九州大学ライブラリーサイエンス専攻シンポジウム「オープンデータとデジタルヒューマニティーズ」. pp. 1-, 2017-01-18. Department of Library Science, Graduate School of Integrated Frontier Sciences, Kyushu University
Version:
Publisher
Abstract:
HathiTrustリサーチセンター(HTRC)の Extracted Features( EF:抽出された特徴素)データセットパージョン1 .0. (https://analytics.hathitrust.org/datasets)は最近公開されたオープンデータセットである。EFデータセットは、HathiTrustコーパス内の冊子それぞれのページの語数や行数、品詞等に関する定量的な情報を提供している。EF データセットは、2兆を超えるトークン(単語)、50億ページ以上を含む13,744,765 冊から抽出されたものであり、著作権の制限のために利用できない800万冊以上の特徴へのアクセスを提供するものとして、研究者にとって非常に価値がある。本講演では、この重要なオープンセットの構築について概説し、この貴重な情報源によって可能になった一連の研究プロジェクトを紹介する。 Read more
View fulltext

Similar Items:

2
新しい科学技術文明の構築に向けて by 科学技術振興機構社会技術研究開発センター
2.
新しい科学技術文明の構築に向けて by 科学技術振興機構社会技術研究開発センター