清田 陽司
(きよた ようじ)
東京大学
情報基盤センター
学術情報研究部門
(中川研究室) 第一分野
特任講師
博士(情報学)
- E-mail:
-
- 所在地:
- 〒113-0033 東京都文京区本郷7-3-1 東京大学総合図書館内 3F
東京大学情報基盤センター 学術情報研究部門
[地図]
- Tel:
- 03-5841-2742
- Fax:
- 03-5841-2745
Last Updated: October 1st, 2010
研究分野
自然言語処理(情報検索,質問応答,対話システム,テキストマイニング)
研究テーマ
- 図書館レファレンス・サービスの自動化
現在,情報検索を行うためにインターネットは必要不可欠な存在となっており,なかでもWebサーチエンジンの発達は目を見張るものがあります.しかし,Webサーチエンジンだけに頼った情報検索には,以下のような問題点があります.
- 適切な検索キーワードを選ぶことが難しい.
- 検索結果はページの羅列であるため,大量のページがヒットした場合には必要な情報を見つけにくい.
- 信頼性に欠ける情報が少なくない.
一方で,様々な情報を収集・保管・提供する機関である図書館は近年,電子図書館の実現を目指し,インターネットを介したさまざまな情報提供サービス(例: オンライン蔵書目録,百科事典,電子ジャーナル)を充実させてきています.また,利用者の情報探索を支援するサービス,すなわちレファレンス・サービス(参考調査業務)にも力を入れています.図書館が提供するこれらのリソースを上手に活用すれば,上に述べたWebサーチエンジンの欠点を補完することができます.しかし,以下の理由によって,図書館のサービスを活用している利用者は一部に限られています.
- 図書館が提供しているさまざまなサービスの全体像が見えづらいため,大多数の利用者からは敷居が高いと感じられる.
- 情報の即時性に欠ける.最新の情報を得るためにはWebサーチエンジンも利用する必要があるが,図書館の提供するサービスはWebの情報とほとんど連携していない.
- 現状のレファレンス・サービスには,24時間いつでも利用できるWebサーチエンジンのような便利さはない.
本研究では上記の問題意識に基づき,図書館が提供する様々なサービスとWeb上に存在する様々な情報を統合的に利用する,自動レファレンス・サービス・システムの実現に取り組んでいます.具体的には,以下のトピックを扱います.
-
自然言語による対話的インタフェース:
利用者は,自然文によって自由に質問を入力できる(敷居が低い).システムは,利用者の漠然とした質問を具体化させるような聞き返しを選択肢として提示し,適切な検索キーワードを選べるように支援する.
-
情報探索メタ知識の集積と利用:
上記の聞き返しを実現するため,情報探索に関するメタ知識として,Webサーチエンジンの利用に際しての「コツ」や,図書館の利用に際しての様々な「約束事」,過去のレファレンス・サービスの事例などを保持しておき,適切と思われるものを選択肢として提示する.
-
質問文と情報探索メタ知識の自然言語マッチング:
個々の情報探索メタ知識の利用方法を自然文で記述しておき,利用者の質問文とマッチングを行うことによって適切な情報探索メタ知識を提示する.
-
Web上の二次情報と図書館のもつ一次情報をつなぐゲートウェイ:
Web上のさまざまな情報源と,図書館の分類体系を統合的に活用し,利用者の質問がどのカテゴリに属するかを自動的に検出する.また,Web サーチエンジンによって得られた結果を,図書館の分類体系に従って分類することによって,対応するレファレンス・ブックを提示したり,一次情報に容易にたどりつけるようにする.
- 事例レポートのマイニング
近年,航空・鉄道・医療などのさまざまな産業分野において,事故やトラブルの防止を目的として事例レポートを収集するシステムが整備されつつあります.たとえば,たとえば,FAAとNASAが共同で運営しているASRSのデータベースには,パイロット,管制官などの航空関係者からの自発的な事例報告のレポートが大量に蓄積されています.また,日本においても失敗知識データベースの構築などの試みがなされています.
これらのデータベースに蓄積されている事例レポートは基本的にテキスト形式(自然言語)で記述されており,フォーマットは必ずしも定型化されていません.航空分野など,一つの事故やトラブルの背後に多数の要因が複雑に絡み合っている領域では,フォーマットに書き手の裁量を認めることが不可欠です.しかし,定型的なデータベースと異なり,自然言語で記述された非定型のレポート集合はコンピュータによる自動処理が困難であるという大きな問題があります.そのため,従来は事例レポートの解析作業は人手に頼る部分が大きく,必ずしも大量のレポートの蓄積が有効に活用されていなかった面があります.
そこで,自然言語処理分野の最新の知見を活かして,事例レポートから,事故やトラブルにつながる可能性のある人的要因(human factor)を自動抽出する手法を研究しています.具体的には,大量のコーパスから自動構築された格フレームを,human factorの存在を示唆するフレーズの効率的な収集に応用する手法の研究に取り組んでいます.
- 大規模な自然言語テキストを知識として用いる自動質問応答システム
すでに運用されているマイクロソフト ダイアログナビなどをベースに,下記のトピックについて研究しています.
- 曖昧な質問への聞き返し
自動質問応答システムになされる質問は曖昧なものが多いため,質問と知識ベースをそのままマッチさせるだけでは満足な回答をすることができません.例えば,「エラーが発生した」のような曖昧な質問だと大量のテキストがマッチしてしまい,ユーザがその中から求める答えを探すのは非常に困難です.
そこで,曖昧な質問がなされた場合に自動的に聞き返しを行うための方法について研究を行っています.
- ユーザ質問と知識ベースの柔軟なマッチング
自然言語テキストを知識源とする自動質問応答システムにおいて,ユーザ質問と知識ベースの間のマッチングは最も重要な基本的技術です.しかし,現在実用化されているシステムのほとんどが採用している「キーワード同士のマッチング」という方法では,自然言語特有の問題である「表現の揺れ」,すなわち同じ事柄を表現するのに多くの言い方があるという問題への対処が困難です.
そこで,同義フレーズ辞書などを用いたより柔軟なマッチングの方法について研究を行っています.
これまでの研究テーマ
研究業績
学位論文
- 博士論文:
- Dialog Navigator: A Navigation System from Vague Questions to
Specific Answers Based on Real-World Text Collections
- (ダイアログナビ: 実世界テキスト集合に基づく漠然とした質問から具体的な回答へのナビゲーションシステム),
- 京都大学大学院情報学研究科, November, 2004.
- [PDF]
- 修士論文:
- WWWテキストの自動要約とKWICインデックスの作成,
- 京都大学大学院情報学研究科, February, 2000.
- [PDF]
- 学士論文:
- 構文情報を利用したニュース記事整理システムの作成と評価,
- 京都大学工学部電気工学第二学科, February, 1998.
論文誌
- 清田 陽司:
- Wikipediaを活用した新たな情報ナビゲーションシステムの提案,
- 薬学図書館, Vol. 55, No. 1, pp. 51-59, 日本薬学図書館協議会, 2010.
- 清田 陽司:
- リサーチ・ナビ検索システムの技術,
- 参考書誌研究, Vol. 71, pp. 33-53, 国立国会図書館主題情報部, 2009.
- 増田 英孝,清田 陽司,中川 裕志:
- 自動レファレンスサービスにむけて,
- 情報の科学と技術, Vol. 58, No. 7, pp. 347-352, 2008.
- 翠 輝久, 駒谷 和範, 清田 陽司, 河原 達也:
- 音声対話によるソフトウェアサポートタスクのための効率的な確認戦略,
- 電子情報通信学会論文誌 Vol. J88-DII, No. 3, pp. 499-508, February, 2005.
- 清田 陽司, 黒橋 禎夫, 木戸 冬子:
- 自動抽出した換喩表現を用いた係り受け関係のずれの解消,
- 自然言語処理, Vol. 11, No. 4, pp. 127-145, October, 2004.
- [PDF]
[PostScript]
- 清田 陽司, 黒橋 禎夫, 木戸 冬子:
- 大規模テキスト知識ベースに基づく自動質問応答 −ダイアログナビ−,
- 自然言語処理, Vol. 10, No. 4, pp. 145-175, July, 2003.
- [PDF]
[PostScript]
国際学会
- Yohei Noda, Yoji Kiyota, Hiroshi Nakagawa:
- Discovering Serendipitous Information from Wikipedia by Using its Network Structure,
- In Proceedings of 4th Int'l AAAI Conference on Weblogs and Social Media (ICWSM 2010), poster session, pp. 299-302, Washington, D.C., USA, May, 2010.
- [PDF]
- Yoji Kiyota, Hiroshi Nakagawa, Satoshi Sakai, Tatsuya Mori, Hidetaka Masuda:
- Exploitation of the Wikipedia Category System for Enhancing the Value of LCSH,
- In Proceedings of the 9th ACM/IEEE-CS joint conference on Digital libraries (JCDL 2009), poster session, pp. 411-412, Austin, Texas, USA, June, 2009.
- [PDF]
- Yoji Kiyota, Noriyuki Tamura, Satoshi Sakai, Hiroshi Nakagawa, Hidetaka Masuda:
- Automated Subject Induction from Query Keywords through Wikipedia
Categories and Subject Headings,
- In Proceedings of The Sixth International Conference on Language
Resource and Evaluation (LREC 2008), Marrakesh, Morocco, May, 2008.
- [PDF]
- Yoji Kiyota, Hiroshi Nakagawa:
- A Domain Ontology Production Tool Kit Based on Automatically
Constructed Case Frames,
- In Proceedings of The Fifth International Conference on Language
Resource and Evaluation (LREC 2006), pp. 1482-1487 (P7-T), Genoa, Italy, May, 2006.
- [PDF]
- Tsutomu Ohkura, Yoji Kiyota, Hiroshi Nakagawa:
- Browsing System for Weblog Articles Based on Automated Folksonomy,
- In Proceedings of the WWW2006 Workshop on the Weblogging
Ecosystem, Edinburgh, Scotland, May, 2006.
- [PDF]
- Yoji Kiyota, Sadao Kurohashi, Fuyuko Kido:
- Resolution of Modifier-head Relation Gaps using Automatically
Extracted Metonymic Expressions,
- In Proceedings of The First International Joint Conference on
Natural Language Processing (IJCNLP-04), pp. 171-176, Hainan
Island, China, March, 2004.
- [PDF]
[PostScript]
- Yoji Kiyota, Sadao Kurohashi, Teruhisa Misu, Kazunori Komatani,
Tatsuya Kawahara, Fuyuko Kido:
- Dialog Navigator : A Spoken Dialog Q-A System based on Large
Text Knowledge Base,
- In the Companion Volume to the Proceedings of 41st Annual Meeting
of the Association for Computer Linguistics (ACL 2003 Interactive
Posters/Demonstrations Sessions), pp. 149-152, Sapporo, Japan,
July, 2003.
- [PDF]
[PostScript]
- Yoji Kiyota, Sadao Kurohashi, Fuyuko Kido:
- "Dialog Navigator" : A Question Answering System based on Large
Text Knowledge Base,
- In Proceedings of The 19th International Conference on
Computational Linguistics (COLING 2002), pp. 460-466, Taipei,
August, 2002.
- [PDF]
[PostScript]
- Yoji Kiyota, Sadao Kurohashi:
- Automatic Summarization of Japanese Sentences and its Application
to a WWW KWIC Index,
- In Proceedings of 2001 Symposium on Applications and the Internet
(SAINT 2001), pp. 120-127, San Diego, California, USA, January, 2001.
- [PDF]
[PostScript]
国内学会発表
- 森 竜也, 増田 英孝, 中川 裕志, 清田 陽司:
- Wikipediaにおける言語間の差異マイニング,
- 情報処理学会 第72回全国大会 講演論文集 (5ZN-6), 東京大学, 東京都, March, 2010.
- 坂井 哲, 増田 英孝, 清田 陽司, 中川 裕志:
- Wikipediaと図書館情報資源による調べ方自動提示システム,
- 情報処理学会 第72回全国大会 講演論文集 (3K-5), 東京大学, 東京都, March, 2010.
- 野田 陽平, 清田 陽司, 中川 裕志:
- ネットワーク構造を利用したWikipediaからの意外性のある情報の抽出,
- 情報処理学会 第72回全国大会 講演論文集 (3K-4), 東京大学, 東京都, March, 2010.
- 森 竜也, 増田 英孝, 清田 陽司, 中川 裕志:
- Wikipediaを活用した言語間差異比較システムの提案,
- 第2回データ工学と情報マネジメントに関するフォーラム/第8回日本データベース学会年次大会(DEIM2010), 淡路夢舞台国際会議場, 兵庫県, March, 2010.
- 森竜也, 増田英孝, 清田陽司, 中川裕志:
- 多言語に展開するWikipediaの特徴の比較調査,
- 人工知能学会 第21回セマンティックウェブとオントロジー研究会 (SIG-SWO-A901-05), 東京大学, 東京都, November, 2009.
- [論文PDF
- 野田 陽平, 清田 陽司, 中川 裕志:
- Wikipediaカテゴリネットワークからの意外性のある関連性の抽出,
- 人工知能学会 第21回セマンティックウェブとオントロジー研究会 (SIG-SWO-A901-04), 東京大学, 東京都, November, 2009.
- [論文PDF
- 坂井 哲, 増田 英孝, 清田 陽司, 中川 裕志:
- 国立国会図書館リサーチ・ナビにおけるテーマグラフの生成,
- 情報処理学会 研究報告 情報学基礎(SIG-FI) 96-5, 秋葉原ダイビル, 東京都, November, 2009.
- 佐藤 由紀, 横本 大輔, 中崎 寛之, 宇津呂 武仁, 吉岡 真治, 福原 知宏, 神門 典子, 中川 裕志, 清田 陽司:
- Wikipediaを介した関連ニュース・ブログの対応付け: Wikipediaエントリの分析:
- 情報処理学会 研究報告 自然言語処理(SIG-NL) 194-10, 愛媛大学, 松山市, November, 2009.
- 中崎 寛之, 阿部 佑亮, 宇津呂 武仁, 河田 容英, 福原 知宏, 神門 典子, 吉岡 真治, 中川 裕志, 清田 陽司:
- 特定トピックの日英ブログ収集・分析・類型化: 事例研究:
- 情報処理学会 研究報告 自然言語処理(SIG-NL) 194-9, 愛媛大学, 松山市, November, 2009.
- 中野 幹生, 緒方 淳, 清田 陽司, 東中 竜一郎, 翠 輝久:
- 【パネル討論】音声インタフェースにおけるWebテキスト処理技術の利用,
- 情報処理学会 研究報告 自然言語処理(SIG-NL) 191-12, 東京工業大学, 東京都, May, 2009.
- 野田 陽平, 清田 陽司, 中川 裕志:
- 意外性のある知識発見のためのWikipediaカテゴリ間の関係分析 ,
- セマンティックウェブとオントロジー研究会 第20回 Wikipediaワークショップ, 東京大学, 東京都, January, 2009.
- [論文PDF]
- 森 竜也, 増田 英孝, 清田 陽司, 中川 裕志:
- Wikipediaエントリ構造抽出ツール: Wik-IE,
- セマンティックウェブとオントロジー研究会 第20回 Wikipediaワークショップ, 東京大学, 東京都, January, 2009.
- [論文PDF]
- 清田 陽司, 阿辺川 武, 吉田 稔, 田村 悟之, 坂井 哲, 増田 英孝:
- 汎用シソーラス探索ライブラリの開発,
- 言語処理学会 第14回年次大会 発表論文集(PD1-3), pp. 257-260, 東京大学, 東京都, March, 2008.
- [論文PDF] [ポスターPDF]
- 坂井 哲, 清田 陽司, 増田 英孝, 中川 裕志:
- 図書館とWeb の分類体系を統合的に活用したテーマグラフ可視化インタ
フェース,
- 情報処理学会第70回全国大会講演論文集 (4ZK-9), 筑波大学, 茨城県, March, 2008.
- [PDF]
- 田村 悟之, 清田 陽司, 増田 英孝, 中川 裕志:
- 図書館における自動レファレンスサービスシステムの実現に向けて 〜Web上の二次情報と図書館の一次情報の統合〜,
- 情報処理学会 研究報告 情報学基礎(SIG-FI) 86-1, pp. 1-8, 化学会館, 東京都, March, 2007.
- [PDF]
- 清田 陽司, 田村 悟之, 中川 裕志, 増田 英孝:
- Reference Navigator: 異種オントロジーの統合ブラウジングツール 〜図書館の分類体系とWikipediaカテゴリの対応付け〜,
- 言語処理学会 第13回年次大会 ワークショップ「言語的オントロジーの構築・連携・利用」論文集, pp. 35-38, 龍谷大学, 大津市, March, 2007.
- [PDF]
- 國安 結, 清田 陽司, 綾部 輝幸:
- 東京大学附属図書館におけるレファレンスサービス業務分析 −自動レファレンスサービスシステムの実現を目指して−,
- 日本図書館情報学会 第54回研究大会発表要網, pp. 101-104, 九州女子大学, 北九州市, October, 2006.
- [PDF]
- 清田 陽司, 中川 裕志:
- 航空安全情報分析ツール −human factorに着目したレポート分析手法の提案−,
- 第44回飛行機シンポジウム CD-ROM講演集, 2D9, pp. 501-507, 大宮ソニックシティ, さいたま市, October, 2006.
- [PDF]
- 大倉 務, 清田 陽司, 中川 裕志:
- Folksonomyの機械化:Blog記事へのマルチタグ付与,
- 言語処理学会 第12回年次大会 発表論文集(C2-4), pp. 360-363, 慶應義塾大学, 横浜市, March, 2006.
- [PDF]
- 藤本 宏涼, 國安 結, 中川 裕志, 吉田 稔, 清田 陽司:
- 用例検索システムKiwiの知識テキストマイニングツールへの拡張,
- 言語処理学会 第12回年次大会 発表論文集(C3-6), pp. 516-519, 慶應義塾大学, 横浜市, March, 2006.
- [PDF]
- 一井 崇, 清田 陽司, 吉田 稔, 中川 裕志:
- suffix treeにもとづいたn-gramのtrie構造化とその応用,
- 言語処理学会 第12回年次大会 発表論文集(D3-7), pp. 552-555, 慶應義塾大学, 横浜市, March, 2006.
- [PDF]
- 藤本 宏涼, 吉田 稔, 清田 陽司, 中川 裕志:
- ローカルコーパスからのテキストマイニングツール: PortableKiwi,
- 言語処理学会 第11回年次大会 発表論文集(C1-8), pp. 97-100, 香川大学, 高松市, March, 2005.
- [PDF]
- 翠 輝久, 駒谷 和範, 清田 陽司, 河原 達也, 木戸 冬子:
- 音声対話による大規模知識ベース検索システム −音声版ダイアログナビ−,
- 情報処理学会 研究報告 音声言語情報処理(SIG-SLP) 52-4, pp. 21-26, 登別温泉, 登別市, July, 2004.
- 清田 陽司, 黒橋 禎夫, 木戸 冬子:
- 自動抽出した換喩表現を用いた係り受け関係のずれの解消,
- 言語処理学会
第10回年次大会 発表論文集, pp. 305-308, 東京工業大学, 東京都, March, 2004.
- [PDF]
[PostScript]
- 清田 陽司, 黒橋 禎夫, 木戸 冬子:
- 大規模テキスト知識ベースに基づく自動質問応答 −ダイアログナビ−,
- 言語処理学会 第8回年次大会 発表論文集, pp. 271-274, けいはんなプラザ, 京都府, March, 2002.
- [PDF]
[PostScript]
- 久保田 秀和, 河原 大輔, 清田 陽司, 黒橋 禎夫, 西田 豊明:
- 会話型コンテンツを用いた知識流通支援,
- 情報処理学会 第64回全国大会, 東京電機大学, 埼玉県, March, 2002.
- 駒谷 和範, 河原 達也, 清田 陽司, 黒橋 禎夫, Pascale Fung:
- 柔軟な言語モデルとマッチングを用いた音声によるレストラン検索システム,
- 情報処理学会 研究報告 音声言語情報処理(SIG-SLP) 39-30, 東京工業大学, 東京都, December, 2001.
- 清田 陽司, 黒橋 禎夫:
- WWWテキストの自動要約とKWICインデックスの作成,
- 情報処理学会 研究報告 自然言語処理(SIG-NL) 137-5, pp. 31-38, 湘南国際村センター, 神奈川県, July, 2000.
- [PDF]
[PostScript]
- 清田 陽司, 黒橋 禎夫 ,中村 順一, 工藤 拓:
- 単語の共起情報による重みづけを用いたテキスト検索システム,
- IREXワークショップ予稿集, IREX実行委員会, pp. 53-56, KKRホテル, 東京都, September, 1999.
- [PDF]
[PostScript]
- 清田 陽司, 黒橋 禎夫, 中村 順一, 長尾 真:
- 構文情報を利用した電子ニュース記事のクラスタリングシステムの作成と評価,
- 情報処理学会 研究報告 自然言語処理(SIG-NL) 126-11, 京都大学, 京都市, pp. 77-84, July, 1998.
招待講演等
- 清田 陽司:
- 新たな情報インフラとしてのHadoopの活用,
- Hadoop Hack Night Vol. 2, 株式会社技術評論社/ヤフー株式会社共催, 東京ミッドタウン, 東京都, August, 2010.
- [SlideShare]
- 清田 陽司:
- Hadoopによる大規模分散データ処理,
- 産業技術大学院大学 InfoTalk 第16回, 産業技術大学院大学, 東京都, March, 2010.
- 清田 陽司:
- Apache Hadoopによる大規模データの研究活用事例,
- 産学連携共同研究シンポジウム「クラウド・コンピューティングと大学発ベンチャー」, 東京大学産学連携本部/(株)ユニファイ・リサ−チ共催, 東京大学情報学環福武ホール, 東京都, January, 2010.
- 清田 陽司:
- 知識体系の新たな融合:情報探索と件名標目表の活用をめぐって,
- 京都大学図書館機構 平成21年度第2回講演会「次世代OPACを考える ―目録情報の視点から―」, 京都大学, 京都市, November, 2009.
- 清田 陽司:
- 学生向けレファレンス支援ツールの可能性,
- 第11回図書館総合展/学術情報オープンサミット2009 ミニ・フォーラム&プレゼンテーション企画, 紀伊國屋書店主催, パシフィコ横浜, 横浜市, November, 2009.
- [スライドPDF]
- 清田 陽司:
- リサーチ・ナビ検索システムの技術,
- 第11回図書館総合展/学術情報オープンサミット2009 フォーラム企画, 国立国会図書館主催, パシフィコ横浜, 横浜市, November, 2009.
- [スライドPDF]
- 清田 陽司:
- Wikipediaと図書館情報資源のマッシュアップ,
- 第36回生物医学図書館員研究会, 順天堂大学, 東京都, September, 2009.
- 清田 陽司:
- Wikipediaをいかに使いこなすか? −知識抽出、情報ナビゲーション、そしてトピック発見−,
- 第114回Ku-librarians勉強会, 京都大学, 京都市, August, 2009.
- 清田 陽司:
- 図書館分類体系とWikipediaを統合した情報探索支援システムの開発,
- 日本図書館研究会情報組織化研究グループ/情報知識学会関西部会 合同研究会, 大阪科学技術センター, 大阪市, July, 2009.
- 清田 陽司:
- レファレンスサービスをパワーアップするWeb2.0型レファレンスナビの開発,
- 第10回図書館総合展 フォーラム企画, パシフィコ横浜, 横浜市, November, 2008.
- 清田 陽司:
- 対話的情報探索支援のための統合分類体系の構築,
- 第7回情報科学技術フォーラム イベント企画「情報爆発時代の自然言語処理の新展開 −大規模ウェブリソースは対話を賢くするか?−」, 慶應義塾大学, 神奈川県, September, 2008.
- 清田 陽司:
- 対話的情報探索支援のためのオントロジー 〜Wikipediaと図書館件名標目表の統合〜,
- 私立短期大学図書館中国・四国地区協議会研修会, 広島ガーデンパレス, 広島市, August, 2008.
- (収録誌: 短期大学図書館研究, Vol. 28, pp. 135-138, 2008)
- 清田 陽司:
- レファレンスサービスをパワーアップするレファレンスナビの開発 〜図書館情報資源とWeb情報資源の統合的利用〜,
- 私立短期大学図書館協議会総会, 日本図書館協会, 東京都, May, 2008.
- (収録誌: 短期大学図書館研究, Vol. 28, pp. 51-56, 2008)
- Yoji Kiyota:
- Fusion of Libraries and the Web: Subject-based Information Retrieval in the Web 2.0 Era,
- The 2008 annual meeting of the
Committee on Japanese Materials (CJM), Council on East Asian
Libraries (CEAL), Association for Asian Studies
(AAS), Hyatt Regency Atlanta, Georgia, USA, April, 2008.
- [スライドPDF]
その他口頭発表
- 森 竜也, 増田 英孝, 中川 裕志, 清田 陽司:
- 多言語に展開するWikipediaの特性調査,
- NLP若手の会 第4回シンポジウム, 京都大学, 京都市, September, 2009.
- 野田 陽平, 清田 陽司, 中川 裕志:
- Wikipediaからの意外性のある情報の抽出,
- NLP若手の会 第4回シンポジウム, 京都大学, 京都市, September, 2009.
- 森 竜也, 増田 英孝, 清田 陽司, 中川 裕志:
- Wikipediaデータ抽出ツールWikIE,
- NLP若手の会 第3回シンポジウム, 熱海金城館, 静岡県, September, 2008.
- [ポスターPDF]
- (奨励賞 受賞)
- 野田 陽平, 清田 陽司, 中川 裕志:
- Wikipediaカテゴリを用いたブログ著者の得意分野プロファイリング,
- NLP若手の会 第3回シンポジウム, 熱海金城館, 静岡県, September, 2008.
- [予稿PDF] [ポスターPDF]
- 清田 陽司, 田村 悟之, 坂井 哲:
- なんでもテーマ検索: Wikipediaの項目から情報探索リソースへの誘導,
- NLP若手の会 第2回シンポジウム, 東京大学, 東京都, September, 2007.
- [ポスターPDF]
- (奨励賞 受賞)
- 清田 陽司:
- Wikipediaと図書館資料の分類体系との対応づけ 〜Web上の二次情報と図書館の一次情報の統合的活用に向けた取り組み〜,
- NLP若手の会 第1回シンポジウム, 名古屋大学, 名古屋市, September, 2006.
- [ポスターPDF]
- 清田 陽司:
- 航空安全情報分析ツール −自然言語処理技術のテキストマイニングへの応用−,
- FSF-JAPANセミナー(社団法人日本航空機操縦士協会主催)講演, 東京都, March, 2006.
- [スライドPDF]
科学研究費
- 研究分担者:
- Web上のテキスト情報の信頼性と有益性の評価システムに関する研究,
- 特定領域研究 情報爆発 公募研究A01-05, 課題番号21013011, 2009-(継続中).
- 研究分担者:
- 機械学習によるロングテール現象の解決方法に関する研究,
- 基盤研究(A), 課題番号21240011, 2009-(継続中).
- 研究代表者:
- 情報探索支援を目的としたハイブリッド情報資源オントロジー,
- 若手研究(B), 研究課題番号20700128, 2008-2010.
- 研究代表者:
- Web上の情報資源と図書館情報資源を統合的に利用する情報探索支援システム,
- 若手研究(B), 研究課題番号18700134, 2006-2008.
- 研究分担者:
- 多言語Webテキストからの知識マイニングに関する研究,
- 特定領域研究 情報爆発 公募研究A01-05, 課題番号18049011, 2006-2008.
- 研究分担者:
- Webテキストからの知識抽出支援システムに関する研究,
- 基盤研究(A), 課題番号17200007, 2005-2007.
新聞報道
- 日経産業新聞 2010年(平成22年)4月2日 17面: 「お薦め商品」ツイッター分析し表示 東大発VBリッテル ECサイト向け開発
- 日本経済新聞 2009年(平成21年)5月13日 13面: 東大発VBのリッテル、商品検索簡単に
- 日経産業新聞 2008年(平成20年)7月23日 19面: 検索システム 関連語体系立て表示 リッテル 自動的に整理・抽出
- 日経産業新聞 2007年(平成19年)11月6日 20面: 点検 大学発VB(東大) リッテル 図書館の本 分類表示 〜言語処理技術を活用〜
- 東京大学新聞 2007年10月16日号: 特集 進化する書籍情報の電子化
- 日本経済新聞 2007年(平成19年)4月18日朝刊 ベンチャー面: 図書館で本探し キーワード検索−リッテルがシステム
雑誌記事等
- 清田陽司: 企業で使われるHadoop (連載),
Think IT, 株式会社インプレスビジネスメディア, June, 2010.
- 清田陽司: Hadoop登場の背景,
Software Design 2010年5月号, 技術評論社
- 清田陽司: Hadoopを使ってみる,
みてわかるクラウドマガジン vol. 1, 日経BP社, pp. 36-55, April, 2010.
- Hadoopのここがすごい
- Hadoop をインストールする
- 分散ファイルシステム「HDFS」を体験する
- 「MapReduce」にチャレンジ
- 清田陽司: Googleはなぜ的確に探せるのか? (連載),
ASCII.jp, アスキー・メディアワークス, 2008-(継続中).
イベント開催
学会委員等
上に掲載した著作物の利用に関する注意事項(情報処理学会関係の著作物のみに適用)
本著作物の著作権は(社)情報処理学会に帰属します.本著作物は著作権者である情報処理学会の許可のもとに掲載するものです.ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」に従うことをお願いいたします.
(情報処理学会関係の著作物は「情報処理学会著作権規程」の第5条の5項の規定に則り,公開しています)
略歴