日時: 平成23年5月16日(月)・17日(火)
会場: 東京大学 本郷キャンパス 工学部6号館3階セミナー室AD
(〒113-8654 文京区本郷7-3-1)
...地理案内
共催:情報処理学会 自然言語処理研究会(NL)
プログラム:
***当日予稿集*** (IDとパスワードは登録会員には4月8日頃に送付済; 当日会場でも配布)
***電子図書館*** (Bookparkのアカウントが必要)
5月16日(月) 13:30-18:00 [13:30-14:30] ●テキストマイニング・機械学習 [2件] [14:45-16:45] ●学生セッション(1) [4件] [17:00-18:00] ●招待講演 5月17日(火) 10:30-17:30 [10:30-12:00] ●学生セッション(2) [3件] [13:30-15:00] ●学生セッション(3) [3件] [15:15-17:15] ●構文解析・検索・文法 [4件] [17:15-17:30] ●学生奨励賞発表,表彰 ====================================================================== 5月16日(月) 13:30-18:00 ■ 13:30-14:30 テキストマイニング・機械学習 (2件) ■ (1) Twitter Catches the Flu: 事実性判定を用いたインフルエンザ流行予測 ○荒牧 英治, 増川 佐知子 (東京大学), 森田 瑞樹 (医薬基盤研究所) 本研究ではTwitter発言者がインフルエンザにかかっているかどうかを識 別し,集計することにより,高精度でインフルエンザ流行を予測できるこ とを示す. (2) 多クラスSVMにおけるクラス所属確率を用いたアンサンブル学習の提案 ○高橋 和子 (敬愛大学) 複数の分類器の中で予測クラスの所属確率が最大の分類器を選択し, この 分類器の予測を最終決定とする方法を提案し有効性を示す. ■ 14:45-16:45 学生セッション(1) (4件) ■ (座長:岩野公司) (3) 文書上の潜在トピックを捉える事象の検討とその応用 ○北島 理沙, 小林 一郎 (お茶の水女子大学) 事象を対象にした潜在トピック推定手法を提案し,その応用として,潜在 的な意味に基づいた要約生成を行う. (4) 多言語トピックモデルによる言語横断リンク検出 ○福増 康佑, 松浦 愛美, 江口 浩二 (神戸大学) 複数のテキストデータ集合から言語を横断して同一イベントに関するもの を自動的に対応付ける言語横断リンク検出問題を解決するため、種々の多 言語トピックモデルを比較評価する。 (5) 音声入力型大学情報検索システムに対するベイズリスク最小化音声認識の適用 ○松尾 宏規, 西田 昌史 (同志社大), 古谷 遼, 南條 浩輝 (龍谷大), 山本 誠一 (同志社大) 本研究では,ベイズリスク最小化音声認識を導入し,音声入力により大学 のホームページを検索するシステムの構築について検討を行った. (6) 機械学習による近代文語文への濁点の自動付与 ○岡 照晃, 小町 守 (奈良先端大), 小木曽 智信 (国立国語研究所), 松本 裕治 (奈良先端大) 明治期文書に現れる濁点の脱落を、かな文字の2値分類問題として定式化 し、識別学習によって自動で補う。 ■ 17:00-18:00 招待講演 ■ [招待講演] 言語と知識:粒度の細かな情報アクセスと言語処理の役割 辻井 潤一 (Microsoft Research Asia) ====================================================================== 5月17日(火) 10:30-17:30 ■ 10:30-12:00 学生セッション(2) (3件) ■ (7) インターネット上の英日統計的機械翻訳サービスの誤り分析 ○星野 翔, 建石 由佳 (工学院大学) Google翻訳とBing Translatorの出力を英日対訳データを用いて人手で分 析し,編集プログラムによる誤りの改善を試みた. (8) 質問・回答事例を利用したnon-factoid型質問応答に対する確率的言語モデルの導入 ○吉田 恭輔, 上田 太郎, 石下 円香, 森 辰則 (横浜国立大学) 質問・回答事例から確率的言語モデルを推定・利用して、non-factoid型 質問応答の精度向上を図る方法について報告する。 (9) マイクロブログを用いた感染症サーベイランス ○岡村 直人, 関 和広, 上原 邦昭 (神戸大学) Twitterを用いた感染症サーベイランスについて,特にインフルエンザを 対象にその有効性を検討する. ■ 13:30-15:00 学生セッション(3) (3件) ■ (10) 文脈情報と格構造の類似度を用いた日本語文間述語項構造解析 ○林部 祐太, 小町 守, 松本 裕治 (奈良先端大) 統計的格構造類似度を用いて,着目する述語以前直前の項構造解析結果 を次の解析に活かす方法を提案する. (11) 固有表現抽出のための大規模訓練データの自動獲得 ○宇佐美 佑, Han-Cheol Cho, 岡崎 直観, 辻井 潤一 (東京大学) 低コストで準備できる語彙辞書と、大量の生テキスト群を用いて標題の タスクを達成し、その評価を行う。 (12) ドメイン外発話が扱え拡張性が高い対話ドメイン選択フレームワーク ○佐藤 隼 (東京電機大), 中野 幹生 (HRI-JP), 駒谷 和範 (名大), 船越 孝太郎 (HRI-JP), 奥乃 博 (京大) 拡張性の高いマルチドメイン対話システムのための,ロバストな2段階ド メイン選択フレームワークを提案する. ■ 15:15-17:15 構文解析・検索・文法 (4件) ■ (座長:三木清一) (13) 部分的アノテーションから学習可能な係り受け解析器 ○森 信介, FLANNERY Daniel, (京都大学), 宮尾 祐介 (国立情報学研究所), NEUBIG Graham (京都大学) 限られた言語資源を効率よく使うために、係り受けが部分的にアノテー ションされたコーパスを学習に使える係り受け解析器を提案する。 (14) 子音に注目した早口言葉の検索 鶴巻 有香, ○安川 美智子, 横尾 英俊 (群馬大学) 滑舌訓練用の類似音の検索を行うことを目的として、日本語の子音の特 徴に注目した早口言葉の検索方法を提案する。 (15) 同位語を利用した不在インデックス ○新里 圭司, 鎌田 浩司, 黒橋 禎夫 (京都大学) 「文書に書かれていないこと」を同位語を利用して生成し、インデック スに登録することで、不適合文書を高速に検出する手法を提案する。 (16) チョムスキーに「生成文法」という幻想をいだかせた神経細胞のデジタル・ネットワーク・オートマタにもとづく「二重符号化文法」 ○得丸 公明 (衛星システムエンジニア) 文法は、遺伝子にコードされているのか、いないのか。筆者は、文法は遺 伝子にコード化されておらず、生物体の神経細胞の感覚・記憶・論理判断 が、音韻パターンのわずかな変化を意味の変化へと結びつける「パターン 認識」であると考える。文法はデジタル通信に固有の二つの符号化メカニ ズム、通信路符号化と情報源符号化の相乗効果が生みだした「二重符号化 文法」と呼ぶのがふさわしい。 ■ 17:15-17:30 学生奨励賞発表,表彰 ■参加者:85名 (45+7+25+8) (うちNL研登録者が34名)