日時:2009年5月21日(木)・22日(金)
会場:東京工業大学 大岡山キャンパス 西8号館10階大会議室
(〒152-8550 東京都目黒区大岡山2-12-1)
... 地理案内
共催:情報処理学会 自然言語処理研究会(NL)
プログラム:
***当日予稿集*** (IDとパスワードは登録会員には4月13日頃に送付済; 会場にて配布)
***電子図書館*** (Bookparkのアカウントが必要)
SLP会員登録の方は上記のいずれかから事前にダウンロード・印刷をお願いします。
登録されていない方は、当日無線LANからのアクセスになりますので、PCを用意下さい。
5月21日(木) 10:15〜18:10 ■ 10:15〜11:45 機械翻訳・辞書・文法 (3件) ■ (1) 機械翻訳のための統計的手法に基づく前編集 ○南條 浩輝, 吉見 毅彦, 岡田 真也 (龍谷大) 機械翻訳においては,翻訳前に自然な原文を直訳調の文などに変換 (前編集)することでうまく翻訳できることがある.本研究では,音 声認識や機械翻訳に用いられる統計手法に基づいた前編集を提案する. 統計モデルの学習データの自動作成方法についても提案を行う. (2) 日本語の主観表現の機能的構造 -主観述語- ○牧野 武則 (東邦大) 文は客観表現と主観表現からなり、主観表現も述語をもつ。この主観 述語の機能的構造と役割を議論する。 (3) 日本語慣用的表現辞書について ○首藤 公昭, 田邊 利文, 高橋 雅仁 (福岡大) 日本語処理を目的に慣用句、常套句、およびそれらに類似する表現を 収集し、機能、構造、異表記、派生形を記載した見出し約9万表現の 辞書について報告する。 ■ 12:50〜14:30 学生セッション1 (4件) ■ (4) 意味解析システムSAGEの精度向上 -モダリティと副詞節について- ○梅澤 俊之, 加藤 大知, 松田 源立, 原田 実 (青山学院大) モダリティの付与による文中の語意に現れない意図把握の精密化,及 び決定木による副詞節の深層格判定の精度向上. (5) 意味解析に基づく照応解析システムANASYS -EMアルゴリズムによる先行詞同定の学習の導入- ○西尾 公秀, 村上 春佳, 松田 源立, 原田 実 (青山学院大) NAISTテキストコーパスを用い、文構造や概念類似度などを用いEM アルゴリズムによって学習し、先行詞を推定して照応解析を行う。 (6) HPSG Supertaggingの精度向上のための単語クラスタリング ○吉澤 智也, 松崎 拓也, 宮尾 祐介, 辻井 潤一 (東京大) 語彙化文法の一つHPSGの前処理であるSupertaggingに、単語クラスタ リングの結果を導入し評価した。 (7) 読みやすい字幕生成のための講演文への漸進的改行挿入 ○村田 匡輝, 大野 誠寛, 松原 茂樹 (名大) リアルタイム字幕生成における講演テキストの提示において、音声入 力と同時的に改行挿入位置を同定する手法を提案する。 ■ 14:45〜16:25 学生セッション2 (4件) ■ (座長:滝口 哲也) (8) 日本語講演音声ドキュメント検索における索引付けの検討 ○重安 幸治, 南條 浩輝, 吉見 毅彦 (龍谷大) CSJの講演音声検索における索引付けの研究を行った.具体的には, 形態素と文字N-gramによる索引付けにおいて、統計量に基づくストッ プワードを検討した。 (9) ウェブ検索ログを用いたラベル伝播による意味カテゴリ獲得 ○小町 守 (奈良先端大), 牧本 慎平, 内海 慶, 颯々野 学 (ヤフー) ウェブ検索ログを用い、少数のシード単語からラベル伝播によって意 味カテゴリを学習する半教師あり手法を提案する。 (10) WWWを利用した言語モデル適応のための検索クエリ構成の検討 ○増村 亮, 伊藤 仁, 伊藤 彰則, 牧野 正三 (東北大) WWWを用いた言語モデル適応のために、認識対象の未知語を含むテキ ストを取得するような検索クエリの自動構成について検討する。 (11) 音声ドキュメント検索におけるWebページを用いたドキュメント拡張の効果 ○杉本 樹世貴, 西崎 博光, 関口 芳廣 (山梨大) 音声ドキュメント検索で問題となる音声認識誤りや未知語問題に対応 するために,Webページを用いたドキュメント拡張を提案する. ■ 16:40〜18:10 パネル討論 ■ (12) 【パネル討論】 音声インタフェースにおけるWebテキスト処理技術の利用 中野 幹生 (HRI-JP), 緒方 淳 (産総研), 清田 陽司 (東大), 東中 竜一郎 (NTT) , 翠 輝久 (NICT) 音声インタフェースの性能の向上と構築コストの低減のために,Web テキスト処理を用いる方法について情報を共有し,今後の方向性に関 して議論する. 5月22日(金) 9:00〜16:30 ■ 9:00〜10:15 学生セッション3 (3件) ■ (座長:庄境 誠) (13) 自然語ルールと知識をベースとした対話システムEveの開発 ○後藤 伸男, 中川 侑美, 原田 実 (青山学院大) 問題解決に必要な知識,推論ルールを自然文で表現し,目標スタック の展開と行為の実行により応答を求める対話システムの研究開発. (14) バージイン発話タイミングモデルを導入した指示対象同定 ○松山 匡子, 駒谷 和範, 武田 龍, 尾形 哲也, 奥乃 博 (京都大) 従来の音声認識結果に加えて,モデル化した発話タイミングを用いて 指示対象を同定する手法を開発した. (15) 複数の音声対話システム併用のための発話識別 ○粟野 健太郎, 伊藤 仁, 伊藤 彰則, 牧野 正三 (東北大) タスクが1つである音声対話システムを複数個併用するために必要な、 発話がどのタスクかを識別する方法を検討した ■ 10:30〜11:45 学生セッション4 (3件) ■ (16) 意味グラフ照合による質問応答システムMetisの回答精度向上 -質問文解析フェーズと検索フェーズの改良を中心として- ○西岡 晋太郎, 久保田 裕章, 坂東 晃文, 原田 実 (青山学院大) 検索文字列とインデクスの改良による知識文検索の向上と質問文の細 分類による質問文と知識文の照合の精度向上. (17) 大規模オープンソース日英対訳コーパスの構築 ○石坂 達也 (長岡技科大), 内山 将夫, 隅田 英一郎 (NICT), 山本 和英 (長岡技科大) Web上の翻訳文書と原文書を収集し、文の対応付けを行うことで大規 模な日英対訳コーパスを構築した。 (18) 言い換えを用いたテキストの自動評価 ○平原 一帆, 難波 英嗣, 竹澤 寿幸 (広島市立大), 奥村 学 (東工大) 表層的な文字列の一致だけでなく、言い換えも考慮することにより、 従来のテキスト評価手法を改良する手法を提案する。 ■ 13:15〜14:45 同義語・名詞句解析 (3件) ■ (19) 文字列検索に基づく同義語・類義語抽出ツールとその性能評価 ○吉田 和弘, 吉田 稔, 中川 裕志 (東京大) Suffix Arrayの検索に基づくインタラクティブな同義語抽出ツールを 提案し、文学作品などからなる文書集合を用いて性能を検証する。 (20) 文字係り受けに基づく専門用語の内部構造表現と解析 ○山田 恵美子 (東京大), 松本 裕治 (奈良先端大) 専門用語の内部構造を文字係り受けによって表現し、既存の係り受け 解析手法を用いた解析を試みたので報告する。 (21) 学習不要な名詞句のカテゴリ分類手法 ○Nguyen Pham Thanh Thao, 林 貴宏, 尾内 理紀夫 (電気通信大), 西岡 悠平, 竹中 孝真, 森 正弥 (楽天技術研究所) 係り受け関係と相互情報量を用いた、学習不要なカテゴリ分類手法を 提案した.分類システムの入力は、各カテゴリ対する少数の種語群と 分析用のデータセットのみである.本手法は、すべての名詞句を分類 対象とするため、出現頻度が低い単語も分類可能である.そして、ユー ザが設定した各カテゴリ(目的カテゴリと呼ぶ)以外に、ゴミカテゴ リを設定することにより、目的カテゴリに分類すべきでない単語がゴ ミカテゴリに分類され、誤分類を防止できる効果も実験で確認した. ■ 15:00〜16:30 音声・対話 (3件) ■ (座長:河原 達也) (22) 日本語参照表現コーパスの構築と分析 ○徳永 健伸, Philipp Spanger, 安原 正晃, 飯田 龍 (東工大) 日本語の協調作業対話から参照表現を抽出して構築したコーパスと, その分析結果について報告する. (23) 話し言葉音声合成の韻律制御に関する検討 伊藤 芳幸 (東工大), ○岩野 公司 (東京都市大), 古井 貞煕 (東工大) HMM音声合成に基づく話し言葉音声合成の韻律制御に関し,合成音 の「話し言葉らしさ」に影響を及ぼす制御要因などについて調査を行った. (24) マルチモーダル音声認識におけるストリーム重みの教師なし推定法の検討 ○岩野 公司 (東京都市大), 松尾 俊秀, 古井 貞煕 (東工大) マルチモーダル音声認識を利用した対話システムの実現に向けて,音 響・画像ストリーム重みの教師なし推定法の検討を行う.参加者:113名 (65+11+20+17) (うちNL研登録者が40名)