日時:2010年5月27日(木)・28日(金)
会場:東京工業大学 大岡山キャンパス 西8号館10階大会議室
(〒152-8550 東京都目黒区大岡山2-12-1)
... 地理案内
共催:情報処理学会 自然言語処理研究会(NL)
プログラム:
***当日予稿集*** (IDとパスワードは登録会員には4月9日頃に送付済; 当日会場でも配布)
***電子図書館*** (Bookparkのアカウントが必要)
***電子図書館*** (情報学広場のアカウントが必要)
◎ プログラム (発表件数22件)
5月27日(木) 10:30〜17:15
[10:30-12:00] ●翻訳,言語モデル,類似度計算 [3件]
[13:30-15:30] ●学生セッション1 [4件]
[15:45-17:15] ●学生セッション2 [3件]
5月28日(金) 10:15〜17:30
[10:15-11:45] ●音声言語処理 [3件]
[13:00-14:30] ●学生セッション3 [3件]
[14:45-16:15] ●学生セッション4 [3件]
[16:30-17:30] ●言語分析 [2件]
======================================================================
5月27日(木) 10:30〜17:15
■ 10:30〜12:00 翻訳,言語モデル,類似度計算 (3件) ■
(1) 単語並び換えモデルを考慮した統計的階層句機械翻訳システム
○林 克彦 (同志社大), 塚田 元, 須藤 克仁, Kevin Duh (NTT), 山本 誠一 (同志社大)
統計的階層句機械翻訳方式では生成された翻訳結果の単語並びの正しさは
主にN-gram言語モデルによって推定される.本研究ではさらに単語並び換
えモデルを階層句機械翻訳システムに導入する手法を提案することでより
適切な単語並びの翻訳結果を得ることができるシステムの開発を行った.
(2) 確率的タグ付与コーパスからの言語モデル構築
○森 信介, 笹田 鉄郎, NEUBIG Graham (京都大)
本論文では、コーパスに単語境界や読みなどのタグを確率的に付与するこ
とを提案し、それによる言語モデルの改善を報告する。
(3) 木の編集距離を用いた文の類似度計算方式
○三上 崇志, 平野 敬, 川又 武典 (三菱電機)
自然文を木構造グラフに変換し,同型構文や意味が類似する文の距離を木
の編集距離によって計算する方式を提案する.
■ 13:30〜15:30 学生セッション1 (4件) ■
(4) Webレビューの表形式化システムSECRETの開発
○今井 和雄, 吉村 友希, 原田 実 (青山学院大)
レビューサイトからレビューを収集し、意味解析システムを用いてレビュー
中の属性を自動で決定、表形式化して出力するシステムの開発
(5) テキストマイニングシステムSTMの感情・意思分析機能の組み込みを中心とした機能拡充
石田 涼, ○山西 和広, 早川 紘代, 酒匂 佳織, 後藤 良太, 原田 実 (青山学院大)
テキストマイニングシステムSTMの感情・意思分析機能の組み込みを中心と
した機能の拡充
(6) モノの用途表現を手がかりとしたWebからのノウハウの獲得
○小澤 俊介 (名古屋大), 内元 清貴 (NICT), 松原 茂樹 (名古屋大)
モノとその使われ方に着目することにより効率良くノウハウを獲得する手
法を提案する.
(7) Webフィルタリング処理時における表記揺れの動的解決
○井手 厚, 東 藍, 松本 裕治 (奈良先端大)
KAKASIのかな変換機能とMeCabの分かち書き機能を利用した表記ゆれ対策を
提案する.
■ 15:45〜17:15 学生セッション2 (3件) ■ (座長:河原達也)
(8) 読点の用法的分類に基づく自動読点挿入
○村田 匡輝, 大野 誠寛, 松原 茂樹 (名古屋大)
読点の用法を分類し、その分類に基づく分析から決定した素性を用いた統
計的手法による読点の自動挿入手法を提案する。
(9) 用法の違いを考慮した類似単語の置換による学習データ生成とそれを用いた主題の違いに頑健な言語モデルの構築
○清水 信哉, 鈴木 雅之, 齋藤 大輔, 峯松 信明, 広瀬 啓吉 (東京大)
言語モデル作成のための学習データの不足を補うため,単語を置換するこ
とで新たにデータを生成するという手法を提案する.
(10) 日本人英語学習者の音声文理解にプロソディ情報が果たす役割
○中村 智栄 (慶応大), 原田 康成 (早稲田大), 石崎 俊 (慶応大)
日本人英語学習者が英語音声文理解においてプロソディ情報をどの程度利
用しているのかを実験により検証した。
======================================================================
5月28日(金) 10:15〜17:30
■ 10:15〜11:45 音声言語処理 (3件) ■ (座長:岩野公司)
(11) ヒトの音声はphonitでデジタル変調されている(復調はアナログ方式である)−デジタル言語学(その1)−
○得丸 公明 (システム・エンジニア)
ヒトの話し言葉はデジタル通信である。地上波デジタル放送がアナログ電
波をデジタル変調して送信しているように、ヒトの話し言葉は肺気流を声
帯で有声化したアナログな音を、声道によって母音と子音によってデジタ
ル変調している。
(12) 広域文書類似度と局所文書類似度を用いた講演音声ドキュメント検索
○南條 浩輝, 弥永 裕介, 吉見 毅彦 (龍谷大)
講演音声集合から探したい内容を表す1〜3分程度の箇所(局所文書)を検
索する方法,具体的には局所文書の検索時に,それを包含する大きな単位
(広域文書;例えば講演単位)でも検索を行い,類似度を統合的に用いる
方法を提案する.
(13) Spoken Term Detection のためのテストコレクション構築とベースライン評価
○西崎 博光 (山梨大), 胡 新輝 (NICT), 南條 浩輝 (龍谷大), 伊藤 慶明 (岩手県立大), 秋葉 友良 (豊橋技科大), 河原 達也 (京都大), 中川 聖一 (豊橋技科大), 松井 知子 (統数研), 山下 洋一 (立命館大), 相川 清明 (東京工科大)
CSJを対象としたSTD(音声中の検索語検出)のテストコレクションを構築
している.昨年10月に中間報告を行い,頂いた意見などを元にテストコレ
クションを改訂したので,報告する.
■ 13:00〜14:30 学生セッション3 (3件) ■ (座長:庄境誠)
(14) フィルタリングのための隠語の有害語意検出機能の意味解析システムSAGEへの組み込み
○橋本 広美, 木下 嵩基, 原田 実 (青山学院大)
隠語の有害語意検出のためにEDRコーパスから前出する語との共起性を数
値化した周辺語辞書を構築し、これを基に意味解析システムSAGEの語意決
定方法の改良した。
(15) 照応解析システムANASYSの精度向上−外界照応分離,素性の洗練,ナイーブベイズ法の導入−
○山田 和正, 松田 源立, 原田 実 (青山学院大)
照応解析システムANASYSの精度向上のため、外界照応分離、素性の洗練、
ナイーブベイズ法の導入を行った。
(16) 文間関係認識のための局所構造アライメント
○水野 淳太 (奈良先端大/東北大), 後藤 隼人 (奈良先端大), 渡邉 陽太郎, (東北大) 村上 浩司 (奈良先端大), 乾 健太郎 (東北大/奈良先端大), 松本 裕治 (奈良先端大)
文間関係認識において,単語アライメント後に,文構造に対しても対応付
けを行 うことで意味的な対応をとる手法を提案し,その実装および評価
を行った.
■ 14:45〜16:15 学生セッション4 (3件) ■
(17) NonFactoid型質問文と回答文との意味的関係に基づく質問応答システムMetis
○高山 真行, 今村 泰香, 久保田 裕章, 原田 実 (青山学院大)
理由・方法・定義を問う質問文と内容的に近い照応文と回答を含む回答文
との意味的関係に基づく質問応答システム Metis
(18) ユーザが知らない語を予測する読解支援システムSocialDictとそのリーダビリティ測定への拡張
○江原 遥, 二宮 崇, 清水 伸幸, 中川 裕志 (東京大)
英文Webページ中のユーザが知らない語を単語クリックログから予測する
読解支援システムSocialDictを拡張し,リーダビリティも測定可能にする
手法を提案する.
(19) 半教師あり語義曖昧性解消のためのグラフスパース化
○小嵜 耕平, 小町 守, 新保 仁, 松本 裕治 (奈良先端大)
b-マッチングに基くグラフスパース化の有効性を語義曖昧性解消タスクに
おいて検証した
■ 16:30〜17:30 言語分析 (2件) ■
(20) Rongorongo符号列とイースター島古謡音韻列の対応
○山口 文彦 (東京理科大)
イースター島に伝わる古謡の音韻と未解読文字列である Rongorongo に付
けられた符号との出現順序の関係性を調べた結果を報告する.
(21) 要求概念の定義,および要求の態度
○大森 晃 (東京理科大)
最終的には日本語ウェブページからの要求抽出を目指している.本研究で
は,それに向けて,文から要求を抽出するための言語学的基礎論を整えて
いく一環として,(1)文レベルでの要求概念の定義,(2)所与の文が要求
を表現しているか否かを判別するために必要な言語学的知識を与える.
参加者:90名 (58+3+22+7) (うちNL研登録者が30名)