主催: 情報処理学会 音声言語情報処理研究会(SLP)
電子情報通信学会 言語理解とコミュニケーション研究会(NLC)
電子情報通信学会・日本音響学会 音声研究会(SP)
協賛: 人工知能学会 言語・音声理解と対話処理研究会(SLUD)
IEEE SP Society Japan Chapter
プログラム:
***当日予稿集*** (IDとパスワードは登録会員には4月13日頃に送付済; 当日会場でも配布)
***電子図書館*** (Bookparkのアカウントが必要)
SLP登録会員の方は上記のいずれかから事前にダウンロード・印刷をお願いします。
登録されていない方は、当日電子配布になりますので、PCを用意下さい。
21日(月) 午前 10:00 - 10:10【開会挨拶】 午前 10:10 - 11:50 【Session-1 音響モデル】 4件 午後 13:00 - 13:50 【Session-2 デコーダ】 2件 午後 13:50 - 14:40 【Session-3 言語モデル】 2件 午後 14:55 - 15:45 【Session-4 招待講演】 古井貞煕 午後 15:45 - 17:00 【Session-5 パネル討論】 22日(火) 午前 9:30 - 10:45 【Session-6 韻律・VAD】 3件 午前 11:00 - 12:15 【Session-7 対話】 3件 午後 13:15 - 14:05 【Session-8 招待講演】 片桐恭弘 午後 14:20 - 15:35 【Session-9 音声検索・要約】 3件 午後 15:50 - 17:50 【Session-10 一般(ポスターセッション)】 22件 12月21日(月) 10:00 - 10:10 【開会挨拶】河原達也(京大) 10:10 - 11:50 【Session-1 音響モデル】 座長:庄境誠(旭化成) (1*) 音声認識のための非線形スペクトル変換を用いた話者適応 ○林 豊大, 南角 吉彦, 李 晃伸, 徳田 恵一 (名工大) (2*) 話者不変な相対関係特徴を音響単位とする音響モデリングに関する実験的検討 ○齋藤 大輔, 松浦 良, 峯松 信明, 広瀬 啓吉 (東大) (3) Unsupervised Speaker Adaptation for Speech-to-Speech Translation System ○Keiichiro Oura, Junichi Yamagishi, Mirjam Wester, Simon King, Keiichi Tokuda (NITECH) (4) 音声認識のための複数の認識器を利用した能動学習 ○濱中 悠三 (東工大), 江森 正 (NEC情報システムズ), 越仲 孝文 (NEC/東工大), 篠田 浩一 (東工大), 古井 貞熙 (東工大) 13:00 - 13:50 【Session-2 デコーダ】 座長:李晃伸(名工大) (5*) Recent Evaluations of a WFST-Based Speech Recognition Decoder ○Paul Dixon, Josef Novak, Tasuku Oonishi, Sadaoki Furui (Tokyo_Tech) (6*) サーチエラーリスク最小化に基づくViterbiビーム探索とその評価 ○堀 貴明, 渡部 晋治, 中村 篤 (NTT) 13:50 - 14:40 【Session-3 言語モデル】 座長:小川厚徳(NTT) (7) マルチタスク型音声対話システムの対話制御のための発話識別 ○粟野 健太郎, 伊藤 仁, 伊藤 彰則, 牧野 正三 (東北大) (8) Topic Dependent Language Model based on On-Line Voting ○Welly Naptali, Masatoshi Tsuchiya, Seiichi Nakagawa (Toyohashi_Univ_Tech) 14:55 - 15:45 【Session-4 招待講演】 座長:間野一則(芝浦工大) (9*) [招待講演] 何かが欠けている音声認識研究 古井 貞煕 (東工大) 15:45 - 17:00 【Session-5 パネル討論】 □ 音声認識研究に何が必要か? 招待講演やASRU最新動向を踏まえて、若手研究者とともに これからの音声認識の挑戦課題・研究方法等について討論する。 モデレータ: 河原達也(京大) パネリスト: 緒方淳(産総研), 滝口哲也(神戸大), 村上浩司(奈良先端大), 李晃伸(名工大), 渡部晋治(NTT) 12月22日(火) 9:30 - 10:45 【Session-6 韻律・VAD】 座長:菊池英明(早大) (10*) 母音間のピッチデルタと発話インターバルを用いた焦燥検知 ○岡田 一秀 (トヨタ自動車) (11*) 複数の特徴量による条件付確率場に基づく音声区間検出 ○斎藤 彰, 南角 吉彦, 李 晃伸, 徳田 恵一 (名工大) (12) Dirichlet事前分布を用いた音声区間検出の検討 ○藤本 雅清, 渡部 晋治, 中谷 智広 (NTT) 11:00 - 12:15 【Session-7 対話】 座長:西崎博光 (13*) 音声対話システムのためのN-gramに基づくキーワードからの文生成 ○吉見 孔孝, 南角 吉彦, 李 晃伸, 徳田 恵一 (名工大) (14) 音声対話システムの対話履歴N-gramを利用したユーザ満足度推定手法 ○原 直, 北岡 教英, 武田 一哉 (名大) (15) 対話データの統計量を用いたPOMDPによる対話制御 ○南 泰浩, 森 啓, 目黒 豊美, 東中 竜一郎, 堂坂 浩二, 前田 英作 (NTT) 13:15 - 14:05 【Session-8 招待講演】 座長:井ノ上直己(ATR/NICT) (16) [招待講演] 対話インタラクションの文化パラメータ 片桐 恭弘 (はこだて未来大) 14:20 - 15:35 【Session-9 音声検索・要約】 座長:中野幹生(HRI-JP) (17) 文脈を考慮した確率的モデルによる話し言葉の整形 ○Graham Neubig, 秋田 祐哉, 森 信介, 河原 達也 (京大) (18*) Web上の語彙を利用した音声クエリ拡張による検索語検出 ○栗城 吾央, 伊藤 慶明, 小嶋 和徳, 石亀 昌明 (岩手県立大), 田中 和世 (筑波大), 李 時旭 (産総研) (19) 複数音声認識システムを用いた音声中の検索語検出の検討 ○名取 賢, 西崎 博光, 関口 芳廣 (山梨大) 15:50 - 17:50 【Session-10 一般(ポスターセッション)】 (20) 音声認識の信頼度に着目した文境界検出に関する検討 ○畑 昇吾 (千葉大), 西田 昌史 (同志社大), 堀内 靖雄, 黒岩 眞吾 (千葉大) (21) Buried Markov Model を用いた音声認識モデルの構築法の検討 ○山本 隆之, 滝口 哲也, 有木 康雄 (神戸大) (22) ランダムプロジェクションを用いた音響モデルの線形変換 ○吉井 麻里子, 滝口 哲也, 有木 康雄 (神戸大) (23*) 直交関数系の級数展開に基づくスペクトル引き算 ○赤坂 泰司, 島村 徹也 (埼玉大) (24*) 音声信号の2重自己相関関数のスペクトル表現とその雑音環境下単語認識システムへの応用 ○グェン・ゴック ディン, 島村 徹也 (埼玉大) (25*) F0量子化に基づく韻律コンテキストを用いたHMM音声合成 ○大木 康次郎, 能勢 隆, 小林 隆夫 (東工大) (26*) ユーザの発話を利用した聞き取りやすい英語への音声変換手法 ○小柴 侑一, 榑松 明, 白井 克彦 (早大) (27) 順位統計量を用いた話者照合のためのコホート話者選択方法 ○岡本 悠 (千葉大), 柘植 覚 (徳島大), 堀内 靖雄, 黒岩 眞吾 (千葉大) (28*) 距離感を与える音声の特徴分析と合成 大町 基, 岩田 和彦, 小林 哲則 (早大) (29*) 多重ベータ混合モデルを用いた調波時間構造のモデル化による音声合成の検討 ○中鹿 亘 (神戸大), 立花 隆輝, 西村 雅史 (日本IBM), 滝口 哲也, 有木 康雄 (神戸大) (30*) F0量子化と非パラレル学習に基づく声質変換の検討 ○太田 悠平, 能勢 隆, 小林 隆夫 (東工大) (31*) 多様な声質を表現するための因子分析モデルに基づくHMM音声合成 ○鹿住 恭介, 南角 吉彦, 徳田 恵一 (名工大) (32) WWWを利用したトピック関連語推定に基づく言語モデル教師なし適応の性能評価 ○増村 亮, 伊藤 仁, 伊藤 彰則, 牧野 正三 (東北大) (33) Google N-gramを用いた音声認識のタスク汎用性評価の試み 久保 慶伍, 三宅 純平, 川波 弘道, 猿渡 洋, 鹿野 清宏 (奈良先端大) (34*) AAMを用いた顔方位にロバストな唇領域特徴抽出と音声特徴による構音障害者の音声認識 ○宮本 千琴, 駒井 祐人, 滝口 哲也, 有木 康雄 (神戸大), 李 義昭 (追手門学院大), 中林 稔堯 (神戸大) (35) 英語発音評定における各種正規化の検討 ○久住 大, 加藤 正治, 小坂 哲夫 (山形大), 松永 到 (ビック東海) (36*) ユーザ生成型音声対話コンテンツを用いた音声情報案内システム ○福田 敏則, 吉見 孔孝, 南角 吉彦, 李 晃伸, 徳田 恵一 (名工大) (37) 音声認識・言語理解システムを用いた音声対話コーパスの収集とその利用 ○小野 正貴 (東京農工大), 中野 有紀子 (成蹊大/東京農工大) (38) 共通部分単語の提示を併用した単語音声入力インタフェース ○張 用起, 甲斐 充彦, 王 龍標 (静岡大) (39*) 騒音環境下における音声帯域と単語了解度の関係について ○栗原 祥子, 日和崎 祐介, 佐々木 茂明, 羽田 陽一 (NTT) (40*) One Study of Reasonable Acoustic Attachment for Mute Image ○Kazuhide Okada (Toyota) (41) 人類進化のデジタル符号化要求仮説 ○得丸 公明 (システムエンジニア)参加者:106名 (71+16+3+16) % 信学会との合計は200名番号に * がついているのは、電子情報通信学会に申込まれた(著作権譲渡される)もの
シンポジウム実行委員: 実行委員長: 河原達也(京大) 副委員長: 井ノ上直己(ATR/NICT),有木康雄(神戸大) 幹事: 中野幹生(HRI-JP),伊藤敏彦(北大),間野一則(芝浦工大) 委員: 庄境誠(旭化成),滝口哲也(神戸大) 菊池英明(早大),李晃伸(名工大),小川厚徳(NTT),北村達也(甲南大), 山本和英(長岡技科大),増市博(富士ゼロックス),村上浩司(奈良先端大),竹内孔一(岡山大),柳原正(KDDI研)
問合先: 中野 幹生 (SLP) (株)ホンダ・リサーチ・インスティチュート・ジャパン(HRI-JP) nakano [at] jp.honda-ri.com 伊藤 敏彦 (NLC) 北海道大学 t-itoh [at] media.eng.hokudai.ac.jp 間野 一則 (SP) 芝浦工業大学 mano [at] sic.shibaura-it.ac.jp