2008-SLP-74

第74回音声言語情報処理研究会 (SIG-SLP)

（第10回音声言語シンポジウム）

日時：平成20年12月9日(火)・10日(水)
会場：早稲田大学小野記念講堂（早稲田キャンパス）
　　　 (〒169-8050　新宿区西早稲田1-6-1) 地理案内
主催：電子情報通信学会および日本音響学会音声(SP)研究会
　　　情報処理学会音声言語情報処理(SLP)研究会
　　　電子情報通信学会言語理解とコミュニケーション(NLC)研究会
協賛：人工知能学会言語・音声理解と対話処理(SLUD)研究会
　　　 IEEE SP Society Japan Chapter

概　要：
　9日(火)
　　午前 10:00 - 12:05  【Session-1 音響処理・話者同定】
　　午後 13:10 - 14:00  【Session-2】〔招待講演〕音声言語運用が必要とする認知的能力と音声言語工学が構築した計算論的能力
　　午後 14:10 - 15:00  【Session-3 音声認識・音響モデル】
　　午後 15:10 - 16:25  【Session-4 言語モデル・システム】
　　午後 16:40 - 18:10  【Session-5 企画】

　10日(水)
　　午前  9:30 - 11:10　【Session-6 音声合成・声質変換】
　　午前 11:20 - 12:35　【Session-7 対話】
　　午後 13:40 - 14:30　【Session-8】〔招待講演〕音声認識応用システム開発の新パラダイム
　　午後 14:40 - 15:55　【Session-9 ドキュメント処理・翻訳・言語獲得】
　　午後 16:10 - 18:00　【Session-10 一般】（ポスターセッション）


プログラム：

9日午前 10：00 - 12：05　【Session-1 音響処理・話者同定】　（座長：北村達也）

(1) スパース性に基づくブラインド音源分離を用いた２チャンネル入力音声認識
	○西亀 健太, 和泉 洋介 (東大), 渡部 晋治 (NTT), 西本 卓也, 小野 順貴, 嵯峨山 茂樹 (東大)

(2) ロボットのためのハンズフリー音声認識システム
	○細谷 耕佑, 小川 哲司, 藤江 真也, 渡辺 大地, 市川 悠飛, 谷山 輝, 小林 哲則 (早大)

(3) 音声区間検出と雑音抑圧の統合法を用いた雑音下音声認識
	○藤本 雅清, 石塚 健太郎, 中谷 智広 (NTT)

(4) ベイジアンネットワークを用いた単一チャネル信号による背景音楽の抑圧
	○伊藤 弘章, 西野 隆典, 北岡 教英, 武田 一哉 (名大)

(5) 音響情報と映像情報の統合による多人数会話における話者決定技術
	○石塚 健太郎, 荒木 章子, 大塚 和弘, 藤本 雅清, 中谷 智広 (NTT)


9日午後 13：10 - 14：00　【Session-2】　（司会：小林隆夫）
(6) 〔招待講演〕音声言語運用が必要とする認知的能力と音声言語工学が構築した計算論的能力
	○峯松 信明 (東大)


9日午後 14：10 - 15：00　【Session-3 音声認識・音響モデル】　（座長：北岡教英）

(7) 重回帰HMMに基づくスタイル推定を用いた音声認識における音響モデル学習法
	○井島 勇祐, 橘 誠, 能勢 隆, 小林 隆夫 (東工大)

(8) 制約付き非負行列因子分解を用いた音声特徴抽出の検討
	○朴 玄信, 滝口 哲也, 有木 康雄 (神戸大)


9日午後 15：10 - 16：25　【Session-4 言語モデル・システム】　（座長：竹内孔一）

(9) PLSA言語モデル適応におけるアニーリングスケジュールの評価
	○加藤 正治, 小坂 哲夫 (山形大), 伊藤 彰則, 牧野 正三 (東北大)

(10) 話題の連続/不連続変化を考慮したトピックモデルに基づく音声認識
	○佐古 淳, 有木 康雄 (神戸大), 岩田 具治, 渡部 晋治, 堀 貴明 (NTT)

(11) 音声認識システムの満足度評価におけるユーザモデル
	○原 直, 北岡 教英, 武田 一哉 (名大)


9日午後 16：40 - 18：10　【Session-5 企画】　（座長：間野一則）
     10周年企画「音声言語研究関連分野の10年の歩み」

     趣旨：本シンポジウムは開催10年目の節目を迎える．
     このセッションでは，関連研究分野ごとの10年の進展を
     リレー形式でまとめて紹介するとともに，今後の発展に向けた
     ディスカッションを行う．

     発表一覧：
     「フロントエンド・特徴抽出・音響モデル」 [スライド]
       講演：堀 貴明（NTT）           討論：古井貞煕（東工大）
     「サーチ・信頼度・LVCSR」 [スライド]
       講演：李 晃伸（名工大）        討論：鹿野清宏（奈良先端大）
     「音声対話システム・音声インタフェース」 [スライド]
       講演：中野 幹生（HRI-JP）      討論：中川聖一（豊橋技科大）
     「音声検索」 [スライド]
       講演：秋葉 友良（豊橋技科大）  討論：河原達也（京大）
     「機械翻訳」 [スライド]
     　講演：加藤 直人（NHK技研）     討論：宇津呂武仁（筑波大）
     「言語資源」 [スライド]
     　講演：竹内 孔一（岡山大）      討論：出羽達也（東芝）


10日午前  9：30 - 11：10　【Session-6 音声合成・声質変換】　（座長：堀貴明）

(12) 音響的特徴を用いた話し言葉の断片発話単位への分割
	○瀬戸山 勝義 (奈良先端大), 柏岡 秀紀, ニック キャンベル (奈良先端大/NICT/ATR)

(13) Bayesian Context Clustering Using Cross Validation for HMM-Based Speech Synthesis
	○Kei Hashimoto, Heiga Zen, Yoshihiko Nankaku, Keiichi Tokuda (NITECH)

(14) Simultaneous Transformation of Duration and Spectrum Using Statistical Models Including Time-Sequence Matching
	○Kaori Yutani, Yoshihiko Nankaku (NITECH), Tomoki Toda (NAIST), Keiichi Tokuda (NITECH)

(15) 基本周波数情報に基づく線形予測と時間軸伸縮を利用した非周期成分の抽出について
	○河原 英紀 (和歌山大), 森勢 将雅 (関学大), 高橋 徹 (京大), 坂野 秀樹 (名城大), 西村 竜一, 入野 俊夫 (和歌山大)


10日午前 11：20 - 12：35　【Session-7 対話】　（座長：中野幹生）

(16) 実世界における人とロボットの共有信念に基づいた相互適応的な発話生成
	○中村 慎也 (電通大), 岩橋 直人 (NICT/ATR), 長井 隆行 (電通大)

(17) POMDPを利用した思考喚起型対話の制御
	○南 泰浩, 澤木 美奈子, 東中 竜一郎, 堂坂 浩二 (NTT)

(18) 音声対話用音声認識システム
	○谷口 徹, 藤江 真也, 小林 哲則 (早大)


10日午後 13：40 - 14：30　【Session-8】　（司会：河原達也）
(19) 〔招待講演〕音声認識応用システム開発の新パラダイム
	○小林 哲則 (早大)


10日午後 14：40 - 15：55　【Session-9 ドキュメント処理・翻訳・言語獲得】　（座長：伊藤敏彦）

(20) SLP音声ドキュメント処理ワーキンググループ活動報告
	○秋葉 友良 (豊橋技科大), 相川 清明 (東京工科大), 伊藤 慶明 (岩手県立大), 河原 達也 (京大), 南條 浩輝 (龍谷大), 西崎 博光 (山梨大), 安田 宜仁 (NTT), 山下 洋一 (立命館大), 胡 新輝 (NICT/ATR), 中川 聖一 (豊橋技科大), 伊藤 克亘 (法政大)

(21) 会議録作成支援のための国会審議の音声認識システム
	○秋田 祐哉, 三村 正人, 河原 達也 (京大)

(22) 音声翻訳単位の推定における句読点情報の効果
	○清水 徹, 中村 哲 (NICT), 河原 達也 (京大)


10日午後 16：10 - 18：00　【Session-10 一般】 (ポスターセッション)　（座長：李晃伸）

(23) 対乳児発話におけるピッチアクセントの性質について　～ 理研日本語母子会話コーパスを用いた分析 ～
	○北原 真冬 (早大/理研), 西川 賢哉 (理研/慶大), 五十嵐 陽介 (国語研/理研), 新谷 敬人 (上智大/理研), 馬塚 れい子 (理研/デューク大)

(24) 効果音を用いた感性伝達における条件付加による受信感性情報の変化
	○佐藤 真梨, 相川 清明 (東京工科大)

(25) 軟らかい素材による軟口蓋を伴う声道の物理模型
	○荒井 隆行, 田中 希美 (上智大), 片岡 竜太 (昭和大)

(26) Articulatory feature extraction based on 3-stage MLNs and Inhibition/Enhancement Network
	○Mohammad Nurul_Huda, Hiroaki Kawashima, Tsuneo Nitta (Toyohashi_Univ._of_Tech.)

(27) TANDEM-STRAIGHTに基づく基本周波数抽出法の最適化に関する一検討
	○板垣 英恵 (和大), 森勢 将雅 (関学大), 西村 竜一, 入野 俊夫, 河原 英紀 (和大)

(28) スペクトル平面における勾配ヒストグラムに基づく音声特徴量の検討
	○室井 貴司, 滝口 哲也, 有木 康雄 (神戸大)

(29) 声道情報を用いたニューラルネット話者照合システム
	○渡辺 優介, 松本 直樹 (明大)

(30) 位相情報を利用した話者識別・照合法の評価
	○王 龍標 (静大), 南 和江, 山本 一公, 中川 聖一 (豊橋技科大)

(31) Dialect-based speaker classification of Chinese using acoustic features invariant with extra-linguistic factors
	○XueBin Ma, Nobuaki Minematsu, Yu Qiao, Keikichi Hirose (Univ._of_Tokyo), Akira Nemoto, Feng Shi (Nankai_Univ.)

(32) Speaker Recognition Based on Gaussian Mixture Models Using Variational Bayesian Method
	○Tatsuya Ito, Kei Hashimoto, Yoshihiko Nankaku, Akinobu Lee, Keiichi Tokuda (NITECH)

(33) 音声の動的特徴のモデルを使った突発性雑音の除去
	○三宅 信之, 滝口 哲也, 有木 康雄 (神戸大)

(34) 距離マトリクス画像のハフ変換を用いた単語音声区間検出
	○西 宏之, 木村 義政, グエン ヴァン・ドン (崇城大)

(35) 音声の構造的表象と判別分析を用いた単語音声認識
	○朝川 智, 喬 宇, 峯松 信明, 広瀬 啓吉 (東大)

(36) アフィン変換不変性を有する局所的特徴量を用いた音声認識
	○鈴木 雅之, 喬 宇, 峯松 信明, 広瀬 啓吉 (東大)

(37) HMM音声合成における共分散パラメータの共有に関する検討
	○大浦 圭一郎, 全 炳河, 南角 吉彦, 李 晃伸, 徳田 恵一 (名工大)

(38) Speech recognition based on statistical models including multiple decision trees
	○Sayaka Shiota, Kei Hashimoto, Yoshihiko Nankaku, Akinobu Lee, Keiichi Tokuda (NITECH)

(39) 話速管理機能を持った原稿提示収録システム(ReCoK5)と話速バリエーション型音声データベース(SRV-DB)の公開について
	○高橋 弘太, 蔦木 圭悟, 吉原 亨 (電通大)

(40) 音声の高速再生のための話速推定法と高速発話時の特性解析　～話速バリエーション型データベースの活用例～
	○吉原 亨, 蔦木 圭悟, 高橋 弘太 (電通大)

(41) 音声の雑音比とスペクトルＱを用いた全疲労検知　～話者への効率や安全への助言を考えて～
	○岡田 一秀 (トヨタ)

(42) Driver's irritation detection using speech recogntion results
	○Lucas Malta, Chiyomi Miyajima, Akira Ozaki, Norihide Kitaoka, Kazuya Takeda (Nagoya_Univ.)

(43) 単語出現順序を考慮したトピックモデルによる言語モデル適応
	○佐古 淳, 滝口 哲也, 有木 康雄 (神戸大)

(44) 単語誤り最小化に基づく識別的リスコアリングによる音声認識
	○小林 彰夫, 奥 貴裕, 本間 真一, 佐藤 庄衛, 今井 亨, 都木 徹 (NHK)

(45) 条件付き確率場を用いた発話内容の分類による音声認識結果の検証
	○大田 健紘, 江原 暉将 (諏訪東京理科大)

(46) 質問応答データベースの自動作成に基づく音声対話システムの評価
	○森本 高弘, 伊藤 仁 (東北大), 鈴木 基之 (徳島大), 伊藤 彰則, 牧野 正三 (東北大)

(47) ロボット・エージェント対話行動制御部構築ツールRIME-TKを用いた質問応答機能の実現
	○成松 宏美 (津田塾大), 中野 幹生, 船越 孝太郎, 長谷川 雄二, 辻野 広司 (HRI-JP)


シンポジウム実行委員：
    実行委員長: 小林隆夫(東工大)，
    副委員長: 井ノ上直己(ATR/NICT)，河原達也(京大)
    幹事: 間野一則(芝浦工大), 伊藤敏彦(北大)，中野幹生(HRI-JP)，
    委員: 伊藤慶明(岩手県立大), 李晃伸(名工大), 堀貴明(NTT), 北村達也(甲南大),
          加藤直人(NHK), 山本和英(長岡技科大)，増市博(富士ゼロックス),
          村上浩司(奈良先端大), 竹内孔一(岡山大学),
          北岡教英(名大), 山下洋一(立命館大)

問合先：
      間野 一則(SP) 
          芝浦工業大学 
          mano [at] sic.shibaura-it.ac.jp
      伊藤 敏彦(NLC) 
          北海道大学 
          t-itoh [at] media.eng.hokudai.ac.jp
      中野幹生(SLP) 
          (株)ホンダ・リサーチ・インスティチュート・ジャパン(HRI-JP)
          nakano [at] jp.honda-ri.com
参加者：89名 (38+15+0+36)
第74回 音声言語情報処理研究会 (SIG-SLP)

（第10回 音声言語シンポジウム）

第74回音声言語情報処理研究会 (SIG-SLP)

（第10回音声言語シンポジウム）