日時: 平成24年10月26日(金) 会場: NHK放送技術研究所 技研講堂 (〒157-8510 東京都世田谷区砧1-10-11) 交通アクセスはこちら 問合先:三木 清一(NEC) k-miki (at) bq.jp.nec.com
当日予稿集はこちら (SLP会員のみ)
電子図書館: BookPark 情報学広場
10月のSLP研究会は、これまでご好評頂いております「音声言語情報処理技術デベロッパーズフォーラム」として、音声認識・音声合成などの音声言語情報処理技術の実用化・普及に焦点をおいた情報交換・議論の場を企画します。 近年、スマートフォン等の携帯端末における本分野の実用化にはめざましいものがあります。また、官公庁や企業の業務システムでの適用も着実に進んでおり、ユーザに快適性・利便性をもたらしています。本企画では、そのような導入事例を踏まえて、実用化を成功させるポイントについて、議論できればと考えています。 当日は、招待講演として、NTTドコモ吉村様より、「しゃべってコンシェル」の開発についてご講演いただきます。また、8k4k映像と22.2マルチチャネル音響のスーパーハイビジョンを技研講堂にてご体験頂く等、NHK技研の最近の研究成果をご紹介頂く場も設けました。 |
●一般講演(10:00-11:45)
10:00-10:35
(1)リスク最小化学習に基づく識別的言語モデル
◯小林 彰夫, 奥 貴裕, 藤田 悠哉, 佐藤 庄衛(NHK技研), 中川 聖一(豊橋技科大)
10:35-11:10
(2)非負値行列因子分解に基づき動的適応したn-gram言語モデルによるパープレキシティ削減効果の分析
○藤田 悠哉, 奥 貴裕, 小林 彰夫, 佐藤 庄衛(NHK技研)
11:10-11:45
(3)音声データの隠れ属性を利用した異種音響モデル群の構築
○福田 隆,立花 隆輝,西村 雅史(日本IBM), Upendra Chaudhari, Bhuvana Ramabhadran(IBM Watson Research), Puming Zhan (Nuance Communications)
●デベロッパーズフォーラム(1)(13:00-14:35)
13:00-14:00
(4)(招待講演)
しゃべってコンシェルと言語処理
○吉村 健(NTTドコモ)
14:00-14:35
(5)議会の会議録作成のための音声認識の現状 --衆議院のシステムを中心に--
○河原 達也(京都大学)
●デベロッパーズフォーラム(2)(14:50-16:35)
14:50-15:25
(6)話速変換技術・音声変換技術の放送および関連ビジネスへの応用
○都木 徹(NHKエンジニアリングサービス), 今井 篤, 清山 信正, 世木 寛之, 田高 礼子(NHK技研), 田澤 直幸, 岩鼻 幸男(NHKエンジニアリングサービス)
15:25-16:00
(7)音声合成の多様性向上の取り組み
○籠嶋 岳彦, 橘 健太郎, 布目 光生, 森田 眞弘(東芝)
16:00-16:35
(8)キャラクターとの会話体験を提供する音声応答の試験サービス
○花沢 健, 辻川 剛範(NEC)
●NHK放送技術研究所ご紹介・デモ(16:50-17:30)
16:50-17:10 NHK技研全体のご紹介(5分)、スーパーハイビジョン上映(15分)
17:10-17:20 音声認識による字幕制作のデモ(10分)
17:20-17:30 音声合成(株価読み上げなど)のデモ(10分)
★
研究会登録のご案内
年に2回以上の参加を見込まれる方は登録される方が(ほぼ)お得になります.研究会登録は
http://www.ipsj.or.jp/kenkyukai/toroku.html
から行えます.