第129回音声言語情報処理研究会 (SIG-SLP)


============================================================================

 音声言語情報処理研究会(音声言語情報処理技術デベロッパーズフォーラム)

============================================================================

●日時:2019年10月11日(金)
●会場:キャンパスプラザ京都
    〒600-8216 京都市下京区西洞院通塩小路下る東塩小路町939
    
●主催:情報処理学会 音声言語情報処理研究会(SLP)

●発表申込締切:2019年8月23日(金)延長しました
●原稿締切:2019年9月18日(水) ※厳守

●募集内容
 10月のSLP研究会は,「音声言語情報処理技術デベロッパーズフォーラム」と
題し,音声認識・合成・対話などの音声言語情報処理技術の実用化と普及をスコ
ープとした情報交換や議論の活性化を目指して企画しております.本企画は2005
年に始まり本年度で15回目の開催となります.今回は初めて場所を関西に移して
の開催です.世の中ではスマートスピーカーやスマートフォンで当たりまえのよ
うに音声インターフェースが使われるようになり,家庭にも音声言語情報処理技
術が入り込んできています.本研究会では,幅広い分野での音声言語情報処理技
術の応用例を紹介いただき,導入事例と実用化を成功に導いたポイント,それを
取り巻くビジネスについての議論を深め,研究コミュニティと様々な事業との橋
渡しの場を提供できればと考えております.実用化とビジネス展開に関わる企業
の方々の発表をはじめ,応用を視野に入れた実験システムの開発事例に関する発
表も募集します.
 また上記に限らず,音声認識・音声言語理解・音声合成・音声対話・話し言葉・
音声ドキュメント処理・音声言語翻訳・言語学習支援・韻律・非言語情報・マル
チモーダル・マルチメディア・音声インタフェース・音声言語コーパスなど,基
礎技術から応用システムまで,音声言語情報処理に関わる一般の研究発表も広く
募集いたします.

●招待講演「DCASE 2018 Challenge Task 5における日立のプラクティスとその後の取組み」
 日立製作所の川口様より,DCASE2018のマルチチャンネル音響イベント検知タ
スクで1位となったシステムについてご講演いただく予定です.音響イベント検出
は音声信号処理技術と共通する点が多いため,音声言語処理にも活かせる知見を
ご紹介いただけると思います.

 音響シーン識別とイベント検出の国際コンペティションDCASE 2018 Challenge
において、日立チームはTask 5に参加し、同率1位の精度を達成した。本発表では、
コンペ参加の狙いとプラクティスについて紹介する。また、この結果を受けて
取り組んでいるその後の活動についても紹介する。

●招待講演「補聴器の小型化を支える信号処理技術」
 リオン株式会社の春原様より,補聴器のための信号処理技術についてご講演い
ただく予定です.補聴器という限られた計算機リソースのための信号処理という
観点で音声言語処理にも活かせる知見をご紹介いただけると思います.

 小型化は補聴器にとって重要な課題の一つである。未だに多くの難聴者は
「補聴器を装用していることを人に知られたくない」という気持ちを有しており、
補聴器の普及を妨げている要因の一つとなっている。小型化が進むことで、
目立たない補聴器を実現できるだけではなく、デザイン性の高い形状の実現にも
貢献できるといえる。一方で、小型化を達成するためには機構設計の高度化は
もちろん、低消費電力化へ配慮等、様々な技術的な制約をクリアしなければならない。
本発表では、補聴器の小型化を支える各種技術の中で、信号処理が果たしている
役割を中心に紹介する。

●チュートリアル講演「音声波形直接生成モデル「ニューラルボコーダ」の比較」
 NICTの岡本様より,今注目を集めているニューラルボコーダー(waveNet,waveGlow等)
の最近の技術動向に関して,チュートリアル講演をいただく予定です.

 2016年までの統計的テキスト音声合成や声質変換では,ニューラルネットワークに
基づく音響モデルを用いたとしても,ソースフィルタモデルに基づくボコーダによる
音質劣化が肉声感を阻む大きな壁となっていた.2016年9月,WaveNetからはじまる
ニューラルボコーダの登場により,言語特徴量や音響特徴量からニューラルネットに
より音声波形を直接合成できるようになり,Tacotron 2においては,ついに自然音声と
区別のつかない品質の英語テキスト音声合成が実現された.現在,ニューラルボコーダは
音声合成における基盤技術となり,様々な方式が提案されている.本チュートリアルでは,
WaveNetの登場から最先端のリアルタイムニューラルボコーダまでを紹介し,合成精度,
合成速度,モデルサイズ,学習難易度,学習時間等の観点からの比較を行う.

●ショートオーラル発表
 発表時間を通常の25分+5分(質疑)に加えて,10分/15分/20分+5分(質疑)から自由
に選択いただけます.構想段階の研究や,実験の報告などにお使いください.

●発表申込先:
 こちらのサイトからお申し込みください.


●動画中継
 今回の研究会では,インターネットを利用した研究発表の動画配信を行う予定
です.なお,企業からの発表など,動画配信をしない,閉じた発表の方がより密度
の高い発表ができる場合もあるかと思います.その場合には,積極的に動画配信を
せずに,会場で深い議論を展開し,聴講者と意見交換して頂ければと考えています.
動画配信の可否は当日担当者にお申し出下さい.
ライブ中継した画像は研究会終了後に編集してYouTubeで限定公開します.
(ただし,研究会として不適切と判断したものについては削除することがあります.)

●問い合わせ先
 太刀岡勇気(デンソーアイティーラボラトリ) ytachioka[AT]d-itlab.co.jp
 ※[AT]は@に直してください.


●研究報告のペーパーレス化
本研究会はペーパーレスでの開催となり,印刷した研究報告の配布を行い
ません.また,特許出願の公知日(研究報告の公開日)が従来より1週間
早まりますので,ご留意ください.

※音声言語情報処理研究会に登録されている方
研究報告は研究発表会の1週間前に電子図書館と当日閲覧用サイトで公開
します.当日は資料をプリントアウトしてご持参いただくか,ご自身の
PCにダウンロードのうえ,ご持参ください.

情報処理学会電子図書館(情報学広場)
 (ユーザ登録が必要です)
当日閲覧用サイト


※音声言語情報処理研究会に登録されていない方
当日受付で本研究発表会の資料閲覧用にUSBメモリを貸し出します.
当日はノートPC等をご持参ください.なお,当研究会にご登録頂くことで,
本研究会の資料をバックナンバーも含めて電子図書館で購読できます.
登録されていない方は,是非この機会に研究会に登録してください
(登録まで最大3日かかりますのでご留意ください).

●研究会への登録をお勧めします
年に2回以上の参加を見込まれる方は,研究会に登録される方が(ほぼ)
お得になります.研究会登録は以下のウェブサイトから行えます.
http://www.ipsj.or.jp/kenkyukai/toroku.html

●受け付けは先着順で行なっております
多数のお申し込みを頂いた場合,次回の研究会にまわって頂くようお願いする
場合があります.なるべく早めにお申し込み下さい.

●締め切り後の発表キャンセルは原則としてできません
発表申し込み後にキャンセルの必要が生じた場合は,至急ご連絡ください.
発表申込後,原稿提出締め切りまでに原稿が到着しない場合には,幹事団の
判断により発表を取り消しさせていただくこともあります.

●論文提出締切後の原稿差し替えはできません
論文提出締切後は,訂正版のアップロードやウェブ上での配布などの原稿
差し替えは一切できませんので,予めご留意ください.
※正誤表の掲載が可能な場合がありますのでご相談ください.

●情報処理学会 音声言語情報処理研究会(SLP)
 主査: 西村 雅史 (静岡大学)
 幹事: 塩田 さやか (首都大学東京), 俵 直弘 (NTT),
    秋田 祐哉 (京都大学), 太刀岡 勇気 (デンソーアイティーラボラトリ)