鵜木 祐史 (UNOKI, Masashi)教授
情報科学系, ヒューマンライフデザイン領域, 情報科学研究科
◆学位
修士(情報科学) 北陸先端科学技術大学院大学
博士(情報科学) 北陸先端科学技術大学院大学
◆職歴
2000 - 2001 : 日本学術振興会特別研究員(DC2)(1998),ATR人間情報通信研究所 客員研究員(1999),ケンブリッジ大学CNBH客員研究員(2000-2001),日本学術振興会特別研究員(PD,北陸先端科学技術大学院大学 情報科学研究科)(1999-2001)
2000 - 2001 : JSPS Research Fellow (DC2)(1998), Visiting researcher, ATR Human Information Processing Laboratories (1999), Visiting Associate, CNBH, Univ. of Cambridge (2000-2001), JSPS Research Fellow (PD)(1999-2001)
◆専門分野
知能ロボティクス, 知覚情報処理, 知能情報学
◆研究キーワード
音声信号処理, 聴覚情景解析, 聴覚モデル, Speech dereverberation, Computational Auditory Scene Analysis, Auditory filterbank, 音響情報ハイディング
◆研究課題
聴覚フィルタバンクの構築
聴覚の優れた機能を末梢から一つ一つ順番に解明していくために、聴覚末梢系における周波数選択性を模擬できる聴覚フィルタバンクが必要とされている。本研究では、心理物理データと生理学データの両者を包括的に説明し得る聴覚フィルタバンク(gammachirp auditory filterbank)を構築する。このフィルタバンクは、一種の信号分析系であるため、人間の聴知覚特性をより的確に反映した新しい音響信号処理技術の開発に幅広く貢献できることが期待される。
聴覚的音分離の計算理論に関する研究
聴覚の計算理論を構築しようとする研究は、聴覚に関する心理学的知見や生理学的知見と工学的応用の橋渡しをする原理を解明するための重要な位置にある。本研究は、計算論的聴覚情景解析のアプローチから、聴覚系でどのような(心理学的・生理学的・数理工学的)制約条件を設ければ、音分離を実現できるかを、アルゴリズムに捕われずに一段上のレベルにある計算理論の立場から検討するものである。
雑音・残響にロバストな基本周波数推定法の研究
音声信号処理技術において、観測波形から正確な基本周波数を推定することは極めて重要な課題である。しかし、基本周波数を表す声帯振動を直接観測することができないという生成側の問題や、雑音や残響の影響があるという観測側の問題により、現在でもまだ完全には実現されていない。本研究では、計算論的聴覚情景解析(CASA)の考えに基づき、クリーンなときだけでなく実環境でも観測信号から正確に基本周波数を推定できる方法を確立する。
残響音声回復法の研究
残響音声信号を回復する研究は、音声認識や拡声会議通話システム、補聴システムといった音声信号処理で非常に重要な課題となっている。これまでに提案された多くの方法は、室内音響の伝達特性を事前に測定し、その逆特性を利用することで残響音声の回復処理を実現してきた。しかし、実際の室内伝達特性は、時々刻々、環境の様々な変化とともに変動するため、その都度、伝達特性を測定し、適応的に処理しなければならない。本研究では、室内伝達特性を測定することなく、適応的に残響音声の回復を可能とする方法を検討し、実時間処理への応用を狙ったモデルの構築を目指す。

■研究業績

◆発表論文
Speech Emotion Recognition Using 3D Convolutions and Attention-Based Sliding Recurrent Networks with Auditory Front-Ends
Zhichao Peng, Xingfeng Li, Zhi Zhu, Masashi Unoki, Jianwu Dang, Masato Akagi
IEEE Access, 8, 16560-16572, 2020
Presentation effect of cue tone on tuning of auditory filter for several frequencies
Shunsuke Kidani, Ryota Miyauchi, Masashi Unoki
Acoustical Science and Technology, 41, 1, 378-379, 2020
Non-blind speech watermarking method based on spread-spectrum using linear prediction residue
Reiya Namikawa, Masashi Unoki
IEICE Transactions on Information and Systems, E103D, 1, 63-66, 2020
Speech watermarking based on source-filter model of speech production
Shengbei Wang, Weitao Yuan, Jianming Wang, Masashi Unoki
Journal of Information Hiding and Multimedia Signal Processing, 10, 4, 517-534, 2019
◆Misc
室内インパルス応答のモデル化とその室内音響特性の検討 (応用音響)
鵜木 祐史, 石川 大介, 柏原 佑太, 小林 まおり, 赤木 正人
電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 116, 302, 79-84, 2016
評価指標間の相関に基づく局面の難易度推定
竹内 章, 鵜木 祐史, 飯田 弘之
情報処理学会研究報告. GI, [ゲーム情報学], 2015, 13, 1-7, 2015
Study on blind method speech transmission index from noisy reverberant amplitude-modulated -signal
A. Miyazaki, S. Morita, M. Unoki
2014 RISP International Workshop on Nonlinear Circuits, Communications and Signal Processing (NCSP’14), 105-108, 2014
A modulation-transfer-function-based method for restores sub-band power envelope from noisy reverberant speech
S. Morita, X. Lu, M. Unoki, M. Akagi, R. Hoffmann
The Acoustics 2012 Hong Kong Conference and exhibition, -, 2012
音響信号に対する情報ハイディング及びその評価基準の検討 (マルチメディア情報ハイディング・エンリッチメント)
西村 明, 荻原 昭夫, 鵜木 祐史, 近藤 和弘, 薗田 光太郎, 岩村 惠市, 立花 隆輝
電子情報通信学会技術研究報告 : 信学技報, 111, 334, 31-36, 2011
◆書籍
音響情報ハイディング
コロナ社 ISBN:978-4-339-01135-7., 2018
「マスキング」,音響キーワードブック 日本音響学会編
コロナ社ISBN:978-4-339-00880-7, 2016
Method of Digital-Audio Watermarking Based on Cochlear Delay Characteristics, Multimedia Information Hiding Technologies and Methodologies for Controlling Data, Ed. Kazuhiko Kondo, Chapter 2
pp. 42-70, IGI Global, 2012
聴覚モデル
コロナ社, 2011
◆講演・口頭発表
Noise Suppression Method Based on Modulation Spectrum Analysis
20th International Conference on Speech and Computer SPECOM 2018 (SPECOM2018), Leipzig, Germany, 2018
Auditory-inspired end-to-end speech emotion recognition using 3D convolutional recurrent neural networks based on spectral-temporal modulation
IEEE International Conference on Multimedia and Expo (ICMC2018), San Diego, CA, USA, 2018
Speech watermarking based on robust principal component analysis and formant manipulations
2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2018), Calgary, Canada, 2018
線形予測符号化方式におけるスペクトル拡散型音声電子透かしの検討
IEICE Technical Report, EMM2017-79, pp. 13-16, 奄美市名瀬公民館, 2018
雑音環境が駆動声の個人性・感情知覚に与える影響
日本音響学会聴覚研究会資料, vol. 48, no. 2, H-2018-35, pp. 175-180, 那覇, 2018

■担当講義

Discrete Signal Processing, Human Perceptual Systems and its Models, Statistical Signal Processing, 離散信号処理特論, 知覚情報処理特論, 統計的信号処理特論

■学外活動

◆所属学会
信号処理学会, International Speech Communication Association, 電子情報通信学会, 日本音響学会, Research Institute of Signal Processing, Japan, Information and Communication Engineers, Institute of Electronics, The Acoustical Society of Japan, Institute of Electrical and Electronics Engineers, 米国音響学会
◆学術貢献活動
2017 International Workshop on Nonlinear Circuits and Signal Processing (NCSP17) Committee member (General Chair) , JAIST, Prof. Unoki Masashi , 2017 - 2017 , Guam, USA
2016 International Workshop on Nonlinear Circuits and Signal Processing (NCSP16) Committee member (General Vice Chair) , RISP , 2016 - 2016 , Honolulu, Hawaii, USA
The 14th IWDW, International Workshop on Digital-forensics and Watermarking (IWDW 2015) , Organizaing committee, , 2015 - 2015 , Tokyo University of Sciences

■賞等

・ Best paper award , 鵜木 祐史 , 11th International Conference on Social Computing and Social Media (SCSM 2019) , 2019
・ Best paper award , 鵜木 祐史 , 14th International Conference on Intelligent Information Hiding and Multimedia Signal Processing (II , 2018
・ 平成30年度支部学会活動貢献賞 , 日本音響学会北陸支部 , 2018