鵜木 祐史 (Masashi Unoki)教授
情報科学系,ヒューマンライフデザイン領域
◆学位
修士(情報科学) 北陸先端科学技術大学院大学
博士(情報科学) 北陸先端科学技術大学院大学
◆職歴
2000 - 2001 : 日本学術振興会特別研究員(DC2)(1998),ATR人間情報通信研究所 客員研究員(1999),ケンブリッジ大学CNBH客員研究員(2000-2001),日本学術振興会特別研究員(PD,北陸先端科学技術大学院大学 情報科学研究科)(1999-2001)
◆専門分野
聴覚モデル、音響情報ハイディング,音声信号処理
◆研究キーワード
音響情報ハイディング, 聴覚モデル, 聴覚情景解析, 音声信号処理
◆研究課題
聴覚フィルタバンクの構築
聴覚の優れた機能を末梢から一つ一つ順番に解明していくために、聴覚末梢系における周波数選択性を模擬できる聴覚フィルタバンクが必要とされている。本研究では、心理物理データと生理学データの両者を包括的に説明し得る聴覚フィルタバンク(gammachirp auditory filterbank)を構築する。このフィルタバンクは、一種の信号分析系であるため、人間の聴知覚特性をより的確に反映した新しい音響信号処理技術の開発に幅広く貢献できることが期待される。
聴覚的音分離の計算理論に関する研究
聴覚の計算理論を構築しようとする研究は、聴覚に関する心理学的知見や生理学的知見と工学的応用の橋渡しをする原理を解明するための重要な位置にある。本研究は、計算論的聴覚情景解析のアプローチから、聴覚系でどのような(心理学的・生理学的・数理工学的)制約条件を設ければ、音分離を実現できるかを、アルゴリズムに捕われずに一段上のレベルにある計算理論の立場から検討するものである。
雑音・残響にロバストな基本周波数推定法の研究
音声信号処理技術において、観測波形から正確な基本周波数を推定することは極めて重要な課題である。しかし、基本周波数を表す声帯振動を直接観測することができないという生成側の問題や、雑音や残響の影響があるという観測側の問題により、現在でもまだ完全には実現されていない。本研究では、計算論的聴覚情景解析(CASA)の考えに基づき、クリーンなときだけでなく実環境でも観測信号から正確に基本周波数を推定できる方法を確立する。
残響音声回復法の研究
残響音声信号を回復する研究は、音声認識や拡声会議通話システム、補聴システムといった音声信号処理で非常に重要な課題となっている。これまでに提案された多くの方法は、室内音響の伝達特性を事前に測定し、その逆特性を利用することで残響音声の回復処理を実現してきた。しかし、実際の室内伝達特性は、時々刻々、環境の様々な変化とともに変動するため、その都度、伝達特性を測定し、適応的に処理しなければならない。本研究では、室内伝達特性を測定することなく、適応的に残響音声の回復を可能とする方法を検討し、実時間処理への応用を狙ったモデルの構築を目指す。

■研究業績

◆発表論文
Semi-fragile speech watermarking based on singular-spectrum analysis with CNN-based parameter estimation for tampering detection
Galajit Kasorn, Karnjana Jessada, Unoki Masashi, Aimmanee Pakinee
APSIPA TRANSACTIONS ON SIGNAL AND INFORMATION PROCESSING, 8, -, 2019/04/16
Digital audio watermarking method based on singular spectrum analysis with automatic parameter estimation using a convolutional neural network
Kasorn Galajit, Jessada Karnjana, Pakinee Aimmanee, Masashi Unoki
Smart Innovation, Systems and Technologies, 110, 63-73, 2019/01/01
Enhanced feature network for monaural singing voice separation.
Weitao Yuan,Boxin He,Shengbei Wang,Jianming Wang,Array
Speech Communication, 106, 1-6, 2019/01
Estimates of Transmission Characteristics Related to Perception of Bone-Conducted Speech Using Real Utterances and Transcutaneous Vibration on Larynx.
Teruki Toya,Peter Birkholz,Masashi Unoki
Speech and Computer - 21st International Conference, SPECOM 2019, Istanbul, Turkey, August 20-25, 2019, Proceedings, 491-500, 2019
Data Augmentation for Monaural Singing Voice Separation Based on Variational Autoencoder-Generative Adversarial Network.
Boxin He,Shengbei Wang,Weitao Yuan,Jianming Wang,Masashi Unoki
IEEE International Conference on Multimedia and Expo, ICME 2019, Shanghai, China, July 8-12, 2019, 1354-1359, 2019
◆Misc
Estimation of fundamental frequency of reverberant speech by utilizing complex cepstrum analysis
Masashi Unoki and Toshihiro Hosorogiya
Journal of Signal Processing, 12, 1, 31-44, 2008
歌声らしさの知覚モデルに基づいた歌声特有の音響特徴量の分析
齋藤毅,辻直也,鵜木祐史,赤木正人
日本音響学会論文誌, 64, 5, 267-277, 2008
A study on audio watermarking method based on the cochlear delay characteristics
Daiki Hamada and Masashi Unoki
J. Signal Processing, 12, 4, 315-318, 2008
A Study on the Blind Estimation of Reverberation Time in Room Acoustics
Sota Hiramatsu and Masashi Unoki
J. Signal Processing, 12, 4, 323-326, 2008
MTFに基づいた残響音声回復法の提案
-, 2003/09
◆書籍
音響情報ハイディング
鵜木祐史,西村竜一,伊藤彰則,西村明,近藤和弘,薗田光太郎, コロナ社 ISBN:978-4-339-01135-7., 2018
「マスキング」,音響キーワードブック 日本音響学会編
鵜木祐史, コロナ社ISBN:978-4-339-00880-7, 2016/03/22
Method of Digital-Audio Watermarking Based on Cochlear Delay Characteristics, Multimedia Information Hiding Technologies and Methodologies for Controlling Data, Ed. Kazuhiko Kondo, Chapter 2
Masashi Unoki and Ryota Miyauchi, IGI Global, 2012
Effects of spatial cues on detectability of alarm signals in noisy environments, PRINCIPLES AND APPLICATIONS OF SPATIAL HEARING, Edited by Yoiti Suzuki, Douglas Brungart, Hiroaki Kato, Kazuhiro Iida, Densil Cabrera, & Yukio Iwaya
Naoki Kuroda, Junfeng Li, Yukio Iwaya, Masashi Unoki, and Masato Akagi, World Scientific,, 2011
聴覚モデル,第5章 音の大きさのモデル(分担執筆)
鵜木祐史,鈴木陽一, コロナ社, 2011
◆講演・口頭発表
Noise Suppression Method Based on Modulation Spectrum Analysis
Takuto Isoyama and Masashi Unoki
20th International Conference on Speech and Computer SPECOM 2018 (SPECOM2018), Leipzig, Germany, 2018/09/24
Auditory-inspired end-to-end speech emotion recognition using 3D convolutional recurrent neural networks based on spectral-temporal modulation
Zhichao Peng, Zhi Zhu, Masashi Unoki, Jianwu Dang, Masato Akagi
IEEE International Conference on Multimedia and Expo (ICMC2018), San Diego, CA, USA, 2018/07
Speech watermarking based on robust principal component analysis and formant manipulations
Shengbei Wang, Weitao Yuan, Jianming Wang, Masashi Unoki
2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2018), Calgary, Canada, 2018/04
発話音声を用いた骨導音声の伝達特性の分析
鳥谷輝樹,Peter Birkholz, 鵜木祐史
IEICE Technical Report, EA2017-167, vol. 117, no. 515, pp. 355-360, 南の美ら花 ホテルミヤヒラ(石垣島), 2018/03
変調スペクトルに着目した騒音抑圧法の検討
磯山拓都,鵜木祐史
IEICE Technical Report, EA2017-168, vol. 117, no. 515, pp.361-366, 南の美ら花 ホテルミヤヒラ(石垣島), 2018/03

■担当講義

知覚情報処理特論, 統計的信号処理特論

■学外活動

◆所属学会
Institute of Electrical and Electronics Engineers, 米国音響学会, 日本音響学会, 電子情報通信学会, International Speech Communication Association, 信号処理学会
◆学術貢献活動
2016 International Workshop on Nonlinear Circuits and Signal Processing (NCSP16) Committee member (General Vice Chair) , RISP , 2016/03/07 - 2016/03/09 , Honolulu, Hawaii, USA
2017 International Workshop on Nonlinear Circuits and Signal Processing (NCSP17) Committee member (General Chair) , JAIST, Prof. Unoki Masashi , 2017/03/01 - 2017/03/04 , Guam, USA
The 14th IWDW, International Workshop on Digital-forensics and Watermarking (IWDW 2015) , Organizaing committee, , 2015/10/07 - 2015/10/10 , Tokyo University of Sciences

■賞等

・ Best paper award , 鵜木 祐史 , 11th International Conference on Social Computing and Social Media (SCSM 2019) , 2019/07
・ Best paper award , 鵜木 祐史 , 14th International Conference on Intelligent Information Hiding and Multimedia Signal Processing (II , 2018/11
・ 平成30年度支部学会活動貢献賞 , 日本音響学会北陸支部 , 2018