研究者詳細 - 篠﨑　隆宏

2026/03/10 更新

写真a

シノザキ　タカヒロ

篠﨑　隆宏

SHINOZAKI TAKAHIRO

所属

工学院教授

外部リンク

学位

博士（学術）（ 2004年3月）

研究キーワード

音声認識
パターン認識
統計モデル

研究分野

情報通信 / 知能ロボティクス

学歴

東京工業大学大学院情報理工学研究科計算工学専攻

- 2004年

　詳細を見る

国名：日本国

researchmap

経歴

東京科学大学工学院情報通信系

2024年7月 - 現在

　詳細を見る

researchmap
東京工業大学工学院情報通信系准教授

2016年4月 - 2024年6月

　詳細を見る

researchmap
東京工業大学大学院総合理工学研究科准教授

2013年3月 - 2016年3月

　詳細を見る

researchmap
千葉大学大学院融合科学研究科助教

2011年4月 - 2013年2月

　詳細を見る

researchmap
東京工業大学大学院情報理工学研究科計算工学専攻助教

2008年10月 - 2011年3月

　詳細を見る

researchmap
:東京工業大学大学院情報理工学研究科特別研究員

2007年 - 2008年

　詳細を見る

researchmap
:京都大学学術情報メディアセンター特任助手

2006年 - 2007年

　詳細を見る

researchmap
:ユニバーシティオブワシントン電気工学科研究員

2004年 - 2006年

　詳細を見る

researchmap

▼全件表示

所属学協会

日本音響学会

　詳細を見る

researchmap
IEEE

　詳細を見る

researchmap
情報処理学会

　詳細を見る

researchmap
International Speech Communication Association

　詳細を見る

researchmap

委員歴

音響学会音声研究会主査

2025年 - 現在

　詳細を見る

researchmap
情報処理学会/電子情報通信学会音声言語情報処理研究会/音声研究会主査

2024年 - 現在

　詳細を見る

researchmap
日本学術会議計算音響学小委員会

2021年2月 - 現在

　詳細を見る

団体区分：政府

researchmap
情報処理学会 JIP編集委員

2020年6月 - 現在

　詳細を見る

団体区分：学協会

researchmap
電子情報通信学会 ISS誌編集委員（SP担当）

2012年6月 - 現在

　詳細を見る

団体区分：学協会

researchmap

論文

Spolacq-GDS: 有限状態オートマトンと大規模生成モデルを用いた生成的対話シミュレータ

豊崎玲音, 御厨洸貴, 淡島大晴, 川北晃太, 篠崎隆宏

日本音響学会2025年春季研究発表会講演論文集 2025年3月

　詳細を見る

記述言語：日本語掲載種別：研究論文（研究会，シンポジウム資料等）

researchmap
Speaker-Disentangled HuBERT を用いた教師なし音節発見法の分析評価

川北晃太, 小松亮太, 岡本拓磨, 篠崎隆宏

日本音響学会2025年春季研究発表会講演論文集 2025年3月

　詳細を見る

記述言語：日本語

researchmap
Spolacq-GDS を用いた音声言語獲得に関する予備実験

淡島大晴, 豊崎玲音, 御厨洸貴, 川北晃太, 篠崎隆宏

日本音響学会2025年春季研究発表会講演論文集 2025年3月

　詳細を見る

記述言語：日本語掲載種別：研究論文（研究会，シンポジウム資料等）

researchmap
Deep Generic Representations for Domain-Generalized Anomalous Sound Detection.

Phurich Saengthong, Takahiro Shinozaki

ICASSP 1 - 5 2025年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/ICASSP49660.2025.10887974

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/icassp/icassp2025.html#SaengthongS25
Multi-Domain Dialogue State Tracking with Large Language Model Rationale and Disentangled Domain-Slot Attention

Longfei Yang, Jiyi Li, Sheng Li, Takahiro Shinozaki

IEEE Transactions on Audio, Speech and Language Processing 1 - 14 2025年

　詳細を見る

掲載種別：研究論文（学術雑誌）出版者・発行元：Institute of Electrical and Electronics Engineers (IEEE)

DOI： 10.1109/taslpro.2025.3604650

researchmap
Self-Supervised Syllable Discovery Based on Speaker-Disentangled Hubert.

Ryota Komatsu, Takahiro Shinozaki

SLT 1131 - 1136 2024年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/SLT61566.2024.10832325

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/slt/slt2024.html#KomatsuS24
Self-Supervised Speaker Verification with Adaptive Threshold and Hierarchical Training.

Zehua Zhou, Haoyuan Yang, Takahiro Shinozaki

IEEE International Conference on Acoustics, Speech and Signal Processing(ICASSP) 12141 - 12145 2024年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/ICASSP48485.2024.10448455

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/icassp/icassp2024.html#ZhouYS24
Learning from "Silly" Questions Improves Large Language Models, But Only Slightly.

Tingyuan Zhu, Shudong Liu 0004, Yidong Wang, Derek F. Wong, Han Yu 0001, Takahiro Shinozaki, Jindong Wang 0001

CoRR abs/2411.14121 2024年

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.48550/arXiv.2411.14121

researchmap
Deep Generic Representations for Domain-Generalized Anomalous Sound Detection.

Phurich Saengthong, Takahiro Shinozaki

CoRR abs/2409.05035 2024年

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.48550/arXiv.2409.05035

researchmap
Self-Supervised Syllable Discovery Based on Speaker-Disentangled HuBERT.

Ryota Komatsu, Takahiro Shinozaki

CoRR abs/2409.10103 2024年

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.48550/arXiv.2409.10103

researchmap
Continuous Action Space-Based Spoken Language Acquisition Agent Using Residual Sentence Embedding and Transformer Decoder.

Ryota Komatsu, Yusuke Kimura, Takuma Okamoto, Takahiro Shinozaki

IEEE International Conference on Acoustics, Speech and Signal Processing ICASSP 2023(ICASSP) 1 - 5 2023年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/ICASSP49357.2023.10096250

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/icassp/icassp2023.html#KomatsuKOS23
FreeMatch: Self-adaptive Thresholding for Semi-supervised Learning.

Yidong Wang, Hao Chen 0102, Qiang Heng, Wenxin Hou, Yue Fan, Zhen Wu 0002, Jindong Wang 0001, Marios Savvides, Takahiro Shinozaki, Bhiksha Raj, Bernt Schiele, Xing Xie 0001

The Eleventh International Conference on Learning Representations(ICLR) 2023年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：OpenReview.net

researchmap

その他リンク： https://dblp.uni-trier.de/rec/conf/iclr/2023
Streaming End-to-End Target-Speaker Automatic Speech Recognition and Activity Detection.

Takafumi Moriya, Hiroshi Sato, Tsubasa Ochiai, Marc Delcroix, Takahiro Shinozaki

IEEE Access 11 13906 - 13917 2023年

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.1109/ACCESS.2023.3243690

researchmap
Multi-Domain Dialogue State Tracking with Disentangled Domain-Slot Attention.

Longfei Yang, Jiyi Li, Sheng Li 0010, Takahiro Shinozaki

Findings of the Association for Computational Linguistics: ACL 2023 4928 - 4938 2023年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：Association for Computational Linguistics

DOI： 10.18653/v1/2023.findings-acl.304

researchmap

その他リンク： https://dblp.uni-trier.de/rec/conf/acl/2023f
Memory Network-Based End-To-End Neural ES-KMeans for Improved Word Segmentation.

Yu Iwamoto, Takahiro Shinozaki

24th Annual Conference of the International Speech Communication Association(INTERSPEECH) 486 - 490 2023年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

DOI： 10.21437/Interspeech.2023-1251

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/interspeech/interspeech2023.html#IwamotoS23
Augmented Adversarial Self-Supervised Learning for Early-Stage Alzheimer's Speech Detection 査読

Longfei Yang, Wenqing Wei, Sheng Li, Jiyi Li, Takahiro Shinozaki

in Proc. INTERSPEECH 541 - 545 2022年9月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.21437/Interspeech.2022-943

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/interspeech/interspeech2022.html#YangW0LS22
Self-Adaptive Multilingual ASR Rescoring with Language Identification and Unified Language Model 査読

Zhuo Gong, Daisuke Saito, Longfei Yang, Takahiro Shinozaki, Sheng Li, Hisashi Kawai, Nobuaki Minematsu

The Speaker and Language Recognition Workshop (Odyssey 2022) 415 - 420 2022年6月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.21437/odyssey.2022-58

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/odyssey/odyssey2022.html#GongSYS0KM22
USB: A Unified Semi-supervised Learning Benchmark for Classification.

Yidong Wang, Hao Chen 0102, Yue Fan, Wang Sun, Ran Tao 0013, Wenxin Hou, Renjie Wang, Linyi Yang, Zhi Zhou 0007, Lan-Zhe Guo, Heli Qi, Zhen Wu 0002, Yufeng Li 0008, Satoshi Nakamura 0001, Wei Ye 0004, Marios Savvides, Bhiksha Raj, Takahiro Shinozaki, Bernt Schiele, Jindong Wang 0001, Xing Xie 0001, Yue Zhang 0004

Advances in Neural Information Processing Systems 35: Annual Conference on Neural Information Processing Systems 2022(NeurIPS) 2022年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

researchmap

その他リンク： https://dblp.uni-trier.de/rec/conf/nips/2022
Multi-Domain Dialogue State Tracking with Top-K Slot Self Attention.

Longfei Yang, Jiyi Li, Sheng Li 0010, Takahiro Shinozaki

Proceedings of the 23rd Annual Meeting of the Special Interest Group on Discourse and Dialogue(SIGDIAL) 231 - 236 2022年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：Association for Computational Linguistics

DOI： 10.18653/v1/2022.sigdial-1.24

researchmap

その他リンク： https://dblp.uni-trier.de/rec/conf/sigdial/2022
Exploiting Unlabeled Data for Target-Oriented Opinion Words Extraction.

Yidong Wang, Hao Wu 0059, Ao Liu 0008, Wenxin Hou, Zhen Wu 0002, Jindong Wang 0001, Takahiro Shinozaki, Manabu Okumura, Yue Zhang 0004

CoRR abs/2208.08280 2022年

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.48550/arXiv.2208.08280

researchmap
USB: A Unified Semi-supervised Learning Benchmark.

Yidong Wang, Hao Chen 0102, Yue Fan, Wang Sun, Ran Tao 0013, Wenxin Hou, Renjie Wang, Linyi Yang, Zhi Zhou 0007, Lan-Zhe Guo, Heli Qi, Zhen Wu 0002, Yufeng Li 0008, Satoshi Nakamura 0001, Wei Ye 0004, Marios Savvides, Bhiksha Raj, Takahiro Shinozaki, Bernt Schiele, Jindong Wang 0001, Xing Xie 0001, Yue Zhang 0004

CoRR abs/2208.07204 2022年

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.48550/arXiv.2208.07204

researchmap
Streaming Target-Speaker ASR with Neural Transducer.

Takafumi Moriya, Hiroshi Sato, Tsubasa Ochiai, Marc Delcroix, Takahiro Shinozaki

CoRR abs/2209.04175 2022年

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.48550/arXiv.2209.04175

researchmap
Automatic Spoken Language Acquisition Based on Observation and Dialogue.

Ryota Komatsu, Shengzhou Gao, Wenxin Hou, Mingxin Zhang 0008, Tomohiro Tanaka, Keisuke Toyoda, Yusuke Kimura, Kent Hino, Yu Iwamoto, Kosuke Mori, Takuma Okamoto, Takahiro Shinozaki

IEEE Journal of Selected Topics in Signal Processing 16 ( 6 ) 1480 - 1492 2022年

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.1109/JSTSP.2022.3189279

researchmap
Exploiting Adapters for Cross-Lingual Low-Resource Speech Recognition.

Wenxin Hou, Han Zhu 0004, Yidong Wang, Jindong Wang 0001, Tao Qin 0001, Renjun Xu, Takahiro Shinozaki

IEEE/ACM Transactions on Audio, Speech and Language Processing 30 317 - 329 2022年

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.1109/TASLP.2021.3138674

researchmap
Margin Calibration for Long-Tailed Visual Recognition.

Yidong Wang, Bowen Zhang, Wenxin Hou, Zhen Wu 0002, Jindong Wang 0001, Takahiro Shinozaki

Asian Conference on Machine Learning(ACML) 1101 - 1116 2022年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：PMLR

researchmap

その他リンク： https://dblp.uni-trier.de/rec/conf/acml/2022
Exploiting Unlabeled Data for Target-Oriented Opinion Words Extraction.

Yidong Wang, Hao Wu 0059, Ao Liu 0008, Wenxin Hou, Zhen Wu 0002, Jindong Wang 0001, Takahiro Shinozaki, Manabu Okumura, Yue Zhang 0004

Proceedings of the 29th International Conference on Computational Linguistics(COLING) 7075 - 7085 2022年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：International Committee on Computational Linguistics

researchmap

その他リンク： https://dblp.uni-trier.de/rec/conf/coling/2022
Streaming Target-Speaker ASR with Neural Transducer.

Takafumi Moriya, Hiroshi Sato, Tsubasa Ochiai, Marc Delcroix, Takahiro Shinozaki

23rd Annual Conference of the International Speech Communication Association(INTERSPEECH) 2673 - 2677 2022年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

DOI： 10.21437/Interspeech.2022-11425

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/interspeech/interspeech2022.html#MoriyaSODS22
Self-Supervised Learning with Multi-Target Contrastive Coding for Non-Native Acoustic Modeling of Mispronunciation Verification.

Longfei Yang, Jinsong Zhang 0001, Takahiro Shinozaki

23rd Annual Conference of the International Speech Communication Association(INTERSPEECH) 4312 - 4316 2022年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

DOI： 10.21437/Interspeech.2022-207

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/interspeech/interspeech2022.html#Yang0S22
Hybrid RNN-T/Attention-Based Streaming ASR with Triggered Chunkwise Attention and Dual Internal Language Model Integration.

Takafumi Moriya, Takanori Ashihara, Atsushi Ando, Hiroshi Sato, Tomohiro Tanaka, Kohei Matsuura, Ryo Masumura, Marc Delcroix, Takahiro Shinozaki

IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2022, Virtual and Singapore(ICASSP) 8282 - 8286 2022年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/ICASSP43922.2022.9746428

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/icassp/icassp2022.html#MoriyaAASTMMDS22
Censer: Curriculum Semi-supervised Learning for Speech Recognition Based on Self-supervised Pre-training.

Bowen Zhang, Songjun Cao, Xiaoming Zhang, Yike Zhang, Long Ma, Takahiro Shinozaki

23rd Annual Conference of the International Speech Communication Association(INTERSPEECH) 2653 - 2657 2022年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

DOI： 10.21437/Interspeech.2022-10226

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/interspeech/interspeech2022.html#ZhangCXZMS22
FreeMatch: Self-adaptive Thresholding for Semi-supervised Learning.

Yidong Wang, Hao Chen 0102, Qiang Heng, Wenxin Hou, Yue Fan, Zhen Wu 0002, Marios Savvides, Takahiro Shinozaki, Bhiksha Raj, Bernt Schiele

CoRR abs/2205.07246 2022年

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.48550/arXiv.2205.07246

researchmap
Censer: Curriculum Semi-supervised Learning for Speech Recognition Based on Self-supervised Pre-training.

Bowen Zhang, Songjun Cao, Xiaoming Zhang, Yike Zhang, Long Ma, Takahiro Shinozaki

CoRR abs/2206.08189 2022年

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.48550/arXiv.2206.08189

researchmap
Non-native acoustic modeling for mispronunciation verification based on language adversarial representation learning

Longfei Yang, Kaiqi Fu, Jinsong Zhang, Takahiro Shinozaki

Neural Networks 142 597 - 607 2021年10月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）出版者・発行元：Elsevier Ltd

DOI： 10.1016/j.neunet.2021.07.017

Scopus

PubMed

researchmap
Unsupervised Acoustic-To-Articulatory Inversion Neural Network Learning Based on Deterministic Policy Gradient 査読

Hayato Shibata, Mingxin Zhang, Takahiro Shinozaki

IEEE Spoken Language Technology2021 530 - 537 2021年1月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/SLT48900.2021.9383554

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/slt/slt2021.html#ShibataZS21
Unsupervised Sound Source Localization From Audio-Image Pairs Using Input Gradient Map 査読

Tomohiro Tanaka, Takahiro Shinozaki

ICPR2020 6501 - 6508 2021年1月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/ICPR48806.2021.9412062

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/icpr/icpr2020.html#TanakaS20
Cross-domain Speech Recognition with Unsupervised Character-level Distribution Matching.

Wenxin Hou, Jindong Wang 0001, Xu Tan 0003, Tao Qin 0001, Takahiro Shinozaki

CoRR abs/2104.07491 2021年

　詳細を見る

掲載種別：研究論文（学術雑誌）

researchmap

その他リンク： https://dblp.uni-trier.de/db/journals/corr/corr2104.html#abs-2104-07491
Exploiting Adapters for Cross-lingual Low-resource Speech Recognition.

Wenxin Hou, Han Zhu 0004, Yidong Wang, Jindong Wang 0001, Tao Qin 0001, Renjun Xu, Takahiro Shinozaki

CoRR abs/2105.11905 2021年

　詳細を見る

掲載種別：研究論文（学術雑誌）

researchmap

その他リンク： https://dblp.uni-trier.de/db/journals/corr/corr2105.html#abs-2105-11905
FlexMatch: Boosting Semi-Supervised Learning with Curriculum Pseudo Labeling.

Bowen Zhang, Yidong Wang, Wenxin Hou, Hao Wu 0059, Jindong Wang 0001, Manabu Okumura, Takahiro Shinozaki

Advances in Neural Information Processing Systems 34: Annual Conference on Neural Information Processing Systems 2021(NeurIPS) 18408 - 18419 2021年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

researchmap

その他リンク： https://dblp.uni-trier.de/rec/conf/nips/2021
Self-Supervised Spoken Question Understanding and Speaking with Automatic Vocabulary Learning.

Keisuke Toyoda, Yusuke Kimura, Mingxin Zhang 0008, Kent Hino, Kosuke Mori, Takahiro Shinozaki

24th Conference of the Oriental COCOSDA International Committee for the Co-ordination and Standardisation of Speech Databases and Assessment Techniques(O-COCOSDA) 37 - 42 2021年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/O-COCOSDA202152914.2021.9660413

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/ococosda/ococosda2021.html#ToyodaKZHMS21
FlexMatch: Boosting Semi-Supervised Learning with Curriculum Pseudo Labeling.

Bowen Zhang, Yidong Wang, Wenxin Hou, Hao Wu 0059, Jindong Wang 0001, Manabu Okumura, Takahiro Shinozaki

CoRR abs/2110.08263 2021年

　詳細を見る

掲載種別：研究論文（学術雑誌）

researchmap

その他リンク： https://dblp.uni-trier.de/db/journals/corr/corr2110.html#abs-2110-08263
Margin Calibration for Long-Tailed Visual Recognition.

Yidong Wang, Bowen Zhang, Wenxin Hou, Zhen Wu 0002, Jindong Wang 0001, Takahiro Shinozaki

CoRR abs/2112.07225 2021年

　詳細を見る

掲載種別：研究論文（学術雑誌）

researchmap

その他リンク： https://dblp.uni-trier.de/db/journals/corr/corr2112.html#abs-2112-07225
Meta-adapter: Efficient cross-lingual adaptation with meta-learning

Wenxin Hou, Yidong Wang, Shengzhou Gao, Takahiro Shinozaki

ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings 2021- 7028 - 7032 2021年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：Institute of Electrical and Electronics Engineers Inc.

DOI： 10.1109/ICASSP39728.2021.9414959

Scopus

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/icassp/icassp2021.html#HouWGS21
Low-Resource Mandarin Prosodic Structure Prediction Using Self-Training.

Xingrui Wang, Bowen Zhang, Takahiro Shinozaki

Asia-Pacific Signal and Information Processing Association Annual Summit and Conference 859 - 863 2021年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

researchmap

その他リンク： https://dblp.uni-trier.de/rec/conf/apsipa/2021
Unsupervised Spoken Term Discovery Using wav2vec 2.0.

Yu Iwamoto, Takahiro Shinozaki

Asia-Pacific Signal and Information Processing Association Annual Summit and Conference 1082 - 1086 2021年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

researchmap

その他リンク： https://dblp.uni-trier.de/rec/conf/apsipa/2021
Cross-Domain Speech Recognition with Unsupervised Character-Level Distribution Matching.

Wenxin Hou, Jindong Wang 0001, Xu Tan 0003, Tao Qin 0001, Takahiro Shinozaki

22nd Annual Conference of the International Speech Communication Association(Interspeech) 3425 - 3429 2021年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

DOI： 10.21437/Interspeech.2021-57

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/interspeech/interspeech2021.html#HouW0QS21
Pronunciation Erroneous Tendency Detection with Language Adversarial Represent Learning 査読

Longfei Yang, Kaiqi Fu, Jinsong Zhang, Takahiro Shinozaki

Interspeech 2020 3042 - 3046 2020年10月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

DOI： 10.21437/Interspeech.2020-2033

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/interspeech/interspeech2020.html#YangFZS20
Time-Domain Target-Speaker Speech Separation With Waveform-Based Speaker Embedding 査読

Jianshu Zhao, Shengzhou Gao, Takahiro Shinozaki

Interspeech 2020 4183 - 4187 2020年10月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

DOI： 10.21437/Interspeech.2020-2108

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/interspeech/interspeech2020.html#ZhaoGS20
Large-Scale End-to-End Multilingual Speech Recognition and Language Identification with Multi-Task Learning 査読

Wenxin Hou, Yue Dong, Bairong Zhuang, Longfei Yang, Jiatong Shi, Takahiro Shinozaki

Interspeech 2020 1037 - 1041 2020年10月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

DOI： 10.21437/Interspeech.2020-2164

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/interspeech/interspeech2020.html#HouDZYSS20
Sound-Image Grounding Based Focusing Mechanism for Efficient Automatic Spoken Language Acquisition 査読

Mingxin Zhang, Tomohiro Tanaka, Wenxin Hou, Shengzhou Gao, Takahiro Shinozaki

Interspeech 2020 1436 - 1440 2020年10月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

DOI： 10.21437/Interspeech.2020-2027

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/interspeech/interspeech2020.html#ZhangTHGS20
SPOKEN LANGUAGE ACQUISITION BASED ON REINFORCEMENT LEARNING AND WORD UNIT SEGMENTATION

Shengzhou Gao, Wenxin Hou, Tomohiro Tanaka, Takahiro Shinozaki

Proc. IEEE ICASSP ( 3-2-8 ) 6144 - 6148 2020年9月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/ICASSP40776.2020.9053326

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/icassp/icassp2020.html#GaoHTS20
Dual Inheritance Evolution Strategy for Deep Neural Network Optimization 査読

Kent Hino, Yusuke Kimura, Yue Dong, Takahiro Shinozaki

Proc. IEEE Congress on Evolution Computation (CEC) 1 - 7 2020年7月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/CEC48606.2020.9185634

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/cec/cec2020.html#HinoKDS20
Automated Development of DNN Based Spoken Language Systems Using Evolutionary Algorithms 査読

Takahiro Shinozaki, Shinji Watanabe, Kevin Duh

Deep Neural Evolution - Deep Learning with Evolutionary Computation 97 - 129 2020年5月

　詳細を見る

記述言語：英語出版者・発行元：Deep Neural Evolution - Deep Learning with Evolutionary Computation

DOI： 10.1007/978-981-15-3685-4

researchmap

その他リンク： https://dblp.uni-trier.de/db/series/ncs/IN2020.html#Shinozaki0D20
スピーキングの自動採点技術はどの程度進んでいるか

篠崎隆宏

教材・テスト作成のためのCEFR-Jリソースブック 148 - 153 2020年4月

　詳細を見る

記述言語：日本語出版者・発行元：教材・テスト作成のためのCEFR-Jリソースブック

researchmap
音声認識の現状と将来査読

篠崎隆宏

シミュレーション Vol. 39 ( No. 1 ) 2020年3月

　詳細を見る

記述言語：日本語掲載種別：研究論文（学術雑誌）

researchmap
Efficient free keyword detection based on cnn and end-to-end continuous dp-matching 査読

Tomohiro Tanaka, Takahiro Shinozaki

2019 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU) 637 - 644 2019年12月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/ASRU46091.2019.9004021.

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/asru/asru2019.html#TanakaS19
Cross-Domain Speaker Recognition using Cycle-Consistent Adversarial Networks 査読

Yi Liu, Bairong Zhuang, Zhiyu Li, Takahiro Shinozaki

2019 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC) 2070 - 2074 2019年11月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/APSIPAASC47483.2019.9023042

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/apsipa/apsipa2019.html#LiuZLS19
Automated Development of Deep Neural Network Systems Based on Evolutionary Algorithms 査読

Takahiro Shinozaki

Third International Workshop on Symbolic-Neural Learning (SNL-2019) 2019年7月

　詳細を見る

記述言語：英語

researchmap
Deep neural network optimization based on dual inheritance theory and its application

Takahiro Shinozaki

Vol. jh190066-DAH 2019年7月

　詳細を見る

記述言語：英語

researchmap
Effective and Stable Neuron Model Optimization Based on Aggregated CMA-ES 査読

Han X, Shinozaki T, Kobayashi, R

ICASSP 2019 1264 - 1268 2019年5月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/ICASSP.2019.8682825

researchmap
自動音声認識技術と英語教育：仕組みと研究動向、いまできること・できないこと査読

篠崎隆宏

英語教育 2019年2月号 ( 第2特集 ) 2019年1月

　詳細を見る

記述言語：日本語掲載種別：研究論文（学術雑誌）

researchmap
Evolution-Strategy-Based Automation of System Development for High-Performance Speech Recognition 査読

Takafumi Moriya, Tomohiro Tanaka, Takahiro Shinozaki, Shinji Watanabe, Kevin Duh

"IEEE/ACM Transactions on Audio, Speech, and Language Processing" Vol. 27 ( No. 1 ) 77 - 88 2019年1月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1109/TASLP.2018.2871755

researchmap

その他リンク： https://dblp.uni-trier.de/db/journals/taslp/taslp27.html#MoriyaTSWD19
Investigation of Attention-Based Multimodal Fusion and Maximum Mutual Information Objective for DSTC7 Track3 査読

Bairong Zhuang, Wenbo Wang, Takahiro Shinozaki

DSTC7 2019年1月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

researchmap
Reward Only Training of Encoder-Decoder Digit Recognition Systems Based on Policy Gradient Methods 査読

Yilong Peng, Hayato Shibata, Takahiro Shinozaki

APSIPA ASC 1934 - 1939 2018年11月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.23919/APSIPA.2018.8659527

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/apsipa/apsipa2018.html#PengSS18
F-Measure Based End-To-End Optimization of Neural Network Keyword Detectors 査読

Tomohiro Tanaka, Takahiro Shinozaki

APSIPA ASC 1456 - 1461 2018年11月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.23919/APSIPA.2018.8659736

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/apsipa/apsipa2018.html#TanakaS18
Reinforcement Learning of Speech Recognition System Based on Policy Gradient and Hypothesis Selection 査読

Taku Kato, Takahiro Shinozaki

IEEE ICASSP 2018 abs/1711.03689 5759 - 5763 2018年4月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/ICASSP.2018.8462656

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/icassp/icassp2018.html#KalaS18
Electrooculography-based continuous eye-writing recognition system for efficient assistive communication systems 査読

Fuming Fang, Takahiro Shinozaki

2018年2月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

researchmap
Voice conversion from arbitrary speakers based on deep neural networks with adversarial learning

Sou Miyamoto, Takashi Nose, Suzunosuke Ito, Harunori Koike, Yuya Chiba, Akinori Ito, Takahiro Shinozaki

Smart Innovation, Systems and Technologies 82 97 - 103 2018年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：Springer

DOI： 10.1007/978-3-319-63859-1_13

Scopus

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/iih-msp/iih-msp2017-2.html#MiyamotoNIKCIS17
Comparative Analysis of Word Embedding Methods for DSTC6 End-to-End Conversation Modeling Track[C] 査読

Zhuang Bairong, Wang Wenbo, Li Zhiyu, Zheng Chonghui, Takahiro Shinozaki

Proc. Dialog System Technology Challenges (DSTC6) 2017年12月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

researchmap
Composite Embedding Systems for Zerospeech2017 Track1 査読

Hayato Shibata, Taku Kato, Takahiro Shinozaki, Shinji Watanabe

Proc. IEEE ASRU 2017 747 - 753 2017年12月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/ASRU.2017.8269012

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/asru/asru2017.html#ShibataKSW17
Evolution Strategy Based Automatic Tuning of Neural Machine Translation Systems 査読

Hao Qin, Takahiro Shinozaki, Kevin Duh

Proc. International Workshop on Spoken Language Translation 120 - 128 2017年12月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：International Workshop on Spoken Language Translation

researchmap

その他リンク： https://dblp.uni-trier.de/rec/conf/iwslt/2017
Semi-Supervised Learning of a Pronunciation Dictionary from Disjoint Phonemic Transcripts and Text 査読

Takahiro Shinozaki, Shinji Watanabe, Daichi Mochihashi, Graham Neubig

Interspeech 2546 - 2550 2017年8月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

DOI： 10.21437/Interspeech.2017-1081

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/interspeech/interspeech2017.html#ShinozakiWMN17
A Study on 2D Photo-Realistic Facial Animation Generation Using 3D Facial Feature Points and Deep Neural Networks 査読

Kazuki Sato, Takashi Nose, Akira Ito, Yuya Chiba, Akinori Ito, Takahiro Shinozaki

The Thirteenth International Conference on Intelligent Information Hiding and Multimedia Signal Processing (IIH-MSP) 112 - 118 2017年8月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：Springer

DOI： 10.1007/978-3-319-63859-1_15

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/iih-msp/iih-msp2017-2.html#SatoNICIS17
Development and Evaluation of Julius-Compatible Interface for Kaldi ASR 査読

Yusuke Yamada, Takashi Nose, Yuya Chiba, Akinori Ito, Takahiro Shinozaki

The Thirteenth International Conference on Intelligent Information Hiding and Multimedia Signal Processing (IIH-MSP) 91 - 96 2017年8月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：Springer

DOI： 10.1007/978-3-319-63859-1_12

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/iih-msp/iih-msp2017-2.html#YamadaNCIS17
HMMについてやさしく教えてください査読

篠崎隆宏

音響学入門ペディア 116 - 119 2017年3月

　詳細を見る

記述言語：日本語出版者・発行元：音響学入門ペディア

researchmap
Automated Structure Discovery and Parameter Tuning of Neural Network Language Model based on Evolution Strategy 査読

Tomohiro Tanaka, Takahiro Shinozaki, Shinji Watanabe, Takaaki Hori

Spoken Language Technology (SLT) 665 - 671 2016年12月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/SLT.2016.7846334

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/slt/slt2016.html#TanakaMSWHD16
Improvement of quality of voice conversion based on spectral differential filter using STRAIGHT-based mel-cepstral coefficients

Koike Harunori, Takashi Nose, Takahiro Shinozaki, Akinori Ito

Journal of the Acoustical Sciety of America 2016年11月

　詳細を見る

記述言語：英語

researchmap
Evolutionary optimization of Long Short-Term Memory neural network language model

Tomohiro Tanaka, Takafumi Moriya, Takahiro Shinozaki, Shinji Watanabe, Takaaki Hori, Kevin duh

ASJ and ASA joint meeting (Journal of the Acoustical Sciety of America 2016年11月

　詳細を見る

記述言語：英語

researchmap
大規模進化計算による音声認識システム開発の自動化

篠崎隆宏

GTC Japan 2016 2016年10月

　詳細を見る

記述言語：日本語

researchmap
Kaldiツールキットを用いた音声認識システムの構築

篠崎隆宏

音声研究会 2016年10月

　詳細を見る

記述言語：日本語

researchmap
音声認識ツールキットKaldiを用いた大語彙日本語音声認識

篠崎隆宏

FIT2016 2016年9月

　詳細を見る

記述言語：日本語

researchmap
Improving eye motion sequence recognition using electrooculography based on context-dependent HMM 査読

Fuming Fang, Takahiro Shinozaki, Yasuo Horiuchi, Shingo Kuroiwa, Sadaoki Furui, Toshimitsu Musha

Computational Intelligence and Neuroscience 2016 6898031 - 9 2016年9月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1155/2016/6898031

Web of Science

Scopus

PubMed

researchmap
Evolution Strategy Based Neural Network Optimization and LSTM Language Model for Robust Speech Recognition 査読

Tomohiro Tanaka, Takahiro Shinozaki, Shinji Watanabe, Takaaki Hori

4th International Workshop on Speech Processing in Everyday Environments CHiME 2016 2016年9月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

researchmap
Conversion of Speaker's Face Image Using PCA and Animation Unit for Video Chatting 査読

Saito, Y., Nose, T., Takahiro Shinozaki, Ito, A.

"Proceedings - 2015 International Conference on Intelligent Information Hiding and Multimedia Signal Processing, IIH-MSP 2015" 433 - 436 2016年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/IIH-MSP.2015.85

Web of Science

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/iih-msp/iih-msp2015.html#SaitoNSI15
Automation of System Building for State-of-the-art Large Vocabulary Speech Recognition Using Evolution Strategy 査読

akafumi Moriya, Tomohiro Tanaka, Takahiro Shinozaki, Shinji Watanabe, Kevin Duh

IEEE 2015 Automatic Speech Recognition and Understanding Workshop (ASRU) 610 - 616 2015年12月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/ASRU.2015.7404852

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/asru/asru2015.html#MoriyaTSWD15
Structure discovery of deep neural network based on evolutionary algorithms 査読

Takahiro Shinozaki, Watanabe, S.

"ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings" Vol. 2015-August 4979 - 4983 2015年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/ICASSP.2015.7178918

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/icassp/icassp2015.html#ShinozakiW15
Accent Type and Phrase Boundary Estimation Using Acoustic and Language Models for Automatic Prosodic Labeling 査読

Tomoki Koriyama, Hiroshi Suzuki, Takashi Nose, Takahiro Shinozaki, Takao Kobayashi

Proc. INTERSPEECH 2014 2337 - 2341 2014年9月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

DOI： 10.21437/Interspeech.2014-193

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/interspeech/interspeech2014.html#KoriyamaSNSK14
発話中の一部区間を用いた感情認識

内田正洋, 篠崎隆宏, 堀内靖雄, 黒岩眞吾

電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems 97 ( 1 ) 236 - 238 2014年1月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

人間が相手の感情を判断する場合,短い音声区間からでも推定できる.そこで機械による認識でも短い音声区間から推定できると考え,認識実験を行った.その結果発話音声からどの区間でも3秒程度あれば認識に十分だという結果が得られた.

CiNii Books

J-GLOBAL

researchmap
Automatic scoring method for open answer task in the SJ-CAT speaking test considering utterance difficulty level 査読

Lu, H., Yamada, T., Imai, S., Takahiro Shinozaki, Nisimura, R., Ishizuka, K., Makino, S., Kitawaki, N.

"2014 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA 2014" 1 - 5 2014年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/APSIPA.2014.7041583

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/apsipa/apsipa2014.html#LuYISNIMK14
An automatic input protocol recommendation method for tailored switch-to-speech communication aid systems 査読

Fang, F., Takahiro Shinozaki, Takao Kobayashi

"2014 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA 2014" 1 - 7 2014年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/APSIPA.2014.7041638

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/apsipa/apsipa2014.html#FangSK14
語尾伸ばし発声による3次元直接操作インタフェース査読

川崎智久, 篠崎隆宏, 古井貞熙

電気学会論文誌Ｃ Vol. 133 ( No. 12 ) 2257 - 2263 2013年12月

　詳細を見る

記述言語：日本語掲載種別：研究論文（学術雑誌）出版者・発行元：The Institute of Electrical Engineers of Japan

With the recent progress in computer hardware and computer graphics (CG) techniques, applications using 3D virtual space are getting popular. So far, a mouse and a keyboard are generally used in these applications. While a mouse is a very successful input device for continuously controlling 2D objects, it is not necessarily intuitive for controlling 3D objects. In order to control 3D objects such as an avatar or a moving camera in a virtual space, speech interface has a potential to be a more natural and powerful alternative to a mouse. We propose speech based direct manipulation interface based on stretched word-end voice that controls continuous movements of 3D objects. By combining the proposed method with normal word based commands, both continuous movements and discrete actions are seamlessly controlled. Therefore, everything can be controlled using speech. The proposed method is implemented as an interface to the Second Life system. We compare it with a conventional speech based method that specifies start and end timing of motions. Analyses based on human subjects show that the proposed method is superior to the conventional speech based method. Moreover, we show that the best result is obtained when both methods are combined.

DOI： 10.1541/ieejeiss.133.2257

CiNii Books

researchmap

その他リンク： https://jlc.jst.go.jp/DN/JALC/10026197806?from=CiNii
Statistical Person Verification Using Behavioral Patterns from Complex Human Motion 査読

Felipe Gomez-Caballero, Takahiro Shinozaki, Sadaoki Furui, Koichi Shinoda

New Trends in Image Analysis and Processing ICIAP 2013 8158 550 - 558 2013年9月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1007/978-3-642-41190-8_60

Web of Science

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/iciap/iciap2013-w.html#Gomez-CaballeroSFS13
A statistical approach for person verification using human behavioral patterns 査読

Felipe Gomez-Caballero, Takahiro Shinozaki, Sadaoki Furui, Koichi Shinoda

EURASIP Journal on Image and Video Processing 2013 2013:44 1 - 11 2013年8月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1186/1687-5281-2013-44

Web of Science

researchmap

その他リンク： https://dblp.uni-trier.de/db/journals/ejivp/ejivp2013.html#Gomez-CaballeroSFS13
Reverberant speech recognition based on denoising autoencoder 査読

Ishii, T., Komiyama, H., Takahiro Shinozaki, Horiuchi, Y., Kuroiwa, S.

"Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH" 3512 - 3516 2013年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

DOI： 10.21437/Interspeech.2013-267

researchmap

その他リンク： https://dblp.uni-trier.de/conf/interspeech/2013
Pipeline decomposition of speech decoders and their implementation based on delayed evaluation. 査読

Takahiro Shinozaki, Sadaoki Furui, Yasuo Horiuchi, Shingo Kuroiwa

Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA 2012, Hollywood, CA, USA, December 3-6, 2012 1 - 4 2012年12月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

researchmap

その他リンク： http://dblp.uni-trier.de/db/conf/apsipa/apsipa2012.html#conf/apsipa/ShinozakiFHK12
HMM Based Continuous EOG Recognition for Eye-input Speech Interface. 査読

Fuming Fang, Takahiro Shinozaki, Yasuo Horiuchi, Shingo Kuroiwa, Sadaoki Furui, Toshimitsu Musha

INTERSPEECH 2012, 13th Annual Conference of the International Speech Communication Association, Portland, Oregon, USA, September 9-13, 2012 735 - 738 2012年9月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

DOI： 10.21437/Interspeech.2012-228

researchmap

その他リンク： http://dblp.uni-trier.de/db/conf/interspeech/interspeech2012.html#conf/interspeech/FangSHKFM12
AUTOMATIC SCORING METHOD CONSIDERING QUALITY AND CONTENT OF SPEECH FOR SCAT JAPANESE SPEAKING TEST 査読

Naoko Okubo, Yuto Yamahata, Takeshi Yamada, Shingo Imai, Kenkichi Ishizuka, Takahiro Shinozaki, Ryuichi Nisimura, Shoji Makino, Nobuhiko Kitawaki

2012 INTERNATIONAL CONFERENCE ON SPEECH DATABASE AND ASSESSMENTS 72 - 77 2012年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
UNSUPERVISED CV LANGUAGE MODEL ADAPTATION BASED ON DIRECT LIKELIHOOD MAXIMIZATION SENTENCE SELECTION 査読

Takahiro Shinozaki, Yasuo Horiuchi, Shingo Kuroiwa

2012 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP) 5029 - 5032 2012年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/ICASSP.2012.6289050

Web of Science

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/icassp/icassp2012.html#ShinozakiHK12
Open Answer Scoring for S-CAT Automated Speaking Test System Using Support Vector Regression 査読

Yutaka Ono, Misuzu Otake, Takahiro Shinozaki, Ryuichi Nisimura, Takeshi Yamada, Kenkichi Ishizuka, Yasuo Horiuchi, Shingo Kuroiwa, Shingo Imai

2012 ASIA-PACIFIC SIGNAL AND INFORMATION PROCESSING ASSOCIATION ANNUAL SUMMIT AND CONFERENCE (APSIPA ASC) 1 - 4 2012年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap

その他リンク： https://dblp.uni-trier.de/rec/conf/apsipa/2012
Person Authentication using 3D Human Motion 査読

Felipe Gomez-Caballero, Takahiro Shinozaki, Sadaoki Furui, Koichi Shinoda

Proc. Joint ACM Workshop on Human Gesture and Behavior Understanding 2011 (J-HGBU '11) 35 - 40 2011年11月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ACM

DOI： 10.1145/2072572.2072586

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/mm/jhgbu2011.html#Gomez-Caballero11
Strategies for model training and adaptation based on data dependency control 査読

Takahiro Shinozaki, Sadaoki Furui

Proc. APSIPA ASC 2011 Xi’an 2011年10月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

researchmap
Compact speech decoder based on pure functional programming 査読

Takahiro Shinozaki, Masakazu Sekijima, Shigeki Hagihara, Sadaoki Furui

Proc. APSIPA ASC 2011 2011年10月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

researchmap
Sentence selection by direct likelihood maximization for language model adaptation 査読

Takahiro Shinozaki, Yu Kubota, Sadaoki Furui, Eiji Utsunomiya, Yasutaka Shindoh

Proc. INTERSPEECH 2011 613 - 616 2011年8月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.21437/Interspeech.2011-244

Web of Science

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/interspeech/interspeech2011.html#ShinozakiKFUS11
A compact speech decoder based on pure functional programming

Takahiro Shinozaki, Masakazu Sekijima, Shigeki Hagihara, Sadaoki Furui

"Manuscript for presentation at IPSJ-SIGPRO, 25 April 2011." ( 2010-5 ) 2011年4月

　詳細を見る

記述言語：英語

researchmap
Pseudo speaker models for text-independent speaker verification using rank threshold.

Shiori Takenaka, Takahiro Shinozaki, Yasuo Horiuchi, Shingo Kuroiwa

7th International Conference on Natural Language Processing and Knowledge Engineering(NLPKE) 265 - 268 2011年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/NLPKE.2011.6138206

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/nlpke/nlpke2011.html#TakenakaSHK11
Visualization of Audio Information for Home Video Highlight Extraction 査読

Koichi Takagi, Ryoichi Kawada, Takahiro Shinozaki, Sadaoki Furui

Proc. of the Second APSIPA Annual Summit and Conference 145 - 148 2010年12月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

researchmap
Unsupervised Acoustic Model Adaptation Based on Ensemble Methods 査読

Takahiro Shinozaki, Yu Kubota, Sadaoki Furui

IEEE journal of Selected Topics in Signal Processing Vol. 4 ( No. 6 ) 1007 - 1015 2010年12月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/JSTSP.2010.2076010

Web of Science

researchmap
An Efficient Prosody Adaptation Method and Its Application to HMM-based Speech Synthesis 査読

Hosana Kamiyama, Takahiro Shinozaki, Koji Iwano, Sadaoki Furui

Proc. of the Second APSIPA Annual Summit and Conference 82 - 85 2010年12月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

researchmap
Investigations of features and estimators for speech-based age estimation 査読

Toshiya Wada, Takahiro Shinozaki, Sadaoki Furui

Proc. of the Second APSIPA Annual Summit and Conference 470 - 473 2010年12月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

researchmap
Gaussian Mixture Optimization Based on Efficient Cross-Validation 査読

Takahiro Shinozaki, Sadaoki Furui, Tatsuya Kawahara

IEEE Journal of Selected Topics in Signal Processing Vol. 4 ( No. 3 ) 540 - 547 2010年6月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1109/JSTSP.2010.2048235

researchmap
Investigations on Ensemble Based Unsupervised Adaptation Methods 査読

Yu Kubota, Takahiro Shinozaki, Sadaoki Furui

IEEE ICASSP2010 4874 - 4877 2010年3月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/ICASSP.2010.5495118

Web of Science

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/icassp/icassp2010.html#KubotaSF10
Target Speech GMM-based Spectral Compensation for Noise Robust Speech Recognition 査読

Takahiro Shinozaki, Sadaoki Furui

INTERSPEECH 2009 BRIGHTON 1255 - 1258 2009年9月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

DOI： 10.21437/Interspeech.2009-361

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/interspeech/interspeech2009.html#ShinozakiF09
Characteristics of speaking style and implications for speech recognition 査読

Takahiro Shinozaki, Mari Ostendorf, Les Atlas

The Journal of the Acoustical Society of America Vol. 126 ( No. 3 ) 1500 - 1510 2009年9月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

researchmap
Unsupervised cross-validation adaptation algorithms for improved adaptation performance 査読

Takahiro Shinozaki, Yu kubota, Sadaoki Furui

IEEE ICASSP 2009 4377 - 4380 2009年4月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/ICASSP.2009.4960599

Web of Science

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/icassp/icassp2009.html#ShinozakiKF09
Aggregated cross-validation and its efficient application to Gaussian mixture optimization 査読

SHINOZAKI T.

Proc. Interspeech, 2008 2382 - 2385 2008年9月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.21437/Interspeech.2008-124

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/interspeech/interspeech2008.html#ShinozakiFK08
Cross-validation and aggregated EM training for robust parameter estimation 査読

SHINOZAKI T.

Computer speech and language Vol. 22 ( No. 2 ) 185 - 195 2008年8月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1016/j.csl.2007.07.005

researchmap
GMM and HMM training by aggregated EM algorithm with increased ensemble sizes for robust parameter estimation

Takahiro Shinozaki, Tatsuya Kawahara

ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings 4405 - 4408 2008年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/ICASSP.2008.4518632

Scopus

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/icassp/icassp2008.html#ShinozakiK08
Gaussian mixture optimization for HMM based on efficient cross-validation

Takahiro Shinozaki, Tatsuya Kawahara

Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH 1 653 - 656 2007年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

DOI： 10.21437/Interspeech.2007-558

Scopus

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/interspeech/interspeech2007.html#ShinozakiK07
HMM training based on CV-EM and CV Gaussian mixture optimization 査読

Takahiro Shinozaki, Tatsuya Kawahara

2007 IEEE WORKSHOP ON AUTOMATIC SPEECH RECOGNITION AND UNDERSTANDING, VOLS 1 AND 2 318 - 322 2007年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/ASRU.2007.4430131

Web of Science

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/asru/asru2007.html#ShinozakiK07
Model Complexity Selection and Cross-Validation EM Training for Robust Speaker Diarization.

Xavier Anguera Miró, Takahiro Shinozaki, Chuck Wooters, Javier Hernando

Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing 273 - 276 2007年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/ICASSP.2007.366902

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/icassp/icassp2007.html#MiroSWH07
Cross-Validation EM Training for Robust Parameter Estimation.

Takahiro Shinozaki, Mari Ostendorf

Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing 437 - 440 2007年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/ICASSP.2007.366943

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/icassp/icassp2007.html#ShinozakiO07
Investigation on Mandarin broadcast news speech recognition.

Mei-Yuh Hwang, Xin Lei, Wen Wang 0001, Takahiro Shinozaki

Ninth International Conference on Spoken Language Processing(INTERSPEECH) 2006年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

DOI： 10.21437/Interspeech.2006-371

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/interspeech/interspeech2006.html#HwangLWS06
Hmm State Clustering Based on Efficient Cross-Validation.

Takahiro Shinozaki

2006 IEEE International Conference on Acoustics Speech and Signal Processing 1157 - 1160 2006年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/ICASSP.2006.1660231

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/icassp/icassp2006.html#Shinozaki06
Cluster-based modeling for ubiquitous speech recognition 査読

Sadaoki Furui, Tomohisa Ichiba, Takahiro Shinozaki, Edward W.D.Whittaker, Koji Iwano

Interspeech2005 2865 - 2868 2005年9月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

DOI： 10.21437/Interspeech.2005-838

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/interspeech/interspeech2005.html#FuruiISWI05
Pushing the envelope - aside [speech recognition].

Nelson Morgan, Qifeng Zhu 0001, Andreas Stolcke, M. Kemal Sönmez, Sunil Sivadas, Takahiro Shinozaki, Mari Ostendorf, Pratibha Jain, Hynek Hermansky, Dan Ellis, George R. Doddington, Barry Y. Chen, Özgür Çetin, Hervé Bourlard, Marios Athineos

IEEE Signal Processing Magazine 22 ( 5 ) 81 - 88 2005年

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.1109/MSP.2005.1511826

researchmap

その他リンク： https://dblp.uni-trier.de/db/journals/spm/spm22.html#MorganZSSSSOJHE05
Data sampling for improved speech recognizer training.

Takahiro Shinozaki, Mari Ostendorf, Les E. Atlas

9th European Conference on Speech Communication and Technology(INTERSPEECH) 1693 - 1696 2005年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

DOI： 10.21437/Interspeech.2005-551

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/interspeech/interspeech2005.html#ShinozakiOA05
Noise-robust speech recognition using multi-band spectral features

Yoshitaka Nishimura, Takahiro Shinozaki, Koji Iwano, Sadaoki Furui

148th Acoustical Society of America Meetings 2004年11月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

researchmap
Spontaneous Speech Recognition Using a Massively Parallel Decoder 査読

SHINOZAKI T.

Proc. ICSLP'04, Oct. ( No. 3 ) 1705 - 1708 2004年10月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.21437/Interspeech.2004-185

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/interspeech/interspeech2004.html#ShinozakiF04
Dynamic Bayesian network-based acoustic models incorporating speaking rate effects 査読

Takahiro Shinozaki, Sadaoki Furui

IEICE Transactions on Information and Systems Vol. E87-D ( No. 10 ) 2339 - 2347 2004年10月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

researchmap

その他リンク： https://dblp.uni-trier.de/db/journals/ieicet/ieicet87d.html#ShinozakiF04
Time Adjustable Mixture Weights for Speaking Rate Fluctuation 査読

SHINOZAKI T.

Proc. EUROSPEECH, 2003 973 - 976 2003年9月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.21437/Eurospeech.2003-336

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/interspeech/interspeech2003.html#ShinozakiF03
Benchmark test for speech recognition using the corpus of spontaneous Japanese 査読

Tatsuya Kawahara, Hiroaki Nanjo, Takahiro Shinozaki, Sadaoki Furui

SSPR2003 135 - 138 2003年4月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

researchmap
Unsupervised class-based language model adaptation for spontaneous speech recognition 査読

Tadasuke Yokoyama, Takahiro Shinozaki, Koji Iwano, Sadaoki Furui

IEEE ICASSP 2003 Vol. 1 236 - 239 2003年4月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/ICASSP.2003.1198761

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/icassp/icassp2003.html#YokoyamaSIF03
Unsupervised language model adaptation using word classes for spontaneous speech recognition 査読

Tadasuke Yokoyama, Takahiro Shinozaki, Koji Iwano, Sadaoki Furui

SSPR2003 71 - 74 2003年4月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

researchmap
Hidden mode HMM using Bayesian network for modeling speaking rate fluctuation 査読

SHINOZAKI T.

Proc. IEEE Workshop on Automatic Speech Recognition and Understanding, St. Thomas, 2003 417 - 422 2003年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

researchmap
An assessment of automatic recognition techniques for spontaneous speech in comparison with human performance 査読

Takahiro Shinozaki, Sadaoki Furui

SSPR2003 95 - 98 2003年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

researchmap
A New Lexicon Optimization Method for LVCSR Based on Linguistic and Acoustic Characteristics of Words 査読

Takahiro Shinozaki, Sadaoki Furui

7th International Conference on Spoken Language Processing (ICSLP-2002) 717 - 720 2002年9月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

DOI： 10.21437/ICSLP.2002-236

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/interspeech/interspeech2002.html#ShinozakiF02
日本語話し言葉コーパスを用いた講演音声認識査読

篠崎隆宏, 古井貞熙

情報処理学会論文誌 Vol. 43 ( No. 7 ) 2098 - 2107 2002年7月

　詳細を見る

記述言語：日本語掲載種別：研究論文（学術雑誌）

researchmap
Analysis on individual differences in automatic transcription of spontaneous presentations 査読

SHINOZAKI T.

Proc. ICASSP2002, Orlando, FL, May 2002 Vol. 1 ( No. SP-P11.07 ) 729 - 732 2002年5月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/ICASSP.2002.5743821

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/icassp/icassp2002.html#ShinozakiF02
Error analysis using decision trees in spontaneous presentation speech recognition 査読

SHINOZAKI T.

Proc. ASRU, Trento, Italy, Dec. 2001 2001年12月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/ASRU.2001.1034621

researchmap
Towards Automatic Transcription of Spontaneous Presentations 査読

Takahiro Shinozaki, Chiori Hori, Sadaoki Furui

Eurospeech 2001 Vol. 1 491 - 494 2001年9月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

DOI： 10.21437/Eurospeech.2001-129

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/interspeech/interspeech2001.html#ShinozakiHF01
Ubiquitous Speech Processing 査読

Sadaoki Furui, Koji Iwano, Chiori Hori, Takahiro Shinozaki, Yohei Saito, Satoshi Tamura

IEEE ICASSP 2001 Vol. 1 ( No. SPEC-L1.4 ) 13 - 16 2001年5月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/ICASSP.2001.940755

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/icassp/icassp2001.html#FuruiIHSST01
Toward the Realization of Spontaneous Speech Recognition and Summarization 査読

Sadaoki Furui, Chiori Hori, Takahiro Shinozaki

Research on Computational Linguistics Conference IV (2001 ROCLING) 1 - 21 2001年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

researchmap
Toward the Realization of Spontaneous Speech Recognition-Introduction of a Japanese Priority Program and Preliminary Results- 査読

Sadaoki Furui, Kikuo Maekawa, Hitoshi Isahara, Takahiro Shinozaki, Takashi Ohdaira

ICSLP2000 Vol. 3 518 - 521 2000年10月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

DOI： 10.21437/ICSLP.2000-586

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/interspeech/interspeech2000.html#FuruiMISO00

▼全件表示

MISC

超多言語事前学習による低資源音声認識の検討

Hou Wenxin, Dong Yue, ZHUANG BAIRONG, 楊龍飛, 篠崎隆宏

日本音響学会 ( 2-P1-7 ) 2020年9月

　詳細を見る

記述言語：日本語

researchmap
Transformer 音声認識システムの進化的最適化

日野健人, 篠崎隆宏

日本音響学会2020年秋季研究発表会講演論文集 2-P1-6 2020年9月

　詳細を見る

記述言語：日本語

researchmap
二重相続進化戦略による音声認識システムの最適化

日野健人, 木村友祐, Dong Yue, 篠崎隆宏

日本音響学会2020年春季研究発表会講演論文集 2-4-5 893 - 894 2020年3月

　詳細を見る

記述言語：日本語

researchmap
CNNフロントエンドによる高速なEnd-to-End連続DPマッチングの実現

田中智宏, 篠崎隆宏

日本音響学会2020年春季研究発表会講演論文集 2-4-4 891 - 892 2020年3月

　詳細を見る

記述言語：日本語

researchmap
Robust Multichannel End-to-End Speech Recognition Based on Multi-Output Densenet

Chonghui Zheng, Takahiro Shinozaki

2020-SLP-131 ( No. 10 ) 1 - 3 2020年2月

　詳細を見る

記述言語：英語

researchmap
二重相続進化戦略によるEnd-to-End音声認識システムの最適化

木村友祐, 日野健人, DongYue, 篠崎隆宏

研究報告音声言語情報処理（SLP） 2020-SLP-131 ( No. 11 ) 1 - 3 2020年2月

　詳細を見る

記述言語：日本語

researchmap
相乗的複合学習による効率的な音声言語獲得機構

篠崎隆宏, GAO Shengzhou, ZHANG Mingxin, HOU Wenxin, 田中智宏

人工知能学会言語・音声理解と対話処理研究会資料 89th 2020年

　詳細を見る

J-GLOBAL

researchmap
CNNフロントエンドによるEnd-to-End連続DPマッチングの高速化

田中智宏, 篠崎隆宏

研究報告音声言語情報処理（SLP） Vol. 2019-SLP-130 ( No. 2 ) 2019年12月

　詳細を見る

記述言語：日本語

researchmap
入力画像勾配を用いたモデル構造フリーな教師無し音源ローカライゼーション

田中智宏, 篠崎隆宏

日本音響学会2019年秋季研究発表会講演論文集 2-3-3 919 - 920 2019年9月

　詳細を見る

記述言語：日本語

researchmap
営業電話における大規模 End-to-End 音声認識システムの活用

平村健勝, 篠崎隆宏

日本音響学会2019年秋季研究発表会講演論文集 1-3-3 1183 - 1184 2019年9月

　詳細を見る

記述言語：日本語

researchmap
Aggregated CMA-ES: An Effective and Stable Strategy for Neuron Model Optimization

Xu Han, Takahiro Shinozaki, Ryota Kobayashi

( No. 9 ) 1 - 2 2019年3月

　詳細を見る

記述言語：英語

researchmap
連続単語検出のための 2D-RNN を用いた End-to-EndDPマッチング

田中智宏, 篠崎隆宏

日本音響学会2019年春季研究発表会講演論文集 ( 2-P-13 ) 979 - 980 2019年3月

　詳細を見る

記述言語：日本語

researchmap
Analysis of Attention-Based Multimodal Fusion and Maximum Mutual Information Objective for DSTC7 Audio Visual Scene-Aware Dialog Track

Wenbo Wang, Bairong Zhuang, Takahiro Shinozaki

( 2-P-10 ) 973 - 974 2019年3月

　詳細を見る

記述言語：英語

researchmap
連続対応検出ネットワークによる音声動画からの教師なし物体セグメンテーションおよび関連学習の検討

田中智宏, 篠崎隆宏

日本音響学会2019年春季研究発表会講演論文集 ( 2-P-13 ) 979 - 980 2019年3月

　詳細を見る

記述言語：日本語

researchmap
大規模 End-to-End 音声認識システムの教師なし強化学習の実現に向けた検討

PengYilong, 篠崎隆宏

日本音響学会2019年春季研究発表会講演論文集 ( 1-P-9 ) 919 - 920 2019年3月

　詳細を見る

記述言語：日本語

researchmap
I-vector Domain Adaptation Using Cycle-Consistent Adversarial Networks for Speaker Recognition

Yi Liu, Takahiro Shinozaki

2019-SLP-126 ( No. 2 ) 1 - 3 2019年2月

　詳細を見る

記述言語：英語

researchmap
マルチゲートGRUユニットを用いた2D-RNNによるEnd-to-End始終端フリー単語検出

田中智宏, 篠崎隆宏

音声言語情報処理研究会 2018年12月

　詳細を見る

記述言語：日本語

researchmap
Improving the audio visual scene-aware dialog system in DSTC7 by using attentional multimodal fusion and MMI objective

Wenbo Wang, Bairong Zhuang, Takahiro Shinozaki

2018年12月

　詳細を見る

記述言語：英語

researchmap
単語検出性能を目的関数とした単語検出器学習法の提案

田中智宏, 篠崎隆宏

2018年秋季研究発表会 2018年9月

　詳細を見る

記述言語：日本語

researchmap
音声認識システムの教師なし強化学習における報酬と報酬ノイズの影響の検討

PengYilong, 柴田駿人, 篠崎隆宏

2018年秋季研究発表会 2018年9月

　詳細を見る

記述言語：日本語

researchmap
強化学習による報酬のみを用いたend-to-end 認識システム学習

柴田駿人, PengYilong, 篠崎隆宏

2018年秋季研究発表会 2018年9月

　詳細を見る

記述言語：日本語

researchmap
End-to-end音声認識システムの強化学習の検討

PengYilong, 柴田駿人, 篠崎隆宏

音声言語情報処理研究会 2018-SLP-123 ( 9 ) 1 - 4 2018年7月

　詳細を見る

記述言語：日本語

researchmap
Taxi Demand Prediction using Ensemble Model Based on RNNs and XGBOOST 査読

Takahiro Shinozaki

9th International Conference of Information and Communication Technology for Embedded Systems 130 - 135 2018年5月

　詳細を見る

記述言語：英語

researchmap
日本人英語学習者を対象とした自動英語音声認識の予備検討

篠崎隆宏, 加藤拓

CEFR-J 2018 Symposium 2018年3月

　詳細を見る

記述言語：日本語

researchmap
End-to-Endニューラル対話モデルにおける単語分散表現の比較検討

鄭崇輝, 李知雨, 王文博, 庄佰融, 篠崎隆宏

2018年春季研究発表会講演論文集 2018年3月

　詳細を見る

記述言語：日本語

researchmap
音声認識仮説を用いたベイズ的半教師あり発音辞書学習の検討

池下裕紀, 篠崎隆宏

春季研究発表会講演論文集 2018年3月

　詳細を見る

記述言語：日本語

researchmap
方策勾配法と仮説選択に基づくDNN音声認識システムの強化学習

加藤拓, 篠崎隆宏

春季研究発表会講演論文集 2018年3月

　詳細を見る

記述言語：日本語

researchmap
英語学習者の発声自動評価を目的としたDNN音声認識システムの検討

加藤拓, 篠崎隆宏

情報処理学会研究報告 Vol. 2017-SLP-119 ( No. 11 ) 1 - 4 2017年12月

　詳細を見る

記述言語：日本語

researchmap
ベイズ推論を用いた半教師あり学習の日本語適用

池下裕紀, 篠崎隆宏, 渡部晋治, 持橋大地, Graham Neubig

情報処理学会研究報告 Vol. 2017-SLP-118 ( No. 3 ) 1 - 4 2017年10月

　詳細を見る

記述言語：日本語

researchmap
仮説選択に基づくDNN音声認識システムの強化学習

加藤拓, 篠崎隆宏

情報処理学会研究報告 Vol. 2017-SLP-118 ( No. 4 ) 1 - 5 2017年10月

　詳細を見る

記述言語：日本語

researchmap
進化的戦略を用いたDNNハードウエア音声センサの低消費電力化

銭博宇, 王健, 劉溢, 朱凱, 篠崎隆宏

2017年秋季研究発表会講演論文集 131 - 132 2017年9月

　詳細を見る

記述言語：日本語

researchmap
ゼロリソース言語への応用を目的としたABXテストによるDNN特徴量の検討

柴田駿人, 加藤拓, 篠崎隆宏, 渡部晋治

秋季研究発表会講演論文集 1 - 2 2017年9月

　詳細を見る

記述言語：日本語

researchmap
進化的戦略を用いたニューラル機械翻訳システムの自動最適化

覃浩, 篠崎隆宏, Duh Kevin

2017年秋季研究発表会講演論文集 1397 - 1398 2017年9月

　詳細を見る

記述言語：日本語

researchmap
読み上げ音声を用いたニューラルネットワークによる任意歌唱者歌声声質変換の検討

篠崎隆宏, 小池治憲, 能勢隆, 伊藤彰則

日本音響学会春季研究発表会講演論文集 357 - 358 2017年3月

　詳細を見る

記述言語：日本語

researchmap
Highwayネットワーク言語モデルを用いた日本語話し言葉音声認識

田中智大, 篠崎隆宏, 渡部晋治

日本音響学会春季研究発表会講演論文集 107 - 108 2017年3月

　詳細を見る

記述言語：日本語

researchmap
ベイズ的教師なし発音辞書学習のWFST実装およびサンプリングアルゴリズムの検討

篠崎隆宏, 渡部晋治, 持橋大地, Graham Neubig

日本音響学会春季研究発表会講演論文集 17 - 18 2017年3月

　詳細を見る

記述言語：日本語

researchmap
Hardware Speech Sensor Based on Deep Neural Network Feature Extractor and Template Matching (音声)

劉溢, 銭博宇, 王健, 篠崎隆宏

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 116 ( 477 ) 297 - 300 2017年3月

　詳細を見る

記述言語：英語出版者・発行元：電子情報通信学会

CiNii Books

researchmap
半教師ありDNN学習を用いた日本語スピーキングテスト音声の認識

加藤拓, 篠崎隆宏

日本音響学会春季研究発表会講演論文集 93 - 94 2017年3月

　詳細を見る

記述言語：日本語

researchmap
敵対的学習を利用したニューラルネットワークに基づく任意話者声質変換の検討

篠崎隆宏, 宮本颯, 能勢隆, 伊藤鈴乃介, 小池治憲, 伊藤彰則

日本音響学会春季研究発表会講演論文集 355 - 356 2017年3月

　詳細を見る

記述言語：日本語

researchmap
ChimeChallengeタスクにおけるNMFによる雑音除去の検討

小澤奈摘, 田中智大, 篠崎隆宏

音声言語情報処理研究会(SLP) Vol. 2017-SLP-115 ( No. 12 ) 2017年2月

　詳細を見る

記述言語：日本語

researchmap
進化戦略に基づいた単語検出ハードウェアのためのDNNメタパラメータ最適化

王健, 銭博宇, 劉溢, 篠崎隆宏

音声言語情報処理研究会(SLP) Vol. 2017-SLP-115 ( No. 6 ) 2017年2月

　詳細を見る

記述言語：日本語

researchmap
眼球動作に基づいた対話支援システムのための連続画なぞり入力手法 (音声) -- (第18回音声言語シンポジウム)

房福明, 篠崎隆宏

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 116 ( 378 ) 83 - 88 2016年12月

　詳細を見る

記述言語：日本語出版者・発行元：電子情報通信学会

researchmap
第３回Frederick Jelinek記念サマーワークショップでの教師なし発音辞書学習の取り組み

篠崎隆宏, 渡部晋治, 持橋大地, Graham Neubig

音声言語情報処理研究会 (SIG-SLP) 2016年12月

　詳細を見る

記述言語：日本語

researchmap
眼球動作に基づいた対話支援システムのための連続画なぞり入力手法

房福明, 篠崎隆宏

音声言語情報処理研究会(SLP) Vol. 2016-SLP-114 ( No. 19 ) 2016年12月

　詳細を見る

記述言語：日本語

researchmap
第3回Frederick Jelinek記念サマーワークショップでの教師なし発音辞書学習の取り組み (音声) -- (第18回音声言語シンポジウム)

篠崎隆宏, 渡部晋治, 持橋大地, Neubig Graham

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 116 ( 378 ) 11 - 15 2016年12月

　詳細を見る

記述言語：日本語出版者・発行元：電子情報通信学会

researchmap
日本語話し言葉音声における半教師ありDNN学習の検討

加藤拓, 篠崎隆宏

音声言語情報処理研究会 (SIG-SLP) Vol. 2016-SLP-113 ( No. 1 ) 2016年10月

　詳細を見る

記述言語：日本語

researchmap
音声認識とブラックボックス最適化

篠崎隆宏, 渡部晋治

日本音響学会誌 72 ( 10 ) 644 - 652 2016年10月

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

CiNii Books

researchmap
連続音声認識におけるLSTMによる単語履歴を考慮した未知語検出法

池下裕紀, 篠崎隆宏

日本音響学会秋季研究発表会 2016年9月

　詳細を見る

記述言語：日本語

researchmap
差分スペクトルフィルタに基づく声質変換における性能向上の検討

小池治憲, 能勢隆, 篠崎隆宏, 伊藤彰則

日本音響学会秋季研究発表会講演論文集 285 - 286 2016年9月

　詳細を見る

記述言語：日本語

researchmap
進化的戦略を用いたリカレントニューラルネットワーク言語モデルの最適化

田中智大, 森谷崇史, 篠崎隆宏, 渡部晋治, 堀貴明, Kevin Duh

日本音響学会秋季研究発表会講演論文集 31 - 32 2016年9月

　詳細を見る

記述言語：日本語

researchmap
LSTMによる単語履歴を考慮した未知語検出法

池下裕紀, 篠崎隆宏

音声研究会(SP) 116 ( 189 ) 33 - 36 2016年8月

　詳細を見る

記述言語：日本語出版者・発行元：電子情報通信学会

CiNii Books

researchmap
国際会議ICASSP2016参加報告

峯松信明, 秋田祐哉, 浅見太一, 伊藤信貴, 落合翼, 郡山知樹, 齋藤大輔, 塩田さやか, 篠崎隆宏, 鈴木雅之, 高木信二, 俵直弘, 橋本佳, 樋口卓哉, 福田隆

研究報告音声言語情報処理（SLP） Vol. 2016-SLP-112 ( No. 5 ) 1 - 6 2016年7月

　詳細を見る

記述言語：日本語

researchmap
声質変換における学習時の DTW 精度が性能に与える影響

小池治憲, 能勢隆, 篠崎隆宏, 伊藤彰則

春季研究発表会講演論文集 313 - 314 2016年3月

　詳細を見る

記述言語：日本語

researchmap
進化的戦略による高精度大語彙音声認識システムの多目的最適化

森谷崇史, 田中智大, 篠崎隆宏, 渡部晋治, Duh Kevin

春季研究発表会講演論文集 45 - 46 2016年3月

　詳細を見る

記述言語：日本語

researchmap
入力話者非依存ニューラルネットワークに基づく差分スペクトルフィルタを用いた声質変換における学習データ量の影響

小池治憲, 能勢隆, 篠崎隆宏, 伊藤彰則

春季研究発表会講演論文集 241 - 242 2016年3月

　詳細を見る

記述言語：日本語

researchmap
Kaldi 用 CSJ レシピへの RNN 言語モデルの導入と性能評価

田中智大, 森谷崇史, 篠崎隆宏, 渡部晋治, 堀貴明

春季研究発表会講演論文集 193 - 194 2016年3月

　詳細を見る

記述言語：日本語

researchmap
KaldiにおけるCSJレシピの利用法

篠崎隆宏, 森谷崇史, 田中智大, 渡部晋治

音声言語情報処理研究会 2016年2月

　詳細を見る

記述言語：日本語

researchmap
粒子フィルタとガウス過程回帰によるシングルチャネル音源分離

博多屋涼, 篠崎隆宏, 郡山知樹

研究報告音声言語情報処理（SLP） Vol. 2016-SLP-110 ( No. 6 ) 1 - 6 2016年1月

　詳細を見る

記述言語：日本語

researchmap
パレート最適と進化的戦略を用いた高精度大語彙音声認識システム構築の自動化

篠崎隆宏, 森谷崇史, 田中智大・篠崎隆宏, 渡部晋治, Kevin

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 115 ( 346 ) 31 - 36 2015年12月

　詳細を見る

記述言語：日本語出版者・発行元：電子情報通信学会

CiNii Books

researchmap
DNNを利用したAnimation Unitの変換に基づく顔画像変換の検討 (マルチメディア情報ハイディング・エンリッチメント)

齋藤優貴, 能勢隆, 篠崎隆宏

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 115 ( 303 ) 23 - 28 2015年11月

　詳細を見る

記述言語：日本語出版者・発行元：電子情報通信学会

researchmap
ニューラルネットワークに基づく差分スペクトルフィルタを用いた任意話者声質変換の検討 (音声)

小池治憲, 能勢隆, 篠崎隆宏

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 115 ( 253 ) 13 - 18 2015年10月

　詳細を見る

記述言語：日本語出版者・発行元：電子情報通信学会

CiNii Books

researchmap
WFSTを用いたスイッチ入力音声コミュニケーション支援システムと低遅延探索アルゴリズム (音声)

房福明, 篠崎隆宏

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 115 ( 253 ) 51 - 56 2015年10月

　詳細を見る

記述言語：日本語出版者・発行元：電子情報通信学会

CiNii Books

researchmap
高精度日本語話し言葉音声認識のためのKaldiレシピとその評価

森谷崇史, 篠崎隆宏, 渡部晋治

秋季研究発表会講演論文集 155 - 156 2015年9月

　詳細を見る

記述言語：日本語

researchmap
DNN特徴量抽出器に基づく単語検出器のFPGA実装と評価

朱凱, 李昊霖, 篠崎隆宏, 堀内靖雄, 黒岩眞吾

秋季研究発表会講演論文集 153 - 154 2015年9月

　詳細を見る

記述言語：日本語

researchmap
国際会議ICASSP2015参加報告

岡本拓磨, 小川哲司, 落合翼, 柏木陽佑, 亀岡弘和, 木下慶介, 郡山知樹, 齋藤大輔, 篠崎隆宏, 高木信二, 滝口哲也, 太刀岡勇気, 俵直弘, 橋本佳, 藤本雅清, 松田繁樹, 三村正人, 吉岡拓也, 渡部晋治

研究報告音声言語情報処理（SLP） Vol. 2015-SLP-107 ( No. 3 ) 1 - 7 2015年7月

　詳細を見る

記述言語：日本語

researchmap
ビデオ通話における音声および表情特徴量を用いた話者変換の検討 (マルチメディア情報ハイディング・エンリッチメント)

齋藤優貴, 能勢隆, 篠崎隆宏

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 115 ( 38 ) 45 - 50 2015年5月

　詳細を見る

記述言語：日本語出版者・発行元：電子情報通信学会

researchmap
ビデオ通話における音声および表情特徴量を用いた話者変換の検討

齋藤優貴, 能勢隆, 篠崎隆宏, 伊藤彰則

EMM研究会 2015年5月

　詳細を見る

記述言語：日本語

researchmap
ビデオ通話におけるニューラルネットワークを利用した話者変換の検討

齋藤優貴, 能勢隆, 篠崎隆宏, 伊藤彰則

情報処理学会第77回全国大会論文集 2015年3月

　詳細を見る

記述言語：日本語

researchmap
言語モデルと音響モデルを用いた自動韻律ラベリングの評価

増子理菜, 郡山知樹, 篠崎隆宏, 小林隆夫

春季研究発表会講演論文集 361 - 362 2015年3月

　詳細を見る

記述言語：日本語

researchmap
進化的アルゴリズムの大規模実行によるDNN構造最適化

篠崎隆宏, 渡部晋治

春季研究発表会講演論文集 11 - 12 2015年3月

　詳細を見る

記述言語：日本語

researchmap
DNN特徴量抽出器とDTWによる組み込みシステム向け耐雑音単語検出器の検討

朱凱, 篠崎隆宏

春季研究発表会講演論文集 155 - 156 2015年3月

　詳細を見る

記述言語：日本語

researchmap
ニューラルネットワークを用いた話者特徴量抽出に基づく一対多クロスリンガル声質変換

伊藤洋二郎, 篠崎隆宏, 能勢隆

春季研究発表会講演論文集 397 - 398 2015年3月

　詳細を見る

記述言語：日本語

researchmap
ニューラルネットワークに基づくユーザ音声を必要としない多対一声質変換の検討

能勢隆, 篠崎隆宏, 伊藤洋二郎, 伊藤彰則

春季研究発表会講演論文集 271 - 274 2015年3月

　詳細を見る

記述言語：日本語

researchmap
スピーキングテストシステムにおける発話内容を考慮した自動採点

小野豊, 篠崎隆宏, 堀内靖雄, 黒岩眞吾

電子情報通信学会 2015年3月

　詳細を見る

記述言語：日本語

researchmap
話者特徴量入力を付加したデノイジングオートエンコーダによるクロスリンガル声質変換 (音声) -- (第16回音声言語シンポジウム)

伊藤洋二郎, 篠崎隆宏, 能勢隆

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 114 ( 365 ) 13 - 18 2014年12月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

数発話程度のごく少量のラベルなし音声を用いて特定話者の任意の発話を任意話者の声質に変換することを目的として,音声特徴量を音声特徴量に変換するデノイジングオートエンコーダに話者特徴量入力を付加した構造を持つニューラルネットを用いた声質変換手法を提案する.多言語音声コーパスを用いた実験により,提案法の有効性を示す.

CiNii Books

researchmap
話者特徴量入力を付加したデノイジングオートエンコーダによるクロスリンガル声質変換

伊藤洋二郎, 篠崎隆宏, 能勢隆

音声言語情報処理研究会 (SIG-SLP) 2014年12月

　詳細を見る

記述言語：日本語

researchmap
GMMに基づく声質変換のためのMDL基準による混合数の自動決定

小林友哉, 能勢隆, 篠崎隆宏, 小林隆夫

秋季講演論文集 341 - 342 2014年9月

　詳細を見る

記述言語：日本語

researchmap
Denoising Autoencoderによる残響除去の大語彙音声認識における評価

小宮山大樹, 篠崎隆宏, 堀内靖雄, 黒岩眞吾

秋季講演論文集 131 - 132 2014年9月

　詳細を見る

記述言語：日本語

researchmap
ディープニューラルネットワークを用いた簡素な構造の単一単語検出器の検討

篠崎隆宏

秋季講演論文集 149 - 150 2014年9月

　詳細を見る

記述言語：日本語

researchmap
眼電位入力音声合成インタフェースのためのコンテキスト依存眼動素を用いた眼電位認識

房福明, 篠崎隆宏, 古井貞煕, 堀内靖雄, 黒岩眞吾

秋季講演論文集 393 - 394 2014年9月

　詳細を見る

記述言語：日本語

researchmap
複数ドメインコーパスからの文選択に基づくキャラクター音声合成の検討

荒生侑介, 能勢隆, 篠崎隆宏, 小林隆夫

秋季講演論文集 2014年9月

　詳細を見る

記述言語：日本語

researchmap
ボルツマンマシンとMCMCサンプリングを用いた音声のシングルチャネル雑音除去

博多屋涼, 篠崎隆宏, 小林隆夫

秋季研究発表会講演論文集 59 - 60 2014年9月

　詳細を見る

記述言語：日本語

researchmap
スイッチ入力音声コミュニケーション支援システムのための入力プロトコル推薦手法

房福明, 篠崎隆宏, 小林隆夫

秋季研究発表会講演論文集 229 - 230 2014年9月

　詳細を見る

記述言語：日本語

researchmap
スイッチ入力音声合成システムのための仮名プロトコル推薦手法

房福明, 篠崎隆宏, 小林隆夫

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 Vol. 114 ( No. 52 ) 355 - 360 2014年5月

　詳細を見る

記述言語：日本語

researchmap
スイッチ入力音声合成システムのための仮名プロトコル推薦手法

房福明, 篠崎隆宏, 小林隆夫

研究報告音楽情報科学（MUS） 2014 ( 68 ) 1 - 6 2014年5月

　詳細を見る

記述言語：日本語

単純なスイッチ操作を入力として素早く音声を合成できるインタフェースが実現すれば，随意運動の障害により意思伝達が困難な者に対する情報保障手段として有用であると期待される．スイッチは適切なインタフェース装置を用いることで，眼球運動など身体の様々な動作をもとに操作できる．一度のスイッチ操作で何通りの状態を区別できるかはケースバイケースであるが，一般にあまり複雑な操作は難しく，通信速度は極めて限定的である．そのため少しでも円滑な音声対話を可能とするためには，各ユーザーの状況に応じた効率的な入力プロトコルを用意することが非常に重要である．また同時に，入力プロトコルは容易に学習可能なものである必要がある．本研究では効率的な入力が可能でかつ学習も容易なプロトコルをユーザーの要望に応じながら自動生成する手法を提案する．提案手法の主なアイデアは，50 音表のような誰もが既に知っている文字表の知識を活用することと，スイッチ入力から発音シンボルへの変換において若干のエラーを許容しそれを N-gram 言語モデルを用いて補うことである．主観評価と客観評価を行い，提案手法により推薦されたプロトコルは従来のものと比べて覚えやすく入力速度も速いことを示す．Switch-to-speech interface can provide a means of interactive speech communication as a support system for people with disabilities with voluntary movements. Any motion of a part of the body such as eye movements can be used for the switch input. The number of possible switch states specified by an operation varies person to person, but the bandwidth is generally quite limited. Therefore, efficient protocols are needed to map the switch operations to pronunciations. Besides, the protocol must be easily learnable so that anyone can use. We propose a protocol recommendation method that can accept individual requirements in switch operations. It suggests a customized protocol that is both speedy to input and easy to remember. Two main ideas in the protocol design are utilizing the knowledge about the alphabet table that everyone already knows, and allowing a small error in the switch to pronunciation conversion that is compensated by an N-gram language model. The performance of the protocols is evaluated by objective and subjective experiments and the advantage of the proposed method is shown.

CiNii Books

researchmap
ハードウエア音声認識研究のためのプラットフォームFPGA基板

永谷悠, 李昊霖, 篠崎隆宏, 堀内靖雄, 黒岩眞吾

春季講演論文集 185 - 186 2014年3月

　詳細を見る

記述言語：日本語

researchmap
腕時計型スマートデバイスにおける音声GUIの有効性の検討

山本宗典, 篠崎隆宏, 堀内靖雄, 黒岩眞吾

春季講演論文集 147 - 148 2014年3月

　詳細を見る

記述言語：日本語

researchmap
SCMS2.0によるタンパク質ポテンシャルエネルギー最小化の諸条件における評価

篠崎隆宏, 関嶋政和

バイオ情報学研究発表会 2014年3月

　詳細を見る

記述言語：日本語

researchmap
音声合成のための音韻・韻律コンテキストを考慮した文選択アルゴリズムの評価

荒生侑介, 能勢隆, 郡山知樹, 篠崎隆宏, 小林隆夫

日本音響学会2014年春季研究発表会講演論文集 405 - 406 2014年3月

　詳細を見る

記述言語：日本語

researchmap
HMM音声合成のための音節出現頻度にロバストな音素セットの検討

舘野英樹, 能勢隆, 郡山知樹, 篠崎隆宏, 小林隆夫

日本音響学会2014年春季研究発表会講演論文集 409 - 410 2014年3月

　詳細を見る

記述言語：日本語

researchmap
音響モデルと言語モデルを利用したアクセント型・アクセント句境界の同時推定

鈴木啓史, 郡山知樹, 能勢隆, 篠崎隆宏, 小林隆夫

日本音響学会2014年春季研究発表会講演論文集 441 - 442 2014年3月

　詳細を見る

記述言語：日本語

researchmap
「音声認識」は今後こうなる！

河原達也, 篠田浩一, 堀貴明, 堀智織, 篠崎隆宏

SIG-SLP第100回記念シンポジウム 2014年1月

　詳細を見る

記述言語：日本語

researchmap
言語モデルと音響モデルを利用したアクセント句境界の自動推定

鈴木啓史, 郡山智樹, 能勢隆, 篠崎隆宏, 小林隆夫

研究報告音声言語情報処理（SLP） 2013 ( 16 ) 1 - 6 2013年12月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

テキスト音声合成システムの構築にはアクセント情報に関する韻律情報ラベルが付与された音声データが必要不可欠であるが，アクセント情報の付与は主に人手で行われており高コストである．そこで本研究では，音声データの自動ラベリングを目的としたアクセント句の境界推定手法を提案する．提案手法では，音声を書き起こしたテキスト情報だけでなく，音声から得られるＦ0 などの音響特徴量を使用する．アクセント句境界モデルおよびアクセント型モデルといった言語モデルには条件付き確率場 (CRF) を，そして音響モデルに隠れマルコフモデル (HMM) を使用し，それらを組み合わせてアクセント句の境界を推定する．本稿では，読み上げ音声に対するアクセント句境界推定実験を行い，従来法に比べ推定精度が向上することを示した．This paper proposes a technique for automatically estimating accent phrase boundaries for text-to-speech synthesis systems. To construct speech synthesis systems, we need to prepare a database that has annotations of prosodic information including accents. However, manual annotation for this purpose generally requires costly process. In contrast, the proposed method utilizes conditional random field (CRF) for the language models of accent phrase boundary and accent type, and uses hidden markov model (HMM) for the acoustic feature model. In this paper, we confirmed that the proposed method improved the estimation accuracy for reading-style speech data compared with conventional method.

CiNii Books

researchmap
言語モデルと音響モデルを利用したアクセント境界の自動推定

鈴木啓史, 郡山知樹, 能勢隆, 篠崎隆宏, 小林隆夫

電子情報通信学会技術研究報告 Vol. 113 ( No. 366 ) 97 - 102 2013年12月

　詳細を見る

記述言語：日本語

researchmap
S-CATにおける音響特徴量とSVRによるスコア推定

篠崎隆宏, 小野豊

日本行動計量学会 41 44 - 45 2013年9月

　詳細を見る

記述言語：日本語出版者・発行元：日本行動計量学会

CiNii Books

researchmap
Denoising Autoencoderを用いた残響下大語彙音声認識の検討

小宮山大樹, 石井敬章, 篠崎隆宏, 堀内靖雄, 黒岩眞吾

情報処理学会 vol. 2013-SLP-97 ( No. 1 ) 1 - 6 2013年7月

　詳細を見る

記述言語：日本語

researchmap
ユーザ属性を考慮した字幕付与方法の検討

白井洋輔, 柳村舞衣, 篠崎隆宏, 堀内靖雄, 黒岩眞吾, 遠藤俊樹, 宇都宮栄二

信学技報 vol. 112 ( no. 475 ) 245 - 250 2013年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

リアルタイム映像配信における字幕提示において,字幕情報の遅延や欠落は大きな問題である.この問題に対し,音声と字幕の同期と字幕の要約が有効であると考えられるが,一般的な映像での検証はほとんどなされていない.そこで本研究では(1)字幕提示のタイミングを変化させた場合の了解度実験(2)音声に忠実な字幕文(全文字幕)と音声を要約した字幕文(要約字幕)での了解度実験と主観評価実験を行った.結果として字幕提示のタイミングは音声と同期させた場合の了解度が最も高くなった.全文字幕と要約字幕では了解度において有意差は見られなかったが,ろう者に対しては要約字幕の方が了解度が高い傾向が示された.また,主観評価では要約字幕の評価が高くなり,字幕を要約することの有効性が示された.

CiNii Books

researchmap
Kinectとパーティクルフィルタによる手話認識手法の検討 (マルチメディア･仮想環境基礎)

古谷佳大, 今村大輔, 堀内靖雄, 川本一彦, 篠崎隆宏, 黒岩眞吾

電子情報通信学会技術研究報告 : 信学技報 112 ( 474 ) 251 - 256 2013年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

本論文ではKinectとパーティクルフィルタを用いた手話認識手法について検討する.我々の先行研究では腕の肌色情報とKinectによる距離情報を統合し、パーティクルフィルタにより、腕を追跡して手話認識を行う手法を提案し、高い認識精度が示された.しかしこの手法では、腕の肌色情報を用いるために腕まくりをしなければならないという制約が存在した.そこで本研究ではKinectの距離情報を利用することにより、腕まくりの制約を課さなくても腕検出を行える手法を提案し、認識実験により先行研究と同程度の認識精度が得られたことを示す.

researchmap
コミュニケーション支援のための眼球動作入力音声合成インタフェースの研究

房福明, 篠崎隆宏, 堀内靖雄, 黒岩眞吾, 古井貞熙, 武者利光

電子情報通信学会技術研究報告 112 ( 426 ) 29 - 34 2013年2月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

身体的なハンディキャップにより意思疎通が難しい患者,特に筋萎縮性側索硬化症(ALS)の患者に対し代替となる効率的なコミュニケーション手段を提供することを目的として,眼電位を入力とした音声合成インタフェースを提案し研究を行っている.システムは目の周囲に配置した生体電極から眼電位信号を取り込み,音声認識技術を応用した認識器を用いて眼球動作を認識する.そしてその結果をもとに,実時間で音声合成を行う.これまでのシステムでは認識器においてコンテキスト非依存隠れマルコフモデル(HMM)や一部の眼動素のみ直前のコンテキストに依存化させたバイ眼動素モデルを用いていたが,認識性能の点で不十分であった.そこで本研究では,直前および直後のコンテキストに依存化させた状態共有トライ眼動素モデルの利用を検討する.さらに,眼動素の並びをモデル化したN-gramモデルの導入を行う.従来のコンテキスト非依存HMMのみを用いた場合の仮名認識精度が84 3%,バイ眼動素モデルを用いた場合が89 1%であったのに対し,トライ眼動素モデルを用いた場合は96 2%と認識精度が大きく向上したさらに, N-gramモデルとして仮名3-gramモデルを使用することで, 97 3%の高い認識精度が得られた.

CiNii Books

researchmap
音声認識システムのパイプライン分解と遅延評価を用いた実装法

篠崎隆宏, 古井貞熙, 堀内靖雄, 黒岩眞吾

日本音響学会2012年秋季研究発表会 2012年9月

　詳細を見る

記述言語：日本語

researchmap
日本語スピーキングテストにおける文章読み上げ問題の自動採点の検討

山畑勇人, 大久保梨思子, 山田武志, 今井新悟, 石塚賢吉, 篠崎隆宏, 西村竜一, 牧野昭二, 北脇信彦

秋季講演論文集 399 - 400 2012年9月

　詳細を見る

記述言語：日本語

researchmap
コミュニケーション支援のための連続眼電位認識の研究

房福明, 篠崎隆宏, 古井貞熙, 堀内靖雄, 黒岩眞吾

日本音響学会2012年秋季研究発表会 1513 - 514 2012年9月

　詳細を見る

記述言語：日本語

researchmap
日本語スピーキングテストシステムS-CAT のためのSVR による自由発話の自動採点

小野豊, 大竹美鈴, 篠崎隆宏, 西村竜一, 山田武志, 石塚賢吉, 堀内靖雄, 黒岩眞吾, 今井新悟

秋季講演論文集 335 - 336 2012年9月

　詳細を見る

記述言語：日本語

researchmap
日本語スピーキングテストにおける文生成問題の自動採点の検討

大久保梨思子, 山畑勇人, 山田武志, 今井新悟, 石塚賢吉, 篠崎隆宏, 西村竜一, 牧野昭二, 北脇信彦

秋季講演論文集 395 - 396 2012年9月

　詳細を見る

記述言語：日本語

researchmap
純粋関数型コンパクトデコーダHusky2 の性能評価

深津澪, 篠崎隆宏, 堀内靖雄, 黒岩眞吾

秋季講演論文集 187 - 188 2012年9月

　詳細を見る

記述言語：日本語

researchmap
日本語スピーキングテストS-CAT における並列セグメンテーションを用いた自動採点の検討

西村竜一, 栗原理沙, 篠崎隆宏, 石塚賢吉, 山田武志, 今井新悟, 河原英紀, 入野俊夫

秋季講演論文集 397 - 399 2012年9月

　詳細を見る

記述言語：日本語

researchmap
クラウド時代の新しい音声研究パラダイム

秋葉友良, 岩野公司, 緒方淳, 小川哲司, 小野順貴, 篠崎隆宏, 篠田浩一, 南條浩輝, 西崎博光, 西田昌史, 西村竜一, 原直, 堀貴明

情報処理学会研究報告 Vol. 2012-SLP-92 ( No. 4 ) 1 - 7 2012年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

個人が複数の携帯情報端末を所有し,そこで得られたあらゆる音声データをクラウドに蓄積することが容易になりつつある.このように音声情報処理の周辺環境・技術が激変していく中で,音声情報処理技術のより一層の高度化が求められている.その期待に応えるためには,クラウド処理を前提とした音声研究プラットフォームの構築と,それを基盤とした新しい音声研究のパラダイムが必要である.本稿では,現在までに培われてきた音声情報処理技術を概観した上で,新しい研究パラダイムの方向性とそこで生じる新たな課題について議論する.

CiNii Books

researchmap
Slice Chain Max-Sumアルゴリズムによるタンパク質のポテンシャルエネルギー最小化に関する研究

猪瀬直人, 篠崎隆宏, 杜世橋, 古井貞熙, 関嶋政和

情報処理学会バイオ情報学研究会 Vol. 2012-BIO-28 ( No. 20 ) 1 - 8 2012年3月

　詳細を見る

記述言語：日本語

researchmap
日本語スピーキングテストにおける文章読み上げ問題の採点に影響を及ぼす要因の検討

山畑勇人, 大久保梨思子, 山田武志, 今井新悟, 石塚賢吉, 篠崎隆宏, 西村竜一, 牧野昭二, 北脇信彦

電子情報通信学会総合大会 2012年3月

　詳細を見る

記述言語：日本語

researchmap
眼電位入力音声合成インタフェースの提案とユーザー適応の検討

房福明, 篠崎隆宏, 堀内靖雄, 黒岩眞吾, 古井貞熙, 武者利光

第39回知能システムシンポジウム資料 293 - 298 2012年3月

　詳細を見る

記述言語：日本語

researchmap
言語モデルの順向き最尤文選択適応への教師なしクロスバリデーション適応法の応用

篠崎隆宏, 堀内靖雄, 黒岩眞吾

春季講演論文集 99 - 100 2012年3月

　詳細を見る

記述言語：日本語

researchmap
AWA長期間収録音声コーパスと時期差の分析

黒岩眞吾, 柘植覚, 張文彬, 篠崎隆宏, 堀内靖雄

春季講演論文集 83 - 86 2012年3月

　詳細を見る

記述言語：日本語

researchmap
ストーリー性を考慮した映画あらすじからの類似度計算

村手宏輔, 黒岩眞吾, 堀内靖雄, 篠崎隆宏

全国大会講演論文集 2012 ( 1 ) 535 - 537 2012年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

情報推薦に用いられるコンテンツベースベース技術に関して、あらすじが書かれた文書などストーリー性のあるコンテンツに対する類似度計算方法を提案する.ストーリーとは映画や小説などに含まれる話の筋のことであり、それらを説明する文書の中では人物の行動の経緯など要素の連続によって表現されていることが多い.しかし、従来の文書間類似度を計算する際に用いられるベクトル空間モデルでは、出現順序によって意味合いが変るストーリーを比較することは難しい.本研究ではストーリー性を考慮した文書の比較を行うことを目標とし、映画のあらすじ文書を対象に要素の並びを利用した類似度計算方法を検討した.

CiNii Books

researchmap
軽量な画像特徴量を用いたマルチモーダル音声認識査読

吉川正祥, 篠崎隆宏, 岩野公司, 古井貞熙

電子情報通信学会論文誌 Vol. J95-D ( No. 3 ) 618 - 627 2012年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

音声と動画のマルチモーダル音声認識は,音声のみを用いた場合と比較して高い認識性能が期待される手法であり,これまでの研究で雑音環境下での音声認識に有効であることが示されている.また画像特徴量として,様々なものが提案されている.しかしこれまでは認識性能に注意が向けられ,ポータブル機器等において重要な計算量に注目した研究はほとんど存在しない.実際,代表的な画像特徴量であるオプティカルフローや主成分分析に基づいた手法では,音響特徴量の計算と比べ計算量がかなり大きい.そこで本研究では,計算量と認識性能のバランスに優れた特徴量について検討を行った.発話区間検出を目的として提案された低輝度画素数に着目した特徴量を多次元に拡張し,マルチモーダル音声認識に応用する.実験ではビデオカメラで収録したデータとともにiPhone4で収録したデータを用い,提案輝度特徴量が計算量が少なくどの環境においても認識性能の向上に有効であることを示す.

CiNii Books

researchmap
Kinectとパーティクルフィルタを用いたHMM手話認識手法の検討

西村洋介, 今村大輔, 堀内靖雄, 川本一彦, 篠崎隆宏, 黒岩眞吾

信学技報 vol. 111 ( no. 431 ) 161 - 166 2012年2月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

本論文ではKinectによる手話認識手法を提案する.Kinectにより得られたRGB画像と距離情報を統合し,パーティクルフィルタにより,3次元空間上での手の位置座標を推定して,HMMにより連続手話認識を行った.その結果,従来手法であるRGB画像のみを用いたものと比較して認識精度を76.2%から86.0%に向上させることができた.また,磁気センサを用いた場合に比べ,認識精度の低下を1%以下に抑えることができた.実用的な応用を考慮した場合,磁気センサは高価で,装着するのも面倒であるが,提案手法は一般のユーザでも容易に入手可能なKinectのみを使用するため,実用的であるということが言える.

J-GLOBAL

researchmap
日本語発話能力測定ウェブシステムのための留学生発話分析

栗原理沙, 石塚賢吉, 西村竜一, 篠崎隆宏, 山田武志, 今井新悟

信学技報 vol. 111 ( no. 431 ) 141 - 142 2012年2月

　詳細を見る

記述言語：日本語

researchmap
隠れマルコフモデルを用いた眼電位認識の研究

房福明, 篠崎隆宏, 堀内靖雄, 黒岩眞吾, 古井貞熙, 武者利光

信学技報 111 ( No. SP2011-117 ) 97 - 102 2012年2月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

身体的なハンディキャップにより意思疎通が難しい者,特に筋萎縮性側索硬化症(ALS)の患者に対し,代替となる効率的なコミュニケーション手段を提供することを目的として,眼電位を入力とした音声合成インタフェースを提案する.眼電位は眼球が弱い電池であることに起因し,目の周囲に生体電極を配置することで検出できる.提案システムでは,音声認識を応用した認識器を用いて連続した眼球動作を眼電位信号から認識し,その結果をもとに実時間で音声合成を行う.本論文では,このうち認識部について評価を行う.認識器の動作には,予め眼球動作と眼電位の関係を学習した隠れマルコフモデルを用いる.実験では,ユーザ自身から収録したデータを元にモデルを作成することで,平均して95.7%の高い認識精度が得られることを示す.この方法で作成した眼電位のモデルは,基本的にそのユーザ専用となる.しかし実用の観点からは,不特定のユーザに対して動作することが望ましい.そこで,眼電位モデルの個人差による認識性能への影響や,その影響を低減するための適応化手法についても検討を行った.音声認識における話者適応化手法を応用することで,眼電位の認識精度が向上することを示す.

CiNii Books

researchmap
日本手話対話と日本語音声対話における話者交替現象の比較分析 (福祉情報工学)

村瀬優美, 堀内靖雄, 篠崎隆宏, 黒岩眞吾

電子情報通信学会技術研究報告 : 信学技報 111 ( 424 ) 7 - 12 2012年1月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

本稿では自発的対話における話者交替現象について,Sacksらの話者交替規則に基づいて,日本手話対話と日本語音声対話を比較分析した.日本手話の母語話者6名による3対話と日本語音声母語話者6名による3対話(各対話は約5分)を分析した結果,どちらもSacksらの話者交替規則を指向しているが,オーバーラップの時間長は手話の方が音声よりも長いことが示された.その理由として,(1)オーバーラップが生じた場合,音声は発話の途中で言いやめる場合が多いが,手話では発話の最後まで言い切る現象が多い,(2)日本手話の特徴として,自発話のTRP後に繰り返しや言換えをすることが多く,その場合,相手話者が発話を開始しても最後まで言い換え/繰返しを行うことにより話者重複が生じる,という二つの現象が明らかになった.ただし,(2)のような現象においても,繰返し/言い換えの際には非手指信号(NMS;手動作以外の表現)が消失したり,弱化したりすることにより,発話権の譲渡が明示される現象が多く見られた.これらの分析結果から,視覚言語と聴覚言語の違いが話者交替に与える影響が明らかになった.

CiNii Books

researchmap
Protein Potential Energy Minimization Using Slice Chain Max-Sum Algorithm

N. Inose, T. Shinozaki, S. Du, S. Furui, M. Sekijima

26th Annual Symposium of The Protein Society 2012年

　詳細を見る

記述言語：英語

researchmap
Distance based Graph Linearization and Sampled Max-sum Algorithm for Efficient 3D Potential Decoding of Macromolecules 査読

篠崎隆宏, 岩木聡直, 杜世橋, 関嶋政和, 古井貞熙

情報処理学会研究会報告 Vol. 4 ( 1 ) 34 - 44 2011年12月

　詳細を見る

記述言語：英語出版者・発行元：Information and Media Technologies Editorial Board

Three-dimensional structure prediction of a molecule can be modeled as a minimum energy search problem in a potential landscape. Popular ab initio structure prediction approaches based on this formalization are the Monte Carlo methods represented by the Metropolis method. However, their prediction performance degrades for larger molecules such as proteins since the search space is exponential to the number of atoms. In order to search the exponential space more efficiently, we propose a new method modeling the potential landscape as a factor graph. The key ideas are slicing the factor graph based on the maximum distance of bonded atoms to convert it to a linear structured graph, and the utilization of the max-sum search algorithm combined with samplings. It is referred to as Slice Chain Max-Sum and it has an advantage that the search is efficient because the graph is linear. Experiments are performed using polypeptides having 50 to 300 amino acid residues. It has been shown that the proposed method is computationally more efficient than the Metropolis method for large molecules.

DOI： 10.2197/ipsjtbio.4.34

researchmap
時期差に頑健な話者識別手法

張文彬, 陸昊澤, 篠崎隆宏, 堀内靖雄, 黒岩眞吾

バイオメトリクスと認識・認証シンポジウム 2011年11月

　詳細を見る

記述言語：日本語

researchmap
構内アナウンス環境下における音声認識のための音声区間検出

紺野遼輔, 篠崎隆宏, 堀内靖雄, 黒岩眞吾

日本音響学会 151 - 152 2011年9月

　詳細を見る

記述言語：日本語

researchmap
Distance-based Graph Linearization and Sampled Max-sum Algorithm for Efficient 3D Potential Decoding of Macromolecules

Takahiro Shinozaki, Toshinao Iwaki, Shiqiao Du, Masakazu Sekijima, Sadaoki Furui

研究報告バイオ情報学（BIO） 2011 ( 5 ) 1 - 8 2011年9月

　詳細を見る

記述言語：英語

Three-dimensional structure prediction of a molecule can be modeled as a minimum energy search problem in a potential landscape. Popular ab initio structure prediction approaches based on this formalization are the Monte Carlo methods represented by the Metropolis method. However, their prediction performance degrades for larger molecules such as proteins since the search space is exponential to the number of atoms. In order to search the exponential space more efficiently, we propose a new method modeling the potential landscape as a factor graph. The key ideas are slicing the factor graph based on the maximum distance of bonded atoms to convert it to a linear structured graph, and the utilization of the max-sum search algorithm combined with samplings. It is referred to as Slice Chain Max-Sum and it has an advantage that the search is efficient because the graph is linear. Experiments are performed using polypeptides having 50 to 300 amino acid residues. It has been shown that the proposed method is computationally more efficient than the Metropolis method for large molecules.Three-dimensional structure prediction of a molecule can be modeled as a minimum energy search problem in a potential landscape. Popular ab initio structure prediction approaches based on this formalization are the Monte Carlo methods represented by the Metropolis method. However, their prediction performance degrades for larger molecules such as proteins since the search space is exponential to the number of atoms. In order to search the exponential space more efficiently, we propose a new method modeling the potential landscape as a factor graph. The key ideas are slicing the factor graph based on the maximum distance of bonded atoms to convert it to a linear structured graph, and the utilization of the max-sum search algorithm combined with samplings. It is referred to as Slice Chain Max-Sum and it has an advantage that the search is efficient because the graph is linear. Experiments are performed using polypeptides having 50 to 300 amino acid residues. It has been shown that the proposed method is computationally more efficient than the Metropolis method for large molecules.

CiNii Books

researchmap
Sampled Max-Sum Algorithm and Application to 3D Structure Prediction of Proteins

岩木聡直, 篠崎隆宏, 古井貞熙

日本蛋白質科学会年会 2011年6月

　詳細を見る

記述言語：日本語

researchmap
純粋関数型言語を用いた超コンパクトデコーダの開発

篠崎隆宏, 関嶋政和, 萩原茂樹, 古井貞熙

情報処理学会 2011年4月

　詳細を見る

記述言語：日本語

researchmap
N-gramカウントを用いた言語モデルの効率的な選択学習

久保田雄, 篠崎隆宏, 古井貞熙, 宇都宮栄二, 新堂安孝

日本音響学会2011年春季講演論文集 ( No. 3-5-2 ) 73 - 74 2011年3月

　詳細を見る

記述言語：日本語

researchmap
クロス言語検索を用いた中国語音声認識による乗換案内システム

張 ?, 大西翼, 篠崎隆宏, 古井貞熙

日本音響学会2011年春季講演論文集 ( No. 2-5-7 ) 61 - 62 2011年3月

　詳細を見る

記述言語：日本語

researchmap
眼電位を用いた音声合成インタフェースの研究

尾崎賢人, 篠崎隆宏, 武者利光, 古井貞煕

日本音響学会2011年春季講演論文集 ( No. 3-4-13 ) 1621 - 1622 2011年3月

　詳細を見る

記述言語：日本語

researchmap
ホームビデオからのハイライト検出支援のための音声情報の視覚化

高木幸一, 川田亮一, 篠崎隆宏, 古井貞熙

日本音響学会2010年秋季講演論文集 ( No. 2-9-11 ) 69 - 70 2010年9月

　詳細を見る

記述言語：日本語

researchmap
柔軟でコンパクトな純粋関数型デコーダの検討

篠崎隆宏, 関嶋政和, 萩原茂樹, 古井貞熙

日本音響学会2010年秋季講演論文集 ( No. 1-Q-26 ) 181 - 182 2010年9月

　詳細を見る

記述言語：日本語

researchmap
音声の有無による違いを考慮したHome video簡易編集 (モバイルマルチメディア通信)

高木幸一, 川田亮一, 篠崎隆宏

電子情報通信学会技術研究報告 110 ( 128 ) 51 - 56 2010年7月

　詳細を見る

記述言語：日本語出版者・発行元：電子情報通信学会

researchmap
音声の有無による違いを考慮したHome video簡易編集

高木幸一, 川田亮一, 篠崎隆宏, 古井貞熙

研究報告オーディオビジュアル複合情報処理（AVM） 2010 ( 10 ) 1 - 6 2010年7月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

本稿では，音声の有無による違いを考慮した home video 簡易編集方式について報告する．音声情報を含む home video を編集する際に，映像・音声の両方を参照しながら編集する場合と，映像のみの情報を参照して編集する場合で結果が異なる．この違いを主観評価実験から明らかにする．さらに，その結果を利用して，音のみからしか得られない情報，すなわち，音としての本質的な情報のみを視覚化し，一般ユーザが視覚だけを使用して音声を含めたものと同じレベルの編集を行うことができる方式を提案する．主観評価の結果，映像・音声の両方を参照して編集する場合と大差ない結果が得られることを示す．This paper proposes a method for supporting trimming from home video on a mobile terminal without listening to the sound. It has two main contributions. First, we have analyzed the difference of trimming results between with and without listening to the sound, and derived what the necessary audio information not to be obtained from video is. Second, in consideration of the results, only the essential audio data is visualized on a small display of mobile terminal. An experimental result shows that the case of using the above-mentioned visualization data is comparable to that of providing both audio and video.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00069814/
年齢推定のための音声特徴量および推定器の検討

和田俊也, 篠崎隆宏, 古井貞熙

電子情報通信学会技術研究報告 Vol. SP2010-27 31 - 36 2010年6月

　詳細を見る

記述言語：日本語

researchmap
識別学習モデルと教師なしCV適応を用いたCSJ講演音声認識

篠崎隆宏, 久保田雄, ディクソン・ポール, 古井貞煕

日本音響学会2010年春季講演論文集 ( No. 1-6-14 ) 37 - 38 2010年3月

　詳細を見る

記述言語：日本語

researchmap
MLLR変換行列を特徴量として用いた年齢推定

和田俊也, 篠崎隆宏, 古井貞熙

日本音響学会2010年春季講演論文集 ( No. 2-6-13 ) 83 - 84 2010年3月

　詳細を見る

記述言語：日本語

researchmap
自然性と個人性に優れた音声合成のための音素継続時間長適応法

神山歩相名, 篠崎隆宏, 岩野公司, 古井貞熙

日本音響学会2010年春季講演論文集 ( No. 2-7-1 ) 329 - 330 2010年3月

　詳細を見る

記述言語：日本語

researchmap
日本語話し言葉コーパスを用いた異なるタスクに対する音声認識

西井俊介, 篠崎隆宏, 古井貞熙

日本音響学会2010年春季講演論文集 ( No. 1-6-10 ) 27 - 28 2010年3月

　詳細を見る

記述言語：日本語

researchmap
User identification using Time-of-Flight camera image streams

Felipe Gomez-Caballero, Takahiro Shinozaki, Sadaoki Furui

( No. 5X-8 ) 2 - 615 2010年3月

　詳細を見る

記述言語：英語

researchmap
HMM音声合成における自然性と個人性に優れた韻律モデル適応法の検討

神山歩相名, 篠崎隆宏, 岩野公司, 古井貞煕

情報処理学会研究会報告 Vol. 2010-SLP-80 ( No. 12 ) 1 - 6 2010年2月

　詳細を見る

記述言語：日本語

researchmap
教師無しアンサンブル適応法の提案と音響モデル適応への応用

篠崎隆宏, 古井貞煕

第１２回情報論的学習理論ワークショップ 2009年10月

　詳細を見る

記述言語：日本語

researchmap
目的音GMM尤度基準スペクトル補正法の諸評価

篠崎隆宏, 古井貞熙

日本音響学会2009年秋季講演論文集 ( No. 1-1-10 ) 31 - 32 2009年9月

　詳細を見る

記述言語：日本語

researchmap
自然性と個人性に優れたF0パターン適応法

神山歩相名, 篠崎隆宏, 岩野公司, 古井貞熙

日本音響学会2009年秋季講演論文集 ( No. 1-2-7 ) 249 - 250 2009年9月

　詳細を見る

記述言語：日本語

researchmap
音響モデルのアンサンブル学習

篠崎隆宏

( No. 11. ) 2009年7月

　詳細を見る

記述言語：日本語

researchmap
教師なしクロスバリデーション適応法の諸条件における評価

久保田雄, 篠崎隆宏, 古井貞熙

"情報処理学会研究報告, IPSJ SIG Technical Report" Vol. 2009-SLP-77 ( No. 7 ) 2009年7月

　詳細を見る

記述言語：日本語

researchmap
F0パターン生成モデルのための数量化?類の平均値置換による話者適応法の検討

神山歩相名, 篠崎隆宏, 岩野公司, 古井貞熙

電子情報通信学会技術研究報告 87 - 92 2009年6月

　詳細を見る

記述言語：日本語

researchmap
高精度音声認識のための教師なしクロスバリデーション適応法の提案

篠崎隆宏, 久保田雄, 古井貞熙

日本音響学会2009年春季講演論文集 ( No. 1-5-10 ) 27 - 28 2009年3月

　詳細を見る

記述言語：日本語

researchmap
教師なしクロスバリデーション適応によるタスク適応

久保田雄, 篠崎隆宏, 古井貞熙

日本音響学会2009年春季講演論文集 ( No. 1-5-11 ) 29 - 30 2009年3月

　詳細を見る

記述言語：日本語

researchmap
音声による３次元直接操作インタフェース査読

川崎智久, 大西翼, 篠崎隆宏, 古井貞熙

インタラクション2009 43 - 44 2009年3月

　詳細を見る

記述言語：日本語

researchmap
高精度音声認識のための教師なしクロスバリデーションおよび集合適応法の提案

篠崎隆宏, 久保田雄, 古井貞熙

社団法人情報処理学会研究報告（2009-SLP-75） ( No. 75 ) 1 - 6 2009年2月

　詳細を見る

記述言語：日本語

researchmap
携帯端末上でのプロキシ編集

高木幸一, 米山暁夫, 篠崎隆宏, 古井貞熙

電子情報通信学会技術研究報告 ( No. IE2009-02 ) 7 - 12 2009年2月

　詳細を見る

記述言語：日本語

researchmap
音声入力によるマウスの直接操作の検討

川崎智久, 大西翼, 岩野公司, 篠崎隆宏, 古井貞熙

日本音響学会2008年秋季講演論文集 ( No. 1-1-23 ) 55 - 56 2008年9月

　詳細を見る

記述言語：日本語

researchmap
目的音GMMを用いたスペクトル補正フィルタの提案

篠? 隆宏, 古井貞煕

日本音響学会2008年秋季講演論文集 ( No. 1-1-1 ) 1 - 2 2008年9月

　詳細を見る

記述言語：日本語

researchmap
効率的なクロスバリデーションに基づく混合ガウス分布の最適化とその拡張

篠? 隆宏, 古井貞煕, 河原達也

社団法人情報処理学会研究報告 2008-SLP-72 69 - 74 2008年7月

　詳細を見る

記述言語：日本語

researchmap
クロスバリデーション尤度によるHMMの混合数の最適化

篠崎隆宏, 河原達也

春季講演論文集 41 - 42 2008年3月

　詳細を見る

記述言語：日本語

researchmap
Aggregated cross-validation尤度を用いた混合ガウス分布最適化アルゴリズムの提案

篠崎隆宏, 古井貞熙, 河原達也

日本音響学会2008年春季講演論文集 ( No. 2-10-1 ) 67 - 68 2008年3月

　詳細を見る

記述言語：日本語

researchmap
Initial Evaluation of the Drivers' Japanese Speech Corpus in a Car Environment

Kousuke Hiraki, Takahiro Shinozaki, Koji Iwano, Agnieszka Betkowska, Betkowska Agnieszka, Koichi Shinoda, SADAOKI FURUI

Vol. SP2007-202 93 - 98 2008年3月

　詳細を見る

記述言語：英語

researchmap
頑健なパラメタ推定のためのAggregated EM 法の提案と評価

篠崎隆宏, Mari Ostendorf, 河原達也

電子情報通信学会技術研究報告 223 - 228 2007年12月

　詳細を見る

記述言語：日本語

researchmap
頑健なパラメタ推定のためのAggregated EMアルゴリズムの提案

篠崎隆宏, Mari Ostendorf, 河原達也

秋季講演論文集 131 - 134 2007年9月

　詳細を見る

記述言語：日本語

researchmap
効率的なクロスバリデーション尤度評価に基づく混合ガウス分布の最適化

篠崎隆宏, 河原達也

情報処理学会 81 - 86 2007年7月

　詳細を見る

記述言語：日本語

researchmap
ICASSP2007報告

戸田智基, 篠崎隆宏, 秋田祐哉

情報処理学会 45 - 48 2007年7月

　詳細を見る

記述言語：日本語

researchmap
超並列計算機を用いた話し言葉音声認識の研究

篠崎隆宏, 河原達也

京都大学学術情報メディアセンター全国共同利用版[公報] Vol. 6 ( No. 1 ) 31 - 37 2007年3月

　詳細を見る

記述言語：日本語

researchmap
頑健なパラメタ推定のためのクロスバリデーション EM 法の提案

篠崎隆宏, Mari OSTENDORF

情報処理学会研究報告音声言語情報処理（SLP） 2006 ( 136 ) 191 - 196 2006年12月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

EM アルゴリズムの欠点である過学習の問題を補うため、従来の自己尤度に代えてクロスバリデーション尤度を用いる新しい最尤学習アルゴリズムの提案を行う。並列化 EM学習と同様に学習セットを区画化し、各区画ごとに求めたモデルの十分統計量を用いることで、提案手法は従来の EM 学習と同程度の計算量で実行可能である。人工的なデータを用いた分析実験により、提案法が従来の EM アルゴリズムと比較して過学習に対して頑健であることを示す。中国語放送音声を用いた大語彙連続音声認識実験により、提案手法が EM 学習と比較してより多くのパラメタを有効に活用し、単語誤り率の削減に有効であることを示す。A new maximum likelihood training algorithm is proposed that compensates for weaknesses of the EM algorithm by using cross-validation likelihood in the expectation step to avoid overtraining. By using a set of sufficient statistics associated with a partitioning of the training data, as in parallel EM, the algorithm has the same order of computational requirements as the original EM algorithm. Analyses using a GMM with artificial data show the proposed algorithm is more robust for overtraining than the conventional EM algorithm. Large vocabulary recognition experiments on Mandarin broadcast news data show that the method makes better use of more parameters and gives lower recognition error rates than EM training.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00056862/
頑健なパラメタ推定のためのクロスバリデーションEM法の提案

篠崎隆宏, Mari Ostendorf

電子情報通信学会技術研究報告 13 - 18 2006年12月

　詳細を見る

記述言語：日本語

researchmap
音声情報処理技術の最先端：2.統計的手法を用いた音声モデリングの高度化とその音声認識への応用

篠田浩一, 篠崎隆宏

情報処理 45 ( 10 ) 1012 - 1019 2004年10月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

従来、音声認識においては隠れマルコフモデル(HMM)による音声のモデル化が一般的であるHMMを用いた音声認識は丁寧な読み上げ発声に対しては90%以上の高い認識性能を持つ.しかしながら,日常会話などの通常の話し言葉音声に対してはその性能はまだ十分でない.また,認識性能の著しく低い話者が存在する,周囲雑音の影響を受け性能が劣化する,など多くの課題が残されている.これらの課題の解決のためには,HMMを内包した,より柔軟な統計的モデリング手法が必要とされている.この目的のために多様な手法が活発に研究されているが,ここでは,その中で特に3つのトピック,情報量基準を用いたモデル選択,構造的事後確率最大化による話者適応化,ダイナミックベイジアンネットを用いた音声モデリング,について解説し,今後の展望を述べる.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00065158/
Dynamic Bayesian Network-Based Acoustic Models Incorporating Speaking Rate Effects

SHINOZAKI Takahiro, FURUI Sadaoki

IEICE transactions on information and systems 87 ( 10 ) 2339 - 2347 2004年10月

　詳細を見る

記述言語：英語出版者・発行元：一般社団法人電子情報通信学会

One of the most important issues in spontaneous speech recognition is how to cope with the degradation of recognition accuracy due to speaking rate fluctuation within an utterance. This paper proposes an acoustic model for adjusting mixture weights and transition probabilities of the HMM for each frame according to the local speaking rate. The proposed model is implemented along with variants and conventional models using the Bayesian network framework. The proposed model has a hidden variable representing variation of the "mode" of the speaking rate, and its value controls the parameters of the underlying HMM. Model training and maximum probability assignment of the variables are conducted using the EM/GEM and inference algorithms for the Bayesian networks. Utterances from meetings and lectures are used for evaluation where the Bayesian network-based acoustic models are used to rescore the likelihood of the N-best lists. In the experiments, the proposed model indicated consistently higher performance than conventional HMMs and regression HMMs using the same speaking rate information.

CiNii Books

researchmap
周波数帯域ごとの重みつき尤度を用いた音声認識の検討

西村義隆, 篠崎隆宏, 岩野公司, 古井貞煕

日本音響学会 2004年春季講演論文集 1 ( No. 2-11-9 ) 117 - 118 2004年3月

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

researchmap
超並列デコーダを用いた話し言葉音声認識

篠崎隆宏, 古井貞熙

日本音響学会 2004年春季講演論文集 ( No. 2-11-6 ) 111 - 112 2004年3月

　詳細を見る

記述言語：日本語

researchmap
超並列デコーダによる話し言葉音声認識

篠崎隆宏, 古井貞熙

第3回話し言葉の科学と工学ワークショップ講演予稿集 67 - 72 2004年2月

　詳細を見る

記述言語：日本語

researchmap
話し言葉音声認識へのベイジアンネットの適用

篠崎隆宏, 古井貞熙

国立国語研究所公開研究発表会「話し言葉のデータベース ?『日本語話し言葉コーパス』?」講演予稿集 47 - 48 2003年12月

　詳細を見る

記述言語：日本語

researchmap
周波数帯域ごとの重みつき尤度を用いた雑音に頑健な音声認識

西村義隆, 篠崎隆宏, 岩野公司, 古井貞熙

電子情報通信学会技術研究報告 ( No. SP2003-116 ) 19 - 24 2003年12月

　詳細を見る

記述言語：日本語

researchmap
隠れモードベイズ分類器を用いた音響モデルの適応学習

篠崎隆宏, 古井貞熙

日本音響学会 2003年秋季講演論文集 ( No. 2-6-2 ) 63 - 64 2003年9月

　詳細を見る

記述言語：日本語

researchmap
重みつきスペクトル特徴量を用いた雑音に頑健な音声認識

西村義隆, 篠崎隆宏, 岩野公司, 古井貞熙

日本音響学会 2003年秋季講演論文集 ( No. 1-6-3 ) 5 - 6 2003年9月

　詳細を見る

記述言語：日本語

researchmap
発話速度変動を考慮した隠れモードHMMによる音声のモデル化 : 音声認識におけるベイジアンネットの応用

篠崎隆宏, 古井貞煕

聴覚研究会資料 = Proceedings of the auditory research meeting 33 ( 4 ) 245 - 250 2003年6月

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

CiNii Books

researchmap
発話速度変動を考慮した隠れモードHMMによる音声のモデル化

篠崎隆宏, 古井貞熙

電子情報通信学会技術研究報告 ( No. SP2003-41 ) 37 - 42 2003年6月

　詳細を見る

記述言語：日本語

researchmap
大語彙連続音声認識のための言語的音響的属性に基づく単語単位の最適化

篠崎隆宏, 古井貞熙

日本音響学会 2003年春季講演論文集 ( No. 3-4-4 ) 135 - 136 2003年3月

　詳細を見る

記述言語：日本語

researchmap
言語モデルの教師なしバッチ型話題適応

横山忠介, 篠崎隆宏, 岩野公司, 古井貞熙

日本音響学会 2003年春季講演論文集 ( No. 3-4-1 ) 129 - 130 2003年3月

　詳細を見る

記述言語：日本語

researchmap
隠れモードHMMによる発話速度変動を考慮した音声のモデル化

篠崎隆宏, 古井貞熙

日本音響学会 2003年秋季講演論文集 ( No. 2-6-1 ) 61 - 62 2003年

　詳細を見る

記述言語：日本語

researchmap
言語モデルのバッチ型教師なし適応化法

横山忠介, 篠崎隆宏, 岩野公司, 古井貞煕

情報処理学会研究報告音声言語情報処理（SLP） 2002 ( 121 ) 183 - 188 2002年12月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

本稿では話し言葉音声認識の性能向上を目的とした、クラスモデルを用いた言語モデルのバッチ型教師なし適応化法を提案する。対象としているタスクは日本語講演音声認識である。提案手法では、複数の講演から構築される話題非依存の単語n-gramを用いて一つの講演音声を全て認識し、その認識仮説から講演ごとの話題依存クラスとに言語も出る適応を行い、その適応モデルを用いて講演音声を再認識する。提案する手法を用いた評価実験を行った結果、評価セット中の全ての講演について適応による単語正解精度の向上を確認した。適応化における最適なクラス数は100程度であり、そのときの単語正解精度の改善は絶対値で2.3%であった。さらに、音響モデルの教師なし適応を併用した場合についても言語モデルの適応化の効果を評価する実験を行ったところ、同様の認識性能の改善が得られ、最終的な講演音声認識性能は、単語正解精度で焼く71.8%に達した。This paper proposes an unsupervised, batch-type, class-based language model adaptation method for spontaneous speech recognition. The word classes are automatically determined by maximizeing the bigram likelihood using a training set. A class-based language model is built based on recognition hypotheses obtained using a general word-based language model, and linearly interpolated with the general language model. All the input utterances are re-recognized using the adapted language model. The proposed method was applied to the recognition of spontaneous presentations and was found to be effective in improving the recognition accuracy for all the presentations. The best condition was found to be using 100 word classes, and in this condition 2.3% of the absolute value improvement in the word accuracy averaged over all the speakers was achieved, using speaker independent acoustic models. It was also found that effectiveness of the proposed method is additive to that of the acoustic model adaptation. Consequently, 71.8% word recognition accuracy was achieved for spontaneous presentations after adapting both acoustic and language models.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00057297/
言語モデルのバッチ型教師なし適応化法

横山忠介, 篠崎隆宏, 岩野公司, 古井貞熙

電子情報通信学会技術研究報告 Vol. NLC2002-74 ( No. SP2002-151 ) 19 - 24 2002年12月

　詳細を見る

記述言語：日本語

researchmap
講演音声認識を対象とした言語モデルの話者適応化

横山忠介, 篠崎隆宏, 古井貞熙

日本音響学会 2002年秋季講演論文集 ( No. 3-9-6 ) 141 - 142 2002年9月

　詳細を見る

記述言語：日本語

researchmap
話し言葉音声中の単語認識における人を基準としたデコーダの性能評価

篠崎隆宏, 古井貞熙

日本音響学会 2002年秋季講演論文集 ( No. 2-9-13 ) 87 - 88 2002年9月

　詳細を見る

記述言語：日本語

researchmap
話し言葉音声認識における認識率の変動要因の分析と認識単位の設計

篠崎隆宏, 古井貞熙

第2回話し言葉の科学と工学ワークショップ講演予稿集 59 - 64 2002年3月

　詳細を見る

記述言語：日本語

researchmap
話し言葉音声認識における認識性能の個人差の解析

篠崎隆宏, 古井貞熙

日本音響学会 2002年春季講演論文集 ( No. 1-5-9 ) 17 - 18 2002年3月

　詳細を見る

記述言語：日本語

researchmap
Presentation Transcription Using a Japanese Spontaneous Speech Corpus

Takahiro Shinozaki, Sadaoki Furui

43 ( 7 ) 2098 - 2107 2002年

　詳細を見る

researchmap
話し言葉音声認識における話者間の認識率変動要因の解析

篠崎隆宏, 古井貞煕

情報処理学会研究報告音声言語情報処理（SLP） 2001 ( 123 ) 111 - 116 2001年12月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

話し言葉認識の認識性能は十分ではなく、また話し言葉の音声認識における単語正解精度低下の要因はあまり分かっていない。そこで、日本語話し言葉のコーパスの多数の話者を対象に音声認識実験を行い、話者間での単語正解精度変動の分布の解析を行った。個人差の主たる要因が発話速度、未知語率および言い直し頻度である事を明らかにした。また、教師無し話者適応化は単語正解精度の向上に効率的に働くが、適応化を行った後も発話速度の影響は減少しないことを示した。This paper reports results of various investigations on recognizing spontaneous presentation speech. Individual differences in the speech recognition preformance are analyzed. A restricted set of the speaker attributes comprising the speaking rate, the out of vocablary rate and the repair rate is found to be most significant to yield individual differences in the word accuracy. It is shown that unsupervised MLLR speaker adaptation works well form improving the word accuracy but does not compensate for the effect of the speaking rate.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00057386/
話し言葉音声認識における話者間の認識率変動要因の解析

篠崎隆宏, 古井貞熙

電子情報通信学会技術研究報告 Vol. SP2001-102 ( No. NLC2001-67 ) 1 - 6 2001年12月

　詳細を見る

記述言語：日本語

researchmap
話し言葉認識における決定木を用いた誤り要因の分析

篠崎隆宏, 古井貞熙

日本音響学会 2001年秋季講演論文集 2001 ( No. 1-1-9 ) 17 - 18 2001年10月

　詳細を見る

記述言語：日本語

CiNii Books

researchmap
話し言葉コーパスを用いた音声認識の検討

篠崎隆宏, 細川貴生, 古井貞熙

日本音響学会2001年春季講演論文集 2001 ( No. 1-3-14 ) 31 - 32 2001年3月

　詳細を見る

記述言語：日本語

CiNii Books

researchmap
話し言葉音声認識のための音響・言語モデル

篠崎隆宏, 堀智織, 古井貞熙

話し言葉の科学と工学ワークショップ予稿集 101 - 108 2001年3月

　詳細を見る

記述言語：日本語

researchmap
話し言葉音声の認識を目指して

篠崎隆宏, 斎藤洋平, 堀智織, 古井貞煕

情報処理学会研究報告音声言語情報処理（SLP） 2000 ( 119 ) 125 - 130 2000年12月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

話し言葉音声の認識を目指して平成11年度に開始したプロジェクトに関連して、講演音声、対談音声、討論音声などを対象として進めている種々の検討状況を報告する。実際の話し言葉コーパスから作成した音素モデルや言語モデル、話題の分野に対応した過去のニュースや教科書を用いた未知語の登録、対談のクロストークの区間における音響back-offなどが有用であることが確認された。認識性能に個人差が大きく、発話速度、フィラー数、言い直し数などに関連していることなどが確認された。会議などの議事録を、音声認識システムとユーザとが対話を行いながら効率的に作成する方法についても検討した。話し言葉の音声認識性能はまだ低く、認識対象としての文単位の抽出法、発音辞書、コーパス作成における書き起こし法など、今後解決しなければならない研究課題が多い。This paper reports various investigations on recognizing spontaneous speech such as lectures, interviews and discussions conducted in relation with our national project started in 1999. Usefulness of acoustic and linguistic modeling based on actual spontaneous speech corpora, registration of new words using past broadcast news or a textbook related to the areas of topics, and an acoustic backing-off method for the periods of cross talk in interviews have been confirmed. Recognition accuracy has a wide speaker-to-speaker variability according to the speaking rate, number of fillers, number of repairs, etc. This paper also reports a method for efficiently making minutes of meetings based on interaction between a speech recognition system and a user. The recognition accuracy for spontaneous speech is still very low, and there exist a large number of research issues including how to extract pseudo-sentence unit speech for recognition, how to build pronunciation dictionaries, and how to transcribe spontaneous speech in corpora.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00057471/
話し言葉音声の認識を目指して

篠崎隆宏, 斎藤洋平, 堀智織, 古井貞熙

電子情報通信学会技術研究報告 ( No. SP2000-96 ) 7 - 12 2000年12月

　詳細を見る

記述言語：日本語

researchmap
k-制限最小値独立置換族のサイズ均等性

篠崎隆宏, 武井由智, 伊東利哉

平成12年度信越支部大会 2000年10月

　詳細を見る

記述言語：日本語

researchmap
最適な最小値独立置換族の構成

武井由智, 伊東利哉, 篠崎隆宏

電子情報通信学会技術研究報告. COMP, コンピュテーション 98 ( 432 ) 89 - 98 1999年11月

　詳細を見る

記述言語：英語出版者・発行元：一般社団法人電子情報通信学会

最小値独立置換族は, インターネット上に存在する多数の類似した文書の特定に有用であることが知られている.整数n>0に対し, 集合{1, 2, ..., n}上の置換族Cが最小値独立であるとは, 任意の(空でない)部分集合X⊆{1, 2, ..., n}と任意のx∈Xに対し, π∈Cを一様且つ無作為に選んだ場合, Pr{min{π(X)}=π(x)}=∥X∥^<-1>が成り立つことを言う.ただし, ∥A∥は有限集合Aの要素数を表すものとする.これまでに, 集合{1, 2, ..., n}上の最小値独立置換族に関して, 以下の結果-(1)任意の最小値独立置換族Cに対して, ∥C∥>1cm(n, n-1, ..., 2, 1)=e^<n-o(n)>;(2)∥C∥<4^nとなるような最小値独立置換族Cが存在する-が知られているが, ∥C∥=1cm(n, n-1, ..., 2, 1)を満たす最小値独立置換族Cの存在さらにその構成法は未解決であった.本論文では, 全ての整数n>0に対し, ∥F_n∥=1cm(n, n-1, ..., 2, 1)を満たす極小な最小値独立置換族F_nの構成法を与え, その詳細な解析を行なう.

CiNii Books

researchmap
A Polynomial Time Sampling Algorithm for an Optimal Family of Min-Wise Independent Permutations (Models of Computation and Algorithms)

篠崎隆宏, 伊東利哉

数理解析研究所講究録 1093 74 - 80 1999年4月

　詳細を見る

記述言語：英語出版者・発行元：京都大学

CiNii Books

researchmap

▼全件表示

受賞

情報・システムソサイエティ活動功労賞

2018年電子情報通信学会

　詳細を見る

researchmap
情報処理学会山下記念研究賞

2009年

　詳細を見る

受賞国：日本国

researchmap
日本音響学会粟屋潔学術奨励賞

2008年

　詳細を見る

受賞国：日本国

researchmap
カナガワビエンナーレ日本国際連合協会会長賞

1987年神奈川県

　詳細を見る

researchmap

共同研究・競争的資金等の研究課題

ミクロな地震間作用の統計解析による地震発生システムの物理的多様性解明

研究課題/領域番号：22K03753 2022年4月 - 2026年3月

日本学術振興会科学研究費助成事業基盤研究(C)

麻生尚文, 篠崎隆宏

　詳細を見る

配分額：4290000円（直接経費：3300000円、間接経費：990000円）

researchmap
抑揚のある自然発話を実現する音声言語獲得エージェント

研究課題/領域番号：22K12069 2022年4月 - 2025年3月

日本学術振興会科学研究費助成事業基盤研究(C)

篠崎隆宏, 岡本拓磨

　詳細を見る

配分額：4160000円（直接経費：3200000円、間接経費：960000円）

researchmap
CEFR-Jに基づくCAN-DOタスク中心の教授と評価に関する総合的研究

研究課題/領域番号：20H00095 2020年4月 - 2025年3月

日本学術振興会科学研究費助成事業基盤研究(A) 基盤研究(A)

根岸雅史, 投野由紀夫, 奥村学, 高田智子, 片桐徳昭, 中谷安男, 能登原祥之, 石井康毅, 長沼君主, 篠崎隆宏, 工藤洋路, 内田諭, 村越亮治, 大橋由紀子, 和泉絵美, 周育佳

　詳細を見る

配分額：44720000円（直接経費：34400000円、間接経費：10320000円）

2020年度前半は研究チームの編成・計画の具体化と研究協力校の募集と依頼を行った。小中高と検討したが、最も可能性が高い京都府との連携を最初に模索し、CAN-DOリストを用いた CEFR-Jを基盤とする教育実践と評価を、高校レベルでは京都府立東舞鶴高等学校に研究協力校として受諾してもらい、詳細データ（短期・長期）を収集することになった。
一方、具体的な授業への介入を行う以外に、全般的な CAN-DO 評価を CEFR-J CAN-DO テストを用いて実施する計画も立てられた。これに関しても、CEFR-J のメーリングリスト等で呼びかけて大規模に実施する予定であったが、2020年度後半からのコロナ感染拡大により、当初の予定通り学校募集等ができなくなった。
またライティングのように大規模にデータ収集を不特定多数の学校で実施できる可能性も検討し、これに関してはさいたま市を対象に検討を進めていったが、こちらもコロナによる学校側の感染対策がさまざまな障害となり、十分に研究協力に時間を割くことが学校側としてできない状況があった。
2020年度後半は予定を変更し、研究協力校に負担にならないように京都府の全体研修などの機会を利用して担当の教員と連絡を取り合い、こちら側の研究目的や教育支援体制を説明し、連携できる体制を整えることに時間を費やした。2020年度終盤に、次年度の予定を話し合い、まずは試験的に授業観察を行って授業データを録画・分析して、そこから課題を見いだして二学期に授業を焦点化して改善点を探ることとした。

researchmap
全ベイズモデルに基づく音声認識システム学習のデータ無制約化

研究課題/領域番号：17K20001 2017年6月 - 2020年3月

日本学術振興会科学研究費助成事業挑戦的研究(萌芽) 挑戦的研究(萌芽)

篠崎隆宏, 持橋大地

　詳細を見る

配分額：6240000円（直接経費：4800000円、間接経費：1440000円）

音声認識を様々なタスクにおいて実用的なものとするためには、認識システムの学習において教師あり学習への依存度を減らし、システムをより自律的なものへとする必要がある。本研究では、ノンパラメトリックベイズ法と重み付き有限トランスデューサ技術を応用し、対応の無い音素データとテキストデータから、自動的に発音辞書を拡張する手法を提案した。また、書き起こしテキストを用いずにEncoder-Decoder型の音声認識システム全体を方策関数として、認識結果のスカラー評価値をもとにシステムを強化学習する方法について検討および実験を進めた。これは、クラウド上に構築された音声認識サーバーが多数のユーザーに認識サービスを提供する際に、ユーザーからのわずかなフィードバックを大量に集めることで、書き起こしを用いることなくシステム性能を向上させる応用を想定したものである。学習と共に期待報酬が増加することは理論的には保障されているものの、実際に有限のリソースのもとに学習を進めることは容易ではない。例えば、教師あり学習を行うシステムにおいて一般的なアテンション機構の利用は、学習の初期において強化学習を困難にすることが判明した。これは、アライメントの学習がうまくいかないためである。そこで、従来のアテンション機構を代替するものとしてスポーク状の構造を提案し、有効性を示した。人間にとって視覚と聴覚はそれぞれが重要であることに加えて、それらの相関の利用は学習を行う上で役立っていると考えられる。ビデオカメラに代表されるように画像と音声を同時に収録することは一般的に行われており、人手によるラベルを用いない学習において音声と画像の相関を有効利用できれば有用であると考えられる。このような目的の元、音声を手掛かりに画像中の音源を教師なしで特定する手法を提案し、有効性を示した。

researchmap
英語到達度指標CEFR-J準拠のCAN-DO指導タスクおよびテスト開発と公開

研究課題/領域番号：16H01935 2016年4月 - 2020年3月

日本学術振興会科学研究費助成事業基盤研究(A) 基盤研究(A)

根岸雅史, 投野由紀夫, 酒井英樹, 長沼君主, 高田智子, 内田諭, 金子恵美子, 村越亮治, 奥村学, 工藤洋路, 能登原祥之, 小泉利恵, 石井康毅, 篠崎隆宏, 和泉絵美, 印南洋, 中谷安男

　詳細を見る

配分額：37960000円（直接経費：29200000円、間接経費：8760000円）

まず、指導タスクとテスト・タスクのうち、CEFR-Jの各CAN-DOディスクリプタに基づくテスト・タスクの開発およびその困難度の検証を優先することを決定した。
各CAN-DOディスクリプタに基づく評価タスクの開発としては、2017年度はPre-A1からA2.2を作成したが、2018年度はB1.1からB2.2までのテスト項目の開発と検証を行った。リーディングにおいては、リーディングのテキスト・タイプ、テキスト困難度、タスクについて検討し、修正をした後、テスト・セットを作成した。リスニングにおいては、リーディングと同様、リスニングのテキスト・タイプ、テキスト困難度、タスクについて検討し、修正をしたが、音声の収録およびテストの実施には至らなかった。ススピーキング（発表）・スピーキング（やりとり）・ライティングにおいては、タスクと採点方法について検討し、修正をした後、テスト・セットを作成した。これらのテストをそれぞれ実施し、採点・統計的な分析・解釈を行った。
言語処理班では、リーディングやリスニングのテキスト分析の結果に基づき、テキストのCEFR-Jレベルの判定を可能にするプログラムの開発を行い、公開した。さらに、文法のレベル別基準特性を判定を可能にするCEFR-J Grammar Profileを開発・公開した。音声認識では、スピーキング・テスト解答データを追加することで、音声認識プログラムの精度を向上した。
2019年3月23日に「CEFR-J 2019シンポジウム in 京都」を開催し、170名余りの参加者があった。このシンポジウムでは、3年間の研究成果の発表をするとともに、CEFR-Jのリソースの活用ワークショップも行った。さらに、CEFR-Jの利用企業や協力校の発表機会を提供した。これらの活動により、CEFR-Jが広く認知され、日本の英語教育の改善に大きく資することができた。

researchmap
音声認識生成システムの自己組織化学習

研究課題/領域番号：26280055 2014年4月 - 2018年3月

日本学術振興会科学研究費助成事業基盤研究(B) 基盤研究(B)

篠崎隆宏, 能勢隆, Duh Kevin, 荒井隆行, 渡部晋治

　詳細を見る

配分額：15730000円（直接経費：12100000円、間接経費：3630000円）

少量のラベル付き音声データと大量のラベル無し音声データから音声言語を学習したり、人手に頼ることなく自動的にシステム構造や学習条件を最適化しシステム性能を最大化したりすることのできる、自律的な音声言語情報処理システムの仕組みを実現することを目的に研究を行った。進化戦略を用いた大規模なニューラルネットワークシステムの自動最適化手法や、音声をモデル化する各種の統計モデルの教師なし学習法、強化学習法の提案を行い、実験により有効性を示した。研究成果発表の一環として公開したフリーな高性能日本語音声認識システムは、国内外で幅広く用いられている。

researchmap
コンピュータ自動採点日本語スピーキングテストの実用化と妥当性の検証

研究課題/領域番号：26244026 2014年4月 - 2017年3月

日本学術振興会科学研究費助成事業基盤研究(A) 基盤研究(A)

今井新悟, 西村竜一, 山田武志, 赤木彌生, 中園博美, 伊東祐郎, 菊地賢一, 中村洋一, 本田明子, 篠崎隆宏, 家根橋伸子, 石塚賢吉

　詳細を見る

配分額：37700000円（直接経費：29000000円、間接経費：8700000円）

日本語学習者の日本語スピーキング能力の測定を自動で行う適応型テストシステムSJ-CAT (Speaking Japanese Computerized Adaptive Test) を開発し、インターネット上で公開した。SJ-CATは、文読み上げ問題、選択肢読み上げ問題、文生成問題、自由発話問題の4種類2セクションで構成され、音声の特徴量（韻律、音響尤度、スピーキングレートなど）やキーワードなどで評価する。項目応答理論の段階反応モデルで日本語スピーキング能力を点数化する。訓練された人間が評定を行うスピーキングテストとSJ-CATを比較し、実用化に十分な相関を得た。

researchmap
Deep Generative Model とその因子分解による音声情報処理基盤

研究課題/領域番号：25280058 2013年4月 - 2016年3月

日本学術振興会科学研究費助成事業基盤研究(B) 基盤研究(B)

篠田浩一, 岩野公司, 篠崎隆宏

　詳細を見る

配分額：16900000円（直接経費：13000000円、間接経費：3900000円）

多数話者の発声した大量の音声データから、Deep Neural Network (DNN)を構築し、それを音韻と話者の要因毎に分解することで高性能な音声認識モデルを獲得する枠組みの研究開発を行った。2つのDNNの一部を共有させた構造をもつDeep Siamese Networkを用いた話者認識、音韻構造を階層的な出力層で表現したDNNを用いた話者適応化、Soft Targetを教師としたStudent-Teacher学習の枠組みを用いた話者正規化学習、の3つの手法を提案し、それぞれで話者認識性能、音声認識性能の顕著な向上を得た。それ以外にもDNNの実装、ネットワーク構造設計の研究を行った。

researchmap
グラフィカルモデルを用いた高分子ポテンシャルデコーダの開発

研究課題/領域番号：23650068 2011年 - 2013年

日本学術振興会科学研究費助成事業挑戦的萌芽研究挑戦的萌芽研究

篠崎隆宏, 篠田浩一, 関嶋政和, 関嶋政和

　詳細を見る

配分額：3250000円（直接経費：2500000円、間接経費：750000円）

タンパク質の立体構造はその機能と深く関わるため、アミノ酸配列から立体構造を予測することは重要である。本プロジェクトでは効率的な立体構造予測の実現のため、分子のポテンシャルエネルギーにより定まるギブス分布の表現に因子グラフと呼ばれるグラフ構造を導入した上で、マルコフ連鎖モンテカルロ(MCMC) 法による局所的な探索とグローバルなグラフ探索手法であるmax-sumアルゴリズムを組み合わせたSCMS手法の提案と改良を行った。計算機実験により提案法が従来のMCMC 法や、MCMCに準ニュートン法を組み合わせた方法と比較して、少ない計算量でより低いエネルギーの分子形状を探索できることを示した。

researchmap
音声認識技術を応用したコンピュータ自動採点日本語スピーキングテストの開発

研究課題/領域番号：22242014 2010年 - 2012年

日本学術振興会科学研究費助成事業基盤研究(A) 基盤研究(A)

今井新悟, 伊東祐郎, 中村洋一, 酒井たか子, 赤木彌生, 菊地賢一, 本田明子, 中園博美, 西村竜一, 篠崎隆宏, 山田武志, 家根橋伸子, 石塚賢吉, ファムターンソン

　詳細を見る

配分額：46670000円（直接経費：35900000円、間接経費：10770000円）

日本語学習者のための日本語スピーキング能力をコンピュータ上で自動採点するテストシステムを開発した。インターネットを介して受験でき、時間と場所の制約を受けずに受験が可能である。音声認識技術を使い、受験者の発話から特徴量を抽出することにより、自動採点を実現している。項目応答理論を用い、受験者の能力に適合した難しさの問題を出題するアダプティブテストとなっており、少ない問題数で能力の判定ができる。

researchmap
遅延評価手法を用いた大規模統計システム構築法の確立

2010年

　詳細を見る

資金種別：競争的資金

researchmap
長期間収録音声コーパスに基づく話者内音声変動に頑健な話者認識手法の研究

研究課題/領域番号：21300060 2009年4月 - 2014年3月

日本学術振興会科学研究費助成事業基盤研究(B) 基盤研究(B)

黒岩眞吾, 柘植覚, 長内隆, 篠崎隆宏, 堀内靖雄, 西田昌史, 篠崎隆宏

　詳細を見る

配分額：17940000円（直接経費：13800000円、間接経費：4140000円）

本研究では、音声が長期間及び短期間にどのように変化するかを調査するための音声コーパスを構築すると共に、民生利用及び法科学の分野での利用を視野に、話者内音声変動に頑健で信頼性の高い話者認識手法の検討を行った。具体的には、10年間に渡り、毎週1回朝・昼・夕に同一話者が防音室で音素バランス文等を発声した音声データを国立情報学研究所・音声資源コンソーシアムを通じ『AWA長期間収録音声コーパス』として公開した。また、同コーパスを利用して話者内音声変動に頑健な話者認識手法を提案すると共に、法科学分野における話者認識で有用な特徴量、機械と人の話者認識特性の比較、話者モデル構築手法、照合手法を提案した。

researchmap
多層モデルの階層間密統合に基づく音声理解フレームワークの研究

研究課題/領域番号：21300066 2009年4月 - 2014年3月

日本学術振興会科学研究費助成事業基盤研究(B) 基盤研究(B)

李晃伸, 駒谷和範, 南條浩輝, 西村竜一, 西田昌史, 篠崎隆弘, 秋田祐哉

　詳細を見る

配分額：17550000円（直接経費：13500000円、間接経費：4050000円）

本研究では，音声認識における信号処理から言語理解までの各層における制約について，低次から高次までの制約を互いに相互作用させる枠組みの研究を行った．階層ごとの統計モデルの研究では，言語・音響・対話の各層における高精度な統計モデルの研究を行い，各層からの制約統合について検討を行った．制約の統合手法の研究では，ベイズリスク最小化探索および対話制御における音声情報の統合等について研究を行った．これらの成果は音声対話システムを構築するための基盤システムとして，オープンソースツールキットMMDAgentおよび音声認識エンジンJuliusの一部として公開されている．

researchmap
WFSTによる音声認識の高度化

研究課題/領域番号：21300062 2009年 - 2011年

日本学術振興会科学研究費助成事業基盤研究(B) 基盤研究(B)

古井貞煕, 篠田浩一, 篠崎隆宏

　詳細を見る

配分額：18070000円（直接経費：13900000円、間接経費：4170000円）

重みつき有限状態トランスデューサ(WFST)による音声認識の高度化と、WFSTデコーダの新たな応用展開を目指して研究を行い、以下の種々の成果を上げることができた。WFSTデコーダのon-the-fly合成アルゴリズムの改良を行い、世界最高性能の音声認識デコーダ(T^3デコーダ)を開発した。これにさらに音声・非音声情報を組み込み、雑音下での認識性能を向上させた。開発したデコーダを、大規模コーパスを持たない音声や、複数言語が混在して用いられる音声の認識、transliterationなどに適用し、効果的なアルゴリズムを提案した。さらに、デコーダ技術の新たな展開となるアイディアを創出した。開発したT^3デコーダを、国内外に公開した。

researchmap
目的音モデル尤度を用いた高速な耐雑音音声認識フロントエンドの研究

2009年 - 2011年

　詳細を見る

資金種別：競争的資金

researchmap
目的音モデル尤度を用いた高速な耐雑音音声認識フロントエンドの研究

研究課題/領域番号：21700188 2009年 - 2010年

日本学術振興会科学研究費助成事業若手研究(B) 若手研究(B)

篠崎隆宏

　詳細を見る

配分額：4290000円（直接経費：3300000円、間接経費：990000円）

雑音の補償操作を雑音の定式化に最も適した短時間スペクトル領域で行い、補償のためのパラメタ推定に音声の性質を表すのに最も適した音声特徴量に対する最尤基準を用いる目的音GMMスペクトル補正法(TGSC法)の提案を行った。構成のバリエーションやパラメタの推定法等について最適な条件の探索を行い、音声認識実験により効果を示した。また実時間動作が可能であることを確認した。

researchmap
CV 学習法を用いた最尤及び識別学習基準による準教師あり学習法の研究

2009年 - 2010年

　詳細を見る

資金種別：競争的資金

researchmap
Lightly supervised training based on CV framework using ML and discriminative criteria

2009年 - 2010年

　詳細を見る

資金種別：競争的資金

researchmap
Statistical pattern classifier training based on cross-validation likelihood

2007年 - 2009年

　詳細を見る

資金種別：競争的資金

researchmap
クロスバリデーション尤度を用いた統計的パターン分類器学習アルゴリズムの研究

2007年 - 2009年

　詳細を見る

資金種別：競争的資金

researchmap
クロスバリデーション尤度を用いた統計的パターン分類器学習アルゴリズムの研究

研究課題/領域番号：19700167 2007年 - 2008年

日本学術振興会科学研究費助成事業若手研究(B) 若手研究(B)

篠崎隆宏

　詳細を見る

配分額：3780000円（直接経費：3300000円、間接経費：480000円）

モデル選択手法として用いられているクロスバリデーション的手法を繰り返し最尤パラメタ推定法の内部に効果的に組み込むことで、少ないデータから精密かつ一般性の高い統計モデルを学習するための手法を提案した。具体的には期待値最大化学習法にクロスバリデーションを組み込んだ手法の提案を行い、さらに教師なし適応への応用も行った。提案手法を音声認識で用いる統計モデルの学習に応用し、認識性能の向上に非常に効果的であることを示した。

researchmap

▼全件表示