研究者詳細 - 中臺　一博

写真a

ナカダイ　カズヒロ

中臺　一博

nakadai kazuhiro

所属

工学院教授

ホームページ

http://www.ra.sc.e.titech.ac.jp/

プロフィール

1993年東京大学工学部電気工学科卒業，1995年同大学院工学系研究科情報工学専攻修了．1995年から1999年までNTT および NTTコムウェア，1999年から2003年までJST ERATO 北野プロジェクト，2003年から2022年まで（株）ホンダ・リサーチ・インスティチュート・ジャパンに勤務．2022年より東京工業大学工学院システム制御系教授．博士（工学）．その間，2006年から2015年まで，東京工業大学大学院情報理工学研究科客員准教授，連携准教授，連携教授兼務．2016年より，東京工業大学工学院システム制御系特定教授, 2017 年より同特任教授を兼務．2011-2018年，早稲田大学理工学術院創造理工学研究科客員教授を兼務．ロボット聴覚，実時間情報統合，音環境理解の研究に従事．2015-2016年，2024-2025年人工知能学会理事，2017-2018年日本ロボット学会理事．IEEE Fellow，日本ロボット学会フェロー．

外部リンク

News & Topics

Listening drone helps find victims needing rescue in disasters

2017/12/22

掲載言語：英語

　詳細を見る

As part of the ImPACT Tough Robotics Challenge Program, an initiative of the Cabinet Office of Japan, a Japanese research group has developed the first system worldwide that is able to detect acoustic signals such as voices from victims needing rescue, even when they are difficult to find or are in places cameras cannot be used. This system was developed using three technological elements: a microphone array technology for the robot ears, an interface for visualization of invisible sounds, and a microphone array that is easily connected to a drone, even in rainy weather.
ドローンが耳を澄まして要救助者の位置を検出 ―災害発生時の迅速な救助につながる技術を開発―

2017/12/08

掲載言語：日本語

　詳細を見る

ドローンのようなロボットによる人命救助はカメラなど視覚的な方法が主集音方法を工夫して雑音減らし、瓦礫の下の人の声などを検出迅速かつ効率的な人命救助に活用できる全天候型システムを開発暗くても、うるさくても、見えない場所でも、音を検出可

学位

Ph. D. （ The Univ. of Tokyo ）

研究キーワード

ロボット聴覚
音環境理解
音響信号処理
ロボティクス
人工知能

研究分野

情報通信 / 知能ロボティクス / ロボット聴覚
情報通信 / 知能情報学 / 音環境理解
情報通信 / ヒューマンインタフェース、インタラクション / HMI. HRI
情報通信 / ソフトウェア / オープンソースソフトウェア

学歴

東京大学大学院情報工学専攻

1993年4月 - 1995年3月

　詳細を見る

researchmap
東京大学工学部電気工学科

1991年4月 - 1993年3月

　詳細を見る

researchmap
東京大学教養学部理科一類

1989年4月 - 1991年3月

　詳細を見る

researchmap

経歴

東京科学大学工学院システム制御系教授博士（工学）

2024年10月 - 現在

　詳細を見る

国名：日本国

researchmap
東京工業大学工学院システム制御系教授博士（工学）

2022年4月 - 2022年9月

　詳細を見る

国名：日本国

researchmap
東京工業大学工学院システム制御系（大学院情報理工学研究科からの改組による）特定教授→特任教授(2017.6)

2016年4月 - 2022年3月

　詳細を見る

researchmap
早稲田大学理工学術院創造理工学研究科客員教授

2011年4月 - 2018年3月

　詳細を見る

researchmap
東京工業大学大学院情報理工学研究科客員助教授→客員准教授(2008)→連携准教授(2009)→連携教授(2012)

2006年4月 - 2016年3月

　詳細を見る

researchmap
株式会社ホンダ・リサーチ・インスティチュート・ジャパンプリンシパル・サイエンティスト

2003年5月 - 2022年3月

　詳細を見る

researchmap
独立行政法人科学技術振興事業団 ERATO北野共生システムプロジェクト研究員

1999年7月 - 2003年4月

　詳細を見る

researchmap
NTTコミュニケーションウェア株式会社社員

1997年9月 - 1999年6月

　詳細を見る

researchmap
日本電信電話株式会社社員

1995年4月 - 1999年6月

　詳細を見る

researchmap

▼全件表示

所属学協会

ISCA

　詳細を見る

researchmap
日本ロボット学会

　詳細を見る

researchmap
人工知能学会

　詳細を見る

researchmap
IEEE

　詳細を見る

researchmap
ヒューマンインタフェース学会

　詳細を見る

researchmap
日本音響学会

　詳細を見る

researchmap
ACM

　詳細を見る

researchmap
情報処理学会

　詳細を見る

researchmap

▼全件表示

委員歴

日本ロボット学会理事

2025年3月 - 2027年3月

　詳細を見る

団体区分：学協会

researchmap
人工知能学会理事

2024年7月 - 2026年6月

　詳細を見る

団体区分：学協会

researchmap
日本ロボット学会理事

2017年4月 - 2019年3月

　詳細を見る

団体区分：学協会

researchmap
人工知能学会理事

2015年7月 - 2017年6月

　詳細を見る

団体区分：学協会

researchmap

論文

What Do Neural Networks Learn for TDOA Estimation? A Cross-Architecture Probing Study.

Yaozhong Kang, Jiang Wang, Runwu Shi, Takeshi Ashizawa, Benjamin Yen 0001, Kazuhiro Nakadai

CoRR abs/2606.22020 2026年6月

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.48550/arXiv.2606.22020

researchmap
Fast-SDE: Efficient Single-Microphone Sound Source Distance Estimation in Reverberant Environments.

Jiang Wang, Runwu Shi, Yaozhong Kang, Benjamin Yen 0001, Takeshi Ashizawa, Kazuhiro Nakadai

CoRR abs/2606.12339 2026年6月

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.48550/arXiv.2606.12339

researchmap
Ecologically-Constrained Task Arithmetic for Multi-Taxa Bioacoustic Classifiers Without Shared Data.

Ragib Amin Nihal, Benjamin Yen 0001, Runwu Shi, Takeshi Ashizawa, Kazuhiro Nakadai

CoRR abs/2605.03914 2026年5月

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.48550/arXiv.2605.03914

researchmap
The Talking Robot: Distortion-Robust Acoustic Models for Robot-Robot Communication.

Hanlong Li, Karishma Kamalahasan, Jiahui Li, Kazuhiro Nakadai, Shreyas Kousik

CoRR abs/2603.07072 2026年3月

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.48550/arXiv.2603.07072

researchmap
Unsupervised Single-Channel Audio Separation with Diffusion Source Priors.

Runwu Shi, Chang Li, Jiang Wang, Rui Zhang, Nabeela Khan, Benjamin Yen 0001, Takeshi Ashizawa, Kazuhiro Nakadai

AAAI 25348 - 25356 2026年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1609/aaai.v40i30.39728

researchmap

その他リンク： https://dblp.org/db/conf/aaai/aaai2026.html#ShiLWZKYAN26
Pattern Enhanced Multi-Turn Jailbreaking: Exploiting Structural Vulnerabilities in Large Language Models.

Ragib Amin Nihal, Rui Wen, Kazuhiro Nakadai, Jun Sakuma

ACL (Findings) 22123 - 22174 2026年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

researchmap

その他リンク： https://dblp.org/rec/conf/acl/2026f
Single-Microphone-Based Sound Source Localization for Mobile Robots in Reverberant Environments. 査読国際共著国際誌

Jiang Wang, Runwu Shi, Benjamin Yen 0001, He Kong, Kazuhiro Nakadai

CoRR abs/2506.16173 2025年6月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.48550/arXiv.2506.16173

researchmap
Observability-Aware Active Calibration of Multi-Sensor Extrinsics for Ground Robots via Online Trajectory Optimization. 査読国際共著

Jiang Wang, Yaozhong Kang, Linya Fu, Kazuhiro Nakadai, He Kong

CoRR abs/2506.13420 2025年6月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.48550/arXiv.2506.13420

researchmap
合同研究会 2024（SIGAIs 2024）開催報告

馬場雪乃, 松井藤五郎, 中臺一博, 坂地泰紀

人工知能 40 ( 3 ) 426 - 433 2025年5月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人人工知能学会

DOI： 10.11517/jjsai.40.3_426

CiNii Research

researchmap

その他リンク： https://ndlsearch.ndl.go.jp/books/R000000004-I034116187
Multilingual Gloss-free Sign Language Translation: Towards Building a Sign Language Foundation Model. 査読

Sihan Tan, Taro Miyazaki, Kazuhiro Nakadai

CoRR abs/2505.24355 2025年5月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.48550/arXiv.2505.24355

researchmap
Single-Channel Target Speech Extraction Utilizing Distance and Room Clues. 査読

Runwu Shi, Zirui Lin, Benjamin Yen 0001, Jiang Wang, Ragib Amin Nihal, Kazuhiro Nakadai

CoRR abs/2505.14433 2025年5月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.48550/arXiv.2505.14433

researchmap
An Efficient GPU-based Implementation for Noise Robust Sound Source Localization. 査読

Zirui Lin, Masayuki Takigahira, Naoya Terakado, Haris Gulzar, Monikka Roslianna Busto, Takeharu Eda, Katsutoshi Itoyama, Kazuhiro Nakadai, Hideharu Amano

CoRR abs/2504.03373 2025年4月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.48550/arXiv.2504.03373

researchmap
Weakly Supervised Multiple Instance Learning for Whale Call Detection and Localization in Long-Duration Passive Acoustic Monitoring. 査読

Ragib Amin Nihal, Benjamin Yen 0001, Runwu Shi, Kazuhiro Nakadai

CoRR abs/2502.20838 2025年2月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.48550/arXiv.2502.20838

researchmap
Improvement in Sign Language Translation Using Text CTC Alignment. 査読

Sihan Tan, Taro Miyazaki, Nabeela Khan, Kazuhiro Nakadai

COLING 3255 - 3266 2025年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：Association for Computational Linguistics

researchmap

その他リンク： https://dblp.uni-trier.de/rec/conf/coling/2025
MultiGAU: Real Time Sign Language Generation Using Multimodal Gated Attention. 査読

Nabeela Khan, Bowen Wu 0002, Carlos Toshinori Ishi, Kazuhiro Nakadai

IEA/AIE (1) 149 - 160 2025年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：Springer

DOI： 10.1007/978-981-96-8889-0_13

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/ieaaie/ieaaie2025-1.html#KhanWIN25
Distance Based Single-Channel Target Speech Extraction. 査読

Runwu Shi, Benjamin Yen 0001, Kazuhiro Nakadai

ICASSP 1 - 5 2025年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/ICASSP49660.2025.10887680

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/icassp/icassp2025.html#Shi0N25
Swarm Active Audition with Robots and Drones: Real-World Performance Validation.

Kazuhiro Nakadai, Kotaro Hoshiba, Benjamin Yen 0001, Makoto Kumon, Yoko Sasaki

IROS 6107 - 6112 2025年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/IROS60139.2025.11247372

researchmap

その他リンク： https://dblp.org/db/conf/iros/iros2025.html#NakadaiHYKS25
Single-Microphone-Based Sound Source Localization for Mobile Robots in Reverberant Environments.

Jiang Wang, Runwu Shi, Benjamin Yen 0001, He Kong 0001, Kazuhiro Nakadai

IROS 6135 - 6140 2025年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/IROS60139.2025.11246992

researchmap

その他リンク： https://dblp.org/db/conf/iros/iros2025.html#WangSYKN25
Towards Online Sign Language Expression for Real-Time Human-Robot Interaction.

Nabeela Khan, Sihan Tan, Kazuhiro Nakadai

RO-MAN 1123 - 1128 2025年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/RO-MAN63969.2025.11217908

researchmap

その他リンク： https://dblp.org/db/conf/ro-man/ro-man2025.html#KhanTN25
Multi-Speaker Localization Based on Von Mises-Bernoulli Vivit.

Haruto Yokota, Benjamin Yen 0001, Kazuhiro Nakadai

EUSIPCO 241 - 245 2025年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

researchmap

その他リンク： https://dblp.org/rec/conf/eusipco/2025
From Blurry to Brilliant Detection: YOLO-Based Aerial Object Detection with Super Resolution.

Ragib Amin Nihal, Benjamin Yen 0001, Takeshi Ashizawa, Katsutoshi Itoyama, Kazuhiro Nakadai

APSIPA 1922 - 1927 2025年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/APSIPAASC65261.2025.11249079

researchmap

その他リンク： https://dblp.org/db/conf/apsipa/apsipa2025.html#Nihal0AIN25
SignFlow: End-to-End Sign Language Generation for One-to-Many Modeling using Conditional Flow Matching.

Nabeela Khan, Bowen Wu 0002, Sihan Tan, Carlos Toshinori Ishi, Kazuhiro Nakadai

ICMI 173 - 180 2025年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1145/3716553.3750765

researchmap

その他リンク： https://dblp.org/db/conf/icmi/icmi2025.html#Khan0TIN25
Single-Channel Target Speech Extraction Utilizing Distance and Room Clues.

Runwu Shi, Zirui Lin, Benjamin Yen 0001, Jiang Wang, Ragib Amin Nihal, Kazuhiro Nakadai

EUSIPCO 481 - 485 2025年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

researchmap

その他リンク： https://dblp.org/rec/conf/eusipco/2025
Dialect Identification Using Resource-Efficient Fine-Tuning Approaches.

Zirui Lin, Haris Gulzar, Monnika Roslianna Busto, Akiko Masaki, Takeharu Eda, Kazuhiro Nakadai

APSIPA 670 - 675 2025年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/APSIPAASC65261.2025.11249367

researchmap

その他リンク： https://dblp.org/db/conf/apsipa/apsipa2025.html#LinGBMEN25
Multilingual Gloss-free Sign Language Translation: Towards Building a Sign Language Foundation Model.

Sihan Tan, Taro Miyazaki, Kazuhiro Nakadai

Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers) 553 - 561 2025年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：Association for Computational Linguistics

DOI： 10.18653/v1/2025.acl-short.43

researchmap

その他リンク： https://dblp.org/db/conf/acl/acl2025-2.html#TanMN25
AIチャレンジ研究会のすすめ

植村渉, 干場功太郎, 鈴木麗璽, 中臺一博, 光永法明

人工知能学会第二種研究会資料 2024 ( Challenge-066 ) 03 2024年12月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人人工知能学会

DOI： 10.11517/jsaisigtwo.2024.challenge-066_03

CiNii Research

researchmap
屋外環境下でのドローンのローターノイズによる地表材質推定に向けた手法の検討およびマイクロホンアレイ用風防の設計

矢野翼, Yen Benjamin, 中臺一博

人工知能学会第二種研究会資料 2024 ( Challenge-066 ) 13 2024年12月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人人工知能学会

DOI： 10.11517/jsaisigtwo.2024.challenge-066_13

CiNii Research

researchmap
小領域移動物体検出における背景フローの弁別手法

西田健次, 中臺一博, 糸山克寿

人工知能学会第二種研究会資料 2024 ( Challenge-066 ) 10 2024年12月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人人工知能学会

DOI： 10.11517/jsaisigtwo.2024.challenge-066_10

CiNii Research

researchmap
音声強調と雑音特徴量を用いた音声認識の雑音耐性向上

大﨑崇博, 周藤唯, 中臺一博

人工知能学会第二種研究会資料 2024 ( Challenge-066 ) 01 2024年12月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人人工知能学会

DOI： 10.11517/jsaisigtwo.2024.challenge-066_01

CiNii Research

researchmap
複数ドローンとロボットの協調による群アクティブ聴覚システム

中臺一博, 公文誠, 佐々木洋子, 干場功太郎, Yen Benjamin

人工知能学会第二種研究会資料 2024 ( Challenge-066 ) 11 2024年12月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人人工知能学会

DOI： 10.11517/jsaisigtwo.2024.challenge-066_11

CiNii Research

researchmap
話者情報の半教師あり学習を用いたオフライン話者ダイアライゼーション

阿坂脩平, Yen Benjamin, 糸山克寿, 中臺一博

人工知能学会第二種研究会資料 2024 ( Challenge-066 ) 04 2024年12月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人人工知能学会

DOI： 10.11517/jsaisigtwo.2024.challenge-066_04

CiNii Research

researchmap
Swarm Active Audition System with Robots and Drones for a Search and Rescue Task 査読

Kazuhiro Nakadai, Makoto Kumon, Yoko Sasaki, Kotaro Hoshiba, Benjamin Yen

2024 Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC) 1 - 6 2024年12月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/apsipaasc63619.2025.10848937

researchmap
Can all variations within the unified mask-based beamformer framework achieve identical peak extraction performance? 査読

Atsuo Hiroe, Katsutoshi Itoyama, Kazuhiro Nakadai

EURASIP Journal on Audio, Speech, and Music Processing 2024 ( 1 ) 66 - 66 2024年12月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1186/s13636-024-00387-x

researchmap
A review of deep learning-based approaches to sign language processing. 査読

Sihan Tan, Nabeela Khan, Zhaoyi An, Yoshitaka Ando, Rei Kawakami, Kazuhiro Nakadai

Advanced Robotics 38 ( 23 ) 1649 - 1667 2024年12月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1080/01691864.2024.2442721

researchmap
Special issue on robot and human interactive communication (Part II). 査読国際共著

Kazuhiro Nakadai, Emilia I. Barakova, Ki-Uk Kyung

Advanced Robotics 38 ( 23 ) 1647 - 1648 2024年12月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1080/01691864.2024.2440161

researchmap
Special issue on robot and human interactive communication. 査読国際共著

Kazuhiro Nakadai, Emilia I. Barakova, Ki-Uk Kyung

Advanced Robotics 38 ( 19-20 ) 1349 - 1350 2024年10月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1080/01691864.2024.2410825

researchmap
Online adaptation of fourier series-based acoustic transfer function model and its application to sound source localization and separation 査読

Yui Sudo, Masayuki Takigahira, Hideo Tsuru, Kazuhiro Nakadai, Hirofumi Nakajima

Advanced Robotics 38 ( 19-20 ) 1351 - 1363 2024年7月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）出版者・発行元：Informa UK Limited

DOI： 10.1080/01691864.2024.2379384

researchmap
能動推論に基づく1対1インタラクションモデルの検討

木村, 駿希, 中臺, 一博, 仁科, 繁明, 糸山, 克寿

第86回全国大会講演論文集 2024 ( 1 ) 193 - 194 2024年3月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

能動推論は生物が環境内で未知の状態を推定しながら最適な行動を推論し選択するための理論的アプローチである。本研究ではこの能動推論を人と人との言語的インタラクションに基づく他者の情動推定と発話選択のモデルに適用することを試みた。具体的には、親子のインタラクションにおいて、子供に部屋を掃除させたいという意図を持つ親に対して、できるだけ親に叱られないようにしながら最小限の掃除で済ませたい子どもの発話選択が能動推論によってどのように行われるかを検討した。子から見た親の感情状態を未知状態とみなし、その推定が子にとって望ましい状態になるような発話の選択を、能動推論によって行なった。提案した発話選択モデルに基づく親子間のインタラクションを実装し、シミュレーション実験で評価を行ったところ、子が親の状態の推定誤差を減少させながら、親の発言に対して適切な応答を選択し望ましい状態を達成できることを確認した。

CiNii Books

CiNii Research

researchmap
距離ベース時間周波数マスク推定による音声強調手法の検討

石井, 遼平, 中臺, 一博, 糸山, 克寿

第86回全国大会講演論文集 2024 ( 1 ) 361 - 362 2024年3月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

一般に会議では、複数の人が集まって話をするため、たとえ各話者の口元にマイクをつけて収録した場合でも、収録音には対象話者の音声に加え、他の話者の音声が混入してしまう。このため、収録音中の対象話者の音声の聴取が困難になり、議事録作成などの用途に支障をきたすという問題がある。本稿では、この問題を解決するため、ディープラーニングにより推定された時間周波数マスクを用いて、モノラル収録音から、近距離話者の音声のみを抽出する音声強調法を提案する。提案手法を人間の聴覚と相関があるPESQとSTOIを用いて評価した結果、提案手法の有効性を示すことができた。

CiNii Books

CiNii Research

researchmap
LCMV-based Scan-and-Sum Beamforming for Region Source Extraction. 査読

Aoto Yasue, Benjamin Yen 0001, Katsutoshi Itoyama, Kazuhiro Nakadai

APSIPA 1 - 6 2024年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/APSIPAASC63619.2025.10848984

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/apsipa/apsipa2024.html#Yasue0IN24
UAV-Enhanced Combination to Application: Comprehensive Analysis and Benchmarking of a Human Detection Dataset for Disaster Scenarios. 査読

Ragib Amin Nihal, Benjamin Yen 0001, Katsutoshi Itoyama, Kazuhiro Nakadai

ICPR (14) 145 - 162 2024年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1007/978-3-031-78341-8_10

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/icpr/icpr2024-14.html#NihalYIN24
A Video Vision Transformer for Sound Source Localization. 査読

Haruto Yokota, Mert Bozkurtlar, Benjamin Yen 0001, Katsutoshi Itoyama, Kenji Nishida, Kazuhiro Nakadai

32nd European Signal Processing Conference(EUSIPCO) 106 - 110 2024年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

researchmap

その他リンク： https://dblp.uni-trier.de/rec/conf/eusipco/2024
音声強調ネットワークとアダプターを用いた音声認識の耐雑音ロバスト性向上査読

大崎崇博, 周藤唯, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

日本ロボット学会誌 42 ( 9 ) 2024年

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
Improving Impressions of Response Delay in AI-based Spoken Dialogue Systems. 査読

Shuhei Asaka, Katsutoshi Itoyama, Kazuhiro Nakadai

33rd IEEE International Conference on Robot and Human Interactive Communication(RO-MAN) 1416 - 1421 2024年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/RO-MAN60168.2024.10731216

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/ro-man/ro-man2024.html#AsakaIN24
面音源抽出のための複数拘束 MVDR ビームフォーマーの逐次計算による高速化

安江蒼人, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

日本ロボット学会誌 42 ( 6 ) 2024年

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
Drone audition: implementation of an indoor multi-drone system for sound source tracking. 査読

Benjamin Yen 0001, Kazuhiro Nakadai

APSIPA 1 - 6 2024年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/APSIPAASC63619.2025.10848928

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/apsipa/apsipa2024.html#0001N24
Drone audition: dataset and methods for ground surface material classification using drone noise in outdoor environment. 査読

Tsubasa Yano, Benjamin Yen 0001, Kazuhiro Nakadai

APSIPA 1 - 6 2024年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/APSIPAASC63619.2025.10848914

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/apsipa/apsipa2024.html#Yano0N24
Implementation of a Robot Operation System-based network for sound source localization using multiple drones. 査読

Takumi Yamamoto, Kotaro Hoshiba, Benjamin Yen 0001, Kazuhiro Nakadai

APSIPA 1 - 6 2024年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/APSIPAASC63619.2025.10849321

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/apsipa/apsipa2024.html#YamamotoH0N24
Bird Vocalization Embedding Extraction Using Self-Supervised Disentangled Representation Learning.

Runwu Shi, Katsutoshi Itoyama, Kazuhiro Nakadai

CoRR abs/2412.20146 2024年

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.48550/arXiv.2412.20146

researchmap
Distance Based Single-Channel Target Speech Extraction.

Runwu Shi, Benjamin Yen 0001, Kazuhiro Nakadai

CoRR abs/2412.20144 2024年

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.48550/arXiv.2412.20144

researchmap
FPGA-based Low Power Acceleration of HARK Sound Source Localization. 査読

Zirui Lin, Katsutoshi Itoyama, Kazuhiro Nakadai, Hideharu Amano

COOL CHIPS 1 - 6 2024年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/COOLCHIPS61292.2024.10531180

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/coolchips/coolchips2024.html#LinINA24
Parallel Adapter ModelとNear-Identity初期化を用いた音声認識の雑音耐性向上査読

大崎崇博, 周藤唯, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

人工知能学会第二種研究会資料(Web) 2023 ( Challenge-063 ) 454 - 466 2024年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1007/978-981-97-4677-4_37

J-GLOBAL

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/ieaaie/ieaaie2024.html#OsakiSINN24
Real Time Sound Source Localization Using von-Mises ResNet. 査読国際共著

Mert Bozkurtlar, Benjamin Yen 0001, Katsutoshi Itoyama, Kazuhiro Nakadai

SII 466 - 471 2024年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/SII58957.2024.10417224

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/sii/sii2024.html#BozkurtlarYIN24
From Blurry to Brilliant Detection: YOLOv5-Based Aerial Object Detection with Super Resolution. 査読

Ragib Amin Nihal, Benjamin Yen 0001, Katsutoshi Itoyama, Kazuhiro Nakadai

CoRR abs/2401.14661 2024年

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.48550/arXiv.2401.14661

researchmap
SLAM-based Joint Calibration of Multiple Asynchronous Microphone Arrays and Sound Source Localization. 査読

Jiang Wang, Yuanzheng He, Daobilige Su, Katsutoshi Itoyama, Kazuhiro Nakadai, Junfeng Wu 0001, Shoudong Huang, Youfu Li 0001, He Kong

CoRR abs/2405.19813 2024年

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.48550/arXiv.2405.19813

researchmap
Can all variations within the unified mask-based beamformer framework achieve identical peak extraction performance? 査読

Atsuo Hiroe, Katsutoshi Itoyama, Kazuhiro Nakadai

CoRR abs/2407.15310 2024年

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.48550/arXiv.2407.15310

researchmap
UAV-Enhanced Combination to Application: Comprehensive Analysis and Benchmarking of a Human Detection Dataset for Disaster Scenarios. 査読

Ragib Amin Nihal, Benjamin Yen 0001, Katsutoshi Itoyama, Kazuhiro Nakadai

CoRR abs/2408.04922 2024年

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.48550/arXiv.2408.04922

researchmap
SLAM-Based Joint Calibration of Multiple Asynchronous Microphone Arrays and Sound Source Localization. 査読国際共著

Jiang Wang, Yuanzheng He, Daobilige Su, Katsutoshi Itoyama, Kazuhiro Nakadai, Junfeng Wu 0001, Shoudong Huang, Youfu Li 0001, He Kong

IEEE Trans. Robotics 40 4024 - 4044 2024年

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1109/TRO.2024.3410456

researchmap
Improvement in Sign Language Translation Using Text CTC Alignment.

Tan Sihan, Taro Miyazaki, Khan Nabeela Khanum, Kazuhiro Nakadai

CoRR abs/2412.09014 2024年

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.48550/arXiv.2412.09014

researchmap
Monitoring the courtship flight trajectory of Latham's snipe ( Gallinago hardwickii ) using microphone arrays 査読

Shiho Matsubayashi, Hideki Osaka, Reiji Suzuki, Kazuhiro Nakadai, Hiroshi G. Okuno

Ecology and Evolution 13 ( 4 ) 2023年3月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）出版者・発行元：Wiley

DOI： 10.1002/ece3.9938

researchmap
Estimating the Soundscape Structure and Dynamics of Forest Bird Vocalizations in an Azimuth-Elevation Space Using a Microphone Array 査読

Reiji Suzuki, Koichiro Hayashi, Hideki Osaka, Shiho Matsubayashi, Takaya Arita, Kazuhiro Nakadai, Hiroshi G. Okuno

Applied Sciences 13 ( 6 ) 3607 - 3607 2023年3月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）出版者・発行元：MDPI AG

Songbirds are one of the study targets for both bioacoustic and ecoacoustic research. In this paper, we discuss the applicability of robot audition techniques to understand the dynamics of forest bird vocalizations in a soundscape measured in azimuth and elevation angles with a single 16-channel microphone array, using HARK and HARKBird. First, we evaluated the accuracy in estimating the azimuth and elevation angles of bird vocalizations replayed from a loudspeaker on a tree, 6.55 m above the height of the array, from different horizontal distances in a forest. The results showed that the localization error of azimuth and elevation angle was equal to or less than 5 degrees and 15 degrees, respectively, in most of cases when the horizontal distance from the array was equal to or less than 35 m. We then conducted a field observation of vocalizations to monitor birds in a forest. The results showed that the system can successfully detect how birds use the soundscape horizontally and vertically. This can contribute to bioacoustic and ecoacoustic research, including behavioral observations and study of biodiversity.

DOI： 10.3390/app13063607

researchmap
深層ブラインド音源分離を用いた転移学習による環境音分離

合澤, 隆拓, 坂東, 宜昭, 糸山, 克寿, 西田, 健次, 中臺, 一博

第85回全国大会講演論文集 2023 ( 1 ) 435 - 436 2023年2月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

音環境理解において雑踏環境下での音源分離は，環境音認識の基盤技術の一つである．環境音は音声と異なり，スペクトル構造が多様であり，事前にあらゆる環境に適応できるモデルを学習することが難しい．本研究では，非線形ブラインド音源分離法のひとつである深層フルランク空間相関分析法を用いた目的環境への教師なし転移学習を行う．事前学習データに含まれない未知の音源信号が混合音に含まれていても，多チャネル信号の空間情報を表す周辺尤度関数に基づき，混合音のみから分離モデルを改善するよう学習できる．環境音を用いた数値混合音により，推論データに対する教師なし転移学習の有効性を確認した．

CiNii Books

CiNii Research

researchmap
Extracting Bird Vocalizations from a Complex Natural Soundscape in Forests Using Robot Audition Techniques 査読

Reiji Suzuki, Shinji Sumitani, Zachary Harlow, Shiho Matsubayashi, Takaya Arita, Kazuhiro Nakadai, Hiroshi G. Okuno

2023 IEEE/SICE International Symposium on System Integration (SII) 1 - 6 2023年1月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/sii55687.2023.10039198

researchmap
Audio-Visual Class Association Based on Two-stage Self-supervised Contrastive Learning towards Robust Scene Analysis 査読

Kei Suzuki, Katsutoshi Itoyama, Kenji Nishida, Kazuhiro Nakadai

2023 IEEE/SICE International Symposium on System Integration (SII) 1 - 6 2023年1月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/sii55687.2023.10039379

researchmap
Metric-Based Multimodal Meta-Learning for Human Movement Identification Via Footstep Recognition 査読

Muhammad Shakeel, Katsutoshi Itoyama, Kenji Nishida, Kazuhiro Nakadai

2023 IEEE/SICE International Symposium on System Integration (SII) abs/2111.07979 1 - 8 2023年1月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/sii55687.2023.10039089

researchmap
An Ensemble Method for Multiple Speech Enhancement Using Deep Learning 査読

Masahiko Fujita, Katsutoshi Itoyama, Kenji Nishida, Kazuhiro Nakadai

2023 IEEE/SICE International Symposium on System Integration (SII) 1 - 6 2023年1月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/sii55687.2023.10039167

researchmap
FPGA based Power-Efficient Edge Server to Accelerate Speech Interface for Socially Assistive Robotics 査読

Haris Gulzar, Muhammad Shakeel, Katsutoshi Itoyama, Kazuhiro Nakadai, Kenji Nishida, Hideharu Amano, Takeharu Eda

2023 IEEE/SICE International Symposium on System Integration (SII) 1 - 6 2023年1月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/sii55687.2023.10039093

researchmap
Reconstruction of Depth Scenes Based on Echolocation 査読

Hidehiko Kishinami, Katsutoshi Itoyama, Kenji Nishida, Kazuhiro Nakadai

2023 IEEE/SICE International Symposium on System Integration (SII) 1 - 6 2023年1月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/sii55687.2023.10039271

researchmap
Is the Ideal Ratio Mask Really the Best? - Exploring the Best Extraction Performance and Optimal Mask of Mask-based Beamformers. 査読

Atsuo Hiroe, Katsutoshi Itoyama, Kazuhiro Nakadai

CoRR abs/2309.12065 2023年

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.48550/arXiv.2309.12065

researchmap
Unsupervised Domain Adaptation of Universal Source Separation Based on Neural Full-Rank Spatial Covariance Analysis. 査読

Takahiro Aizawa, Yoshiaki Bando, Katsutoshi Itoyama, Kenji Nishida, Kazuhiro Nakadai, Masaki Onishi

MLSP 1 - 6 2023年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/MLSP55844.2023.10285999

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/mlsp/mlsp2023.html#AizawaBINNO23
Is the Ideal Ratio Mask Really the Best? - Exploring the Best Extraction Performance and Optimal Mask of Mask-based Beamformers. 査読

Atsuo Hiroe, Katsutoshi Itoyama, Kazuhiro Nakadai

APSIPA ASC 1843 - 1850 2023年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/APSIPAASC58517.2023.10317440

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/apsipa/apsipa2023.html#HiroeIN23
Low power implementation of Geometric High-order Decorrelation-based Source Separation on an FPGA board. 査読

Ziquan Qin, Kaijie Wei, Hideharu Amano, Kazuhiro Nakadai

IEEE Symposium in Low-Power and High-Speed Chips 1 - 6 2023年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/COOLCHIPS57690.2023.10121954

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/coolchips/coolchips2023.html#QinWAN23
Retraining-free Customized ASR for Enharmonic Words Based on a Named-Entity-Aware Model and Phoneme Similarity Estimation. 査読

Yui Sudo, Kazuya Hata, Kazuhiro Nakadai

INTERSPEECH 491 - 495 2023年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

DOI： 10.21437/Interspeech.2023-1320

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/interspeech/interspeech2023.html#SudoHN23
miniStreamer: Enhancing Small Conformer with Chunked-Context Masking for Streaming ASR Applications on the Edge. 査読

Haris Gulzar, Monikka Roslianna Busto, Takeharu Eda, Katsutoshi Itoyama, Kazuhiro Nakadai

INTERSPEECH 3277 - 3281 2023年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

DOI： 10.21437/Interspeech.2023-1162

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/interspeech/interspeech2023.html#GulzarBEIN23
Improving Sign Language Understanding Introducing Label Smoothing. 査読

Tan Sihan, Khan Nabeela Khanum, Katsutoshi Itoyama, Kazuhiro Nakadai

RO-MAN 113 - 118 2023年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/RO-MAN57019.2023.10309531

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/ro-man/ro-man2023.html#SihanKIN23
フーリエ級数展開を用いた軽量伝達関数のオンライン適応による音源定位・分離の向上査読

周藤唯, 瀧ケ平将行, 中臺一博, 中島弘史

人工知能学会第二種研究会資料(Web) 2023 ( Challenge-063 ) 2058 - 2063 2023年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/RO-MAN57019.2023.10309550

J-GLOBAL

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/ro-man/ro-man2023.html#SudoTTNN23
Observability Analysis of Graph SLAM-Based Joint Calibration of Multiple Microphone Arrays and Sound Source Localization. 査読

Yuanzheng He, Jiang Wang, Daobilige Su, Kazuhiro Nakadai, Junfeng Wu 0001, Shoudong Huang, Youfu Li 0001, He Kong

IEEE/SICE International Symposium on System Integration(SII) 1 - 8 2023年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/SII55687.2023.10039204

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/sii/sii2023.html#HeWSNWHLK23
Assessment of Simultaneous Calibration for Positions, Orientations, and Time Offsets in Multiple Microphone Arrays Systems. 査読

Chishio Sugiyama, Katsutoshi Itoyama, Kenji Nishida, Kazuhiro Nakadai

IEEE/SICE International Symposium on System Integration(SII) 1 - 6 2023年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/SII55687.2023.10039440

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/sii/sii2023.html#SugiyamaINN23
Retraining-free Customized ASR for Enharmonic Words Based on a Named-Entity-Aware Model and Phoneme Similarity Estimation. 査読

Yui Sudo, Kazuya Hata, Kazuhiro Nakadai

CoRR abs/2305.17846 2023年

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.48550/arXiv.2305.17846

researchmap
深層ブラインド音源分離と転移学習に基づく遠隔音声認識の評価

合澤隆拓, 坂東宜昭, 糸山克寿, 西田健次, 中臺一博

人工知能学会第二種研究会資料 2022 ( Challenge-061 ) 09 2022年11月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人人工知能学会

DOI： 10.11517/jsaisigtwo.2022.challenge-061_09

CiNii Research

J-GLOBAL

researchmap
Outdoor evaluation of sound source localization for drone groups using microphone arrays 査読

Taiki Yamada, Katsutoshi Itoyama, Kenji Nishida, Kazuhiro Nakadai

2022 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS) 9296 - 9301 2022年10月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/iros47612.2022.9982039

researchmap
Spotforming by NMF Using Multiple Microphone Arrays 査読

Yasuhiro Kagimoto, Katsutoshi Itoyama, Kenji Nishida, Kazuhiro Nakadai

2022 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS) 9253 - 9258 2022年10月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/iros47612.2022.9981808

researchmap
Weakly-Supervised Neural Full-Rank Spatial Covariance Analysis for a Front-End System of Distant Speech Recognition 査読

Yoshiaki Bando, Takahiro Aizawa, Katsutoshi Itoyama, Kazuhiro Nakadai

Interspeech 2022 3824 - 3828 2022年9月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

DOI： 10.21437/interspeech.2022-11077

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/interspeech/interspeech2022.html#BandoAIN22
Empirical Sampling from Latent Utterance-wise Evidence Model for Missing Data ASR based on Neural Encoder-Decoder Model 査読

Ryu Takeda, Yui Sudo, Kazuhiro Nakadai, Kazunori Komatani

Interspeech 2022 3789 - 3793 2022年9月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

DOI： 10.21437/interspeech.2022-576

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/interspeech/interspeech2022.html#TakedaSNK22
Auditory Survey of Endangered Eurasian Bittern Using Microphone Arrays and Robot Audition 査読

Shiho Matsubayashi, Kazuhiro Nakadai, Reiji Suzuki, Tatsuya Ura, Makoto Hasebe, Hiroshi G. Okuno

Frontiers in Robotics and AI 9 854572 - 854572 2022年4月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.3389/frobt.2022.854572

researchmap

その他リンク： https://dblp.uni-trier.de/db/journals/firai/firai9.html#MatsubayashiNSU22
visualizing soundscapes and quantifying interspecific interactions in forest animal vocalizations using robot audition technology

2022 ( 1 ) 475 - 476 2022年2月

　詳細を見る

記述言語：英語

CiNii Books

CiNii Research

researchmap
深層学習を用いた複数音声強調処理のアンサンブル手法の検討

藤田, 雅彦, 糸山, 克寿, 西田, 健次, 中臺, 一博

第84回全国大会講演論文集 2022 ( 1 ) 337 - 338 2022年2月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

本稿では，複数の音声強調処理から生成される時間周波数マスクに対して，深層学習を用いたアンサンブル学習法を提案する．提案手法は複数の規範から生成される時間周波数マスクを用いるため，様々な環境雑音に対応することができる．提案手法により，得られたアンサンブル時間周波数マスクをビームフォーミングに適用し，音声を強調する評価実験を行った結果，提案手法が既存手法を上回り，深層学習によるアンサンブルの有効性を示すことができた．

CiNii Books

CiNii Research

researchmap
エコロケーションに基づく視覚シーンの再構成手法の提案と入力特徴量の検討査読

岸波華彦, 糸山克寿, 西田健次, 中臺一博, 中臺一博

日本ロボット学会誌 40 ( 4 ) 351 - 354 2022年

　詳細を見る

記述言語：日本語掲載種別：研究論文（学術雑誌）

DOI： 10.7210/jrsj.40.351

J-GLOBAL

researchmap
アンサンブル時間周波数マスクとビームフォーミングを組み合わせた音声強調手法の評価査読

藤田雅彦, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

日本ロボット学会誌 40 ( 7 ) 631 - 634 2022年

　詳細を見る

記述言語：日本語掲載種別：研究論文（学術雑誌）

DOI： 10.7210/jrsj.40.631

J-GLOBAL

researchmap
An FPGA off-loading of HARK sound source localization. 査読

Zhongyang Hou, Kaijie Wei, Hideharu Amano, Kazuhiro Nakadai

2022 Tenth International Symposium on Computing and Networking(CANDARW) 236 - 240 2022年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/CANDARW57323.2022.00057

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/ic-nc/candar2022w.html#HouWAN22
Blockwiseストリーミング音声認識と発話区間検出の統合査読

周藤唯, SHAKEEL Muhammad, 中臺一博, SHI Jiatong, 渡部晋二

人工知能学会第二種研究会資料(Web) 2022 ( Challenge-061 ) 4641 - 4645 2022年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.21437/Interspeech.2022-11216

J-GLOBAL

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/interspeech/interspeech2022.html#Sudo0NS022
Observability Analysis of Graph SLAM-Based Joint Calibration of Multiple Microphone Arrays and Sound Source Localization. 査読

Yuanzheng He, Jiang Wang, Daobilige Su, Kazuhiro Nakadai, Junfeng Wu 0001, Shoudong Huang, Youfu Li 0001, He Kong

CoRR abs/2210.05600 2022年

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.48550/arXiv.2210.05600

researchmap
Multichannel environmental sound segmentation: with separately trained spectral and spatial features 査読

Yui Sudo, Katsutoshi Itoyama, Kenji Nishida, Kazuhiro Nakadai

Applied Intelligence 51 ( 11 ) 8245 - 8259 2021年11月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）出版者・発行元：Springer

DOI： 10.1007/s10489-021-02314-5

Scopus

researchmap
CASE: CNN Acceleration for Speech-Classification in Edge-Computing 査読

Haris Gulzar, Muhammad Shakeel, Kenji Nishida, Katsutoshi Itoyama, Kazuhiro Nakadai, Hideharu Amano

2021 IEEE Cloud Summit (Cloud Summit) 2021年10月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/ieeecloudsummit52029.2021.00018

researchmap
Assessment of sound source tracking using multiple drones equipped with multiple microphone arrays 査読

Taiki Yamada, Katsutoshi Itoyama, Kenji Nishida, Kazuhiro Nakadai

International Journal of Environmental Research and Public Health 18 ( 17 ) 2021年9月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）出版者・発行元：MDPI

DOI： 10.3390/ijerph18179039

Scopus

PubMed

researchmap
Assessment of von Mises-Bernoulli Deep Neural Network in Sound Source Localization 査読

Katsutoshi Itoyama, Yoshiya Morimoto, Shungo Masaki, Ryosuke Kojima, Kenji Nishida, Kazuhiro Nakadai

Interspeech 2021 2152 - 2156 2021年8月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

DOI： 10.21437/interspeech.2021-1050

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/interspeech/interspeech2021.html#ItoyamaMMKNN21
Simultaneous Calibration of Positions, Orientations, and Time Offsets, Among Multiple Microphone Arrays 査読

Chishio Sugiyama, Katsutoshi Itoyama, Kenji Nishida, Kazuhiro Nakadai

2021 IEEE International Conference on Autonomous Systems (ICAS) 2021年8月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/icas49788.2021.9551166

researchmap
Non-Invasive Monitoring of the Spatio-Temporal Dynamics of Vocalizations among Songbirds in a Semi Free-Flight Environment Using Robot Audition Techniques 査読

Shinji Sumitani, Reiji Suzuki, Takaya Arita, Kazuhiro Nakadai, Hiroshi G. Okuno

Birds 2 ( 2 ) 158 - 172 2021年4月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）出版者・発行元：MDPI AG

To understand the social interactions among songbirds, extracting the timing, position, and acoustic properties of their vocalizations is essential. We propose a framework for automatic and fine-scale extraction of spatial-spectral-temporal patterns of bird vocalizations in a densely populated environment. For this purpose, we used robot audition techniques to integrate information (i.e., the timing, direction of arrival, and separated sound of localized sources) from multiple microphone arrays (array of arrays) deployed in an environment, which is non-invasive. As a proof of concept of this framework, we examined the ability of the method to extract active vocalizations of multiple Zebra Finches in an outdoor mesh tent as a realistic situation in which they could fly and vocalize freely. We found that localization results of vocalizations reflected the arrangements of landmark spots in the environment such as nests or perches and some vocalizations were localized at non-landmark positions. We also classified their vocalizations as either songs or calls by using a simple method based on the tempo and length of the separated sounds, as an example of the use of the information obtained from the framework. Our proposed approach has great potential to understand their social interactions and the semantics or functions of their vocalizations considering the spatial relationships, although detailed understanding of the interaction would require analysis of more long-term recordings.

DOI： 10.3390/birds2020012

researchmap
Detecting earthquakes: a novel deep learning-based approach for effective disaster response 査読

Muhammad Shakeel, Katsutoshi Itoyama, Kenji Nishida, Kazuhiro Nakadai

Applied Intelligence 51 ( 11 ) 8305 - 8315 2021年4月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）出版者・発行元：Springer Science and Business Media LLC

DOI： 10.1007/s10489-021-02285-7

researchmap

その他リンク： http://link.springer.com/article/10.1007/s10489-021-02285-7/fulltext.html
アンサンブル時間周波数マスクによる音声強調手法の検討

藤田, 雅彦, 糸山, 克寿, 西田, 健次, 中臺, 一博

第83回全国大会講演論文集 2021 ( 1 ) 235 - 236 2021年3月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

本稿では, アンサンブル時間周波数マスクを用いたビームフォーミングに基づく音声強調手法を報告する. 従来の時間周波数マスクベースの音声強調手法は, 単一のキューから時間周波数マスク推定していたため，十分に入力信号に含まれる音声強調の鍵となる特徴量を活かしきれていなかった．そこで，異なるキューから推定される複数の時間周波数マスクを統合して処理のロバスト性を向上するアンサンブル時間周波数マスク法を提案する. 提案手法をCHiME3コーパスを使って, 人間の聴感と相関があるPESQとSTOIを用いて評価した. いずれの評価指標においても提案手法がアンサンブルを行わない既存手法を上回り, 提案手法の有効性を示した.

CiNii Books

CiNii Research

researchmap

その他リンク： http://id.nii.ac.jp/1001/00214813/
複数マイクロホンアレイの同期および位置・姿勢推定の同時最適化の検討

杉山, 地塩, 糸山, 克寿, 西田, 健次, 中臺, 一博

第83回全国大会講演論文集 2021 ( 1 ) 363 - 364 2021年3月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

本稿では, 複数のマイクロホンアレイによる観測信号から, マイクロホンアレイ位置・向きおよび音源位置を推定する問題を扱う. 従来法では, マイクロホンアレイ間の同期が取れていることが前提であり, 推定問題自体の探索空間が大きく局所最適解に陥りやすいため, 実問題に適用する際の制約が大きいという問題があった. この問題を解決するため, マイクロホンアレイ間の時間オフセットの導入および, 位置・向きおよび時間オフセットを同時最適化する統合型コスト関数の設計を行った. 結果として, 複数の同期が取れていないマイクロホンアレイを用いた場合でも, 従来法よりも局所最適解に陥りにくく, 推定精度の高い手法を構築することができた.

CiNii Books

CiNii Research

researchmap

その他リンク： http://id.nii.ac.jp/1001/00215170/
Investigation of Node Pruning Criteria for Neural Networks Model Compression with Non-Linear Function and Non-Uniform Network Topology 査読

Kazuhiro Nakadai, Yosuke Fukumoto, Ryu Takeda

2021 IEEE Spoken Language Technology Workshop, SLT 2021 - Proceedings 117 - 124 2021年1月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：Institute of Electrical and Electronics Engineers Inc.

DOI： 10.1109/SLT48900.2021.9383593

Scopus

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/slt/slt2021.html#NakadaiFT21
Visualizing Directional Soundscapes of Bird Vocalizations Using Robot Audition Techniques 査読

Reiji Suzuki, Hao Zhao, Shinji Sumitani, Shiho Matsubayashi, Takaya Arita, Kazuhiro Nakadai, Hiroshi G. Okuno

2021 IEEE/SICE International Symposium on System Integration, SII 2021 487 - 492 2021年1月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：Institute of Electrical and Electronics Engineers Inc.

DOI： 10.1109/IEEECONF49454.2021.9382639

Scopus

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/sii/sii2021.html#SuzukiZSMANO21
Observing Nocturnal Birds Using Localization Techniques 査読

Shiho Matsubayashi, Fumiyuki Saito, Reiji Suzuki, Kazuhiro Nakadai, Hiroshi G. Okuno

2021 IEEE/SICE International Symposium on System Integration, SII 2021 493 - 498 2021年1月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：Institute of Electrical and Electronics Engineers Inc.

DOI： 10.1109/IEEECONF49454.2021.9382665

Scopus

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/sii/sii2021.html#MatsubayashiSSN21
Sound Source Tracking Using Integrated Direction Likelihood for Drones with Microphone Arrays 査読

Taiki Yamada, Katsutoshi Itoyama, Kenji Nishida, Kazuhiro Nakadai

2021 IEEE/SICE International Symposium on System Integration (SII) 394 - 399 2021年1月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/ieeeconf49454.2021.9382619

researchmap
Assessment of a Beamforming Implementation Developed for Surface Sound Source Separation 査読

Zhi Zhong, Muhammad Shakeel, Katsutoshi Itoyama, Kenji Nishida, Kazuhiro Nakadai

2021 IEEE/SICE International Symposium on System Integration (SII) 369 - 374 2021年1月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/ieeeconf49454.2021.9382648

researchmap
Multi-channel Environmental Sound Segmentation utilizing Sound Source Localization and Separation U-Net 査読

Yui Sudo, Katsutoshi Itoyama, Kenji Nishida, Kazuhiro Nakadai

2021 IEEE/SICE International Symposium on System Integration (SII) 382 - 387 2021年1月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/ieeeconf49454.2021.9382730

researchmap
EMC: Earthquake Magnitudes Classification on Seismic Signals via Convolutional Recurrent Networks 査読

Muhammad Shakeel, Katsutoshi Itoyama, Kenji Nishida, Kazuhiro Nakadai

2021 IEEE/SICE International Symposium on System Integration (SII) 388 - 393 2021年1月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/ieeeconf49454.2021.9382696

researchmap
Fully-Online Always-Adaptation of Transfer Functions and Its Application to Sound Source Localization and Separation. 査読

Kazuhiro Nakadai, Masayuki Takigahira, Yusuke Kawai, Hirofumi Nakajima

IEEE/RSJ International Conference on Intelligent Robots and Systems(IROS) 2100 - 2105 2021年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/IROS51168.2021.9636631

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/iros/iros2021.html#NakadaiTKN21
重み付け尤度関数と定在波を用いた可聴音による二次元環境認識

岸波華彦, 糸山克寿, 西田健次, 中臺一博, 中臺一博

日本ロボット学会誌 39 ( 3 ) 271 - 274 2021年

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.7210/jrsj.39.271

J-GLOBAL

researchmap
Spatial Normalization to Reduce Positional Complexity in Direction-aided Supervised Binaural Sound Source Separation. 査読

Ryu Takeda, Kazuhiro Nakadai, Kazunori Komatani

APSIPA ASC 248 - 253 2021年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

researchmap

その他リンク： https://dblp.uni-trier.de/rec/conf/apsipa/2021
複数マイクロホンアレイを用いたNMFによる空間音源分離法の提案と評価査読

鍵本泰宏, 糸山克寿, 西田健次, 中臺一博, 中臺一博

日本ロボット学会誌 39 ( 7 ) 2021年

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
Age Classification of Evacuees at Times of Disaster Using a Vibration Sensor

Toru Yamashita, Futoshi Asano, Kazuhiro Nakadai

2020 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA ASC 2020 - Proceedings 184 - 188 2020年12月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：Institute of Electrical and Electronics Engineers Inc.

Scopus

researchmap

その他リンク： https://dblp.uni-trier.de/rec/conf/apsipa/2020
Synchronization of microphones based on rank minimization of warped spectrum for asynchronous distributed recording

Katsutoshi Itoyama, Kazuhiro Nakadai

IEEE International Conference on Intelligent Robots and Systems 4842 - 4847 2020年10月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：Institute of Electrical and Electronics Engineers Inc.

DOI： 10.1109/IROS45743.2020.9341584

Scopus

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/iros/iros2020.html#ItoyamaN20
Sound event aware environmental sound segmentation with Mask U-Net

Y. Sudo, K. Itoyama, K. Nishida, K. Nakadai

Advanced Robotics 34 ( 20 ) 1280 - 1290 2020年10月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）出版者・発行元：Robotics Society of Japan

DOI： 10.1080/01691864.2020.1829040

Scopus

researchmap
Recognition of non-manual content in continuous Japanese sign language

Heike Brock, Iva Farag, Kazuhiro Nakadai

Sensors (Switzerland) 20 ( 19 ) 1 - 21 2020年10月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）出版者・発行元：MDPI AG

DOI： 10.3390/s20195621

Scopus

PubMed

researchmap

その他リンク： https://dblp.uni-trier.de/db/journals/sensors/sensors20.html#BrockFN20
Robot Audition and Computational Auditory Scene Analysis

Kazuhiro Nakadai, Hiroshi G. Okuno

Advanced Intelligent Systems 2 ( 9 ) 2000050 - 2000050 2020年9月

　詳細を見る

掲載種別：研究論文（学術雑誌）出版者・発行元：Wiley

DOI： 10.1002/aisy.202000050

researchmap

その他リンク： https://onlinelibrary.wiley.com/doi/full-xml/10.1002/aisy.202000050
Multi-hop wireless command and telemetry communication system for remote operation of robots with extending operation area beyond line-of-sight using 920 MHz/169 MHz 査読

34 ( 11 ) 756 - 766 2020年6月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1080/01691864.2020.1760934

Scopus

researchmap
A Spatial Filter Design for Surface Sound Source Separation

2020 ( 1 ) 189 - 190 2020年2月

　詳細を見る

記述言語：英語

CiNii Books

CiNii Research

researchmap

その他リンク： http://id.nii.ac.jp/1001/00205118/
複数マイクロホンアレイを用いた尤度分布統合による移動音源追跡

山田, 泰基, 糸山, 克寿, 西田, 健次, 中臺, 一博

第82回全国大会講演論文集 2020 ( 1 ) 191 - 192 2020年2月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

近年, 複数のマイクロホンアレイを用いた音源位置推定は盛んに研究されている. 特に, 複数マイクロホンアレイのアレイ処理より音源位置尤度を算出し, 静止音源の位置推定を行う手法が報告されているが, 移動音源に対して適用し, 音源追跡を行うことについては十分に研究されていない. そこで本稿では, 音源位置尤度の分布から移動音源のダイナミクスを推定することで音源追跡を行う. 逐次的な音源位置推定に加えて, 音源ダイナミクス推定を行うことで, 音源位置追跡誤差の抑制が期待できる. 既存のデータベースを用いてシミュレーションを行い, 提案手法の有効性を評価する.

CiNii Books

CiNii Research

researchmap

その他リンク： http://id.nii.ac.jp/1001/00205119/
バイナリマスク付き非負値行列因子分解に基づく音源分離手法の発音時刻ずれに対する性能評価

日下, 湧太, 糸山, 克寿, 西田, 健次, 中臺, 一博

第82回全国大会講演論文集 2020 ( 1 ) 361 - 362 2020年2月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

本稿では，目的音源の発音時刻を事前情報として利用するバイナリマスク付き非負値行列因子分解による音源分離手法において，入力される発音時刻に時間のずれが含まれている際の分離精度の変化について評価を行う．複数の楽器により構成されるモノラル音響信号から特定の音源のみを分離する処理には目的音源の事前情報を利用する手法が主流となっており，ユーザが容易に作成可能な事前情報として目的音源の発音時刻を利用する音源分離手法を提案した．これまでの報告では，提案法に入力する発音時刻はMIDIやアノテーションから作成した理想的な状況に限られていた．本報告では人間が発音時刻を作成する際に発生する時間のずれをモデル化し，これを用いて音源分離のシミュレーションと分離精度評価を行った．

CiNii Books

CiNii Research

researchmap

その他リンク： http://id.nii.ac.jp/1001/00205203/
クラウドソーシングを用いた作成した環境音キャプションコーパスの評価

岩月, 道生, 糸山, 克寿, 西田, 健次, 中臺, 一博

第82回全国大会講演論文集 2020 ( 1 ) 201 - 202 2020年2月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

音環境理解の形の一つとして，音響信号に対してその音環境を自然言語で説明するキャプション生成システムの構築がある．機械学習を用いた音響信号に対するキャプション生成システムの構築には，環境音とそれに対応するキャプションのペアを多数集めた，環境音キャプションデータセットが必要となる．本稿では以前に岩月らがクラウドソーシングを用いてアノテーションを行い作成した環境音キャプションコーパスを，RNNを用いた深層学習ベースのモデルに学習させることで，コーパスの評価を行った．

CiNii Books

CiNii Research

researchmap

その他リンク： http://id.nii.ac.jp/1001/00205123/
Design and Implementation of Real-Time Visualization of Sound Source Positions by Drone Audition 査読

Mizuho Wakabayashi, Kai Washizaka, Kotaro Hoshiba, Kazuhiro Nakadai, Hiroshi G. Okuno, Makoto Kumon

2020 IEEE/SICE International Symposium on System Integration (SII) 1 814 - 819 2020年1月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/SII46433.2020.9025940

CiNii Research

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/sii/sii2020.html#WakabayashiWHNO20
Soundscape Analysis of Bird Songs in Forests Using Microphone Arrays 査読

Shinji Sumitami, Reiji Suzuki, Takemi Morimatsu, Shiho Matsubayashi, Takaya Arita, Kazuhiro Nakadai, Hiroshi G. Okuno

2020 IEEE/SICE International Symposium on System Integration 634 - 639 2020年1月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/SII46433.2020.9026267

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/sii/sii2020.html#SumitaniSMMANO20
Multi-channel environmental sound segmentation 査読

Yui Sudo, Katsutoshi Itoyama, Kenji Nishida, Kazuhiro Nakadai

Proceedings of the 2020 IEEE/SICE International Symposium on System Integration (SII2020) 820 - 825 2020年1月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/SII46433.2020.9025963

researchmap
Design and assessment of a scan-and-sum beamformer for surface sound source separation 査読

Zhi Zhong, Katsutoshi Itoyama, Kenji Nishida, Kazuhiro Nakadai

Proceedings of the 2020 IEEE/SICE International Symposium on System Integration (SII2020) 808 - 813 2020年1月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/SII46433.2020.9025981

researchmap
Audio-visual 3D reconstruction framework for dynamic scenes 査読

Takashi Konno, Kenji Nishida, Katsutoshi Itoyama, Kazuhiro Nakadai

Proceedings of the 2020 IEEE/SICE International Symposium on System Integration (SII2020) 802 - 807 2020年1月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/SII46433.2020.9025812

researchmap
Sound source tracking by drones with microphone arrays 査読

Taiki Yamada, Katsutoshi Itoyama, Kenji Nishida, Kazuhiro Nakadai

Proceedings of the 2020 IEEE/SICE International Symposium on System Integration (SII2020) 796 - 801 2020年1月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/SII46433.2020.9026185

researchmap
Sound source localization based on von-Mises-Bernoulli deep neural network 査読

Kazuhiro Nakadai, Shungo Masaki, Ryosuke Kojima, Osamu Sugiyama, Katsutoshi Itoyama, Kenji Nishida

2020 IEEE/SICE International Symposium on System Integration (SII2020) 658 - 663 2020年1月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/SII46433.2020.9025880

researchmap
マイクロホン位置と音源スペクトルの確率モデルに基づくマイクロホンアレイのキャリブレーション

段雄啓, 糸山克寿, 西田健次, 中臺一博, 中臺一博

人工知能学会AIチャレンジ研究会(Web) 57th 2020年

　詳細を見る

J-GLOBAL

researchmap
マイクロホンアレイ搭載ドローンによる音源方向尤度統合に基づく音源追跡

山田泰基, 糸山克寿, 西田健次, 中臺一博, 中臺一博

人工知能学会AIチャレンジ研究会(Web) 57th 2020年

　詳細を見る

J-GLOBAL

researchmap
バイナリマスク付き非負値行列因子分解に基づく発音時刻を用いた音源分離

日下湧太, 糸山克寿, 西田健次, 中臺一博, 中臺一博

人工知能学会AIチャレンジ研究会(Web) 57th 2020年

　詳細を見る

J-GLOBAL

researchmap
ロボット聴覚オープンソースソフトウェアHARK用ミドルウェアHARK middlewareの紹介

木下智義, 中臺一博, 中臺一博

人工知能学会AIチャレンジ研究会(Web) 57th 2020年

　詳細を見る

J-GLOBAL

researchmap
伸縮スペクトルのランク最小化の緩和に基づくチャネル間同期

糸山克寿, 中臺一博, 中臺一博

日本ロボット学会学術講演会予稿集(CD-ROM) 38th 2020年

　詳細を見る

J-GLOBAL

researchmap
複雑なニューラルネットワークを対象としたノードプルーニングベースのモデル圧縮の検討

中臺一博, 中臺一博, 福本陽典, 武田龍

人工知能学会AIチャレンジ研究会(Web) 57th 2020年

　詳細を見る

J-GLOBAL

researchmap
A Fourier series based Data compression model for Acoustic transfer function.

Yoshiaki Asahara, Kohich Matsuda, Hirofumi Nakajima, Kazuhiro Nakadai

2020 IEEE/SICE International Symposium on System Integration(SII) 664 - 668 2020年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/SII46433.2020.9026238

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/sii/sii2020.html#AsaharaMNN20
Learning Three-dimensional Skeleton Data from Sign Language Video.

Heike Brock, Felix Law, Kazuhiro Nakadai, Yuji Nagashima

ACM Transactions on Intelligent Systems and Technology 11 ( 3 ) 30 - 24 2020年

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.1145/3377552

researchmap
Fine-scale observations of spatio-spectro-temporal dynamics of bird vocalizations using robot audition techniques

Shinji Sumitani, Reiji Suzuki, Shiho Matsubayashi, Takaya Arita, Kazuhiro Nakadai, Hiroshi G. Okuno

Remote Sensing in Ecology and Conservation 2020年

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.1002/rse2.152

Scopus

researchmap
Detection of Ball Spin Direction using Hitting Sound in Tennis

山本修己, 西田健次, 糸山克寿, 中臺一博, 中臺一博

人工知能学会AIチャレンジ研究会(Web) 57th 30 - 37 2020年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.5220/0010107600300037

J-GLOBAL

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/icsports/icsports2020.html#YamamotoNIN20
Calibration of a Microphone Array Based on a Probabilistic Model of Microphone Positions

Katsuhiro Dan, Katsutoshi Itoyama, Kenji Nishida, Kazuhiro Nakadai

Trends in Artificial Intelligence Theory and Applications. Artificial Intelligence Practices 614 - 625 2020年

　詳細を見る

掲載種別：論文集(書籍)内論文出版者・発行元：Springer International Publishing

DOI： 10.1007/978-3-030-55789-8_53

researchmap
Reactive Chameleon: A Method to Mimic Conversation Partner's Body Sway for a Robot.

Ryosuke Hasumoto, Kazuhiro Nakadai, Michita Imai

International Journal of Social Robotics 12 ( 1 ) 239 - 258 2020年

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.1007/s12369-019-00557-4

researchmap
鳴き声で追う夜行性鳥類：ロボット聴覚技術の応用実例招待査読

松林志保, 斎藤史之, 鈴木麗璽, 中臺一博, 奥乃博

景観生態学 24 ( 1・2 ) 104 - 105 2019年12月

　詳細を見る

記述言語：日本語

ポスター賞受賞報告

researchmap
Environmental sound segmentation utilizing mask U-Net 査読

Yui Sudo, Katsutoshi Itoyama, Kenji Nishida, Kazuhiro Nakadai

Proceedings of the 2019 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2019) 5340 - 5345 2019年11月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/IROS40897.2019.8967954

researchmap
Improvement of DOA estimation by using quaternion output in sound event localization and detection 査読

Yui Sudo, Katsutoshi Itoyama, Kenji Nishida, Kazuhiro Nakadai

Proceedings of the 2019 DCASE Workshop 244 - 247 2019年10月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

researchmap

その他リンク： https://dblp.uni-trier.de/rec/conf/dcase/2019
AI チャレンジ研究会（Challenge）

光永法明, 植村渉, 鈴木麗璽, 干場功太郎, 中臺一博

人工知能 34 ( 5 ) 635 - 638 2019年9月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人人工知能学会

DOI： 10.11517/jjsai.34.5_635

CiNii Books

CiNii Research

researchmap

その他リンク： https://ndlsearch.ndl.go.jp/books/R000000004-I029969740
Acoustic simulation in dynamic environments for robot audition

Zhaofeng Zhang, Kazuhiro Nakadai, Hirofumi Nakajima, Naoaki Sumida

European Signal Processing Conference 2019- 1 - 5 2019年9月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：European Signal Processing Conference, EUSIPCO

DOI： 10.23919/EUSIPCO.2019.8902609

Scopus

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/eusipco/eusipco2019.html#ZhangNNS19
Special issue on robot and human interactive communication 査読

Kazuhiro Nakadai, Emilia Barakova, Michita Imai, Tetsunari Inamura

Advanced Robotics 33 ( 7-8 ) 307 - 308 2019年8月

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.1080/01691864.2019.1652953

researchmap
von Mises - Bernoulli RBMを用いた音源定位の検討

正木, 俊伍, 杉山, 治, 小島, 諒介, 中臺, 一博, 糸山, 克寿, 西田, 健次

第81回全国大会講演論文集 2019 ( 1 ) 555 - 556 2019年2月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

本稿では，ニューラルネットワークで音源定位を学習する際に，位相差情報を直接入力情報として使用する手法を検討する．マイクロホンアレイ信号処理など，一般的に用いられる音源定位手法では，位相差情報を重要なキューとして使用する．しかし，位相差情報は周期関数で表現されるため，入力が，0/1信号やガウス分布に従っているとする Bernoulli-Bernoulli 型や Gaussian- Bernoulli 型の RBM(restricted Boltzmann machine) では，扱うことができない．そこで，本手法では，Bernoulli-Bernoulli 型のRBMを位相情報を直接入力できるよう von Mises-Bernoulli 型のRBMに拡張した音源定位モデルを提案する．予備実験の結果，提案手法は位相差情報を入力した場合にも音源定位が可能であることを示すことができた.

CiNii Books

CiNii Research

researchmap

その他リンク： http://id.nii.ac.jp/1001/00196911/
Listen and Tell: 深層学習を用いた音響シーンのキャプション生成

岩月, 道生, 周藤, 唯, 糸山, 克寿, 西田, 健次, 中臺, 一博

第81回全国大会講演論文集 2019 ( 1 ) 407 - 408 2019年2月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

本稿では，環境音響信号に対してキャプションを自動生成する手法を検討する．画像に対するキャプション生成手法は show and tell として知られ，深層学習を用いた研究が多く存在する．一方音響信号は時系列の一次元信号であり，かつ各音イベントが可変長であるから画像で用いられる手法をそのまま適用することは難しい．そこで，1) 音響信号を複数の時分割スペクトログラムとすることにより音響信号を画像化し，2) RNNを用いることで可変長の時系列信号を扱えるようにした listen & tell 手法を提案する．提案手法に基づき音の種類とタイミングをキャプションするモデルを構築し、合成データを用いてその有効性を確認した．

CiNii Books

CiNii Research

researchmap

その他リンク： http://id.nii.ac.jp/1001/00196838/
マルコフ連鎖に基づくマスク付きNMFを用いた特定音源の分離

日下, 湧太, 糸山, 克寿, 西田, 健次, 中臺, 一博

第81回全国大会講演論文集 2019 ( 1 ) 419 - 420 2019年2月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

本稿では，マルコフ連鎖に基づくバイナリマスクを導入した非負値行列因子分解（NMF）により，音楽音響信号から特定の楽器音のみを分離する手法を提案する．一般に，NMFによる音源分離では，必ずしも基底と楽器とが一対一に対応しない．これを解決する手法として，楽器の教師音により基底を事前学習するNMFが提案されているものの，教師音を準備する手間が大きいという問題がある．提案手法では，楽器音の立上り（オンセット）情報の一部を指定したうえで，新たに導入したバイナリマスクを自動推定することにより，教師音なしでの特定楽器音分離を行う．予備的な実験を行い，オンセットを事前情報として与えることで，特定の楽器音のみが分離できることを確認した．

CiNii Books

CiNii Research

researchmap

その他リンク： http://id.nii.ac.jp/1001/00196844/
視聴覚統合による三次元構造復元に関する検討

紺野, 隆志, 西田, 健次, 糸山, 克寿, 中臺, 一博

第81回全国大会講演論文集 2019 ( 1 ) 207 - 208 2019年2月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

本稿では、音と画像を用いたStructure from Motion (SfM)に基づく、動的環境下における三次元復元アルゴリズムを提案する。SfMは通常、動的物体の存在しない定常環境を仮定するため、動的物体は三次元復元をすることができない。動的物体は、その動きや振動から音を発することが多い。本稿ではこの問題を解決するため、音源定位により得られる音情報を利用した、Audio-Visual SfMを提案する。評価実験において提案手法が、動的物体が存在する領域を適切に復元していることを示す。

CiNii Books

CiNii Research

researchmap

その他リンク： http://id.nii.ac.jp/1001/00196734/
マイクロホンと音源位置に関する確率モデルに基づくマイクロホンアレイのキャリブレーションの検討

段, 雄啓, 糸山, 克寿, 西田, 健次, 中臺, 一博

第81回全国大会講演論文集 2019 ( 1 ) 553 - 554 2019年2月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

本稿は，音源定位や音源分離といったマイクロホンアレイ信号処理の性能低下の一因である，マイクロホンアレイを構成するマイクロホンの所与の位置と実際の位置とのずれに対し，このずれのキャリブレーションのため実際の位置を観測信号から推定する手法について述べる．提案法では，マイクロホン位置の存在確率モデルを所与の位置に基づいて定義される事前確率と観測信号及び実際の位置に基づいて定義される尤度関数の組み合わせで定義し，最大事後確率推定によりマイクロホンの実際の位置を推定する．数値シミュレーション実験によるマイクロホン位置情報推定精度の評価では，音到来角度の異なる複数音源を用いることで推定精度の大幅な向上が確認された．

CiNii Books

CiNii Research

researchmap

その他リンク： http://id.nii.ac.jp/1001/00196910/
複数のマイクロホンアレイを搭載した複数のUAVによる移動音源の三次元追跡

山田, 泰基, Daniel, Gabriel, 糸山, 克寿, 西田, 健次, 中臺, 一博

第81回全国大会講演論文集 2019 ( 1 ) 115 - 116 2019年2月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

本研究では, 複数の移動機体に搭載された複数マイクロホンアレイによる移動音源の 3 次元軌跡推定手法について検討する. 単独のマイクロホンアレイでは音源方向のみ推定可能で，音源位置の推定は困難である．複数マイクロホンアレイを用いることで三角測量に基づく音源位置の推定が可能になり，さらに複数の移動機体を用いることでロバストな移動音源軌跡が可能になると期待される．各マイクロホンアレイから得られた音源方向より音源位置の候補点を算出し，各候補点に重みをつけながらUnscented Kalman Filterを適用することで移動音源軌跡を推定する．数値シミュレーションによる検証では，提案手法の推定誤差は0.1[m]以下であることが確認された．

CiNii Books

CiNii Research

researchmap

その他リンク： http://id.nii.ac.jp/1001/00196078/
Special issue on robot and human interactive communication.

Kazuhiro Nakadai, Emilia I. Barakova, Michita Imai, Tetsunari Inamura

Advanced Robotics 33 ( 15-16 ) 699 - 699 2019年

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.1080/01691864.2019.1652953

researchmap
2D sound source position estimation using microphone arrays and its application to a VR-based bird song analysis system. 査読

Daniel Gabriel, Ryosuke Kojima, Kotaro Hoshiba, Katsutoshi Itoyama, Kenji Nishida, Kazuhiro Nakadai

Advanced Robotics 33 ( 7-8 ) 403 - 414 2019年

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.1080/01691864.2019.1598491

researchmap
An Integrated Framework for Field Recording, Localization, Classification and Annotation of Birdsongs Using Robot Audition Techniques - Harkbird 2.0. 査読

Shinji Sumitani, R. Suzuki, Naoaki Chiba, Shiho Matsubayashi, Takaya Arita, Kazuhiro Nakadai, Hiroshi Gitchang Okuno

IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2019, Brighton, United Kingdom, May 12-17, 2019 8246 - 8250 2019年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/ICASSP.2019.8683743

researchmap
Design and assessment of multiple-sound source localization using microphone arrays. 査読

Daniel Gabriel, Ryosuke Kojima, Kotaro Hoshiba, Katsutoshi Itoyama, Kenji Nishida, Kazuhiro Nakadai

IEEE/SICE International Symposium on System Integration, SII 2019, Paris, France, January 14-16, 2019 199 - 204 2019年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/SII.2019.8700368

researchmap
Close Sound Source Localization incorporating Semi-Supervised Variational Bayesian NMF. 査読

Makoto Kumon, Kai Washizaki, Kazuhiro Nakadai

IEEE/SICE International Symposium on System Integration, SII 2019, Paris, France, January 14-16, 2019 313 - 318 2019年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/SII.2019.8700459

researchmap
Recent R&D Technologies and Future Prospective of Flying Robot in Tough Robotics Challenge. 査読

Kenzo Nonami, Kotaro Hoshiba, Kazuhiro Nakadai, Makoto Kumon, Hiroshi G. Okuno, Yasutada Tanabe, Koichi Yonezawa, Hiroshi Tokutake, Satoshi Suzuki, Kohei Yamaguchi, Shigeru Sunada, Takeshi Takaki, Toshiyuki Nakata, Ryusuke Noda, Hao Liu, Satoshi Tadokoro

Disaster Robotics - Results from the ImPACT Tough Robotics Challenge 128 77 - 142 2019年

　詳細を見る

掲載種別：論文集(書籍)内論文出版者・発行元：Springer

DOI： 10.1007/978-3-030-05321-5_3

Scopus

researchmap
CNN-based Multichannel End-to-End Speech Recognition for Everyday Home Environments*.

Nelson Yalta, Shinji Watanabe 0001, Takaaki Hori, Kazuhiro Nakadai, Tetsuya Ogata

27th European Signal Processing Conference(EUSIPCO) abs/1811.02735 1 - 5 2019年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.23919/EUSIPCO.2019.8902524

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/eusipco/eusipco2019.html#YaltaWHNO19
Weakly-Supervised Deep Recurrent Neural Networks for Basic Dance Step Generation.

Nelson Yalta, Shinji Watanabe 0001, Kazuhiro Nakadai, Tetsuya Ogata

International Joint Conference on Neural Networks(IJCNN) abs/1807.01126 1 - 8 2019年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/IJCNN.2019.8851872

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/ijcnn/ijcnn2019.html#YaltaWNO19
The 27th IEEE International Symposium on Robot and Human Interactive Communication (RO-MAN 2018)

稲邑哲也, 中臺一博

日本ロボット学会誌 37 ( 1 ) 69 - 69 2019年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本ロボット学会

DOI： 10.7210/jrsj.37.69

CiNii Research

researchmap
音で知るフクロウの営巣活動と巣立ち:定位技術を活用した鳥類観測実例

松林志保, 斎藤史之, 鈴木麗璽, 中臺一博, 中臺一博, 奥乃博

日本鳥学会大会講演要旨集 2019 2019年

　詳細を見る

J-GLOBAL

researchmap
鳥類集団の音声コミュニケーション理解のための半野外音源定位環境の構築と予備的調査

炭谷晋司, 鈴木麗璽, 和多和宏, 有田隆也, 中臺一博, 奥乃博

日本鳥学会大会講演要旨集 2019 2019年

　詳細を見る

J-GLOBAL

researchmap
振動センサと重回帰分析を用いた歩行速度の推定に関する検討

椿順, 浅野太, 中臺一博

電子情報通信学会大会講演論文集(CD-ROM) 2019 2019年

　詳細を見る

J-GLOBAL

researchmap
地上音源の位置推定を行うドローン聴覚システムのための分散処理環境の開発

公文誠, 中臺一博, 干場功太郎, 奥乃博, 加川敏規, 三浦龍

人工知能学会AIチャレンジ研究会 52nd 2018年12月

　詳細を見る

記述言語：日本語掲載種別：研究論文（研究会，シンポジウム資料等）

J-GLOBAL

researchmap
単一の振動センサを用いた歩行方向推定

尾崎翔, 浅野太, 中臺一博

電子情報通信学会論文誌 A(Web) J101-A ( 6 ) 137‐149 (WEB ONLY) 2018年6月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
Evaluation of 2D bird localization algorithm using microphone arrays

2018 ( 1 ) 381 - 382 2018年3月

　詳細を見る

記述言語：英語

CiNii Books

CiNii Research

researchmap

その他リンク： http://id.nii.ac.jp/1001/00188613/
可聴音を用いた周波数自動選択に基づく距離推定法の検討

高尾, 麻衣子, 干場, 功太郎, 中臺, 一博

第80回全国大会講演論文集 2018 ( 1 ) 383 - 384 2018年3月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

環境理解は,システムやロボットがその周囲の環境を把握する技術を構築する研究分野であり、自動運転や災害救助ロボットなど様々な目的に利用可能である.本研究では,その第一歩として,音響信号を用い,かつ人間に不快感を与えない形でアクティブに距離計測を行う手法を検討する.分解能が不十分,狭帯域信号に対するノイズ耐性が低いといった音響信号を用いた既存の距離計測手法の問題に対して,本稿ではこの問題を解決するために周波数ごとに重みと尤度を自動的に設定する手法を提案する.実収録データを用いた距離計測実験を行った結果,雑音に対する頑健性,および距離計測の精度について,最も雑音に頑健な手法であるCSP法と比較して,提案法が有効であることを示すことができた.

CiNii Books

CiNii Research

researchmap

その他リンク： http://id.nii.ac.jp/1001/00188614/
Quad-directional LSTMを用いた音楽音響信号修復とその評価

谷口, 亮輔, 干場, 功太郎, 中臺, 一博

第80回全国大会講演論文集 2018 ( 1 ) 171 - 172 2018年3月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

本稿ではLSTM(Long Short-Term Memory)を用いた音楽音響信号の修復法を提案し,実際の欠損に対しての修復性能の評価を行う.実際にLSTMを適用した場合,情報が比較的スパースである高域の学習が十分でなくなり,修復性能が劣化してしまう.この問題に対し,我々は,入力信号に対して高域を強調するような周波数フィルタを用いて,その解決を試みた.また,この手法の拡張として,時間方向のみではなく,周波数方向の系列情報も考慮することが可能な QLSTM(Quad-directional LSTM)を用いることを提案した.これらの手法を実際の欠損に対して適用し,評価を行った結果,提案手法は通常のLSTMと比較して,より詳細な修復が可能であるということを確認した.

CiNii Books

CiNii Research

researchmap

その他リンク： http://id.nii.ac.jp/1001/00188512/
合同研究会2017 開催報告

小林一郎, 加藤恒昭, 上田康晴, 中臺一博

人工知能 33 ( 2 ) 223 - 230 2018年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人人工知能学会

DOI： 10.11517/jjsai.33.2_223

CiNii Books

CiNii Research

researchmap

その他リンク： https://ndlsearch.ndl.go.jp/books/R000000004-I028890972
A spatial-Cue-Based probabilistic model for bird song scene analysis 査読

Ryosuke Kojima, Reiji Suzuki, Osamu Sugiyama, Kotaro Hoshiba, Kazuhiro Nakadai

Proceedings - 2017 International Conference on Data Science and Advanced Analytics, DSAA 2017 2018- 395 - 404 2018年1月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：Institute of Electrical and Electronics Engineers Inc.

DOI： 10.1109/DSAA.2017.34

Scopus

researchmap
A spatiotemporal analysis of acoustic interactions between great reed warblers (Acrocephalus arundinaceus) using microphone arrays and robot audition software HARK 査読

Reiji Suzuki, Shiho Matsubayashi, Fumiyuki Saito, Tatsuyoshi Murate, Tomohisa Masuda, Koichi Yamamoto, Ryosuke Kojima, Kazuhiro Nakadai, Hiroshi G. Okuno

Ecology and Evolution 8 ( 1 ) 812 - 825 2018年1月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）出版者・発行元：John Wiley and Sons Ltd

DOI： 10.1002/ece3.3645

Scopus

PubMed

researchmap
特集「2016 年度研究会優秀賞受賞論文紹介」にあたって

中臺一博, 小林一郎

人工知能 33 ( 1 ) 55 - 56 2018年1月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人人工知能学会

DOI： 10.11517/jjsai.33.1_55

CiNii Research

researchmap
Extracting the Relationship between the Spatial Distribution and Types of Bird Vocalizations Using Robot Audition System HARK. 査読

Shinji Sumitani, Reiji Suzuki, Shiho Matsubayashi, Takaya Arita, Kazuhiro Nakadai, Hiroshi G. Okuno

2018 IEEE/RSJ International Conference on Intelligent Robots and Systems, IROS 2018, Madrid, Spain, October 1-5, 2018 2485 - 2490 2018年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/IROS.2018.8594130

researchmap
HARK-Bird-Box: A Portable Real-time Bird Song Scene Analysis System. 査読

Ryosuke Kojima, Osamu Sugiyama, Kotaro Hoshiba, Reiji Suzuki, Kazuhiro Nakadai

2018 IEEE/RSJ International Conference on Intelligent Robots and Systems, IROS 2018, Madrid, Spain, October 1-5, 2018 2497 - 2502 2018年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/IROS.2018.8594070

researchmap
Multi-timescale Feature-extraction Architecture of Deep Neural Networks for Acoustic Model Training from Raw Speech Signal. 査読

Ryu Takeda, Kazuhiro Nakadai, Kazunori Komatani

2018 IEEE/RSJ International Conference on Intelligent Robots and Systems, IROS 2018, Madrid, Spain, October 1-5, 2018 2503 - 2510 2018年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/IROS.2018.8593925

researchmap
Data-driven development of Virtual Sign Language Communication Agents. 査読

Agathe Balayn, Heike Brock, Kazuhiro Nakadai

27th IEEE International Symposium on Robot and Human Interactive Communication, RO-MAN 2018, Nanjing, China, August 27-31, 2018 370 - 377 2018年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/ROMAN.2018.8525717

researchmap
To animate or anime-te?: Investigating sign avatar comprehensibility. 査読

Heike Brock, Shigeaki Nishina, Kazuhiro Nakadai

Proceedings of the 18th International Conference on Intelligent Virtual Agents, IVA 2018, Sydney, NSW, Australia, November 05-08, 2018 331 - 332 2018年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ACM

DOI： 10.1145/3267851.3267864

researchmap
Assessment of MUSIC-Based Noise-Robust Sound Source Localization with Active Frequency Range Filtering. 査読

Kotaro Hoshiba, Kazuhiro Nakadai, Makoto Kumon, Hiroshi G. Okuno

JRM 30 ( 3 ) 426 - 435 2018年

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.20965/jrm.2018.p0426

researchmap
Weakly Supervised Deep Recurrent Neural Networks for Basic Dance Step Generation. 査読

Nelson Yalta, Shinji Watanabe, Kazuhiro Nakadai, Tetsuya Ogata

CoRR abs/1807.01126 2018年

　詳細を見る

researchmap
Signal Restoration based on Bi-directional LSTM with Spectral Filtering for Robot Audition. 査読

Ryosuke Taniguchi, Kotaro Hoshiba, Katsutoshi Itoyama, Kenji Nishida, Kazuhiro Nakadai

27th IEEE International Symposium on Robot and Human Interactive Communication, RO-MAN 2018, Nanjing, China, August 27-31, 2018 955 - 960 2018年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/ROMAN.2018.8525793

researchmap
CNN-based MultiChannel End-to-End Speech Recognition for everyday home environments. 査読

Nelson Yalta, Shinji Watanabe, Takaaki Hori, Kazuhiro Nakadai, Tetsuya Ogata

CoRR abs/1811.02735 2018年

　詳細を見る

researchmap
Speech Enhancement Based on Bayesian Low-Rank and Sparse Decomposition of Multichannel Magnitude Spectrograms. 査読

Yoshiaki Bando, Katsutoshi Itoyama, Masashi Konyo, Satoshi Tadokoro, Kazuhiro Nakadai, Kazuyoshi Yoshii, Tatsuya Kawahara, Hiroshi G. Okuno

IEEE ACM Trans. Audio Speech Lang. Process. 26 ( 2 ) 215 - 230 2018年

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.1109/TASLP.2017.2772340

researchmap
Deep JSLC: A Multimodal Corpus Collection for Data-driven Generation of Japanese Sign Language Expressions. 査読

Heike Brock, Kazuhiro Nakadai

Proceedings of the Eleventh International Conference on Language Resources and Evaluation, LREC 2018, Miyazaki, Japan, May 7-12, 2018. 2018年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：European Language Resources Association (ELRA)

researchmap
The 26th IEEE International Symposium on Robot and Human Interactive Communication (RO-MAN 2017)

中臺一博, 柴田智広

日本ロボット学会誌 36 ( 2 ) 145 - 145 2018年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本ロボット学会

DOI： 10.7210/jrsj.36.145

CiNii Research

researchmap
スペクトル伸縮に基づく複数A/Dコンバータのチャネル間同期

糸山克寿, 中臺一博

ロボティクス・メカトロニクス講演会講演概要集 2018 2P1-K05 2018年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本機械学会

DOI： 10.1299/jsmermd.2018.2p1-k05

CiNii Research

researchmap
ロボットが聴く夜の鳥

松林志保, 斎藤史之, 鈴木麗璽, 中臺一博, 奥乃博

第52回人工知能学会 AIチャレンジ研究会予稿集 52(4) 15 - 20 2018年

　詳細を見る

掲載種別：研究論文（学術雑誌）

CiNii Research

researchmap
The 30th IEEE/RSJ International Conference on Intelligent Systems and Robots（IROS 2017）

中臺一博, 柴田智広

日本ロボット学会誌 36 ( 1 ) 53 - 55 2018年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本ロボット学会

DOI： 10.7210/jrsj.36.53

CiNii Research

researchmap
Development of microphone-array-embedded UAV for search and rescue task 査読

Kazuhiro Nakadai, Makoto Kumon, Hiroshi G. Okuno, Kotaro Hoshiba, Mizuho Wakabayashi, Kai Washizaki, Takahiro Ishiki, Daniel Gabriel, Yoshiaki Bando, Takayuki Morito, Ryosuke Kojima, Osamu Sugiyama

IEEE International Conference on Intelligent Robots and Systems 2017- 5985 - 5990 2017年12月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：Institute of Electrical and Electronics Engineers Inc.

DOI： 10.1109/IROS.2017.8206494

Scopus

researchmap
Design of UAV-Embedded Microphone Array System for Sound Source Localization in Outdoor Environments 査読

Kotaro Hoshiba, Kai Washizaki, Mizuho Wakabayashi, Takahiro Ishiki, Makoto Kumon, Yoshiaki Bando, Daniel Gabriel, Kazuhiro Nakadai, Hiroshi G. Okuno

SENSORS 17 ( 11 ) 2535 2017年11月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.3390/s17112535

Web of Science

PubMed

researchmap
Acoustic model training based on node-wise weight boundary model for fast and small-footprint deep neural networks 査読

Ryu Takeda, Kazuhiro Nakadai, Kazunori Komatani

COMPUTER SPEECH AND LANGUAGE 46 461 - 480 2017年11月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1016/j.csl.2017.02.002

Web of Science

researchmap
Iterative Outlier Removal Method Using In-Cluster Variance Changes in Multi-Microphone Array Sound Source Localization.

2017 ( 1 ) 229 - 230 2017年3月

　詳細を見る

記述言語：英語

CiNii Books

CiNii Research

researchmap

その他リンク： http://id.nii.ac.jp/1001/00180795/
LSTMによる音楽音響信号の修復法の提案-周波数フィルタ導入による学習データ量削減の検討-

谷口, 亮輔, 小島, 諒介, 干場, 功太郎, 中臺, 一博

第79回全国大会講演論文集 2017 ( 1 ) 133 - 134 2017年3月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

本稿では、深層学習の一手法であるLSTM を用いた音楽音響信号修復について報告する．一般に，深層学習では性能の高いモデルを学習するために大量のデータが必要である．実際に音楽音響信号修復に深層学習を用いると,学習データが少ない場合，情報が比較的スパースである高域の修復性能が劣化するという問題が発生する．この問題を解決するため，学習時に，入力信号に対して，周波数フィルタを用いることにより，周波数方向に重みをかけることを提案する．予備検討の結果，少量の学習データであっても提案法が有効であることを確認した．

CiNii Books

CiNii Research

researchmap

その他リンク： http://id.nii.ac.jp/1001/00180751/
Bird song scene analysis using a spatial-cue-based probabilistic model 査読

Ryosuke Kojima, Osamu Sugiyama, Kotaro Hoshiba, Kazuhiro Nakadai, Reiji Suzuki, Charles E. Taylor

Journal of Robotics and Mechatronics 29 ( 1 ) 236 - 246 2017年2月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）出版者・発行元：Fuji Technology Press

DOI： 10.20965/jrm.2017.p0236

Scopus

researchmap
Special issue on robot audition technologies 査読

Hiroshi G. Okuno, Kazuhiro Nakadai

Journal of Robotics and Mechatronics 29 ( 1 ) 15 - 15 2017年2月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）出版者・発行元：Fuji Technology Press

DOI： 10.20965/jrm.2017.p0015

Scopus

researchmap
Sound source localization using deep learning models 査読

Nelson Yalta, Kazuhiro Nakadai, Tetsuya Ogata

Journal of Robotics and Mechatronics 29 ( 1 ) 37 - 48 2017年2月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）出版者・発行元：Fuji Technology Press

DOI： 10.20965/jrm.2017.p0037

Scopus

researchmap
Psychologically-inspired audio-visual speech recognition using coarse speech recognition and missing feature theory 査読

Kazuhiro Nakadai, Tomoaki Koiwa

Journal of Robotics and Mechatronics 29 ( 1 ) 105 - 113 2017年2月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）出版者・発行元：Fuji Technology Press

DOI： 10.20965/jrm.2017.p0105

Scopus

researchmap
Ego-noise suppression for robots based on semi-blind infinite non-negative matrix factorization 査読

Kazuhiro Nakadai, Taiki Tezuka, Takami Yoshida

Journal of Robotics and Mechatronics 29 ( 1 ) 114 - 124 2017年2月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）出版者・発行元：Fuji Technology Press

DOI： 10.20965/jrm.2017.p0114

Scopus

researchmap
Design and assessment of sound source localization system with a UAV-Embedded microphone array 査読

Kotaro Hoshiba, Osamu Sugiyama, Akihide Nagamine, Ryosuke Kojima, Makoto Kumon, Kazuhiro Nakadai

Journal of Robotics and Mechatronics 29 ( 1 ) 154 - 167 2017年2月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）出版者・発行元：Fuji Technology Press

DOI： 10.20965/jrm.2017.p0154

Scopus

researchmap
Outdoor sound source detection using a quadcopter with microphone array 査読

Takuma Ohata, Keisuke Nakamura, Akihide Nagamine, Takeshi Mizumoto, Takayuki Ishizaki, Ryosuke Kojima, Osamu Sugiyama, Kazuhiro Nakadai

Journal of Robotics and Mechatronics 29 ( 1 ) 177 - 187 2017年2月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）出版者・発行元：Fuji Technology Press

DOI： 10.20965/jrm.2017.p0177

Scopus

researchmap
Outdoor acoustic event identification with DNN using a quadrotor-embedded microphone array 査読

Osamu Sugiyama, Satoshi Uemura, Akihide Nagamine, Ryosuke Kojima, Keisuke Nakamura, Kazuhiro Nakadai

Journal of Robotics and Mechatronics 29 ( 1 ) 188 - 197 2017年2月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）出版者・発行元：Fuji Technology Press

DOI： 10.20965/jrm.2017.p0188

Scopus

researchmap
Harkbird: Exploring acoustic interactions in bird communities using a microphone array 査読

Reiji Suzuki, Shiho Matsubayashi, Richard W. Hedley, Kazuhiro Nakadai, Hiroshi G. Okuno

Journal of Robotics and Mechatronics 29 ( 1 ) 213 - 223 2017年2月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）出版者・発行元：Fuji Technology Press

DOI： 10.20965/jrm.2017.p0213

Scopus

researchmap
Acoustic monitoring of the great reed warbler using multiple microphone arrays and robot audition 査読

Shiho Matsubayashi, Reiji Suzuki, Fumiyuki Saito, Tatsuyoshi Murate, Tomohisa Masuda, Koichi Yamamoto, Ryosuke Kojima, Kazuhiro Nakadai, Hiroshi G. Okuno

Journal of Robotics and Mechatronics 29 ( 1 ) 224 - 235 2017年2月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）出版者・発行元：Fuji Technology Press

DOI： 10.20965/jrm.2017.p0224

Scopus

researchmap
Development, deployment and applications of robot audition open source software HARK 査読

Kazuhiro Nakadai, Hiroshi G. Okuno, Takeshi Mizumoto

Journal of Robotics and Mechatronics 29 ( 1 ) 16 - 25 2017年2月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）出版者・発行元：Fuji Technology Press

DOI： 10.20965/jrm.2017.p0016

Scopus

researchmap
HARKBird: Exploring acoustic interactions in bird communities using a microphone array 査読

Reiji Suzuki, Shiho Matsubayashi, R. Hedley, Kazuhiro Nakadai, Hiroshi G. Okuno

Journal of Robotics and Mechatronics 27 ( 1 ) 224 - 235 2017年2月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

researchmap
Node Pruning Based on Entropy of Weights and Node Activity for Small-Footprint Acoustic Model Based on Deep Neural Networks. 査読

Ryu Takeda, Kazuhiro Nakadai, Kazunori Komatani

Interspeech 2017, 18th Annual Conference of the International Speech Communication Association, Stockholm, Sweden, August 20-24, 2017 1636 - 1640 2017年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

DOI： 10.1016/j.csl.2017.02.002

researchmap
Swarm of micro-quadrocopters for consensus-based sound source localization 査読

L. Sinapayen, K. Nakamura, K. Nakadai, H. Takahashi, T. Kinoshita

ADVANCED ROBOTICS 31 ( 12 ) 624 - 633 2017年

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1080/01691864.2017.1310632

Web of Science

researchmap
Variational Bayesian multi-channel robust NMF for human-voice enhancement with a deformable and partially-occluded microphone array 査読

Yoshiaki Bando, Katsutoshi Itoyama, Masashi Konyo, Satoshi Tadokoro, Kazuhiro Nakadai, Kazuyoshi Yoshii, Hiroshi G. Okuno

European Signal Processing Conference 2016- 1018 - 1022 2016年11月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：European Signal Processing Conference, EUSIPCO

DOI： 10.1109/EUSIPCO.2016.7760402

Scopus

researchmap
Online simultaneous localization and mapping of multiple sound sources and asynchronous microphone arrays 査読

Kouhei Sekiguchi, Yoshiaki Bando, Keisuke Nakamura, Kazuhiro Nakadai, Katsutoshi Itoyama, Kazuyoshi Yoshii

Proceedings of the 2016 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2016) 1973 - 1979 2016年10月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/IROS.2016.7759311

researchmap
会話内非言語音声情報抽出のための音響特徴量の検討

柴田, 健作, 中村, 圭佑, 中臺, 一博

第78回全国大会講演論文集 2016 ( 1 ) 539 - 540 2016年3月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

音声処理の分野では，コンピュータに人間の会話を理解させるための研究として音声認識や自然言語処理の研究が行われている．これらの研究では入力が言語音のみであることを仮定しており，笑い声や咳払いなどの非言語音を含む自然な会話の理解が困難である問題がある．そこで，本研究では会話音声からの非言語音声情報抽出について検討する．非言語音は音声信号に顕著な調波構造を持つとは限らないため，MFCCなどの音声特徴量では非言語音を柔軟に表現することが難しい．そこで本論文では非言語音声情報を抽出するための音響特徴量や特徴量抽出方法，学習方法について検討する．

CiNii Books

CiNii Research

researchmap

その他リンク： http://id.nii.ac.jp/1001/00162755/
Construction of Japanese Audio-Visual Emotion Database and Its Application in Emotion Recognition.

Nurul Lubis, Randy Gomez, Sakriani Sakti, Keisuke Nakamura, Koichiro Yoshino, Satoshi Nakamura 0001, Kazuhiro Nakadai

Proceedings of the Tenth International Conference on Language Resources and Evaluation LREC 2016(LREC) 2016年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：European Language Resources Association (ELRA)

researchmap

その他リンク： https://dblp.uni-trier.de/conf/lrec/2016
2チャンネル近接マイクロホンアレイによる風雑音の低減

坂田直人, 村上哲郎, 中島弘史, 中臺一博

日本音響学会誌 72 ( 12 ) 739 - 748 2016年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本音響学会

風雑音は一般的に非定常な雑音であり，信号の波形レベルでの相関をもとにした処理についてはあまり行われていない。本論文では2チャンネルを近接させたマイクロホンを用いて，各チャンネルで相関のある風雑音の収録を行い，相関の分析・風雑音の低減の二つの実験を行った。振幅・パワー・複素信号のそれぞれについてコヒーレンス関数により相関を分析した結果，どの項目についても125Hz以下で0.3～0.8の相関が確認された。その相関を利用して2種類の線形ビームフォーマにより風雑音の低減を行い，125Hz以下で3～10dB程度のパワーの低減が確認された。また，従来法（パワースペクトルサブトラクション）と提案法とでカートシス比を比較し，提案法は従来法に比べて音質の点で優位であることが確認された。

DOI： 10.20697/jasj.72.12_739

CiNii Books

researchmap
Localizing Bird Songs Using an Open Source Robot Audition System with a Microphone Array. 査読

Reiji Suzuki, Shiho Matsubayashi, Kazuhiro Nakadai, Hiroshi G. Okuno

Interspeech 2016, 17th Annual Conference of the International Speech Communication Association, San Francisco, CA, USA, September 8-12, 2016 2626 - 2630 2016年

　詳細を見る

DOI： 10.21437/Interspeech.2016-782

Web of Science

researchmap
Variational Bayesian multi-channel robust NMF for human-voice enhancement with a deformable and partially-occluded microphone array. 査読

Yoshiaki Bando, Katsutoshi Itoyama,Array, Satoshi Tadokoro, Kazuhiro Nakadai, Kazuyoshi Yoshii, Hiroshi G. Okuno

24th European Signal Processing Conference, EUSIPCO 2016, Budapest, Hungary, August 29 - September 2, 2016 1018 - 1022 2016年

　詳細を見る

DOI： 10.1109/EUSIPCO.2016.7760402

Web of Science

researchmap
Multimodal Scene Understanding Framework and Its Application to Cooking Recognition. 査読

Ryosuke Kojima, Osamu Sugiyama, Kazuhiro Nakadai

Applied Artificial Intelligence 30 ( 3 ) 181 - 200 2016年

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1080/08839514.2016.1156461

researchmap
Partially Shared Deep Neural Network in sound source separation and identification using a UAV-embedded microphone array. 査読

Takayuki Morito, Osamu Sugiyama, Ryosuke Kojima, Kazuhiro Nakadai

2016 IEEE/RSJ International Conference on Intelligent Robots and Systems, IROS 2016, Daejeon, South Korea, October 9-14, 2016 1299 - 1304 2016年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/IROS.2016.7759215

researchmap
Reduction of Computational Cost Using Two-Stage Deep Neural Network for Training for Denoising and Sound Source Identification. 査読

Takayuki Morito, Osamu Sugiyama, Satoshi Uemura, Ryosuke Kojima, Kazuhiro Nakadai

Trends in Applied Knowledge-Based Systems and Data Science - 29th International Conference on Industrial Engineering and Other Applications of Applied Intelligent Systems, IEA/AIE 2016, Morioka, Japan, August 2-4, 2016, Proceedings 562 - 573 2016年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1007/978-3-319-42007-3_49

researchmap
Leveraging Phantom Signals for Improved Voice-based Human-Robot Interaction 査読

Randy Gomez, Yurii Vasylkiv, Keisuke Nakamura, Takeshi Mizumoto, Kazuhiro Nakadai

2016 25TH IEEE INTERNATIONAL SYMPOSIUM ON ROBOT AND HUMAN INTERACTIVE COMMUNICATION (RO-MAN) 30 - 35 2016年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/ROMAN.2016.7745087

Web of Science

researchmap
Robust Sound Source Mapping using Three-layered Selective Audio Rays for Mobile Robots 査読

Daobilige Su, Keisuke Nakamura, Kazuhiro Nakadai, Jaime Valls Miro

2016 IEEE/RSJ INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS (IROS 2016) 2771 - 2777 2016年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
部分共有型Deep Neural Networkを用いた音源同定

森戸隆之, 杉山治, 小島諒介, 中臺一博

ロボティクス・メカトロニクス講演会講演概要集 2016 1A1-09b4 2016年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本機械学会

DOI： 10.1299/jsmermd.2016.1a1-09b4

CiNii Research

researchmap
音素バランスを考慮した読み上げ用フリー文章データベースの構築手法

松永寛之, 橋本直矢, 佐々木一磨, 中臺一博, 尾形哲也

人工知能学会全国大会論文集 JSAI2016 1E52 - 1E52 2016年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人人工知能学会

DOI： 10.11517/pjsai.jsai2016.0_1e52

CiNii Research

researchmap
UAV搭載マイクアレイを用いた高雑音環境下における音イベント検出・識別システム

杉山治, 上村知史, 小島諒介, 中臺一博

ロボティクス・メカトロニクス講演会講演概要集 2016 1A1-09b6 2016年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本機械学会

DOI： 10.1299/jsmermd.2016.1a1-09b6

CiNii Research

researchmap
Human-voice enhancement based on online RPCA for a hose-shaped rescue robot with a microphone array 査読

Yoshiaki Bando, Katsutoshi Itoyama, Masashi Konyo, Satoshi Tadokoro, Kazuhiro Nakadai, Kazuyoshi Yoshii, Hiroshi G. Okuno

2015 IEEE International Symposium on Safety, Security, and Rescue Robotics (SSRR) 1 - 6 2015年10月

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/ssrr.2015.7442949

Web of Science

researchmap
Microphone-accelerometer based 3D posture estimation for a hose-shaped rescue robot. 査読

Yoshiaki Bando, Katsutoshi Itoyama,Array, Satoshi Tadokoro, Kazuhiro Nakadai, Kazuyoshi Yoshii,Array

2015 IEEE/RSJ International Conference on Intelligent Robots and Systems, IROS 2015, Hamburg, Germany, September 28 - October 2, 2015 2015-December 5580 - 5586 2015年9月

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/IROS.2015.7354168

DOI： 10.1109/iros.2015.7354168

Web of Science

researchmap
Audio-visual speech recognition using deep learning 査読

Kuniaki Noda, Yuki Yamaguchi, Kazuhiro Nakadai, Hiroshi G. Okuno, Tetsuya Ogata

Appl. Intell. 42 ( 4 ) 722 - 737 2015年6月

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.1007/s10489-014-0629-7

Web of Science

Scopus

researchmap
Robot audition: Its rise and perspectives 査読

Hiroshi G. Okuno, Kazuhiro Nakadai

2015 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) 2015年4月

　詳細を見る

出版者・発行元：Institute of Electrical {\&} Electronics Engineers ({IEEE})

DOI： 10.1109/icassp.2015.7179045

researchmap
Deep Neural Networkを用いた雑音抑圧及びブラインド音源分離手法の提案とその評価

橋本, 直矢, 野田, 邦昭, 中臺, 一博, 尾形, 哲也

第77回全国大会講演論文集 2015 ( 1 ) 115 - 116 2015年3月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

従来音源分離には独立成分分析等の手法を用いることが一般的であったが，分離フィルタが線形写像となるためその性能には限界があった．本研究では任意の非線形写像を近似できるDeep Neural Network (DNN)を分離フィルタ及び雑音抑圧のモデルとして用いる手法を提案する．提案モデルでは，マイクロホンアレイにより収録した混合音声信号の多チャンネルメルフィルタバンク特徴を入力，目的の音源の音響特徴を出力としてDNNを学習し，分離フィルタをモデル化した．DNNの構造や音響特徴量等の条件を，隠れ層の数やSN比を変化させて評価実験を行った結果，多くの場合において提案手法が従来の方法より高い性能を示す事を確認した．

CiNii Books

CiNii Research

researchmap

その他リンク： http://id.nii.ac.jp/1001/00164218/
Posture estimation of hose-shaped robot by using active microphone array 査読

Yoshiaki Bando, Takuma Otsuka, Takeshi Mizumoto, Katsutoshi Itoyama, Masashi Konyo, Satoshi Tadokoro, Kazuhiro Nakadai, Hiroshi G. Okuno

Advanced Robotics 29 ( 1 ) 35 - 49 2015年1月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1080/01691864.2014.981291

Web of Science

researchmap
Improved sound source localization in horizontal plane for binaural robot audition. 査読

Ui-Hyun Kim, Kazuhiro Nakadai,Array

Appl. Intell. 42 ( 1 ) 63 - 74 2015年1月

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.1007/s10489-014-0544-y

Web of Science

CiNii Research

researchmap
Outdoor Acoustic Event Identification using Sound Source Separation and Deep Learning with a Quadrotor-Embedded Microphone Array

Uemura Satoshi, Sugiyama Osamu, Kojima Ryosuke, Nakadai Kazuhiro

The Abstracts of the international conference on advanced mechatronics : toward evolutionary fusion of IT and mechatronics : ICAM 2015 329 - 330 2015年

　詳細を見る

記述言語：英語出版者・発行元：一般社団法人日本機械学会

We present acoustic event identification by integration of sound source separation and deep learning based on a convolutional neural network for extremely noisy acoustics signals captured with a 16 ch microphone array embedded in an Unmanned Aerial Vehicle (UAV).We showed that the proposed method can identify over 98% sound sources correctly for a 10 class classification task using 16 ch recorded sound data with a microphone array embedded in a quadrotor.

DOI： 10.1299/jsmeicam.2015.6.329

CiNii Books

researchmap
Beat Tracking for Interactive Dancing Robots 査読

Jo{\~{a } }o, Lobato Oliveira, GÃ¶khan Ince, Keisuke Nakamura, Kazuhiro Nakadai, Hiroshi G. Okuno, Fabien Gouyon, Lu{\'{\i, Paulo Reis

Int. J. Human. Robot. 12 ( 04 ) 1550023 2015年

　詳細を見る

出版者・発行元：World Scientific Pub Co Pte Lt

DOI： 10.1142/s0219843615500231

researchmap
Audio-visual scene understanding utilizing text information for a cooking support robot 査読

Ryosuke Kojima, Osamu Sugiyama, Kazuhiro Nakadai

Intelligent Robots and Systems (IROS), 2015 IEEE/RSJ International Conference on 2015年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

researchmap
Scene understanding based on sound and text information for a cooking support robot 査読

Ryosuke Kojima, Osamu Sugiyama, Kazuhiro Nakadai

Current Approaches in Applied Artificial Intelligence: 28th International Conference on Industrial, Engineering and Other Applications of Applied Intelligent Systems, IEA/AIE 2015, Seoul, South Korea 2015年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

researchmap
Multimodal scene understanding using CNN and hierarchical HMM for a cooking support robot

Ryosuke Kojima, Osamu Sugiyama, Kazuhiro Nakadai

Machine Learning Summer School 2015年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

researchmap
Interactive interface to optimize sound source localization based on microphone array with coarse-to-fine tuning for humanoids 査読

Osamu Sugiyama, Ryosuke Kojima, Kazuhiro Nakadai

Humanoid Robots (Humanoids), 2015 IEEE-RAS 15th International Conference on 2015年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

researchmap
Interactive Interface to Optimize Sound Source Localization with HARK 査読

Osamu Sugiyama, Ryosuke Kojima, Kazuhiro Nakadai

Current Approaches in Applied Artificial Intelligence: 28th International Conference on Industrial, Engineering and Other Applications of Applied Intelligent Systems, IEA/AIE 2015, Seoul, South Korea 2015年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

researchmap
Acoustic model training based on node-wise weight boundary model increasing speed of discrete neural networks. 査読

Ryu Takeda, Kazunori Komatani, Kazuhiro Nakadai

2015 IEEE Workshop on Automatic Speech Recognition and Understanding, ASRU 2015, Scottsdale, AZ, USA, December 13-17, 2015 52 - 58 2015年

　詳細を見る

出版者・発行元：IEEE

DOI： 10.1109/ASRU.2015.7404773

researchmap
Compensating changes in speaker position for improved voice-based human-robot communication. 査読

Randy Gomez, Keisuke Nakamura, Takeshi Mizumoto, Kazuhiro Nakadai

15th IEEE-RAS International Conference on Humanoid Robots, Humanoids 2015, Seoul, South Korea, November 3-5, 2015 977 - 982 2015年

　詳細を見る

出版者・発行元：IEEE

DOI： 10.1109/HUMANOIDS.2015.7363488

researchmap
Temporal smearing compensation in reverberant environment for speech-based human-robot interaction. 査読

Randy Gomez, Keisuke Nakamura, Takeshi Mizumoto, Kazuhiro Nakadai

IEEE International Conference on Robotics and Automation, ICRA 2015, Seattle, WA, USA, 26-30 May, 2015 3347 - 3353 2015年

　詳細を見る

出版者・発行元：IEEE

DOI： 10.1109/ICRA.2015.7139661

researchmap
Dereverberation for active human-robot communication robust to speaker's face orientation. 査読

Randy Gomez, Levko Ivanchuk, Keisuke Nakamura, Takeshi Mizumoto, Kazuhiro Nakadai

INTERSPEECH 2015, 16th Annual Conference of the International Speech Communication Association, Dresden, Germany, September 6-10, 2015 180 - 184 2015年

　詳細を見る

出版者・発行元：ISCA

researchmap

その他リンク： http://dblp.uni-trier.de/db/conf/interspeech/interspeech2015.html#conf/interspeech/GomezINMN15
Utilizing visual cues in robot audition for sound source discrimination in speech-based human-robot communication. 査読

Randy Gomez, Levko Ivanchuk, Keisuke Nakamura, Takeshi Mizumoto, Kazuhiro Nakadai

2015 IEEE/RSJ International Conference on Intelligent Robots and Systems, IROS 2015, Hamburg, Germany, September 28 - October 2, 2015 4216 - 4222 2015年

　詳細を見る

出版者・発行元：IEEE

DOI： 10.1109/IROS.2015.7353974

researchmap
Robot-Audition-based Human-Machine Interface for a Car. 査読

Kazuhiro Nakadai, Takeshi Mizumoto, Keisuke Nakamura

2015 IEEE/RSJ International Conference on Intelligent Robots and Systems, IROS 2015, Hamburg, Germany, September 28 - October 2, 2015 6129 - 6136 2015年

　詳細を見る

出版者・発行元：IEEE

DOI： 10.1109/IROS.2015.7354250

researchmap
Optimized Wavelet-domain Filtering Under Noisy and Reverberant Conditions 査読

R.Gomez, T.Kawahara, K.Nakadai

APSIPA Trans. Signal & Information Process. 4 ( e3 ) 1 - 12 2015年

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

researchmap
Prevention of accomplishing synchronous multi-modal human-robot cooperation by using visual rhythms 査読

Kenta Yonekura, Chyon Hae Kim, Kazuhiro Nakadai, Hiroshi Tsujino, Kazuhito Yokoi

ADVANCED ROBOTICS 29 ( 14 ) 901 - 912 2015年

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1080/01691864.2015.1031280

Web of Science

researchmap
Robot Audition Based Acoustic Event Identification Using a Bayesian Model Considering Spectral and Temporal Uncertainties 査読

Keisuke Nakamura, Kazuhiro Nakadai

2015 IEEE/RSJ INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS (IROS) 4840 - 4845 2015年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Sound Source Separation for Robot Audition using Deep Learning 査読

Kuniaki Noda, Naoya Hashimoto, Kazuhiro Nakadai, Tetsuya Ogata

2015 IEEE-RAS 15TH INTERNATIONAL CONFERENCE ON HUMANOID ROBOTS (HUMANOIDS) 389 - 394 2015年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Interactive Sound Source Localization using Robot Audition for Tablet Devices 査読

Keisuke Nakamura, Lana Sinapayen, Kazuhiro Nakadai

2015 IEEE/RSJ INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS (IROS) 6137 - 6142 2015年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
A Case Study of An Automatic Volume Control Interface for A Telepresence System 査読

Masaaki Takahashi, Masa Ogata, Michita Imai, Keisuke Nakamura, Kazuhiro Nakadai

2015 24TH IEEE INTERNATIONAL SYMPOSIUM ON ROBOT AND HUMAN INTERACTIVE COMMUNICATION (RO-MAN) 517 - 522 2015年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
On-the-spot Calibration of Microphone Array Transfer Functions for Robot Audition 査読

Keisuke Nakamura, Surya Ambrose, Kazuhiro Nakadai

2015 IEEE INTERNATIONAL CONFERENCE ON ROBOTICS AND AUTOMATION (ICRA) 3354 - 3359 2015年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Erratum : A real-time super-resolution robot audition system that improves the robustness of simultaneous speech recognition (Advanced Robotics (2013) 27 (933-945) DOI: 10.1080/01691864.2013.797139) 査読

Nakamura K, Nakadai K, Okuno H.G

Advanced Robotics 28 ( 19 ) 1329 2014年10月

　詳細を見る

DOI： 10.1080/01691864.2014.943342

Web of Science

Scopus

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
A sound-based online method for estimating the time-varying posture of a hose-shaped robot 査読

Yoshiaki Bando, Katsutoshi Itoyama, Masashi Konyo, Satoshi Tadokoro, Kazuhiro Nakadai, Kazuyoshi Yoshii, Hiroshi G. Okuno

2014 IEEE International Symposium on Safety, Security, and Rescue Robotics (2014) 1 - 6 2014年10月

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：Institute of Electrical {\&} Electronics Engineers ({IEEE})

DOI： 10.1109/ssrr.2014.7017665

researchmap
Sound Source Orientation Estimation Based on an Orientation-Extended Beamformer 査読

Hirofumi Nakajima, Keiko Kikuchi, Kazuhiro Nakadai, Yutaka Kaneda

IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES E97A ( 9 ) 1875 - 1883 2014年9月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1587/transfun.E97.A.1875

Web of Science

researchmap
Making a robot dance to diverse musical genre in noisy environments. 査読

João Lobato Oliveira, Keisuke Nakamura, Thibault Langlois, Fabien Gouyon, Kazuhiro Nakadai, Angelica Lim, Array,Array

2014 IEEE/RSJ International Conference on Intelligent Robots and Systems, Chicago, IL, USA, September 14-18, 2014 1896 - 1901 2014年9月

　詳細を見る

DOI： 10.1109/IROS.2014.6942812

DOI： 10.1109/iros.2014.6942812

Web of Science

researchmap
Sound Source Localization with an Autonomous Swarm of Quadrocopters 査読

Lana Sinapayen, Keisuke Nakamura, Kazuhiro Nakadai, Hideyuki Takahashi, Tetsuo Kinoshita

Proc. of the workshop on Modular and Swarm Systems — from Nature to Robotics of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS2014) 2014年9月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

researchmap
Multi-agent based Sound Source Localization with Multicopters 査読

Lana Sinapayen, Keisuke Nakamura, Kazuhiro Nakadai, Hideyuki Takahashi, Tetsuo Kinoshita

Proc. of International Conference on Smart Technologies for Energy, Information and Communication 2014 (IC-STEIC2014) 95 - 102 2014年8月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

researchmap
マイクロホンアレイのオンライン校正とそのロボット聴覚システムへの応用

中臺一博

日本音響学会誌 70 397 - 402 2014年

　詳細を見る

掲載種別：研究論文（学術雑誌）

CiNii Research

researchmap
Auditory-aware Navigation for Mobile Robots based on Reflection-robust Sound Source Localization and Visual SLAM 査読

Gautam Narang, Keisuke Nakamura, Kazuhiro Nakadai

2014 IEEE INTERNATIONAL CONFERENCE ON SYSTEMS, MAN AND CYBERNETICS (SMC) 4021 - 4026 2014年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Sound annotation tool for multidirectional sounds based on spatial information extracted by HARK robot audition software. 査読

Osamu Sugiyama, Katsutoshi Itoyama, Kazuhiro Nakadai,Array

2014 IEEE International Conference on Systems, Man, and Cybernetics, SMC 2014, San Diego, CA, USA, October 5-8, 2014 2014-January ( January ) 2335 - 2340 2014年

　詳細を見る

DOI： 10.1109/smc.2014.6974275

DOI： 10.1109/SMC.2014.6974275

Web of Science

Scopus

researchmap
Lipreading using convolutional neural network. 査読

Kuniaki Noda, Yuki Yamaguchi, Kazuhiro Nakadai, Hiroshi G. Okuno, Tetsuya Ogata

INTERSPEECH 2014, 15th Annual Conference of the International Speech Communication Association, Singapore, September 14-18, 2014 1 1149 - 1153 2014年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

Scopus

CiNii Research

researchmap

その他リンク： http://dblp.uni-trier.de/db/conf/interspeech/interspeech2014.html#conf/interspeech/NodaYNOO14
IMPROVED HANDS-FREE AUTOMATIC SPEECH RECOGNITION IN REVERBERANT ENVIRONMENT CONDITION 査読

Randy Gomez, Keisuke Nakamura, Takeshi Mizumoto, Kazuhiro Nakadai

2014 4TH JOINT WORKSHOP ON HANDS-FREE SPEECH COMMUNICATION AND MICROPHONE ARRAYS (HSCMA) 67 - 71 2014年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/HSCMA.2014.6843253

Web of Science

researchmap
Speech-based Human-Robot Interaction Robust to Acoustic Reflections in Real Environment 査読

Randy Gomez, Koji Inoue, Keisuke Nakamura, Takeshi Mizumoto, Kazuhiro Nakadai

2014 IEEE/RSJ INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS (IROS 2014) 1367 - 1373 2014年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/IROS.2014.6942735

Web of Science

researchmap
Improvement in Outdoor Sound Source Detection Using a Quadrotor-Embedded Microphone Array 査読

Takuma Ohata, Keisuke Nakamura, Takeshi Mizumoto, Tezuka Taiki, Kazuhiro Nakadai

2014 IEEE/RSJ INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS (IROS 2014) 1902 - 1907 2014年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/IROS.2014.6942813

Web of Science

researchmap
Ego-motion Noise Suppression for Robots Based on Semi-Blind Infinite Non-negative Matrix Factorization 査読

中臺一博

Proceedings of 2014 IEEE International Conference on Robots and Automation (ICRA 2014) 1 6293 - 6298 2014年

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

Web of Science

CiNii Research

researchmap
Noise correlation matrix estimation for improving sound source localization by multirotor UAV. 査読

Koutarou Furukawa, Keita Okutani, Kohei Nagira, Takuma Otsuka, Katsutoshi Itoyama, Kazuhiro Nakadai,Array

2013 IEEE/RSJ International Conference on Intelligent Robots and Systems, Tokyo, Japan, November 3-7, 2013 3943 - 3948 2013年11月

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/IROS.2013.6696920

DOI： 10.1109/iros.2013.6696920

Web of Science

researchmap
Posture estimation of hose-shaped robot using microphone array localization. 査読

Yoshiaki Bando, Takeshi Mizumoto, Katsutoshi Itoyama, Kazuhiro Nakadai,Array

2013 IEEE/RSJ International Conference on Intelligent Robots and Systems, Tokyo, Japan, November 3-7, 2013 3446 - 3451 2013年11月

　詳細を見る

DOI： 10.1109/IROS.2013.6696847

DOI： 10.1109/iros.2013.6696847

Web of Science

researchmap
A real-time super-resolution robot audition system that improves the robustness of simultaneous speech recognition 査読

Nakamura K, Nakadai K, Okuno H.G

Advanced Robotics 27 ( 12 ) 933 - 945 2013年8月

　詳細を見る

DOI： 10.1080/01691864.2013.797139

Web of Science

Scopus

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
Hands-free human-robot communication robust to speaker's radial position. 査読

Randy Gomez, Keisuke Nakamura, Kazuhiro Nakadai, Ui-Hyun Kim,Array, Tatsuya Kawahara

2013 IEEE International Conference on Robotics and Automation, Karlsruhe, Germany, May 6-10, 2013 4329 - 4334 2013年5月

　詳細を見る

DOI： 10.1109/ICRA.2013.6631190

DOI： 10.1109/icra.2013.6631190

Web of Science

researchmap
投影型遠隔コミュニケーションにおけるユーザとアバタの視点の一致

石井健太郎, 谷口祐司, 大澤博隆, 中臺一博, 今井倫太

情報処理学会論文誌 54 ( 4 ) 1413 - 1421 2013年4月

　詳細を見る

記述言語：日本語

本論文では，仮想的な身体を持つアバタを投影する遠隔コミュニケーションシステムPROT AVATARにおけるアバタ操作手法に関する実験をもとに，得られた知見について議論する．PROT AVATARによるコミュニケーションでは，アバタの操作者の映像を遠隔地に投影するため，表情により感情を伝えることができる．さらに，アバタの操作者にとっては明確ではない，アバタの投影に適切な位置をシステムが自動で計算するため，アバタの操作者は投影位置を考えることなく遠隔の環境内を指し示すことができる．しかし，アバタの操作者が採用する視点はアバタの視点とは異なることがあるため，アバタの操作者の発話がアバタとの対話者にとっては自然ではない場合がある．本論文では，アバタの操作手法として，自動操作手法と半自動操作手法の2つの手法を設計・実装し，比較実験を行った．実験の結果，半自動操作手法のほうが自動操作手法よりも，アバタとの対話者にとって自然な発話を引き出すことが示された．また，実験を通して得られた遠隔コミュニケーションシステム関する知見をまとめる．This paper discusses the findings of the viewpoint of an avatar-controlling user on the basis of experimentation with an implemented telecommunication system named PROT AVATAR. Communication using an avatar with facial expressions is useful when a user wants to express emotions. On top of this feature, our system supports avatar movement toward nearest visible location to the target, which is not obvious for the avatar controller. With our system, the avatar controller can easily refer to something remotely. However, sometimes, the words of an avatar controller may not be intuitive for an avatar viewer, because the avatar controller does not necessarily share the viewpoint of the avatar. We designed automatic and semi-automatic methods for controlling the avatar, and we conducted an experiment to compare the two methods. The results showed that semi-automatic control brought more intuitive utterances for an avatar viewer than fully automatic control, and they have design implications for telecommunication systems.

CiNii Books

researchmap
Development of a sound source localization system for assisting group conversation 査読

Mihoko Otake, Myagmarbayar Nergui, Seong-Eun Moon, Kentaro Takagi, Tsutomu Kamashima, Kazuhiro Nakadai

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 8102 ( 1 ) 532 - 539 2013年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1007/978-3-642-40852-6-54

Scopus

researchmap
Footstep detection and classification using distributed microphones 査読

Kazuhiro Nakadai, Yuta Fujii, Shigeki Sugano

International Workshop on Image Analysis for Multimedia Interactive Services 2013年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/WIAMIS.2013.6616127

Scopus

researchmap
Improved Sound Source Localization and Front-Back Disambiguation for Humanoid Robots with Two Ears. 査読

Ui-Hyun Kim, Kazuhiro Nakadai,Array

Recent Trends in Applied Artificial Intelligence, 26th International Conference on Industrial, Engineering and Other Applications of Applied Intelligent Systems, IEA/AIE 2013, Amsterdam, The Netherlands, June 17-21, 2013. Proceedings 7906 LNAI 282 - 291 2013年

　詳細を見る

出版者・発行元：Springer

DOI： 10.1007/978-3-642-38577-3_29

researchmap
Mitigating the effects of reverberation for effective human-robot interaction in the real world. 査読

Randy Gomez, Keisuke Nakamura, Takeshi Mizumoto, Kazuhiro Nakadai

13th IEEE-RAS International Conference on Humanoid Robots, Humanoids 2013, Atlanta, GA, USA, October 15-17, 2013 177 - 182 2013年

　詳細を見る

出版者・発行元：IEEE

DOI： 10.1109/HUMANOIDS.2013.7029973

researchmap
Real-time Super-resolution Three-dimensional Sound Source Localization for Robots 査読

Keisuke Nakamura, Randy Gomez, Kazuhiro Nakadai

2013 IEEE/RSJ INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS (IROS) 3949 - 3954 2013年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Dereverberation Robust to Speaker's Azimuthal Orientation in Multi-channel Human-Robot Communication 査読

Randy Gomez, Keisuke Nakamura, Kazuhiro Nakadai

2013 IEEE/RSJ INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS (IROS) 3439 - 3445 2013年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
ROBUSTNESS TO SPEAKER POSITION IN DISTANT-TALKING AUTOMATIC SPEECH RECOGNITION 査読

Randy Gomez, Keisuke Nakamura, Kazuhiro Nakadai

2013 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP) 7034 - 7038 2013年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Sound source localization using joint bayesian estimation with a hierarchical noise model 査読

Futoshi Asano, Hideki Asoh, Kazuhiro Nakadai

IEEE Transactions on Audio, Speech and Language Processing 21 ( 9 ) 1953 - 1965 2013年

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1109/TASL.2013.2263140

Scopus

researchmap
Improvement of audio-visual score following in robot ensemble with human guitarist. 査読

Tatsuhiko Itohara, Kazuhiro Nakadai, Array,Array

12th IEEE-RAS International Conference on Humanoid Robots (Humanoids 2012), Osaka, Japan, November 29 - Dec. 1, 2012 574 - 579 2012年11月

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/HUMANOIDS.2012.6651577

DOI： 10.1109/humanoids.2012.6651577

Web of Science

Scopus

researchmap
Live assessment of beat tracking for robot audition. 査読

Array,Gökhan Ince, Keisuke Nakamura, Kazuhiro Nakadai, Array,Array,Array

2012 IEEE/RSJ International Conference on Intelligent Robots and Systems, IROS 2012, Vilamoura, Algarve, Portugal, October 7-12, 2012 992 - 997 2012年10月

　詳細を見る

DOI： 10.1109/IROS.2012.6386100

DOI： 10.1109/iros.2012.6386100

Web of Science

researchmap
An active audition framework for auditory-driven HRI: Application to interactive robot dancing 査読

Joao Lobato Oliveira, Gokhan Ince, Keisuke Nakamura, Kazuhiro Nakadai, Hiroshi G. Okuno, Luis Paulo Reis, Fabien Gouyon

2012 IEEE RO-MAN: The 21st IEEE International Symposium on Robot and Human Interactive Communication 2012年9月

　詳細を見る

出版者・発行元：Institute of Electrical {\&} Electronics Engineers ({IEEE})

DOI： 10.1109/roman.2012.6343892

researchmap
マルチモーダル情報統合によるインテリジェント人追跡システム

中村圭佑, 中臺一博, 浅野太, 中島弘史, INCE Gokhan

計測自動制御学会論文集 = Transactions of the Society of Instrument and Control Engineers 48 ( 6 ) 349 - 358 2012年6月

　詳細を見る

記述言語：日本語出版者・発行元：計測自動制御学会

DOI： 10.9746/sicetr.48.349

CiNii Books

CiNii Research

researchmap
Efficient Blind Dereverberation and Echo Cancellation Based on Independent Component Analysis for Actual Acoustic Signals 査読

Ryu Takeda, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno

NEURAL COMPUTATION 24 ( 1 ) 234 - 272 2012年1月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1162/NECO_a_00219

Web of Science

PubMed

researchmap
Robot audition for dynamic environments 査読

Kazuhiro Nakadai, Gokhan Ince, Keisuke Nakamura, Hirofumi Nakajima

2012 IEEE International Conference on Signal Processing, Communications and Computing, ICSPCC 2012 125 - 130 2012年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/ICSPCC.2012.6335729

Scopus

researchmap
A Role of Multi-modal Rhythms in Physical Interaction and Cooperation

Kenta Yonekura, Chyon Hae Kim, Kazuhiro Nakadai, Hiroshi Tsujino, Shigeki Sugano

EURASIP Journal on Audio, Speech, and Music Processing 2012年

　詳細を見る

記述言語：英語

DOI： 10.1186/1687-4722-2012-12

researchmap
Multi-party Human-Robot Interaction with Distant-Talking Speech Recognition 査読

Randy Gomez, Tatsuya Kawahara, Keisuke Nakamura, Kazuhiro Nakadai

HRI'12: PROCEEDINGS OF THE SEVENTH ANNUAL ACM/IEEE INTERNATIONAL CONFERENCE ON HUMAN-ROBOT INTERACTION 439 - 446 2012年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Online Audio Beat Tracking for a Dancing Robot in the Presence of Ego-Motion Noise in a Real Environment 査読

Joao Lobato Oliveira, Goekhan Ince, Keisuke Nakamura, Kazuhiro Nakadai

2012 IEEE INTERNATIONAL CONFERENCE ON ROBOTICS AND AUTOMATION (ICRA) 403 - 408 2012年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Active Audio-Visual Integration for Voice Activity Detection based on a Causal Bayesian Network 査読

Takami Yoshida, Kazuhiro Nakadai

2012 12th IEEE-RAS International Conference on Humanoid Robots (Humanoids) 370 - 375 2012年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Online Learning for Template-based Multi-channel Ego Noise Estimation 査読

Goekhan Ince, Kazuhiro Nakadai, Keisuke Nakamura

2012 IEEE/RSJ INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS (IROS) 3284 - 3289 2012年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Outdoor Auditory Scene Analysis Using a Moving Microphone Array Embedded in a Quadrocopter 査読

Keita Okutani, Takami Yoshida, Keisuke Nakamura, Kazuhiro Nakadai

2012 IEEE/RSJ INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS (IROS) 3290 - 3295 2012年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
SLAM-based Online Calibration for Asynchronous Microphone Array 査読

Hiroki Miura, Takami Yoshida, Keisuke Nakamura, Kazuhiro Nakadai

ADVANCED ROBOTICS 26 ( 17 ) 1941 - 1965 2012年

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1080/01691864.2012.728690

Web of Science

researchmap
Audio-Visual Voice Activity Detection Based on an Utterance State Transition Model 査読

Takami Yoshida, Kazuhiro Nakadai

ADVANCED ROBOTICS 26 ( 10 ) 1183 - 1201 2012年

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1080/01691864.2012.687152

Web of Science

researchmap
Real-time Super-resolution Sound Source Localization for Robots 査読

Keisuke Nakamura, Kazuhiro Nakadai, Goekhan Ince

2012 IEEE/RSJ INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS (IROS) 694 - 699 2012年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Sound source localization in spatially colored noise using a hierarchical Bayesian model 査読

Futoshi Asano, Hideki Asoh, Kazuhiro Nakadai

ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings 193 - 196 2012年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/ICASSP.2012.6287850

Scopus

researchmap
Ego noise cancellation of a robot using missing feature masks 査読

Goekhan Ince, Kazuhiro Nakadai, Tobias Rodemann, Hiroshi Tsujino, Jun-ichi Imura

APPLIED INTELLIGENCE 34 ( 3 ) 360 - 371 2011年6月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1007/s10489-011-0285-0

Web of Science

researchmap
ロボット聴覚用オープンソースソフトウェアHARKの展開 (特集世界に飛び出す日本のソフトウェア)

中臺一博, 奥乃博

情報処理学会デジタルプラクティス 2 ( 2 ) 133 - 140 2011年6月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

CiNii Books

researchmap
Design and implementation of selectable sound separation on the Texai telepresence system using HARK. 査読

Takeshi Mizumoto, Kazuhiro Nakadai, Takami Yoshida, Ryu Takeda, Takuma Otsuka, Toru Takahashi, Array

IEEE International Conference on Robotics and Automation, ICRA 2011, Shanghai, China, 9-13 May 2011 2130 - 2137 2011年5月

　詳細を見る

DOI： 10.1109/ICRA.2011.5979849

DOI： 10.1109/icra.2011.5979849

Web of Science

researchmap
Robot audition: Missing feature theory approach and active audition 査読

Okuno H.G, Nakadai K, Kim H.-D

Springer Tracts in Advanced Robotics 70 ( STAR ) 227 - 244 2011年

　詳細を見る

DOI： 10.1007/978-3-642-19457-3_14

Web of Science

Scopus

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
Real-Time Audio-to-Score Alignment Using Particle Filter for Coplayer Music Robots. 査読

Takuma Otsuka, Kazuhiro Nakadai, Toru Takahashi, Array,Array

EURASIP J. Adv. Sig. Proc. 2011 2011年

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.1155/2011/384651

Web of Science

Scopus

CiNii Research

researchmap
Robust intonation pattern classification in human robot interaction 査読

Martin Heckmann, Kazuhiro Nakadai, Hirofumi Nakajima

12TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2011 (INTERSPEECH 2011), VOLS 1-5 3144 - + 2011年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Whole Body Motion Noise Cancellation of a Robot for Improved Automatic Speech Recognition 査読

Goekhan Ince, Kazuhiro Nakadai, Tobias Rodemann, Hiroshi Tsujino, Jun-ichi Imura

ADVANCED ROBOTICS 25 ( 11-12 ) 1405 - 1426 2011年

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1163/016918611X579448

Web of Science

researchmap
SLAM-based Online Calibration of Asynchronous Microphone Array for Robot Audition 査読

Hiroaki Miura, Takami Yoshida, Keisuke Nakamura, Kazuhiro Nakadai

2011 IEEE/RSJ INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS 524 - 529 2011年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Restoration of Clipped Audio Signal Using Recursive Vector Projection 査読

Shin Miura, Hirofumi Nakajima, Shigeki Miyabe, Shoji Makino, Takeshi Yamada, Kazuhiro Nakadai

2011 IEEE REGION 10 CONFERENCE TENCON 2011 394 - 397 2011年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Incremental Learning for Ego Noise Estimation of a Robot 査読

Goekhan Ince, Kazuhiro Nakadai, Tobias Rodemann, Jun-ichi Imura, Keisuke Nakamura, Hirofumi Nakajima

2011 IEEE/RSJ INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS 131 - 136 2011年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
HARK based Real-time Single Pane 3D Auditory Scene Visualizer Empowered by Speech Arrow 査読

Zheng Gong, Kazuhiro Nakadai, Hirofumi Nakajima, Ichiro Hagiwara

2011 IEEE/RSJ INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS 530 - 535 2011年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
CORRELATION MATRIX INTERPOLATION IN SOUND SOURCE LOCALIZATION FOR A ROBOT 査読

Keisuke Nakamura, Kazuhiro Nakadai, Hirofumi Nakajima, Goekhan Ince

2011 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING 4324 - 4327 2011年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Bayesian Extension of MUSIC for Sound Source Localization and Tracking. 査読

Takuma Otsuka, Kazuhiro Nakadai, Tetsuya Ogata, Hiroshi G. Okuno

INTERSPEECH 2011, 12th Annual Conference of the International Speech Communication Association, Florence, Italy, August 27-31, 2011 3109 - 3112 2011年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

Scopus

researchmap

その他リンク： http://dblp.uni-trier.de/db/conf/interspeech/interspeech2011.html#conf/interspeech/OtsukaNOO11
Incremental Bayesian Audio-to-Score Alignment with Flexible Harmonic Structure Models. 査読

Takuma Otsuka, Kazuhiro Nakadai, Tetsuya Ogata, Hiroshi G. Okuno

Proceedings of the 12th International Society for Music Information Retrieval Conference, ISMIR 2011, Miami, Florida, USA, October 24-28, 2011 525 - 530 2011年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：University of Miami

Scopus

researchmap

その他リンク： http://dblp.uni-trier.de/db/conf/ismir/ismir2011.html#conf/ismir/OtsukaNOO11
Assessment of Single-channel Ego Noise Estimation Methods 査読

Goekhan Ince, Kazuhiro Nakadai, Tobias Rodemann, Jun-ichi Imura, Keisuke Nakamura, Hirofumi Nakajima

2011 IEEE/RSJ INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS 106 - 111 2011年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Intelligent Sound Source Localization and Its Application to Multimodal Human Tracking 査読

Keisuke Nakamura, Kazuhiro Nakadai, Futoshi Asano, Goekhan Ince

2011 IEEE/RSJ INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS 143 - 148 2011年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Assessment of General Applicability of Ego Noise Estimation - Applications to Automatic Speech Recognition and Sound Source Localization 査読

Goekhan Ince, Keisuke Nakamura, Futoshi Asano, Hirofumi Nakajima, Kazuhiro Nakadai

2011 IEEE INTERNATIONAL CONFERENCE ON ROBOTICS AND AUTOMATION (ICRA) 2011年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Rhythmic Reference of a Human while a Rope Turning Task 査読

Kenta Yonekura, Chyon Hae Kim, Kazuhiro Nakadai, Hiroshi Tsujino, Shigeki Sugano

PROCEEDINGS OF THE 6TH ACM/IEEE INTERNATIONAL CONFERENCE ON HUMAN-ROBOT INTERACTIONS (HRI 2011) 289 - 290 2011年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
A multi-expert model for dialogue and behavior control of conversational robots and agents. 査読

Mikio Nakano, Yuji Hasegawa, Kotaro Funakoshi, Johane Takeuchi, Toyotaka Torii, Kazuhiro Nakadai, Naoyuki Kanda, Kazunori Komatani, Array,Array

Knowl.-Based Syst. 24 ( 2 ) 248 - 256 2011年

　詳細を見る

DOI： 10.1016/j.knosys.2010.08.004

researchmap
ロボット聴覚のための2階層視聴覚情報統合を用いた音声認識システムの検討査読

中臺一博, 奥乃博

日本ロボット学会誌 28巻8号 56 - 63 2011年

　詳細を見る

掲載種別：研究論文（学術雑誌）

CiNii Research

researchmap

その他リンク： https://kaken.nii.ac.jp/grant/KAKENHI-PUBLICLY-21013030/
ロボットを対象とした二階層視聴覚統合音声認識システム

吉田尚水, 中臺一博, 奥乃博

日本ロボット学会誌 28 ( 8 ) 970 - 977 2010年10月

　詳細を見る

記述言語：日本語出版者・発行元：日本ロボット学会

Noise-robust Automatic Speech Recognition (ASR) is essential for robots which are expected to communicate with human in a daily environment. In such an environment, Voice Activity Detection (VAD) performance becomes poor, and ASR performance deteriorates due to noises and VAD failures. To cope with these problems, it is said that humans improve speech recognition performance by using visual information like lip reading. Thus, we propose two-layered audio-visual integration framework for VAD and ASR. The two-layered AV integration framework includes three crucial methods. The first is Audio-Visual Voice Activity Detection (AV-VAD) based on Bayesian network. The second is a new lip-related visual feature which is robust for visual noises. The last one is microphone array processing to improve Signal-to-Noise Ratio (SNR) of input signal. We implemented prototype audio-visual speech recognition system based on our proposed framework using HARK which is our robot audition system. Through voice activity detection and speech recognition experiments, we showed the effectiveness of Audio-Visual integration, microphone array processing, and their combination for VAD and ASR. Preliminary results show that our system improves 20 and 9.7 points of ASR results with/without microphone array processing, respectively, and also improves robustness against several auditory/visual noise conditions.

DOI： 10.7210/jrsj.28.970

CiNii Books

CiNii Research

researchmap
PROT — An embodied agent for intelligible and user-friendly human-robot interaction 査読

R Fujimura, K Nakadai, M Imai, R Ohmura

2010 IEEE/RSJ International Conference on Intelligent Robots and Systems 2010年10月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/iros.2010.5649116

researchmap
音響シミュレーションの発話方向推定システムへの適用

鈴木淑正, 中島弘史, 鶴秀生, 荒井隆行, 中臺一博, 長谷川雄二

日本音響学会研究発表会講演論文集 595 - 598 2010年9月

　詳細を見る

記述言語：日本語掲載種別：研究論文（学術雑誌）出版者・発行元：日本音響学会

researchmap
音響シミュレーションを用いた発話方向推定

鈴木淑正, 荒井隆行, 鶴秀生, 中島弘史, 中臺一博

日本ロボット学会学術講演会予稿集 1H2 - 2 2010年9月

　詳細を見る

記述言語：日本語掲載種別：研究論文（学術雑誌）出版者・発行元：日本ロボット学会

researchmap
Blind Source Separation With Parameter-Free Adaptive Step-Size Method for Robot Audition 査読

Hirofumi Nakajima, Kazuhiro Nakadai, Yuji Hasegawa, Hiroshi Tsujino

IEEE TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING 18 ( 6 ) 1476 - 1485 2010年8月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1109/TASL.2009.2035219

Web of Science

researchmap
AIチャレンジ研究会(SIG-Challenge)(<特集>研究会総覧)

中臺一博, 光永法明

人工知能 25 ( 4 ) 545 - 546 2010年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人人工知能学会

DOI： 10.11517/jjsai.25.4_545

CiNii Books

CiNii Research

researchmap
Upper-limit evaluation of robot audition based on ICA-BSS in multi-source, barge-in and highly reverberant conditions 査読

Ryu Takeda, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G Okuno

2010 IEEE International Conference on Robotics and Automation 2010年5月

　詳細を見る

出版者・発行元：Institute of Electrical {\&} Electronics Engineers ({IEEE})

DOI： 10.1109/robot.2010.5509891

researchmap
Improvement in listening capability for humanoid robot HRP-2 査読

Toru Takahashi, Kazuhiro Nakadai, Kazunori Komatani, Tetsuya Ogata, Hiroshi G Okuno

2010 IEEE International Conference on Robotics and Automation 2010年5月

　詳細を見る

出版者・発行元：Institute of Electrical {\&} Electronics Engineers ({IEEE})

DOI： 10.1109/robot.2010.5509830

researchmap
Soft missing-feature mask generation for robot audition. 査読

Toru Takahashi, Kazuhiro Nakadai, Kazunori Komatani, Tetsuya Ogata,Array

Paladyn 1 ( 1 ) 37 - 47 2010年1月

　詳細を見る

出版者・発行元：Walter de Gruyter {GmbH}

DOI： 10.2478/s13230-010-0005-1

researchmap
Voice-awareness control for a humanoid robot consistent with its body posture and movements. 査読

Takuma Otsuka, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata,Array

Paladyn 1 ( 1 ) 80 - 88 2010年1月

　詳細を見る

出版者・発行元：Walter de Gruyter {GmbH}

DOI： 10.2478/s13230-010-0009-x

researchmap
Design and Implementation of Robot Audition System 'HARK' — Open Source Software for Listening to Three Simultaneous Speakers 査読

Kazuhiro Nakadai, Toru Takahashi, Hiroshi G. Okuno, Hirofumi Nakajima, Yuji Hasegawa, Hiroshi Tsujino

Advanced Robotics 24 ( 5-6 ) 739 - 761 2010年1月

　詳細を見る

掲載種別：研究論文（学術雑誌）出版者・発行元：Informa {UK} Limited

DOI： 10.1163/016918610x493561

CiNii Research

researchmap
Applying geometric source separation for improved pitch extraction in human-robot interaction

Martin Heckmann, Claudius Gläser, Frank Joublin, Kazuhiro Nakadai

Proceedings of the 11th Annual Conference of the International Speech Communication Association, INTERSPEECH 2010 2602 - 2605 2010年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：International Speech Communication Association

Scopus

researchmap
ロボットを対象とした二階層視聴覚統合音声認識システム

吉田尚水, 中臺一博, 奥乃博

日本ロボット学会誌 28 ( 8 ) 970 - 977 2010年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本ロボット学会

Noise-robust Automatic Speech Recognition (ASR) is essential for robots which are expected to communicate with human in a daily environment. In such an environment, Voice Activity Detection (VAD) performance becomes poor, and ASR performance deteriorates due to noises and VAD failures. To cope with these problems, it is said that humans improve speech recognition performance by using visual information like lip reading. Thus, we propose two-layered audio-visual integration framework for VAD and ASR. The two-layered AV integration framework includes three crucial methods. The first is Audio-Visual Voice Activity Detection (AV-VAD) based on Bayesian network. The second is a new lip-related visual feature which is robust for visual noises. The last one is microphone array processing to improve Signal-to-Noise Ratio (SNR) of input signal. We implemented prototype audio-visual speech recognition system based on our proposed framework using HARK which is our robot audition system. Through voice activity detection and speech recognition experiments, we showed the effectiveness of Audio-Visual integration, microphone array processing, and their combination for VAD and ASR. Preliminary results show that our system improves 20 and 9.7 points of ASR results with/without microphone array processing, respectively, and also improves robustness against several auditory/visual noise conditions.

DOI： 10.7210/jrsj.28.970

CiNii Research

researchmap
Design and Implementation of Two-level Synchronization for Interactive Music Robot. 査読

Takuma Otsuka, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno

Proceedings of the Twenty-Fourth AAAI Conference on Artificial Intelligence, AAAI 2010, Atlanta, Georgia, USA, July 11-15, 2010 2 1238 - 1244 2010年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：AAAI Press

Scopus

researchmap

その他リンク： http://dblp.uni-trier.de/db/conf/aaai/aaai2010.html#conf/aaai/OtsukaNTKOO10
An improvement in automatic speech recognition using soft missing feature masks for robot audition. 査読

Toru Takahashi, Kazuhiro Nakadai, Kazunori Komatani, Array,Array

2010 IEEE/RSJ International Conference on Intelligent Robots and Systems, October 18-22, 2010, Taipei, Taiwan 964 - 969 2010年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/IROS.2010.5650540

Web of Science

Scopus

researchmap
Two-layered audio-visual speech recognition for robots in noisy environments. 査読

Takami Yoshida, Kazuhiro Nakadai, Array

2010 IEEE/RSJ International Conference on Intelligent Robots and Systems, October 18-22, 2010, Taipei, Taiwan 988 - 993 2010年

　詳細を見る

DOI： 10.1109/IROS.2010.5651205

Web of Science

Scopus

researchmap
Human-robot ensemble between robot thereminist and human percussionist using coupled oscillator model. 査読

Takeshi Mizumoto, Takuma Otsuka, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Array,Array

2010 IEEE/RSJ International Conference on Intelligent Robots and Systems, October 18-22, 2010, Taipei, Taiwan 1957 - 1963 2010年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/IROS.2010.5650364

Web of Science

Scopus

researchmap
An Improvement in Audio-Visual Voice Activity Detection for Automatic Speech Recognition. 査読

Takami Yoshida, Kazuhiro Nakadai, Array

Trends in Applied Intelligent Systems - 23rd International Conference on Industrial Engineering and Other Applications of Applied Intelligent Systems, IEA/AIE 2010, Cordoba, Spain, June 1-4, 2010, Proceedings, Part I 6096 LNAI ( PART 1 ) 51 - 61 2010年

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.1007/978-3-642-13022-9_6

Web of Science

Scopus

CiNii Research

researchmap
Music-Ensemble Robot That Is Capable of Playing the Theremin While Listening to the Accompanied Music. 査読

Takuma Otsuka, Takeshi Mizumoto, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Array,Array

Trends in Applied Intelligent Systems - 23rd International Conference on Industrial Engineering and Other Applications of Applied Intelligent Systems, IEA/AIE 2010, Cordoba, Spain, June 1-4, 2010, Proceedings, Part I 6096 LNAI ( PART 1 ) 102 - 112 2010年

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.1007/978-3-642-13022-9_11

Web of Science

Scopus

CiNii Research

researchmap
Speedup and performance improvement of ICA-based robot audition by parallel and resampling-based block-wise processing. 査読

Ryu Takeda, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Array,Array

2010 IEEE/RSJ International Conference on Intelligent Robots and Systems, October 18-22, 2010, Taipei, Taiwan 1949 - 1956 2010年

　詳細を見る

DOI： 10.1109/IROS.2010.5652757

Web of Science

Scopus

researchmap
Multi-talker Speech Recognition under Ego-motion Noise using Missing Feature Theory 査読

Goekhan Ince, Kazuhiro Nakadai, Tobias Rodemann, Hiroshi Tsujino, Jun-ichi Imura

IEEE/RSJ 2010 INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS (IROS 2010) 982 - 987 2010年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
A Robust Speech Recognition System against the Ego Noise of a Robot 査読

Goekhan Ince, Kazuhiro Nakadai, Tobias Rodemann, Hiroshi Tsujino, Jun-ichi Imura

11TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2010 (INTERSPEECH 2010), VOLS 3 AND 4 2070 - + 2010年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Robust Ego Noise Suppression of a Robot 査読

中臺一博

Trends in Applied Intelligent Systems Lecture Notes in Computer Science 6096 62 - + 2010年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

CiNii Research

researchmap
A Hybrid Framework for Ego Noise Cancellation of a Robot 査読

Goekhan Ince, Kazuhiro Nakadai, Tobias Rodemann, Yuji Hasegawa, Hiroshi Tsujino, Jun-ichi Imura

2010 IEEE INTERNATIONAL CONFERENCE ON ROBOTICS AND AUTOMATION (ICRA) 3623 - 3628 2010年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Two-Layered Audio-Visual Integration in Voice Activity Detection and Automatic Speech Recognition for Robots 査読

Takami Yoshida, Kazuhiro Nakadai

11TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2010 (INTERSPEECH 2010), VOLS 3 AND 4 2710 - 2713 2010年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
An Easily-configurable Robot Audition System using Histogram-based Recursive Level Estimation 査読

Hirofumi Nakajima, Goekhan Ince, Kazuhiro Nakadai, Yuji Hasegawa

IEEE/RSJ 2010 INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS (IROS 2010) 958 - 963 2010年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Sound Source Separation and Automatic Speech Recognition for Moving Sources 査読

Kazuhiro Nakadai, Hirofumi Nakajima, Goekhan Ince, Yuji Hasegawa

IEEE/RSJ 2010 INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS (IROS 2010) 976 - 981 2010年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Correlation matrix estimation by an optimally controlled recursive average method and its application to blind source separation 査読

Hirofumi Nakajima, Kazuhiro Nakadai, Yuji Hasegawa, Hiroshi Tsujino

Acoustical Science and Technology 31 ( 3 ) 205 - 212 2010年

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1250/ast.31.205

Scopus

researchmap
3D sound field recording and reproducing system including sound source orientation 査読

Toshimasa Suzuki, Hirofumi Nakajima, Hideo Tsuru, Takayuki Arai, Kazuhiro Nakadai

2010 4th International Universal Communication Symposium, IUCS 2010 - Proceedings 215 - 220 2010年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/IUCS.2010.5666221

Scopus

researchmap
Pitch extraction in human-robot interaction 査読

Martin Heckmann, Frank Joublin, Kazuhiro Nakadai

IEEE/RSJ 2010 International Conference on Intelligent Robots and Systems, IROS 2010 - Conference Proceedings 1482 - 1487 2010年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/IROS.2010.5649882

Scopus

researchmap
Robust hands-free automatic speech recognition for human-machine interaction 査読

Randy Gomez, Tatsuya Kawahara, Kazuhiro Nakadai

2010 10th IEEE-RAS International Conference on Humanoid Robots, Humanoids 2010 138 - 143 2010年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/ICHR.2010.5686828

Scopus

researchmap
実物体を扱う遠隔協調作業を支援する壁面投影移動型アバタシステム Remy の提案

藤村亮太, 郭斌, 大村廉, 中臺一博, 今井倫太

知能と情報 : 日本知能情報ファジィ学会誌 : journal of Japan Society for Fuzzy Theory and Intelligent Informatics 21 ( 5 ) 701 - 712 2009年10月

　詳細を見る

記述言語：日本語出版者・発行元：日本知能情報ファジィ学会

本論文では壁面投影移動型アバタシステムRemyの提案を行う．Remyは遠隔地から相手の実空間に対する指示や参照を行いコミュニケーションを行うことを支援する．従来の遠隔協調作業支援システムには，実空間の共有を考慮していない問題，デバイスがユーザに与える負担が大きい問題，表情やジェスチャといったノンバーバル情報の伝達を考慮していない問題があった．上記３点の問題に対して，Remyは移動可能な２次元アバタを実空間に直接投影することで解決する．本論文ではローカルユーザの視点においてRemyと従来研究の比較実験を行なった．実験の結果，Remyの手法が上記の問題点を解決し遠隔協調作業においてコミュニケーションの質を高めることが示された．

DOI： 10.3156/jsoft.21.701

CiNii Books

researchmap
Step-size parameter adaptation of multi-channel semi-blind ICA with piecewise linear model for barge-in-able robot audition 査読

Ryu Takeda, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno

2009 IEEE/RSJ International Conference on Intelligent Robots and Systems 2009年10月

　詳細を見る

出版者・発行元：Institute of Electrical {\&} Electronics Engineers ({IEEE})

DOI： 10.1109/iros.2009.5354527

researchmap
Incremental polyphonic audio to score alignment using beat tracking for singer robots 査読

Takuma Otsuka, Toru Takahashi, Hiroshi G. Okuno, Kazunori Komatani, Tetsuya Ogata, Kazumasa Murata, Kazuhiro Nakadai

2009 IEEE/RSJ International Conference on Intelligent Robots and Systems 2289 - 2296 2009年10月

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：Institute of Electrical {\&} Electronics Engineers ({IEEE})

DOI： 10.1109/iros.2009.5354637

Scopus

researchmap
Missing-feature-theory-based robust simultaneous speech recognition system with non-clean speech acoustic model 査読

Toru Takahashi, Kazuhiro Nakadai, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno

2009 IEEE/RSJ International Conference on Intelligent Robots and Systems 2730 - 2735 2009年10月

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：Institute of Electrical {\&} Electronics Engineers ({IEEE})

DOI： 10.1109/iros.2009.5354201

Scopus

researchmap
環境変動を考慮したロボット聴覚のための音源分離

中島弘史, 中臺一博, 長谷川雄二, 辻野広司

日本ロボット学会誌 27 ( 7 ) 774 - 781 2009年9月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本ロボット学会

This paper describes a novel sound source separation method for a robot that needs to cope with dynamically changing noises in the real world. A sound source separation method, Geometric Source Separation (GSS), is promising because it has high separation performance but does not require a high computational cost. However, GSS has several issues when applied to real-world applications such as robot audition systems that are used in dynamically changing environments. To improve performance in dynamically changing environments, we propose two effective techniques. One is Adaptive Step-size control (AS) this adaptively sets the step-size to the optimum value. The other is Optima Controlled Recursive Average that improves the precision of an estimated separation matrix, and thus achieves high separation performance. We evaluated GSS with and without our proposed methods using an 8ch microphone array embedded in Honda ASIMO. Experimental results showed that the proposed methods improved GSS performance in dynamically changing environment.

DOI： 10.7210/jrsj.27.774

CiNii Books

researchmap
ロボットを対象としたビートトラッキング法の提案とその音楽ロボットへの応用

村田和真, 中臺一博, 武田龍, 奥乃博, 長谷川雄二, 辻野広司

日本ロボット学会誌 27 ( 7 ) 793 - 801 2009年9月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本ロボット学会

Human-robot interaction through music in real environments is essential for robots, because such a robot makes people enjoyable. To deal with real music signals by using robot's own ears, we propose a beat-tracking algorithm for a robot based on semi-blind independent component analysis (SB-ICA) and spectro-temporal pattern matching (STPM). SB-ICA suppresses a self-generating sound such as singing or scatting which heavily affects beat-tracking due to its periodicity. STPM provides quick adaptation to beat changes because it is able to use a shorter matching window than conventional beat-tracking methods based on self-correlation functions. We thus developed a music robot which steps, sings, and scats according to musical beats based on the proposed beat-tracking method. The experimental results using the music robot showed highly noise-robust beat-tracking even when the robot was singing or scatting, and quick adaptation to beat changes like a human clapping sound whose tempo is always changing.

DOI： 10.7210/jrsj.27.793

CiNii Books

researchmap
残響下でのバージイン発話認識のための多入力独立成分分析を応用したロボット聴覚

武田龍, 中臺一博, 高橋徹, 駒谷和範, 尾形哲也, 奥乃博

日本ロボット学会誌 27 ( 7 ) 782 - 792 2009年9月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本ロボット学会

This paper presents a new method based on independent component analysis (ICA) for enhancing a target source and suppressing other interfering sound sources, supposed that the latter are known. The method can provides in a reverberant environment a barge-in-able robot audition system; that is, the user can talk to the robot at any time even when the robot speaks. Our method separates and dereverberates the user's speech and the robot's one by using Multiple Input ICA. The critical issue for real-time processing is to reduce the computational complexity of Multiple Input ICA to the linear order of the reverberation time, which has not been proposed so far. We attain it by exploit the property of the independence relationship between late observed signals and late speech signals. Experimental results show that 1) the computational complexity of our method is less than the naïve Multiple Input ICA method, and that 2) our method improves word correctness of automatic speech recognition under barge-in and reverberant situations; by at most 40 points for reverberation time of 240[ms] and 30 points for 670[ms].

DOI： 10.7210/jrsj.27.782

CiNii Books

researchmap
時間領域差分法を用いた音源形状のモデル化による指向性の再現

鈴木淑正, 中島弘史, 荒井隆行, 中臺一博, 長谷川雄二

日本音響学会研究発表会講演論文集 821 - 824 2009年9月

　詳細を見る

記述言語：日本語掲載種別：研究論文（学術雑誌）出版者・発行元：日本音響学会

researchmap
音楽情報処理技術の最前線 : 4.音楽ロボットのための実時間音楽情報処理

奥乃博, 中臺一博, 大塚琢馬

情報処理 50 ( 8 ) 729 - 734 2009年8月

　詳細を見る

記述言語：日本語掲載種別：研究論文（学術雑誌）出版者・発行元：一般社団法人情報処理学会

音楽のリズムに合わせて振舞う音楽ロボットを目標に据えると, 音楽情報処理の課題が見えてくる.

CiNii Books

CiNii Research

researchmap
ICA-based efficient blind dereverberation and echo cancellation method for barge-in-able robot audition. 査読

Ryu Takeda, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Array,Array

Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2009, 19-24 April 2009, Taipei, Taiwan 3677 - 3680 2009年4月

　詳細を見る

DOI： 10.1109/ICASSP.2009.4960424

DOI： 10.1109/icassp.2009.4960424

Web of Science

researchmap
Ego Noise Suppression of a Robot Using Template Subtraction 査読

Goekhan Ince, Kazuhiro Nakadai, Tobias Rodemann, Yuji Hasegawa, Hiroshi Tsujino, Jun-ichi Imura

2009 IEEE-RSJ INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS 199 - 204 2009年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Automatic estimation of reverberation time with robot speech to improve ICA-based robot audition 査読

Ryu Takeda, Kazuhiro Nakadai, Torn Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno

2009 9th IEEE-RAS International Conference on Humanoid Robots 2009年

　詳細を見る

出版者・発行元：Institute of Electrical {\&} Electronics Engineers ({IEEE})

DOI： 10.1109/ichr.2009.5379572

researchmap
Automatic speech recognition improved by two-layered audio-visual integration for robot audition 査読

Takami Yoshida, Kazuhiro Nakadai, Hiroshi G. Okuno

2009 9th IEEE-RAS International Conference on Humanoid Robots 2009年

　詳細を見る

出版者・発行元：Institute of Electrical {\&} Electronics Engineers ({IEEE})

DOI： 10.1109/ichr.2009.5379586

researchmap
Voice quality manipulation for humanoid robots consistent with their head movements. 査読

Takuma Otsuka, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Array,Array

9th IEEE-RAS International Conference on Humanoid Robots, Humanoids 2009, Paris, France, December 7-10, 2009 405 - 410 2009年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/ICHR.2009.5379569

Scopus

researchmap
Intelligent Sound Source Localization for Dynamic Environments 査読

Keisuke Nakamura, Kazuhiro Nakadai, Futoshi Asano, Yuji Hasegawa, Hiroshi Tsujino

2009 IEEE-RSJ INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS 664 - 669 2009年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Real-time sound source orientation estimation using a 96 channel microphone array 査読

Hirofumi Nakajima, Keiko Kikuchi, Toru Daigo, Yutaka Kaneda, Kazuhiro Nakadai, Yuji Hasegawa

2009 IEEE-RSJ INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS 676 - 683 2009年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
SOUND SOURCE SEPARATION OF MOVING SPEAKERS FOR ROBOT AUDITION 査読

Kazuhiro Nakadai, Hirofumi Nakajima, Yuji Hasegawa, Hiroshi Tsujino

2009 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS 1- 8, PROCEEDINGS 3685 - 3688 2009年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
独立成分分析に基づく適応フィルタのロボット聴覚への適用

武田龍, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博

日本ロボット学会誌 26 ( 6 ) 529 - 536 2008年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本ロボット学会

This paper describes a new adaptive filter algorithm based on independent component analysis (ICA) for enhancing a target sound and for suppressing other interference sounds that are known. The technique can provide barge-in capable robot audition systems by utilizing known sound source signals such as self speech. Unlike a conventional ICA-based method, we use the time-frequency domain convolution model to cope with reflections of the sound. Experimental results showed that our method outperformed the conventional ICA-based method and the well-known adaptive filter algorithm called Nomalized Least Mean Squares (LMS) .

DOI： 10.7210/jrsj.26.529

CiNii Books

researchmap
Barge-in-able robot audition based on ICA and missing feature theory under semi-blind situation 査読

Takeda R, Nakadai K, Komatani K, Ogata T, Okuno H.G

2008 IEEE/RSJ International Conference on Intelligent Robots and Systems, IROS 1718 - 1723 2008年

　詳細を見る

DOI： 10.1109/IROS.2008.4650799

Web of Science

Scopus

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
A Robot Uses Its Own Microphone to Synchronize Its Steps to Musical Beats While Scatting and Singing 査読

Kazumasa Murata, Kazuhiro Nakadai, Kazuyoshi Yoshii, Ryu Takeda, Toyotaka Torii, Hiroshi G. Okuno, Yuji Hasegawa, Hiroshi Tsujino

2008 IEEE/RSJ INTERNATIONAL CONFERENCE ON ROBOTS AND INTELLIGENT SYSTEMS, VOLS 1-3, CONFERENCE PROCEEDINGS 2459 - + 2008年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/IROS.2008.4650596

Web of Science

researchmap
High performance sound source separation adaptable to environmental changes for robot audition 査読

Hirofumi Nakajima, Kazuhiro Nakadai, Yuuji Hasegawa, Hiroshi Tsujino

2008 IEEE/RSJ INTERNATIONAL CONFERENCE ON ROBOTS AND INTELLIGENT SYSTEMS, VOLS 1-3, CONFERENCE PROCEEDINGS 2165 - 2171 2008年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/IROS.2008.4650597

Web of Science

researchmap
Computational auditory scene analysis and its application to robot audition 査読

Hiroshi G. Okuno, Kazuhiro Nakadai

2008 HANDS-FREE SPEECH COMMUNICATION AND MICROPHONE ARRAYS 125 - + 2008年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
A robot referee for rock-paper-scissors sound games 査読

Kazuhiro Nakadai, Shunichi Yamamoto, Hiroshi G. Okuno, Hirofumi Nakajima, Yuji Hasegawa, Hiroshi Tsujino

2008 IEEE INTERNATIONAL CONFERENCE ON ROBOTICS AND AUTOMATION, VOLS 1-9 3469 - + 2008年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Adaptive step-size parameter control for real-world blind source separation 査読

Hirofumi Nakajima, Kazuhiro Nakadai, Yuji Hasegawa, Hiroshi Tsujino

2008 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, VOLS 1-12 149 - 152 2008年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/ICASSP.2008.4517568

Web of Science

researchmap
Moving sound source extraction by time-variant beamforming 査読

Hirofumi Nakajima, Kazuhiro Nakadai, Yuji Hasegawa, Hiroshi Tsujino

NEW FRONTIERS IN ARTIFICIAL INTELLIGENCE 4914 47 - 53 2008年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1007/978-3-540-78197-4_6

Web of Science

researchmap
A portable robot audition software system for multiple simultaneous speech signals 査読

Okuno H.G, Yamamoto S, Nakadai K, Valin J.-M, Ogata T, Komatani K

Proceedings - European Conference on Noise Control 123 ( 5 ) 483 - 488 2008年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：Acoustical Society of America ({ASA})

DOI： 10.1121/1.2932825

Scopus

CiNii Research

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
A Robot Singer with Music Recognition Based on Real-Time Beat Tracking 査読

Kazumasa Murata, Kazuhiro Nakadai, Kazuyoshi Yoshii, Ryu Takeda, Toyotaka Torii, Hiroshi G. Okuno, Yuji Hasegawa, Hiroshi Tsujino

ISMIR 2008, 9th International Conference on Music Information Retrieval, Drexel University, Philadelphia, PA, USA, September 14-18, 2008 199 - 204 2008年

　詳細を見る

Scopus

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
An open source software system for robot audition HARK and its evaluation. 査読

Kazuhiro Nakadai, Array, Hirofumi Nakajima, Yuji Hasegawa, Hiroshi Tsujino

8th IEEE-RAS International Conference on Humanoid Robots, Humanoids 2008, Daejeon, South Korea, December 1-3, 2008 561 - 566 2008年

　詳細を見る

DOI： 10.1109/ICHR.2008.4756031

Web of Science

researchmap
Soft missing-feature mask generation for simultaneous speech recognition system in robots. 査読

Toru Takahashi, Shun'ichi Yamamoto, Kazuhiro Nakadai, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno

INTERSPEECH 2008, 9th Annual Conference of the International Speech Communication Association, Brisbane, Australia, September 22-26, 2008 992 - 995 2008年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

Scopus

researchmap

その他リンク： http://dblp.uni-trier.de/db/conf/interspeech/interspeech2008.html#conf/interspeech/TakahashiYNKOO08
MFTを用いたロボットの動作中における音声認識

西村義隆, 石塚満, 中臺一博, 中野幹生, 辻野広司

日本ロボット学会誌 = Journal of Robotics Society of Japan 25 ( 8 ) 1189 - 1198 2007年11月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本ロボット学会

Automatic speech recognition (ASR) is essential for human-humanoid communication. One of the main problems with ASR by a humanoid is that it is inevitably generates motor noises. These noises are easily captured by the humanoid's microphones because the noise sources are closer to the microphones than the target speech source. Thus, the signal-to-noise ratio (SNR) of input speech becomes quite low (sometimes less than 0 [dB] ) . However, it is possible to estimate these noises by using information on the humanoid's motions and gestures. This paper proposes a method to improve ASR for a humanoid with motor noises by utilizing its motion/gesture information. The method consists of noise suppression and missing-feature-theory-based ASR (MFT-ASR) . The proposed noise suppression technique is based on spectral subtraction, and a white noise is added to blur distortion of suppression. MFT-ASR improves ASR by masking unreliable acoustic features in the input sound. The motion/gesture information is used for obtaining the unreliable acoustic features. Furthermore, we also evaluated with the acoustic model adaptation technique called MLLR (Maximum Likelihood Linear Regression) . Un-supervised MLLR was used for the adaptation. We evaluated the proposed method through recognition of speech recorded by using Honda ASIMO in a room with reverberation. The noise data contained 34 kinds of noises: motor noises without motions, gesture noises, walking noises, and other kind of noises. The experimental results show that the proposed method outperforms the conventional multi-condition training technique.

DOI： 10.7210/jrsj.25.1189

CiNii Books

researchmap
移動型および静止型マイクロホンアレイ統合による複数移動音源追跡

中臺一博, 中島弘史, 村瀬昌満, 奥乃博, 長谷川雄二, 辻野広司

日本ロボット学会誌 = Journal of Robotics Society of Japan 25 ( 6 ) 979 - 989 2007年9月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本ロボット学会

Real-time and robust sound source tracking is an important function for a robot operating in a daily environment, because the robot should recognize where a sound event such as speech, music and other environmental sounds originates from. This paper addresses real-time sound source tracking by spatial integration of an in-room microphone array (IRMA) and a robot-embedded microphone array (REMA) . The IRMA system consists of 64 ch microphones attached to the walls. It localizes multiple sound sources based on weighted delay-and-sum beamforming on a 2D plane. The REMA system localizes multiple sound sources in azimuth using eight microphones attached to a robot's head on a rotational table. A particle filter integrates their localization results to track multiple sound sources. The experimental results show that particle filter based integration improved accuracy and robustness of sound source tracking even when the robot's head was in rotation.

DOI： 10.7210/jrsj.25.979

CiNii Books

researchmap
Robust Recognition of Simultaneous Speech by a Mobile Robot 査読

Jean-Marc Valin, Shun{\textquotesingle}ichi Yamamoto, Jean Rouat, Francois Michaud, Kazuhiro Nakadai, Hiroshi G. Okuno

IEEE Trans. Robot. 23 ( 4 ) 742 2007年8月

　詳細を見る

出版者・発行元：Institute of Electrical {\&} Electronics Engineers ({IEEE})

DOI： 10.1109/tro.2007.900612

researchmap
情報統合による実環境音環境理解 : マイクロホンアレイ統合による音源追跡

中臺一博

計測と制御 = Journal of the Society of Instrument and Control Engineers 46 ( 6 ) 427 - 433 2007年6月

　詳細を見る

記述言語：日本語掲載種別：研究論文（学術雑誌）出版者・発行元：計測自動制御学会

DOI： 10.11499/sicejl1962.46.427

CiNii Books

CiNii Research

researchmap
マルチドメイン音声対話システムにおける対話履歴を利用したドメイン選択

神田直之, 駒谷和範, 中野幹生, 中臺一博, 辻野広司, 尾形哲也, 奥乃博

情報処理学会論文誌 48 ( 5 ) 1980 - 1989 2007年5月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

複数のドメインを扱う音声対話システムにおいて対話履歴から得られる特徴量を導入してより精度良くドメイン選択を行う手法を開発した.本研究ではドメイン選択問題を応答すべきドメインが (I)1つ前の応答を行ったドメイン (II)音声認識結果に対する最尤のドメイン (III)それ以外のドメインのいずれかという判別問題ととらえる.対話履歴から得られる特徴量を用いて上記を判別する決定木をドメイン選択の正解を与えた対話データから学習しドメイン選択器を構成した.5ドメインのマルチドメイン音声対話システムを実装しこれを用いて10名の被験者から対話データを収集した.この対話データを用いた評価実験の結果音声認識尤度に基づく従来のドメイン選択手法に比べドメイン選択誤りが16.2%削減されることを確認した.We have developed a robust domain selection method using dialogue history in multi-domain spoken dialogue systems. We define domain selection as a classifying problem among (I) the domain in the previous turn, (II) the domain in which N-best speech recognition results can be accepted with the highest recognition score, (III) other domains. We constructed a classifier by decision tree learning with dialogue data. We implemented a multi-domain spoken dialogue system with 5 domains, and collected dialogue data from 10 sub jects. The experimental result showed our method reduced 16.2% of domain selection errors, compared with a conventional method using speech recognition likelihoods only.

CiNii Books

researchmap
音環境を可視化する録音再生システム

吉田, 雅敏, 海尻, 聡, 山本, 俊一, 中, 臺一博, 駒谷, 和範, 尾形, 哲也, 奥乃, 博

第69回全国大会講演論文集 2007 ( 1 ) 563 - 564 2007年3月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

CiNii Books

CiNii Research

researchmap

その他リンク： http://id.nii.ac.jp/1001/00173375/
動的リコンフィギャラブルデバイスDRPを用いたロボット聴覚のための音源分離フィルタ

黒瀧俊輔, 鈴木紀章, 中臺一博, 奥乃博, 天野英晴

電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems (Japanese edition) 90 ( 3 ) 897 - 907 2007年3月

　詳細を見る

記述言語：日本語掲載種別：研究論文（学術雑誌）出版者・発行元：一般社団法人電子情報通信学会

近年,人間と共生するロボットが多数登場してきている.これらのロボットが人間と言語を用いたインタラクションを行うためには音声認識が必要となるが,従来の音声認識手法は単一音源を対象としているため,複数人の同時発話や周囲に雑音がある環境では著しく認識精度が低下してしまうという問題がある.よって,実環境での音声認識にはその前処理として,混合音から注目する音声信号のみを抽出する音源分離処理が不可欠となる。実時間で音源分離を行うためには多大な計算コストを要する一方で,自律型のロボットは消費電力やシステムのサイズ等の面で厳しい制限をもつため,汎用プロセッサによる実装は現実的ではない.そこで,本研究ではNECエレクトロニクス社の動的再構成可能プロセッサDRP-1上に音源分離処理を実装し,ロボットへの搭載に適したシステムを目指した.実験の結果,DRP上の音源分離フィルタは実時間で精度の良い音源分離を実現し,低面積コストかつ,FPGAなど従来のデバイスと比較して低消費電力で必要な性能を実現できる事が示された.

CiNii Books

CiNii Research

researchmap
音源分離との統合によるミッシングフィーチャマスク自動生成に基づく同時発話音声認識

山本俊一, Valin Jean-Marc, 中臺一博, 中野幹生, 辻野広司, 駒谷和範, 尾形哲也, 奥乃博

日本ロボット学会誌 = Journal of Robotics Society of Japan 25 ( 1 ) 92 - 102 2007年1月

　詳細を見る

記述言語：日本語掲載種別：研究論文（学術雑誌）出版者・発行元：一般社団法人日本ロボット学会

Our goal is to realize a humanoid robot that has the capabilities of recognizing simultaneous speech. A humanoid robot under real-world environments usually hears a mixture of sounds, and thus three capabilities are essential for robot audition; sound source localization, separation, and recognition of separated sounds. In particular, an interface between sound source separation and speech recognition is important. In this paper, we designed an interface between sound source separation and speech recogniton by applying Missing Feature Theory (MFT) . In this method, spectral sub-bands distorted by sound source separation are detected from input speech as missing features. The detected missing features are masked on recognition not to affect the system badly. Therefore, this method is more flexible when noises change dynamically and drastically. It is the most important issue how distorted spectral sub-bands are detected. To solve the issue, we used speech feature apropriate for MFT-based ASR, and developed automatic missing feature mask generation. As a speech feature, we used a Mel-Scale Log Spectral (MSLS) feature instead of Mel-Frequency Cepstrum Coefficient (MFCC) which is commonly used for ASR. We presented a method of generating missing feature mask automatically by using information from sound source separation. To evaluate our method, we implemented it in a humanoid robotSIG2, and performed the experiments on recognition of three simultaneous isolated words. As a result, our method outperformed conventional ASR with MSLS feature.

DOI： 10.7210/jrsj.25.92

CiNii Books

CiNii Research

researchmap
A navigation system using ultrasonic directional speaker with rotating base 査読

Kentaro Ishii, Yukiko Yamamoto, Michita Imai, Kazuhiro Nakadai

HUMAN INTERFACE AND THE MANAGEMENT OF INFORMATION: INTERACTING IN INFORMATION ENVIRONMENTS, PT 2, PROCEEDINGS 4558 526 - + 2007年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Coarse speech recognition by audio-visual integration based on missing feature theory 査読

Tomoaki Koiwa, Kazuhiro Nakadai, Jun-ichi Imura

2007 IEEE/RSJ INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS, VOLS 1-9 1757 - 1762 2007年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/IROS.2007.4399300

Web of Science

researchmap
A biped robot that keeps steps in time with musical beats while listening to music with its own ears 査読

Kazuyoshi Yoshii, Kazuhiro Nakadai, Toyotaka Torii, Yuji Hasegawa, Hiroshi Tsujino, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno

2007 IEEE/RSJ INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS, VOLS 1-9 1749 - + 2007年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
The Design of Phoneme Grouping for Coarse Phoneme Recognition 査読

中臺一博

Lecture Notes in Computer Science, New Trends in Applied Artificial Intelligence vol.4570/2007 4570 905 - + 2007年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

CiNii Research

researchmap
情報統合による実環境音環境理解:マイクロホンアレイ統合による音源追跡

中臺一博

計測と制御 46 ( 6 ) 427 - 433 2007年

　詳細を見る

記述言語：日本語出版者・発行元：公益社団法人計測自動制御学会

DOI： 10.11499/sicejl1962.46.427

CiNii Research

researchmap
Design and implementation of a robot audition system for automatic speech recognition of simultaneous speech. 査読

Shun'ichi Yamamoto, Kazuhiro Nakadai, Mikio Nakano, Hiroshi Tsujino, Jean-Marc Valin, Kazunori Komatani, Tetsuya Ogata,Array

IEEE Workshop on Automatic Speech Recognition & Understanding, ASRU 2007, Kyoto, Japan, December 9-13, 2007 111 - 116 2007年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/ASRU.2007.4430093

Scopus

researchmap
Exploiting known sound source signals to improve ICA-based robot audition in speech separation and recognition 査読

Ryu Takeda, Kazuhiro Nakadai, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno

2007 IEEE/RSJ INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS, VOLS 1-9 1763 - + 2007年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
時変拡張ビームフォーミングによる移動音源の抽出

中島弘史, 中臺一博, 長谷川雄二, 辻野広司

人工知能学会全国大会論文集 JSAI07 3C84 - 3C84 2007年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人人工知能学会

本稿では時変拡張ビームフォーミングによる移動音源の正確な抽出方法とその適用例について述べる。本手法は，音源位置を離散化し，離散化した各位置でBF係数を切替えて行う従来法に比べ，係数切替時の不連続等がなく有効である。

DOI： 10.11517/pjsai.jsai07.0_3c84

CiNii Research

researchmap
Sound Source Separation Filter for Robot Audition used by Dynamic Reconfigurable Device, DRP (in Japanese)

中臺一博, 奥乃博

IEICE Transaction on Information and Systems Vol.J90-D, No.3 897 - 907 2007年

　詳細を見る

掲載種別：研究論文（学術雑誌）

CiNii Research

researchmap
遺伝的アルゴリズムを用いたパラメータ最適化による話者位置に基づく同時発話認識の向上

山本俊一, 中臺一博, 中野幹生, 辻野広司, VALIN Jean-Marc, 武田龍, 駒谷和範, 尾形哲也, 奥乃博

ヒューマンインタフェース学会論文誌 8 ( 2 ) 203 - 212 2006年5月

　詳細を見る

記述言語：日本語掲載種別：研究論文（学術雑誌）出版者・発行元：ヒューマンインタフェース学会

CiNii Books

CiNii Research

researchmap
指向性スピーカを用いたロボット音声インタフェースの提案

中臺一博, 辻野広司

ヒューマンインタフェース学会論文誌 8 ( 2 ) 213 - 221 2006年5月

　詳細を見る

記述言語：日本語出版者・発行元：ヒュ-マンインタフェ-ス学会

CiNii Books

CiNii Research

researchmap
パーティクルフィルタによる音源追跡の性能評価

村瀬昌満, 中臺一博, 奥乃博

第68回全国大会講演論文集 2006 ( 1 ) 329 - 330 2006年3月

　詳細を見る

記述言語：日本語

CiNii Books

CiNii Research

researchmap
複数ドメイン音声対話システムにおける対話履歴を利用したドメイン選択の高精度化

神田, 直之, 駒谷, 和範, 中野, 幹生, 中, 臺一博, 辻野, 広司, 尾形, 哲也, 奥乃, 博

第68回全国大会講演論文集 2006 ( 1 ) 315 - 316 2006年3月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

CiNii Books

CiNii Research

researchmap

その他リンク： http://id.ndl.go.jp/bib/7841154
Real-Time Tracking of Multiple Sound Sources by Integration of In-Room and Robot-Embedded Microphone Arrays 査読

Kazuhiro Nakadai, Hirofumi Nakajima, Masamitsu Murase, Hiroshi G. Okuno, Yuji Hasegawa, Hiroshi Tsujino

2006 IEEE/RSJ INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS, VOLS 1-12 852 - + 2006年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/IROS.2006.281737

DOI： 10.1109/iros.2006.281737

Web of Science

researchmap
Speech Recognition for a Humanoid with Motor Noise Utilizing Missing Feature Theory. 査読

Yoshitaka Nishimura, Mitsuru Ishizuka, Kazuhiro Nakadai, Mikio Nakano, Hiroshi Tsujino

2006 6th IEEE-RAS International Conference on Humanoid Robots, Genova, Italy, December 4-6, 2006 26 - 33 2006年

　詳細を見る

出版者・発行元：IEEE

DOI： 10.1109/ICHR.2006.321359

researchmap
A Robot That Can Engage in Both Task-Oriented and Non-Task-Oriented Dialogues. 査読

Mikio Nakano, Atsushi Hoshino, Johane Takeuchi, Yuji Hasegawa, Toyotaka Torii, Kazuhiro Nakadai, Kazuhiko Kato, Hiroshi Tsujino

2006 6th IEEE-RAS International Conference on Humanoid Robots, Genova, Italy, December 4-6, 2006 404 - 411 2006年

　詳細を見る

出版者・発行元：IEEE

DOI： 10.1109/ICHR.2006.321304

researchmap
Genetic Algorithm-Based Improvement of Robot Hearing Capabilities in Separating and Recognizing Simultaneous Speech Signals. 査読

Shun'ichi Yamamoto, Kazuhiro Nakadai, Mikio Nakano, Hiroshi Tsujino, Jean-Marc Valin, Ryu Takeda, Kazunori Komatani, Tetsuya Ogata,Array

Advances in Applied Artificial Intelligence, 19th International Conference on Industrial, Engineering and Other Applications of Applied Intelligent Systems, IEA/AIE 2006, Annecy, France, June 27-30, 2006, Proceedings 207 - 217 2006年

　詳細を見る

掲載種別：研究論文（学術雑誌）出版者・発行元：Springer

DOI： 10.1007/11779568_24

CiNii Research

researchmap
Leak energy based missing feature mask generation for ICA and GSS and its evaluation with simultaneous speech recognition. 査読

Shun'ichi Yamamoto, Ryu Takeda, Kazuhiro Nakadai, Mikio Nakano, Hiroshi Tsujino, Jean-Marc Valin, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno

ISCA Tutorial and Research Workshop on Statistical and Perceptual Audition, SAPA 2006, Pittsburgh, PA, USA, September 16, 2006 42 - 47 2006年

　詳細を見る

出版者・発行元：ISCA

researchmap

その他リンク： http://dblp.uni-trier.de/db/conf/interspeech/sapa2006.html#conf/interspeech/YamamotoTNNTVKOO06
Speech recognition for a robot under its motor noises by selective application of missing feature theory and MLLR. 査読

Yoshitaka Nishimura, Mikio Nakano, Kazuhiro Nakadai, Hiroshi Tsujino, Mitsuru Ishizuka

ISCA Tutorial and Research Workshop on Statistical and Perceptual Audition, SAPA 2006, Pittsburgh, PA, USA, September 16, 2006 53 - 58 2006年

　詳細を見る

出版者・発行元：ISCA

researchmap

その他リンク： http://dblp.uni-trier.de/db/conf/interspeech/sapa2006.html#conf/interspeech/NishimuraNNTI06
Real-Time Robot Audition System That Recognizes Simultaneous Speech in The Real World. 査読

Shun'ichi Yamamoto, Kazuhiro Nakadai, Mikio Nakano, Hiroshi Tsujino, Jean-Marc Valin, Kazunori Komatani, Array,Array

2006 IEEE/RSJ International Conference on Intelligent Robots and Systems, IROS 2006, October 9-15, 2006, Beijing, China 5333 - 5338 2006年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/IROS.2006.282037

Scopus

researchmap
Recognition of Simultaneous Speech by Estimating Reliability of Separated Signals for Robot Audition. 査読

Shun'ichi Yamamoto, Ryu Takeda, Kazuhiro Nakadai, Mikio Nakano, Hiroshi Tsujino, Jean-Marc Valin, Kazunori Komatani, Tetsuya Ogata,Array

PRICAI 2006: Trends in Artificial Intelligence, 9th Pacific Rim International Conference on Artificial Intelligence, Guilin, China, August 7-11, 2006, Proceedings 484 - 494 2006年

　詳細を見る

掲載種別：研究論文（学術雑誌）出版者・発行元：Springer

DOI： 10.1007/11801603_52

CiNii Research

researchmap
Robust tracking of multiple sound sources by spatial integration of room and robot microphone arrays 査読

Nakadai K, Nakajima H, Murase M, Kaijiri S, Yamada K, Nakamura T, Hasegawa Y, Okuno H.G, Tsujino H

ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings 4 929 - + 2006年

　詳細を見る

掲載種別：研究論文（学術雑誌）

Web of Science

Scopus

CiNii Research

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
Robust tracking of multiple sound sources by spatial integration of room and robot microphone arrays 査読

Nakadai K, Nakajima H, Murase M, Kaijiri S, Yamada K, Nakamura T, Hasegawa Y, Okuno H.G, Tsujino H

2006 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, VOLS 1-13 4 4599 - 4602 2006年

　詳細を見る

Web of Science

Scopus

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
Multi-Domain Spoken Dialogue System with Extensibility and Robustness against Speech Recognition Errors. 査読

Kazunori Komatani, Naoyuki Kanda, Mikio Nakano, Kazuhiro Nakadai, Hiroshi Tsujino, Tetsuya Ogata, Hiroshi G. Okuno

Proceedings of the SIGDIAL 2006 Workshop, The 7th Annual Meeting of the Special Interest Group on Discourse and Dialogue, 15-16 July 2006, Sydney, Australia 9 - 17 2006年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：The Association for Computer Linguistics

DOI： 10.3115/1654595.1654598

Scopus

researchmap

その他リンク： http://dblp.uni-trier.de/db/conf/sigdial/sigdial2006.html#conf/sigdial/KomataniKNNTOO06
ミッシングフィーチャー理論を利用した音源分離と音声認識のインターフェースと複数ロボットへの適用

山本俊一, 中臺一博, 辻野広司, 奥乃博

日本ロボット学会誌 = Journal of Robotics Society of Japan 23 ( 6 ) 743 - 751 2005年9月

　詳細を見る

記述言語：日本語掲載種別：研究論文（学術雑誌）出版者・発行元：一般社団法人日本ロボット学会

Robot audition is a critical technology in creating an intelligent robot operating in daily environments. To realize such a robot audition system, we have designed a missing feature theory based interface between sound source separation and automatic speech recognition (ASR) . In this interface, features distorted by speech separation are detected from input speech as missing features. The detected missing features are masked on recognition to avoid severe deterioration of recognition performance. By using the interface, we developed the robot audition system which recognizes multiple simultaneous speech. We also assess its general applicability by implementing it on three different humanoids, i.e., Honda ASIMO, SIG2, and Replie of Kyoto University. By using three simultaneous speeches as benchmarks, its general applicability was confirmed. When triphone is used and a size of vocabulary is 200 words, the average word correct of three simultaneous speech are 79.7%, 78.7%, and 82.7% for ASIMO, SIG2, and Replie, respectively.

DOI： 10.7210/jrsj.23.743

CiNii Books

CiNii Research

researchmap
Towards new human-humanoid communication: Listening during speaking by using ultrasonic directional speaker 査読

K Nakadai, H Tsujino

2005 IEEE INTERNATIONAL CONFERENCE ON ROBOTICS AND AUTOMATION (ICRA), VOLS 1-4 1483 - 1488 2005年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
A two-layer model for behavior and dialogue planning in conversational service robots. 査読

Mikio Nakano, Yuji Hasegawa, Kazuhiro Nakadai, Takahiro Nakamura, Johane Takeuchi, Toyotaka Torii, Hiroshi Tsujino, Naoyuki Kanda,Array

2005 IEEE/RSJ International Conference on Intelligent Robots and Systems, Edmonton, Alberta, Canada, August 2-6, 2005 3329 - 3335 2005年

　詳細を見る

出版者・発行元：IEEE

DOI： 10.1109/IROS.2005.1545198

researchmap
Implementation of active direction-pass filter on dynamically reconfigurable processor 査読

Kurotaki S, Suzuki N, Nakadai K, Okuno H.G, Amano H

2005 IEEE/RSJ International Conference on Intelligent Robots and Systems, IROS 515 - 520 2005年

　詳細を見る

出版者・発行元：IEEE

DOI： 10.1109/IROS.2005.1545033

Scopus

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
Enhanced robot speech recognition based on microphone array source separation and missing feature theory 査読

Yamamoto S, Valin J.-M, Nakadai K, Rouat J, Michaud F, Ogata T, Okuno H.G

Proceedings - IEEE International Conference on Robotics and Automation 2005 1477 - 1482 2005年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/ROBOT.2005.1570323

Scopus

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
Making a robot recognize three simultaneous sentences in real-time 査読

Shun'ichi Yamamoto, Kazuhiro Nakadai, Jean{-}Marc Valin, Jean Rouat, Fran{\c{c } }ois Michaud, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno

2005 IEEE/RSJ International Conference on Intelligent Robots and Systems, Edmonton, Alberta, Canada, August 2-6, 2005 4040 - 4045 2005年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/IROS.2005.1545094

Scopus

researchmap
Multiple moving speaker tracking by microphone array on mobile robot 査読

Murase M, Yamamoto S, Valin J.-M, Nakadai K, Yamada K, Komatani K, Ogata T, Okuno H.G

9th European Conference on Speech Communication and Technology 249 - 252 2005年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

Scopus

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
Sound source tracking with directivity pattern estimation using a 64 ch microphone array 査読

Kazuhiro Nakadai, Hirofumi Nakajima, Kentaro Yamada, Yuji Hasegawa, Takahiro Nakamura, Hiroshi Tsujino

2005 IEEE/RSJ International Conference on Intelligent Robots and Systems, IROS 196 - 202 2005年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/IROS.2005.1544981

Scopus

researchmap
ロボット聴覚の課題と現状(招待講演)

奥乃博, 中臺一博

音響学会春季研究発表会,3-7-7 633 - 636 2005年

　詳細を見る

掲載種別：研究論文（学術雑誌）

CiNii Research

researchmap
Sound and Visual Tracking for Humanoid Robot 査読

Hiroshi G. Okuno, Kazuhiro Nakadai, Tino Lourens, Hiroaki Kitano

Applied Intelligence 20 ( 3 ) 253 - 266 2004年5月

　詳細を見る

掲載種別：研究論文（学術雑誌）出版者・発行元：Springer Science $\mathplus$ Business Media

DOI： 10.1023/b:apin.0000021417.62541.e0

CiNii Research

researchmap
ミッシングフィーチャー理論による三話者同時発話認識の向上

山本, 俊一, 中, 臺一博, 辻野, 広司, 駒谷, 和範, 尾形, 哲也, 奥乃, 博

第66回全国大会講演論文集 2004 ( 1 ) 285 - 286 2004年3月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

CiNii Books

CiNii Research

researchmap

その他リンク： http://id.nii.ac.jp/1001/00169751/
マルチモーダル情報統合によるヒューマノイドロボットの挙動選択

戸田, 充彦, 中, 臺一博, 駒谷, 和範, 尾形, 哲也, 奥乃, 博

第66回全国大会講演論文集 2004 ( 1 ) 191 - 192 2004年3月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

CiNii Books

CiNii Research

researchmap

その他リンク： http://id.nii.ac.jp/1001/00169704/
Multimodal expression for humanoid robots by integration of human speech mimicking and facial color

Tokitomo Ariyoshi, Kazuhiro Nakadai, Hiroshi Tsujino

8th International Conference on Spoken Language Processing, ICSLP 2004 2305 - 2308 2004年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：International Speech Communication Association

Scopus

researchmap
Assessment of general applicability of robot audition system by recognizing three simultaneous speeches 査読

Yamamoto S, Nakadai K, Tsujino H, Okuno H.G

2004 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS) 3 2111 - 2116 2004年

　詳細を見る

掲載種別：研究論文（学術雑誌）出版者・発行元：IEEE

Scopus

CiNii Research

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
Computational Auditory Scene Analysis and Its Application to Robot Audition 査読

Okuno H.G, Ogata T, Komatani K, Nakadai K

Proceedings - International Conference on Informatics Research for Development of Knowledge Society Infrastructure, ICKS 2004 73 - 80 2004年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/ICKS.2004.1313411

Scopus

CiNii Research

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
Improvement of Recognition of Simultaneous Speech Signals Using AV Integration and Scattering Theory for Humanoid Robots 査読

NAKADAI K, MATSUURA D, OKUNO Hg, TSUJINO H

Speech Communication 44 ( 1-4 ) 97 - 112 2004年

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.1016/j.specom.2004.10.010

Scopus

CiNii Research

J-GLOBAL

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
Improvement of robot audition by interfacing sound source separation and automatic speech recognition with missing feature theory 査読

Yamamoto S, Nakadai K, Tsujino H, Yokoyama T, Okuno H.G

Proceedings - IEEE International Conference on Robotics and Automation 2004 ( 2 ) 1517 - 1523 2004年

　詳細を見る

掲載種別：研究論文（学術雑誌）出版者・発行元：IEEE

DOI： 10.1109/ROBOT.2004.1308039

Scopus

CiNii Research

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
Effects of increasing modalities in recognizing three simultaneous speeches 査読

KITANO H, NAKADAI K, OKUNO Hg

Speech Communication 43 ( 4 ) 347 - 359 2004年

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.1016/j.specom.2004.03.008

Scopus

CiNii Research

J-GLOBAL

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
Effect of facial colors on humanoids in emotion recognition using speech

Tokitomo Ariyoshi, Kazuhiro Nakadai, Hiroshi Tsujino

Proceedings - IEEE International Workshop on Robot and Human Interactive Communication 59 - 64 2004年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Scopus

researchmap
ヒューマノイドを対象にした視聴覚統合による実時間人物追跡 : アクティブオーディションと顔認識の統合

中臺一博, 日台健一, 溝口博, 奥乃博, 北野宏明

日本ロボット学会誌 21 ( 5 ) 517 - 525 2003年7月

　詳細を見る

記述言語：日本語掲載種別：研究論文（学術雑誌）出版者・発行元：一般社団法人日本ロボット学会

This paper describes a real-time human tracking system by audio-visual integrtation for the humanoid SIG. An essential idea for real-time and robust tracking is hierarchical integration of multi-modal information. The system creates three kinds of streams - auditory, visual and associated streams. An auditory stream with sound source direction is formed as temporal series of events from audition module which localizes multiple sound sources and cancels motor noise from a pair of microphones. A visual stream with a face ID and its 3D-position is formed as temporal series of events from vision module by combining face detection, face identification and face localization by stereo vision. Auditory and visual streams are associated into an associated stream, a higher level representation according to their proximity. Because the associated stream disambiguates parcially missing information in auditory or visual streams, &ldquo;focus-of-attention&rdquo; control of SIG works well enough to robust human tracking. These processes are executed in real-time with the delay of 200 msec using off-the-shelf PCs distributed via TCP/IP. As a result, robust human tracking is attained even when the person is visually occluded and simultaneous speeches occur.

DOI： 10.7210/jrsj.21.517

CiNii Books

CiNii Research

researchmap
人間に似た外見を持つロボットReplieにおける挙動選択システム

戸田, 充彦, 山本, 俊一, 中, 臺一博, 奥乃, 博

第65回全国大会講演論文集 2003 ( 1 ) 211 - 212 2003年3月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

CiNii Books

CiNii Research

researchmap

その他リンク： http://id.nii.ac.jp/1001/00169249/
Three simultaneous speech recognition by integration of active audition and face recognition for humanoid 査読

Kazuhiro Nakadai, Daisuke Matsuura, Hiroshi G. Okuno, Hiroshi Tsujino

8th European Conference on Speech Communication and Technology, EUROSPEECH 2003 - INTERSPEECH 2003, Geneva, Switzerland, September 1-4, 2003 2003年

　詳細を見る

出版者・発行元：ISCA

DOI： 10.1016/j.specom.2004.10.010

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
ヒューマノイドにおける聴覚機能の課題とアクティブオーディションによる音源定位

中臺一博, 奥乃博, 北野宏明

人工知能学会論文誌 = Transactions of the Japanese Society for Artificial Intelligence : AI 18 ( 2 ) 104 - 113 2003年

　詳細を見る

記述言語：日本語掲載種別：研究論文（学術雑誌）出版者・発行元：一般社団法人人工知能学会

DOI： 10.1527/tjsai.18.104

Scopus

CiNii Books

CiNii Research

researchmap
ヒューマノイドにおける聴覚機能の課題とアクティブオーディションによる音源定位

中臺一博, 奥乃博, 北野宏明

人工知能学会論文誌(Transactions of the Japanese Society for Artificial Intelligence) 18 ( 2 ) 104 - 113 2003年

　詳細を見る

記述言語：日本語掲載種別：研究論文（学術雑誌）出版者・発行元：The Japanese Society for Artificial Intelligence

DOI： 10.1527/tjsai.18.104

Scopus

CiNii Books

CiNii Research

researchmap
Applying Scattering Theory to Robot Audition System: Robust Sound Source Localization and Extraction 査読

Nakadai K, Matsuura D, Okuno H.G, Kitano H

IEEE International Conference on Intelligent Robots and Systems 2 1147 - 1152 2003年

　詳細を見る

出版者・発行元：IEEE

DOI： 10.1109/IROS.2003.1248800

Scopus

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
Improvement of three simultaneous speech recognition by using AV integration and scattering theory for humanoid 査読

Kazuhiro Nakadai, Daisuke Matsuura, Hiroshi G. Okuno, Hiroshi Tsujino

AVSP 2003 - International Conference on Audio-Visual Speech Processing, St. Jorioz, France, September 4-7, 2003 44 ( 1-4 ) 157 - 162 2003年

　詳細を見る

出版者・発行元：ISCA

DOI： 10.1016/j.specom.2004.10.010

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
Active audition for humanoid robots that can listen to three simultaneous talkers. 査読

Hiroshi G. Okuno, Kazuhiro Nakadai

Journal of the Acoustical Society of America Vol.113, No.4, Pt.2 of 2, pp.2230 ( 4 ) 2230 2003年

　詳細を見る

掲載種別：研究論文（学術雑誌）出版者・発行元：Acoustical Society of America ({ASA})

Apr. 2003

DOI： 10.1121/1.4780329

CiNii Research

researchmap
Real-time sound source localization and separation based on active audio-visual integration 査読

Okuno H.G, Nakadai K

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 2686 118 - 125 2003年

　詳細を見る

掲載種別：研究論文（学術雑誌）出版者・発行元：Springer

DOI： 10.1007/3-540-44868-3_16

Scopus

CiNii Research

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
Realizing Personality in Audio-Visually Triggered Non-verbal Behaviors 査読

Okuno H.G, Nakadai K, Kitano H

Proceedings of IEEE-RAS International Conference on Robots and Automation (ICRA-2003) 392-397 392 - 397 2003年

　詳細を見る

出版者・発行元：IEEE

Scopus

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
Human-Robot Non-Verbal Interaction Empowered by Real-Time Auditory and Visual Multiple-Talker Tracking 査読

OKUNO H G, NAKADAI K, HIDAI K, MIZOGUCHI H, KITANO H

Advanced Robotics 17 ( 2 ) 115 - 130 2003年

　詳細を見る

記述言語：日本語出版者・発行元：VSP

DOI： 10.1163/156855303321165088

CiNii Books

J-GLOBAL

researchmap
Design and implementation of personality of humanoids in human humanoid non-verbal interaction 査読

Okuno H.G, Nakadai K, Kitano H

Lecture Notes in Artificial Intelligence (Subseries of Lecture Notes in Computer Science) 2718 662 - 673 2003年

　詳細を見る

掲載種別：研究論文（学術雑誌）出版者・発行元：Springer

DOI： 10.1007/3-540-45034-3_67

Scopus

CiNii Research

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
Robot recognizes three simultaneous speech by active audition 査読

Nakadai K, Okuno H.G, Kitano H

Proceedings - IEEE International Conference on Robotics and Automation 1 398 - 405 2003年

　詳細を見る

出版者・発行元：IEEE

Scopus

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
ヒューマノイドを対象にした視聴覚統合による実時間人物追跡 : アクティブオーディションと顔認識の統合

中臺一博, 奥乃博

ロボット学会誌 21・5 1333 - 1342 2003年

　詳細を見る

掲載種別：研究論文（学術雑誌）

CiNii Research

researchmap
Real-time sound source localization and separation for robot audition 査読

Kazuhiro Nakadai, Hiroshi G. Okuno, Hiroaki Kitano

7th International Conference on Spoken Language Processing, ICSLP2002 - INTERSPEECH 2002, Denver, Colorado, USA, September 16-20, 2002 193 - 196 2002年

　詳細を見る

出版者・発行元：ISCA

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
Social interaction of humanoid robot based on audio-visual tracking 査読

Okuno H.G, Nakadai K, Kitano H

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 2358 725 - 735 2002年

　詳細を見る

出版者・発行元：Springer

DOI： 10.1007/3-540-48035-8_70

Scopus

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
Realizing audio-visually triggered Eliza-like non-verbal behaviors 査読

Okuno H.G, Nakadai K, Kitano H

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 2417 552 - 562 2002年

　詳細を見る

出版者・発行元：Springer

DOI： 10.1007/3-540-45683-x_59

Scopus

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
Sound and Visual Tracking by Active Audition 査読

Hiroshi G. Okuno, Kazuhiro Nakadai, Tino Lourens, Hiroaki Kitano

Enabling Society with Information Technology 174 2002年

　詳細を見る

出版者・発行元：Springer Science $\mathplus$ Business Media

DOI： 10.1007/978-4-431-66979-1_17

researchmap
Real-time multiple speaker tracking by multi-modal integration for mobile robots 査読

Kazuhiro Nakadai, Ken{-}ichi Hidai, Hiroshi G. Okuno, Hiroaki Kitano

EUROSPEECH 2001 Scandinavia, 7th European Conference on Speech Communication and Technology, 2nd INTERSPEECH Event, Aalborg, Denmark, September 3-7, 2001 1193 - 1196 2001年

　詳細を見る

出版者・発行元：ISCA

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
A computational model of monkey grating cells for oriented repetitive alternating patterns 査読

Tino Lourens, Kazuhiro Nakadai, Hiroshi G. Okuno, Hiroaki Kitano

ESANN 2001, 9th European Symposium on Artificial Neural Networks, Bruges, Belgium, April 25-27, 2001, Proceedings 315 - 322 2001年

　詳細を見る

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
Graph extraction from color images 査読

Tino Lourens, Kazuhiro Nakadai, Hiroshi G. Okuno, Hiroaki Kitano

ESANN 2001, 9th European Symposium on Artificial Neural Networks, Bruges, Belgium, April 25-27, 2001, Proceedings 329 - 334 2001年

　詳細を見る

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
Real-time auditory and visual multiple-object tracking for humanoids 査読

Nakadai K, Hidai K.-I, Mizoguchi H, Okuno H.G, Kitano H

IJCAI International Joint Conference on Artificial Intelligence 1425 - 1432 2001年

　詳細を見る

出版者・発行元：Morgan Kaufmann

Scopus

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
Sound and visual tracking for humanoid robot 査読

Okuno H.G, Nakadai K, Lourens T, Kitano H

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 2070 640 - 650 2001年

　詳細を見る

出版者・発行元：Springer

DOI： 10.1007/3-540-45517-5_71

Scopus

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
Separating three simultaneous speeches with two microphones by integrating auditory and visual processing 査読

Hiroshi G. Okuno, Kazuhiro Nakadai, Tino Lourens, Hiroaki Kitano

EUROSPEECH 2001 Scandinavia, 7th European Conference on Speech Communication and Technology, 2nd INTERSPEECH Event, Aalborg, Denmark, September 3-7, 2001 2643 - 2646 2001年

　詳細を見る

出版者・発行元：ISCA

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
Designing a humanoid head for RoboCup challenge 査読

Kitano Hiroaki, Okuno Hiroshi G, Nakadai Kazuhiro, Fermin Iris, Sabisch Theo, Nakagawa Yukiko, Matsui Tatsuya

Proceedings of the International Conference on Autonomous Agents 17 - 18 2000年

　詳細を見る

出版者・発行元：ACM

Scopus

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
And the Fans Are Going Wild! SIG plus MIKE. 査読

Ian Frank, Kumiko Tanaka-Ishii, Hiroshi G. Okuno, Junichi Akita, Yukiko Nakagawa, Kazuaki Maeda, Kazuhiro Nakadai, Hiroaki Kitano

RoboCup 2000: Robot Soccer World Cup IV 139 - 148 2000年

　詳細を見る

出版者・発行元：Springer

DOI： 10.1007/3-540-45324-5_12

researchmap
Humanoid active audition system improved by the cover acoustics 査読

Nakadai K, Okuno H.G, Kitano H

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 1886 LNAI 544 - 554 2000年

　詳細を見る

Scopus

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
Design and architecture of SIG the humanoid: An experimental platform for integrated perception in RoboCup humanoid challenge 査読

Kitano H, Okuno H.G, Nakadai K, Sabisch T, Matsui T

IEEE International Conference on Intelligent Robots and Systems 1 181 - 190 2000年

　詳細を見る

出版者・発行元：IEEE

Scopus

researchmap

その他リンク： http://orcid.org/0000-0002-8704-4318
音楽情景分析の処理モデルOPTIMAにおける和音の認識

柏野邦夫, 中臺一博, 木下智義, 田中英彦

電子情報通信学会論文誌. D-2, 情報・システム 2-情報処理 79 ( 11 ) 1762 - 1770 1996年11月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

音楽演奏の音響信号を対象として演奏情報を認識する試みとしては,従来自動採譜の研究が行われているが,複数種類の楽器音を含む音楽演奏を対象とする場合には,認識処理の有効性は極めて限られていた.そこで本論文では,複数種類の楽器音を含む音楽演奏の認識を音楽情景分析の問題としてとらえ,その解決を図る.ここで音楽情景分析とは,音楽演奏の音響信号から,単音や和音などの音楽演奏情報を記号表現として抽出することを指す.本論文ではまず,音楽情景分析を実現する上では情報統合の技術が不可欠であるとの認識から,ベイジアンネットワークによる情報統合の機構を備えた音楽情景分析の処理モデルOPTIMAを提案する.次に,特に単音の認識に的を絞って,提案する情報統合機構の有効性を示す.

CiNii Books

CiNii Research

researchmap
音楽情景分析の処理モデルOPTIMAにおける単音の認識

柏野邦夫, 中台一博, 木下智義

電子情報通信学会論文誌. D-2, 情報・システム. 2, パターン処理 = The IEICE transactions on information and systems. Pt. 2 / 電子情報通信学会編 79 ( 11 ) 1751 - 1761 1996年11月

　詳細を見る

記述言語：日本語出版者・発行元：東京 : 電子情報通信学会情報・システムソサイエティ

CiNii Books

CiNii Research

researchmap

その他リンク： https://ndlsearch.ndl.go.jp/books/R000000004-I4087193
音楽情景分析の処理モデルOPTIMAにおける和音の認識

柏野, 木下智義, 中臺一博, 田中英彦

信学論D-II 79 ( 11 ) 1762 - 1770 1996年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

我々は,複数種類の楽器音を含む音楽演奏を対象とした音楽認識を,音楽情景分析の問題としてとらえ研究を行っている.ここで音楽情景分析とは,音楽演奏の音響信号から,単音や和音などの音楽演奏情報を記号表現として抽出することを指す.我々は先に,ベイジアンネットワークによる情報統合の機構を備えた音楽情景分析の処理モデルOPTIMAを提案した.本論文では,OPTIMAにおける処理のうち,特に和音の認識に的を絞って,情報統合機構の有効性を調べた.その結果,サンプル曲を用いた評価実験において,ボトムアップ処理のみによる和音認識を行った場合に比較して,和音を構成する単音に関する統計情報を統合した場合には15.6%,また和音の時間的な遷移に関する統計情報を統合した場合には18.7%の和音認識率の向上が見られたことから,提案する処理モデルにおいてこれらの情報を統合することの有効性が示された.

researchmap
Application of Bayesian Probability Network to Music Scene Analysis 査読

Kunio Kashino, Kazuhiro Nakadai, Tomoyoshi Kinoshita, Hidehiko Tanaka

Working Note of the IJCAI-95 Computational Auditory Scene Analysis Workshop, 1995 1995年

　詳細を見る

出版者・発行元：AAAI

We propose a process model for hierarchical perceptual sound organization, which recognizes perceptual sounds included in incoming sound signals. We consider perceptual sound organization as a scene analysis problem in the auditory domain. Our current application is a music scene analysis system, which recognizes rhythm, chords, and source-separated musical notes included in incoming music signals. Our process model consists of multiple processing modules and a probability network for information integration. The structure of our model is conceptually based on the blackboard architecture....

researchmap
Organization of Hierarchical Perceptual Sounds: Music Scene Analysis with Autonomous Processing Modules and a Quantitative Information Integration Mechanism 査読

Kunio Kashino, Kazuhiro Nakadai, Tomoyoshi Kinoshita, Hidehiko Tanaka

Proc. IJCAI-95 1995年

　詳細を見る

We propose a process model for hierarchical perceptual sound organization, which recognizes perceptual sounds included in incoming sound signals. We consider perceptual sound organization as a scene analysis problem in the auditory domain. Our model consists of multiple processing modules and a hypothesis network for quantitative integration of multiple sources of information. When input information for each processing module is available, the module rises to process it and asynchronously writes output information to the hypothesis network. On the hypothesis network, individual information...

researchmap

▼全件表示

書籍等出版物

AIの活用と感情に寄り添う音声認識・合成の新展開査読

伊藤, 彰則, 森川, 大輔, 上江洲, 安史, 鳥谷, 輝樹, 高野, 佐代子, 河原, 達也, 鵜木, 祐史, 齊藤, 剛史, 吉村, 奈津江, 平井, 重行, 中島, 佐和子, 大河内, 直之, 中臺, 一博, 糸山, 克寿, 福森, 隆寛, 周藤, 唯, 松田, 裕之, 渡辺, 光太朗, 白土, 浩司, 三井, 祥幹, 鳥居, 崇, 中川, 達也, 高橋, 敏, 加藤, 集平

エヌ・ティー・エス 2025年4月（ ISBN:9784860439361 ）

　詳細を見る

総ページ数：1, 7, 254, 6p, 図版5p 記述言語：日本語

CiNii Books

researchmap
ロボット聴覚の基礎 : 実環境での音源定位・分離技術査読

中臺, 一博, 糸山, 克寿

オーム社 2025年2月（ ISBN:9784274232527 ）

　詳細を見る

総ページ数：vi, 214p 記述言語：日本語

CiNii Books

researchmap
感覚デバイス開発―機器が担うヒト感覚の生成・拡張・代替技術査読

廣瀬通孝, 小柳光正, 石鍋隆宏, 川上徹, 小澤史朗, 八木康史, 長原一, 鏡慎吾, 徐剛, 奥乃博, 中臺一博, ホンダ・リサーチ, インスティチュート・ジャパン, ほか執筆者

エヌティーエス 2014年11月（ ISBN:4864690642 ）

　詳細を見る

総ページ数：424 記述言語：日本語

ASIN

researchmap

MISC

野鳥の歌分析用マイクロホンアレイの開発とその応用

中臺一博

人工知能学会第二種研究会資料 2024 ( Challenge-064 ) 01 2024年3月

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）出版者・発行元：一般社団法人人工知能学会

DOI： 10.11517/jsaisigtwo.2024.challenge-064_01

CiNii Research

J-GLOBAL

researchmap
LCMVベースのScan-and-Sum Beamformerによる面領域内音源の抽出

安江蒼人, YEN Benjamin, 糸山克寿, 中臺一博

日本ロボット学会学術講演会予稿集(CD-ROM) 42nd 2024年

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

J-GLOBAL

researchmap
ガウス過程回帰を用いた音響伝達関数の環境変化適応

藤田侑樹, 糸山克寿, 西田健次, 中臺一博

日本ロボット学会学術講演会予稿集(CD-ROM) 42nd ( Challenge-066 ) 06 2024年

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）出版者・発行元：一般社団法人人工知能学会

DOI： 10.11517/jsaisigtwo.2024.challenge-066_06

CiNii Research

J-GLOBAL

researchmap
Biasing Networkを用いた音声認識の雑音耐性向上

大崎崇博, 周藤唯, 糸山克寿, 中臺一博

日本ロボット学会学術講演会予稿集(CD-ROM) 42nd 2024年

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

J-GLOBAL

researchmap
距離学習を用いた話者識別に基づく話者ダイアライゼーションの検討

阿坂脩平, 西田健次, 糸山克寿, 中臺一博

日本ロボット学会学術講演会予稿集(CD-ROM) 42nd 2024年

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

J-GLOBAL

researchmap
Video Vision Transformerに基づく音源定位の提案

横田遥大, BOZKURTLAR Mert, BOZKURTLAR Mert, YEN Benjamin, 糸山克寿, 西田健次, 中臺一博

日本ロボット学会学術講演会予稿集(CD-ROM) 42nd 2024年

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

J-GLOBAL

researchmap
屋外環境下でのドローンのローターノイズによる地表材質推定手法の検討

矢野翼, YEN Benjamin, 糸山克寿, 中臺一博

日本ロボット学会学術講演会予稿集(CD-ROM) 42nd 2024年

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

J-GLOBAL

researchmap
動画中の稀少イベントとしての小領域移動物体の検出手法

西田健次, 糸山克寿, 糸山克寿, 中臺一博

人工知能学会第二種研究会資料(Web) 2024 ( Challenge-064 ) 05 2024年

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）出版者・発行元：一般社団法人人工知能学会

DOI： 10.11517/jsaisigtwo.2024.challenge-064_05

CiNii Research

J-GLOBAL

researchmap
複数のドローンを用いた音源探査のためのROSネットワークの構築

山本拓実, 干場功太郎, YEN Benjamin, 中臺一博

日本ロボット学会学術講演会予稿集(CD-ROM) 42nd 2024年

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

J-GLOBAL

researchmap
自他ドローン雑音を考慮した複数ドローンによる音源追跡性能の向上

三好智大, 山田泰基, 山田泰基, YEN Benjamin, 中臺一博

計測自動制御学会システムインテグレーション部門講演会(CD-ROM) 25th 2024年

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

J-GLOBAL

researchmap
ドローン搭載マイクロホンを用いた環境音識別

野島稔生, 大崎崇博, 矢野翼, YEN Benjamin, 中臺一博

計測自動制御学会システムインテグレーション部門講演会(CD-ROM) 25th 2024年

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

J-GLOBAL

researchmap
話者情報を利用した距離ベース時間周波数マスク推定による音声強調の向上

田口鐵人, 石井遼平, 大崎崇博, 阿坂脩平, YEN Benjamin, 糸山克寿, 中臺一博

計測自動制御学会システムインテグレーション部門講演会(CD-ROM) 25th 2024年

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

J-GLOBAL

researchmap
HARK3.6およびそのアクティブドローン聴覚への応用

中臺一博, 公文誠, 佐々木洋子, 干場功太郎, YEN Benjamin, 糸山克寿, 瀧ヶ平将行, 寺門直哉, LIN Zirui, GULZAR Haris, BUSTO Monikka Rosalianna, 江田毅晴, 天野英晴

計測自動制御学会システムインテグレーション部門講演会(CD-ROM) 25th 2024年

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

J-GLOBAL

researchmap
ロボット聴覚のための音源定位と深層ブラインド音源分離の統合

合澤隆拓, 合澤隆拓, 坂東宜昭, 糸山克寿, 糸山克寿, 西田健次, 中臺一博, 大西正輝

日本ロボット学会学術講演会予稿集(CD-ROM) 41st 2023年

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

J-GLOBAL

researchmap
面音源抽出のための複数拘束MVDRビームフォーマーの逐次計算による高速化

安江蒼人, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

日本ロボット学会学術講演会予稿集(CD-ROM) 41st 2023年

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

J-GLOBAL

researchmap
フォンミーゼス分布に基づく音響伝達関数オンライン適応の向上

藤田侑樹, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

日本ロボット学会学術講演会予稿集(CD-ROM) 41st 2023年

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

J-GLOBAL

researchmap
音声強調ネットワークとアダプターを用いた音声認識の耐雑音ロバスト性向上

大崎崇博, 周藤唯, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

日本ロボット学会学術講演会予稿集(CD-ROM) 41st 2023年

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

J-GLOBAL

researchmap
ロボット聴覚オープンソースソフトウェアHARKのPython化,および組込み向け実装の紹介

中臺一博, LIN Zirui, 糸山克寿, 糸山克寿, 瀧ヶ平将行, 寺門直哉, GULZAR Haris, BUSTO Monikka Rosalianna, 江田毅晴, 天野英晴

計測自動制御学会システムインテグレーション部門講演会(CD-ROM) 24th 2023年

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

J-GLOBAL

researchmap
自然な音声対話AIに向けたシステム応答法の検討

阿坂脩平, 西田健次, 糸山克寿, 糸山克寿, 中臺一博

計測自動制御学会システムインテグレーション部門講演会(CD-ROM) 24th 2023年

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

J-GLOBAL

researchmap
ドローンのローターノイズによる地表材質推定手法の検討

矢野翼, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

計測自動制御学会システムインテグレーション部門講演会(CD-ROM) 24th 2023年

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

J-GLOBAL

researchmap
可聴音ベースの反響定位に基づく3次元空間認識の5チャネルマイクロホンアレイによる向上

小林宙輝, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

計測自動制御学会システムインテグレーション部門講演会(CD-ROM) 24th 2023年

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

J-GLOBAL

researchmap
気配センシングに向けた磁束密度センサと風速センサを用いた動作検出

川口洋慶, SHAKEEL Muhammad, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

日本ロボット学会学術講演会予稿集(CD-ROM) 41st 2023年

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

J-GLOBAL

researchmap
フーリエ級数展開を用いた軽量伝達関数のオンライン適応による音源定位・分離の向上

周藤唯, 瀧ケ平将行, 中臺一博, 中島弘史

人工知能学会第二種研究会資料(Web) 2023 ( Challenge-063 ) 08 2023年

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）出版者・発行元：一般社団法人人工知能学会

DOI： 10.11517/jsaisigtwo.2023.challenge-063_08

CiNii Research

J-GLOBAL

researchmap
Parallel Adapter ModelとNear-Identity初期化を用いた音声認識の雑音耐性向上

大崎崇博, 周藤唯, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

人工知能学会第二種研究会資料(Web) 2023 ( Challenge-063 ) 2023年

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

J-GLOBAL

researchmap
生成モデルによる形質表現を活用した鳥類の鳴き声に関する進化モデルとフィールド実験の融合の試み

鈴木麗璽, 古山諒, HARLOW Zachary, 中臺一博, 有田隆也

人工知能学会第二種研究会資料(Web) 2023 ( Challenge-063 ) 07 2023年

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）出版者・発行元：一般社団法人人工知能学会

DOI： 10.11517/jsaisigtwo.2023.challenge-063_07

CiNii Research

J-GLOBAL

researchmap
鳥類の鳴き声行動の理解に対するロボット聴覚に基づく観測と生成進化モデル

古山諒, 鈴木麗璽, 中臺一博, 有田隆也

日本鳥学会大会講演要旨集 2023 2023年

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

J-GLOBAL

researchmap
鳴き声の音源定位によるシマフクロウの生息位置把握の試み

土門優介, 鈴木祐太郎, 石塚正仁, 内山秀樹, 矢野幹也, 鈴木麗璽, 中臺一博

日本鳥学会大会講演要旨集 2023 2023年

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

J-GLOBAL

researchmap
マイクロホンアレイを用いた渡り鳥の群れの飛行ルート推定

山本悠貴, 鈴木麗璽, 中臺一博, 東信行

日本鳥学会大会講演要旨集 2023 2023年

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

J-GLOBAL

researchmap
一夫一妻制鳥類のリュウキュウコノハズクは交尾声で異性を惹きつけるのか?

金杉尚紀, 澤田明, 佐々木瑠太, 細江隼平, 中臺一博, 高木昌興

日本鳥学会大会講演要旨集 2023 2023年

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

J-GLOBAL

researchmap
ヒバリの求愛飛行実測の試み

松林志保, 斎藤史之, 鈴木麗璽, 中臺一博, 奥乃博

日本鳥学会大会講演要旨集 2023 2023年

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

J-GLOBAL

researchmap
深層フルランク空間相関分析に基づく遠隔音声認識のフロントエンド

合澤, 隆拓, 坂東, 宜昭, 糸山, 克寿, 西田, 健次, 中臺, 一博

第84回全国大会講演論文集 2022 ( 1 ) 285 - 286 2022年2月

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

雑踏環境下でも頑健な音声認識をする実現するには，音源分離により目的音源を抽出するフロントエンドが不可欠である．このような音源分離は，学習コストの観点から教師なしでの動作が望ましく，混合複素角度中心ガウス法や多チャネル非負値行列因子分解といった線形型確率モデルに基づく手法が提案されていた．本稿では，より高い表現能力をもつ深層フルランク空間相関分析（neural FCA）に基づくフロントエンドを提案する．Neural FCAは，フルランク空間モデルと深層音源モデルを統合した非線形型確率モデルであり，従来の枠組みより精緻な分離性能を教師なしで獲得できる．Neural FCAを多人数対話のための音声認識フロントエンドとして拡張し，拡散性雑音を含む複数話者の混合音で評価した認識性能を報告する．

CiNii Books

CiNii Research

researchmap
Blockwiseストリーミング音声認識と発話区間検出の統合国際共著

周藤唯, SHAKEEL Muhammad, 中臺一博, SHI Jiatong, 渡部晋二

人工知能学会第二種研究会資料(Web) 2022 ( Challenge-061 ) 10 2022年

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）出版者・発行元：一般社団法人人工知能学会

DOI： 10.11517/jsaisigtwo.2022.challenge-061_10

CiNii Research

J-GLOBAL

researchmap
PyHARK:HARKのオンライン・オフライン処理用Pythonパッケージ

中臺一博, 瀧ヶ平将行, 糸山克寿, 糸山克寿

人工知能学会第二種研究会資料(Web) 2022 ( Challenge-061 ) 04 2022年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人人工知能学会

本稿では，ロボット聴覚オープンソースソフトウェア HARK 3.4 で新規に導入されるPyHARK をHARK講習会に先立ち紹介する。PyHARK は HARK の Python インタフェースを提供するパッケージであり，Python から HARK の機能のオンライン・オフライン呼び出しを可能にする実装である。そのアーキテクチャ，既存のHARKとの違い，使い方を中心に解説する。

DOI： 10.11517/jsaisigtwo.2022.challenge-061_04

CiNii Research

J-GLOBAL

researchmap
低解像度画像からの小領域物体の検出手法の検討

西田健次, 糸山克寿, 糸山克寿, 中臺一博

人工知能学会第二種研究会資料(Web) 2022 ( Challenge-061 ) 03 2022年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人人工知能学会

野鳥の生態観測のための全天録画画像から、実際に野鳥の録画されている時間帯を切り出す手法について検討を行った。野鳥に対する画像解像度が低く、また、樹木の枝などでのオクルージョンが繰り返されるため、通常の物体検出、物体追跡手法では対応が難しい。野鳥自体の動き、野鳥による樹木の枝の動きを手掛かりとして、検出・追跡を行う手法について検討した。

DOI： 10.11517/jsaisigtwo.2022.challenge-061_03

CiNii Research

J-GLOBAL

researchmap
音声に基づくヒクイナの個体数推定と生息地利用状況の可視化

松林志保, 斎藤史之, 鈴木麗璽, 中臺一博, 奥乃博

日本鳥学会大会講演要旨集 2022 2022年

　詳細を見る

J-GLOBAL

researchmap
野外鳥類集団における音声相互作用分析のためのマイクロホンアレイに基づく自動観測の検討

鈴木麗璽, 炭谷晋司, 有田隆也, 松林志保, 中臺一博, 奥乃博

日本鳥学会大会講演要旨集 2022 2022年

　詳細を見る

J-GLOBAL

researchmap
ロボット聴覚用音響処理ソフトウェアHARKを用いたサウンドスケープの解析

山本遼, 西田健次, 糸山克寿, 糸山克寿, 松林志穂, 鈴木麗璽, 中臺一博

日本鳥学会大会講演要旨集 2022 2022年

　詳細を見る

J-GLOBAL

researchmap
複数マイクロホンアレイのパラメータ同時最適化

杉山地塩, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

日本ロボット学会学術講演会予稿集(CD-ROM) 40th 2022年

　詳細を見る

J-GLOBAL

researchmap
音源定位結果の3D可視化とmAPベースの評価指標の提案

山本遼, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

日本ロボット学会学術講演会予稿集(CD-ROM) 40th 2022年

　詳細を見る

J-GLOBAL

researchmap
環境イベント識別学習フレームワークの提案とその日本語テキスト入力からの音響シーン生成部の実装

露口弘毅, MUHAMMAD Shakeel, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

日本ロボット学会学術講演会予稿集(CD-ROM) 40th 2022年

　詳細を見る

J-GLOBAL

researchmap
アンサンブル時間周波数マスクを用いた複数の音声強調手法の統合

藤田雅彦, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

日本ロボット学会学術講演会予稿集(CD-ROM) 40th 2022年

　詳細を見る

J-GLOBAL

researchmap
複数のマイクロホンアレイ搭載ドローンの配置最適化による音源追跡性能の向上

山田泰基, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

日本ロボット学会学術講演会予稿集(CD-ROM) 40th 2022年

　詳細を見る

J-GLOBAL

researchmap
音源分離処理のFPGA上での実装

QIN Ziquan, WEI Kaijie, 天野英晴, 中臺一博

電子情報通信学会技術研究報告(Web) 122 ( 174(RECONF2022 26-41) ) 2022年

　詳細を見る

J-GLOBAL

researchmap
最頻値フィルタを用いた音響伝達関数の環境適応手法の検討

藤田侑樹, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

計測自動制御学会システムインテグレーション部門講演会(CD-ROM) 23rd 2022年

　詳細を見る

J-GLOBAL

researchmap
音響伝達関数の二次元補間手法の提案とその音源定位への適用

大崎崇博, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

計測自動制御学会システムインテグレーション部門講演会(CD-ROM) 23rd 2022年

　詳細を見る

J-GLOBAL

researchmap
HARK3.4~PyHARKの紹介~

中臺一博, 糸山克寿, 糸山克寿

計測自動制御学会システムインテグレーション部門講演会(CD-ROM) 23rd 2022年

　詳細を見る

J-GLOBAL

researchmap
Scan-and-Sum Beamformerの拡張による二次元領域抽出の検討

安江蒼人, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

計測自動制御学会システムインテグレーション部門講演会(CD-ROM) 23rd 2022年

　詳細を見る

J-GLOBAL

researchmap
複数音源追跡におけるドローン群の行動計画の検討

山田泰基, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

人工知能学会第二種研究会資料(Web) 2022 ( Challenge-061 ) 07 2022年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人人工知能学会

DOI： 10.11517/jsaisigtwo.2022.challenge-061_07

CiNii Research

J-GLOBAL

researchmap
任意の混合音を入力としたマイクロホンアレイ形状のキャリブレーション

糸山克寿, 糸山克寿, 中臺一博

人工知能学会第二種研究会資料(Web) 2022 ( Challenge-061 ) 11 2022年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人人工知能学会

本稿では，マイクロホンアレイの形状，すなわち各マイクロホンの位置をキャリブレーションする手法について述べる．特殊な試験音ではなく任意の混合音を入力とするため，(1)基準位置に基づくマイクロホン位置の事前確率、(2)音源スペクトルの事前確率、(3)録音スペクトルの条件付確率の3つの確率の積として定義されるスペクトルの確率的生成モデルに基づく反復アルゴリズムで推定を行う．

DOI： 10.11517/jsaisigtwo.2022.challenge-061_11

CiNii Research

J-GLOBAL

researchmap
音源位置特定処理のFPGAボードへのオフロード

HOU Zhongyang, WEI Kaijie, 天野英晴, 中臺一博

電子情報通信学会技術研究報告(Web) 122 ( 174(RECONF2022 26-41) ) 2022年

　詳細を見る

J-GLOBAL

researchmap
ロボット聴覚用音響処理ソフトウェアHARKを用いたサウンドスケープの分析および考察

山本遼, 西田健次, 糸山克寿, 中臺一博, 中臺一博

日本生態学会大会講演要旨(Web) 69th 2022年

　詳細を見る

J-GLOBAL

researchmap
音源定位技術を用いた野外鳥類の音声相互作用の分析手法の検討

鈴木麗璽, 炭谷晋司, 松林志保, 有田隆也, 中臺一博, 中臺一博, 奥乃博

日本生態学会大会講演要旨(Web) 69th 2022年

　詳細を見る

J-GLOBAL

researchmap
野外での鳥類鳴き声観測のためのWebベース録音ユニットと可視化ツールの試作

炭谷晋司, 大和祐介, 鈴木麗璽, 小島諒介, 有田隆也, 中臺一博, 中臺一博, 奥乃博, 奥乃博

日本ロボット学会学術講演会予稿集(CD-ROM) 39th 2021年

　詳細を見る

J-GLOBAL

researchmap
鳥類の鳴き声観測に対するロボット聴覚アプローチ

鈴木麗璽, 炭谷晋司, 松林志保, 有田隆也, 中臺一博, 中臺一博, 奥乃博, 奥乃博

日本生態学会大会講演要旨(Web) 68th 2021年

　詳細を見る

J-GLOBAL

researchmap
類似度行列を考慮した野鳥の歌自動識別の検討

山本遼, 中臺一博, 中臺一博, 西田健次, 糸山克寿

日本ロボット学会学術講演会予稿集(CD-ROM) 39th 2021年

　詳細を見る

J-GLOBAL

researchmap
エコロケーションに基づく視覚シーンの再構成手法の提案と入力特徴量の検討

岸波華彦, 糸山克寿, 西田健次, 中臺一博, 中臺一博

日本ロボット学会学術講演会予稿集(CD-ROM) 39th 2021年

　詳細を見る

J-GLOBAL

researchmap
複数マイクアレイを用いたキンカチョウの時空間的発声パターンに基づく個体間相互作用の調査

炭谷晋司, 鈴木麗璽, 有田隆也, 和多和宏, 松林志保, 中臺一博, 中臺一博, 奥乃博

人工知能学会第二種研究会資料(Web) 2021 ( Challenge-058 ) 2021年

　詳細を見る

J-GLOBAL

researchmap
伝達関数の常時オンライン適応による音源定位・分離の向上

中臺一博, 中臺一博, 瀧ケ平雅行, 河合熊輔, 中島弘史

人工知能学会第二種研究会資料(Web) 2021 ( Challenge-058 ) 2021年

　詳細を見る

J-GLOBAL

researchmap
複数マイクロホンアレイを用いたNMFによる空間音源分離法の残響下での評価

鍵本泰宏, 糸山克寿, 西田健次, 中臺一博, 中臺一博

人工知能学会第二種研究会資料(Web) 2021 ( Challenge-058 ) 05 2021年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人人工知能学会

DOI： 10.11517/jsaisigtwo.2021.challenge-058_05

CiNii Research

J-GLOBAL

researchmap
転移学習を用いた音響クラス分類の検討

露口弘毅, 西田健次, 糸山克寿, 中臺一博, 中臺一博

計測自動制御学会システムインテグレーション部門講演会(CD-ROM) 22nd 2021年

　詳細を見る

J-GLOBAL

researchmap
ロボット聴覚5.0~変遷と展望~

中臺一博, 中臺一博

計測自動制御学会システムインテグレーション部門講演会(CD-ROM) 22nd 2021年

　詳細を見る

J-GLOBAL

researchmap
スポットフォーミングによる音声認識性能向上の評価

合澤隆拓, 鍵本泰宏, 西田健次, 糸山克寿, 中臺一博, 中臺一博

計測自動制御学会システムインテグレーション部門講演会(CD-ROM) 22nd 2021年

　詳細を見る

J-GLOBAL

researchmap
複数マイクロホンアレイの同期および3次元位置・姿勢推定の同時最適化の検討

杉山地塩, 糸山克寿, 西田健次, 中臺一博, 中臺一博

日本ロボット学会学術講演会予稿集(CD-ROM) 39th 2021年

　詳細を見る

J-GLOBAL

researchmap
アンサンブル時間周波数マスクによる音声強調手法の評価

藤田雅彦, 糸山克寿, 西田健次, 中臺一博, 中臺一博

日本ロボット学会学術講演会予稿集(CD-ROM) 39th 2021年

　詳細を見る

J-GLOBAL

researchmap
ヒクイナの鳴き声自動観測の可能性と今後の課題

松林志保, 斎藤史之, 鈴木麗璽, 中臺一博, 中臺一博, 奥乃博, 奥乃博

日本鳥学会大会講演要旨集 2021 (CD-ROM) 2021年

　詳細を見る

J-GLOBAL

researchmap
類似度行列による野鳥の歌識別器の検討

山本遼, 中臺一博, 中臺一博, 糸山克寿, 西田健次, 鈴木麗璽, 松林志保

日本鳥学会大会講演要旨集 2021 (CD-ROM) 2021年

　詳細を見る

J-GLOBAL

researchmap
ロボット聴覚技術に基づく鳥類音声の方位角・仰角に関する音源定位と音風景の観測

鈴木麗璽, 林晃一郎, 大坂英樹, 松林志保, 有田隆也, 中臺一博, 中臺一博, 奥乃博, 奥乃博

日本鳥学会大会講演要旨集 2021 (CD-ROM) 2021年

　詳細を見る

J-GLOBAL

researchmap
音で追跡するフクロウの巣立ち

松林志保, 斎藤史之, 鈴木麗璽, 中臺一博, 奥乃博

景観生態学 = Landscape ecology and management 25 ( 1 ) 87 - 89 2020年6月

　詳細を見る

記述言語：日本語出版者・発行元：日本景観生態学会

CiNii Books

J-GLOBAL

researchmap
ロボット聴覚技術を用いた鳥類の鳴き声観測に対するマルチスケールアプローチ

鈴木麗璽, 炭谷晋司, 松林志保, 有田隆也, 中臺一博, 奥乃博

第67回日本生態学会大会 67th 2020年3月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
ロボット聴覚からのクロスモーダルへの期待—メディアエクスペリエンス・バーチャル環境基礎

中臺一博

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 119 ( 386 ) 107 - 112 2020年1月

　詳細を見る

記述言語：日本語出版者・発行元：東京 : 電子情報通信学会

CiNii Books

CiNii Research

researchmap

その他リンク： https://ndlsearch.ndl.go.jp/books/R000000004-I030249880
ドローン搭載マイクロホンアレイを用いた音源探査の高精度化に向けた静音プロペラの開発

干場功太郎, 野田龍介, 中田敏是, 劉浩, 泉田啓, 中臺一博, 中臺一博, 公文誠, 奥乃博, 奥乃博

日本ロボット学会学術講演会予稿集(CD-ROM) 38th 2020年

　詳細を見る

J-GLOBAL

researchmap
表情による感情推定と音声による感情推定手法の検討

西田健次, 山田亨, 糸山克寿, 中臺一博, 中臺一博

人工知能学会AIチャレンジ研究会(Web) 57th 2020年

　詳細を見る

J-GLOBAL

researchmap
重み付け尤度関数と定在波を用いた可聴音による二次元環境認識

岸波華彦, 糸山克寿, 西田健次, 中臺一博, 中臺一博

日本ロボット学会学術講演会予稿集(CD-ROM) 38th 2020年

　詳細を見る

J-GLOBAL

researchmap
テニスの打球音による球種識別の検討

山本修己, 西田健次, 糸山克寿, 中臺一博, 中臺一博

日本ロボット学会学術講演会予稿集(CD-ROM) 38th 2020年

　詳細を見る

J-GLOBAL

researchmap
ロボット聴覚技術の活用による鳥類音声の到来方向に基づく音風景の可視化の検討

鈴木麗璽, ZHAO Hao, 炭谷晋司, 松林志保, 有田隆也, 中臺一博, 中臺一博, 奥乃博, 奥乃博

日本ロボット学会学術講演会予稿集(CD-ROM) 38th 2020年

　詳細を見る

J-GLOBAL

researchmap
複数マイクロホンアレイを用いたNMFによる空間音源分離法の提案と評価

鍵本泰宏, 糸山克寿, 西田健次, 中臺一博, 中臺一博

日本ロボット学会学術講演会予稿集(CD-ROM) 38th 2020年

　詳細を見る

J-GLOBAL

researchmap
環境音情報と画像情報を用いた物体検出による音ラベル付きセグメントの生成

鈴木啓, 糸山克寿, 西田健次, 中臺一博, 中臺一博

日本ロボット学会学術講演会予稿集(CD-ROM) 38th 2020年

　詳細を見る

J-GLOBAL

researchmap
The 31st IEEE/RSJ International Conference on Intelligent Systems and Robots (IROS 2018)

中臺一博

日本ロボット学会誌 37 ( 1 ) 70 - 72 2019年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本ロボット学会

DOI： 10.7210/jrsj.37.70

CiNii Books

CiNii Research

researchmap

その他リンク： https://ndlsearch.ndl.go.jp/books/R000000004-I029462341
柔軟索状レスキューロボットのための空気噴射音下での単チャネル音声強調

坂東宜昭, 安部祐一, 糸山克寿, 糸山克寿, 昆陽雅司, 田所諭, 中臺一博, 中臺一博, 奥乃博

日本機械学会ロボティクス・メカトロニクス講演会講演論文集(CD-ROM) 2019 2019年

　詳細を見る

J-GLOBAL

researchmap
「見えない」鳥を音で追う:定位技術を活用した鳥類観測

松林志保, 斎藤史之, 鈴木麗璽, 中臺一博, 奧乃博

日本景観生態学会大会発表要旨集(Web) 29th 2019年

　詳細を見る

J-GLOBAL

researchmap
ドローンによる地上音源の位置推定―HARKを用いたドローン聴覚の取り組み―

公文誠, 若林瑞保, 干場功太郎, 中臺一博, 中臺一博, 奥乃博

計測自動制御学会システムインテグレーション部門講演会(CD-ROM) 19th ROMBUNNO.2E3‐09 2018年12月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
920MHz帯マルチホップ無線通信システムを用いたドローン制御およびセンサデータ伝送の実証実験

加川敏規, 小野文枝, SHAN Lin, 三浦龍, 中臺一博, 干場功太郎, 公文誠, 奥乃博, 加藤晋, 児島史秀

電子情報通信学会技術研究報告 118 ( 344(RCC2018 58-106) ) 217‐221 2018年11月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
Fine-scale observations of spatiotemporal dynamics and vocalization type of birdsongs using microphone arrays and unsupervised feature mapping

Reiji Suzuki, Shinji Sumitani, Shiho Matsubayashi, Takaya Arita, Kazuhiro Nakadai, Hiroshi G. Okuno

Proceedings of the 10th International Conference on Ecological Informatics 72-73 2018年9月

　詳細を見る

記述言語：英語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

researchmap
Spatial localization of vocalizations of Spotted Towhee (Pipilo maculatus) in playback experiments using robot audition techniques 査読

Shinji Sumitani, Reiji Suzuki, Shiho Matsubayashi, Takaya Arita, Kazuhiro Nakadai, Hiroshi G. Okuno

Proceedings of the 10th International Conference on Ecological Informatics 265 2018年9月

　詳細を見る

記述言語：英語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

researchmap
音情報を活用したフクロウの歌行動観測の試み

松林志保, 斎藤史之, 鈴木麗璽, 中臺一博, 中臺一博, 奥乃博

日本鳥学会大会講演要旨集 2018 72 2018年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
ロボット聴覚技術に基づく鳥類の歌行動の二次元定位精度改善と次元圧縮に基づく分類支援

炭谷晋司, 鈴木麗璽, 松林志保, 有田隆也, 中臺一博, 中臺一博, 奥乃博

日本鳥学会大会講演要旨集 2018 73 2018年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
マイクロホンアレイを用いた鳥類の歌行動の三次元音源到来方向推定

林晃一郎, 鈴木麗璽, 松林志保, 有田隆也, 小島諒介, 中臺一博, 中臺一博, 奥乃博

日本鳥学会大会講演要旨集 2018 74 2018年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
複数のマイクロホンアレイの遠隔制御に基づく鳥類の歌行動の二次元定位

森松健充, 炭谷晋司, 鈴木麗璽, 松林志保, 有田隆也, 中臺一博, 中臺一博, 奥乃博

日本鳥学会大会講演要旨集 2018 72 2018年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
複数のマイクロホンアレイをネットワーク制御可能な鳥類の歌行動観測システムの構築

森松健充, 炭谷晋司, 鈴木麗璽, 松林志保, 有田隆也, 中臺一博, 中臺一博, 奥乃博

日本ロボット学会学術講演会予稿集(CD-ROM) 36th ROMBUNNO.2J2‐03 2018年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
音響センサによるサイバー救助犬のパンディングの検出

鈴木拓也, 中臺一博, 中臺一博, 奥乃博, 星達也, 水野直希, 大貫和也, 濱田龍之介, 大野和則, 干場功太郎

日本ロボット学会学術講演会予稿集(CD-ROM) 36th ROMBUNNO.2J2‐05 2018年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
マイクロホンアレイを用いた鳥類の３次元音源到来方向推定

林晃一郎, 鈴木麗璽, 松林志保, 有田隆也, 小島諒介, 中臺一博, 奧乃博

日本鳥学会2018年度大会講演要旨集 74 2018年9月

　詳細を見る

記述言語：日本語

researchmap
Understanding relationships between spatial movements and bird song-types using a robot audition system HARK with microphone arrays 査読

Shinji Sumitani, Reiji Suzuki, Shiho Matsubayashi, Takaya Arita, Kazuhiro Nakadai, Hiroshi G. Okuno

Proc. of the 27th International Ornithological Congress 188 2018年8月

　詳細を見る

記述言語：英語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

researchmap
Acoustic monitoring of the nocturnal owl (Strix uralensis) using microphone arrays and a robot audition system, HARK: A case study in the Ikoma mountains, Japan 査読

Shiho Matsubayashi, Fumiyuki Saito, Reiji Suzuki, Kazuhiro Nakadai, Hiroshi G. Okuno

Proc. of the 27th International Ornithological Congress 213 2018年8月

　詳細を見る

記述言語：英語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

researchmap
マイクロホンアレイを用いた音源定位・分離ソフトウェア入門

中臺一博

システム／制御／情報 62 ( 2 ) 42 - 49 2018年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人システム制御情報学会

DOI： 10.11509/isciesci.62.2_42

CiNii Books

CiNii Research

researchmap
Understanding ecoacoustic interactions among songbirds as complex systems using robot audition techniques

Reiji Suzuki, Shinji Sumitani, Shiho Matsubayashi, Takaya Arita, Kazuhiro Nakadai, Hiroshi G. Okuno

Abstract Booklet of EVOSLACE: Workshop on the emergence and evolution of social learning, communication, language and culture in natural and artificial agents in ALIFE2018 22 2018年7月

　詳細を見る

記述言語：英語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

researchmap
音響信号処理の変遷と最先端――ロボット聴覚の視点から―― 査読

中臺一博

日本音響学会誌 74 ( 7 ) 394 - 400 2018年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本音響学会

DOI： 10.20697/jasj.74.7_394

CiNii Books

CiNii Research

J-GLOBAL

researchmap
Field observations of ecoacoustic dynamics of a Japanese bush warbler using an open-source software for robot audition HARK 査読

Reiji Suzuki, Shinji Sumitani, Shiho Matsubayashi, Takaya Arita, Kazuhiro Nakadai, Hiroshi G. Okuno

Journal of Ecoacoustics 2 EYAJ46 2018年6月

　詳細を見る

記述言語：英語掲載種別：速報，短報，研究ノート等（学術雑誌）

researchmap
ロボット聴覚技術の極限環境への展開

奥乃博, 糸山克寿, 中臺一博, 中臺一博, 公文誠, 坂東宜昭, 干場功太郎

システム制御情報学会研究発表講演会講演論文集(CD-ROM) 62nd ROMBUNNO.221‐1 2018年5月

　詳細を見る

記述言語：日本語出版者・発行元：システム制御情報学会

J-GLOBAL

researchmap
ロボット聴覚技術を活用した鳥類の行動観測

鈴木麗璽, 中臺一博, 奥乃博

日本鳥学会誌（フォーラム） 67 ( 1 ) 155-157 2018年5月

　詳細を見る

記述言語：日本語掲載種別：機関テクニカルレポート，技術報告書，プレプリント等

researchmap
ロボット聴覚技術を用いた鳥類の歌行動分析の試み―複数のマイクロホンアレイを用いた二次元リアルタイム歌定位―

鈴木麗璽, 炭谷晋司, 中臺一博, 中臺一博, 奥乃博

計測自動制御学会システムインテグレーション部門講演会(CD-ROM) 18th ROMBUNNO.1D6‐04 2017年12月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
人間とロボットとの対話環境における対話終了タイミングの検討 (情報ネットワーク)

北川遼, 蓮本諒介, 今井倫太, 中臺一博

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 117 ( 306 ) 31 - 34 2017年11月

　詳細を見る

記述言語：日本語出版者・発行元：電子情報通信学会

CiNii Books

CiNii Research

researchmap
コミュニケーションロボットのための遠隔音声認識システムの構築と実証実験

山本俊一, 住田直亮, 中臺一博

Honda R&D technical review 29 ( 2 ) 110 - 117 2017年10月

　詳細を見る

記述言語：日本語出版者・発行元：本田技術研究所

CiNii Books

CiNii Research

researchmap
マイクロホンアレイを利用したウグイスの歌行動の時空間分析

炭谷晋司, 鈴木麗璽, 有田隆也, 松林志保, 中臺一博, 中臺一博, 奥乃博

日本鳥学会大会講演要旨集 2017 92 2017年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
マイクロフォンアレイを用いた野鳥観測:ソウシチョウの歌行動をめぐる予備的調査報告

松林志保, 斎藤史之, 鈴木麗璽, 中臺一博, 中臺一博, 奥乃博

日本鳥学会大会講演要旨集 2017 92 2017年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
ロボット聴覚技術を活用した野鳥の歌行動観測・分析ツールHARKBirdの機能強化

千葉尚彬, 炭谷晋司, 松林志保, 鈴木麗璽, 有田隆也, 中臺一博, 中臺一博, 奥乃博

日本ロボット学会学術講演会予稿集(CD-ROM) 35th ROMBUNNO.3A3‐03 2017年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
UAV搭載マイクロホンアレイを用いた組み込みシステムによる音源探査性能の評価

干場功太郎, 中臺一博, 中臺一博, 公文誠, 奥乃博

日本ロボット学会学術講演会予稿集(CD-ROM) 35th ROMBUNNO.3A2‐04 2017年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
マルチロータヘリコプタ収録音の音源分離におけるシステムパラメータと分離性能について―GHDSSとBNP‐MAPの比較

鷲崎海, 公文誠, 大塚琢馬, 奥乃博, 干場功太郎, 中臺一博, 中臺一博

日本ロボット学会学術講演会予稿集(CD-ROM) 35th ROMBUNNO.3A2‐05 2017年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
災害救助犬の呼吸音と周囲の音を同時に計測するサイバスーツの開発

水野直希, 大貫和也, 星達也, 山口竣平, 濱田龍之介, 大野和則, 中臺一博, 奥乃博, 田所諭

日本ロボット学会学術講演会予稿集(CD-ROM) 35th ROMBUNNO.3A3‐02 2017年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
オープンソースコミュニティに貢献するということ

中臺一博

映像情報メディア学会誌 = The journal of the Institute of Image Information and Television Engineers 71 ( 5 ) 647 - 653 2017年9月

　詳細を見る

記述言語：日本語出版者・発行元：映像情報メディア学会

DOI： 10.3169/itej.71.647

CiNii Books

CiNii Research

researchmap
風雑音の相関を用いたパッシブ型音響風向風速計の検討

村上哲郎, 坂田直人, 横尾佳紀, 中島弘史, 中臺一博

日本音響学会誌 73 ( 8 ) 472 - 479 2017年8月

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

CiNii Books

researchmap
Field observations and virtual experiences of bird songs in the soundscape using an open-source software for robot audition HARK

Shinji Sumitani, Reiji Suzuki, Takaya Arita, Naren, Shiho Matsubayashi, Kazuhiro Nakadai, Hiroshi G. Okuno

Abstract Book of 4th International Symposium on Acoustic Communication by Animals 116-117 2017年7月

　詳細を見る

記述言語：英語掲載種別：速報，短報，研究ノート等（学術雑誌）

researchmap
Bird song explorer: 野鳥の歌行動体験のための立体音響に基づく仮想森林アプリケーション

娜仁, 鈴木麗璽, 有田隆也, 中臺一博, 奥乃博

第79回全国大会講演論文集 2017 ( 1 ) 239 - 240 2017年3月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

我々は，マイクロホンアレイとロボット聴覚ソフトウェアHARKを用いて野鳥の歌行動を観測・分析する簡易なシステムHARKBirdを開発している．観測した音空間を臨場的に体験することは，野鳥の生態理解への貢献をはじめ，教育や啓蒙など幅広い活用が期待される．本発表では，ゲームエンジンであるUnityを用いて，野鳥が棲息し歌う様子を3次元空間上の仮想的な森林等で表現するアプリケーションを提案する.具体的には，いくつかの調査地で録音し音源定位・分離した野鳥の歌を，実環境と同じタイミングと方位で仮想的なフィールドに配置し再生する．ユーザはアバターを動かして野鳥を探索しながら立体音響で臨場的に歌を聴くことができる．目的に応じて任意の歌を配置することも可能である．

CiNii Books

CiNii Research

researchmap
マイクロホンアレイ搭載UAVを用いた屋外実環境実時間音源探査

干場功太郎, 若林瑞保, 鷲崎海, 石木隆洋, 公文誠, GABRIEL Daniel, 中臺一博, 中臺一博, 奥乃博

情報処理学会全国大会講演論文集 79th ( 1 ) 1.199‐1.200 2017年3月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
Bird song explorer:野鳥の歌行動体験のための立体音響に基づく仮想森林アプリケーション

NARAN, 鈴木麗璽, 有田隆也, 中臺一博, 中臺一博, 奥乃博

情報処理学会全国大会講演論文集 79th ( 4 ) 4.239‐4.240 2017年3月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
合同研究会2016開催報告

中臺一博, 小林一郎, 和泉潔

人工知能 : 人工知能学会誌 : journal of the Japanese Society for Artificial Intelligence 32 ( 2 ) 297 - 304 2017年3月

　詳細を見る

記述言語：日本語出版者・発行元：人工知能学会 ; 2014-

DOI： 10.11517/jjsai.32.2_297

CiNii Books

CiNii Research

researchmap
ロボットとの会話における画像および音声情報を用いた人の身体動作と発話姿勢の関係に関する検討 (パターン認識・メディア理解)

蓮本諒介, 小山大幾, 水本武志, 中村圭佑, 中臺一博, 今井倫太

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 116 ( 461 ) 19 - 22 2017年2月

　詳細を見る

記述言語：日本語出版者・発行元：電子情報通信学会

CiNii Books

researchmap
ロボットとの会話における画像および音声情報を用いた人の身体動作と発話姿勢の関係に関する検討 (クラウドネットワークロボット)

蓮本諒介, 小山大幾, 水本武志, 中村圭佑, 中臺一博, 今井倫太

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 116 ( 462 ) 19 - 22 2017年2月

　詳細を見る

記述言語：日本語出版者・発行元：電子情報通信学会

CiNii Books

researchmap
外来種ソウシチョウが在来種の歌行動へ与える影響を探る:マイクロフォンアレイを用いた森林性鳥類の観測実例

松林志保, 斉藤史之, 鈴木麗璽, 千葉尚彬, 中臺一博, 中臺一博, 奥乃博

人工知能学会AIチャレンジ研究会(Web) 49th 23‐28 (WEB ONLY) 2017年

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
UAVを用いた音源探査におけるマイクロホンアレイの性能評価

干場功太郎, 鷲崎海, 若林瑞保, 公文誠, 中臺一博

ロボティクス・メカトロニクス講演会講演概要集 2017 ( 0 ) 1P1 - R05 2017年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本機械学会

Sound source localization using a microphone array embedded on an unmanned aerial vehicle has been studied to detect and localize people who need help in a disaster-stricken area. Because such sound source localization should work in outdoor environments, the design of the microphone array is crucial. We thus developed two types of microphone array; 16ch two-storied hexagonal and 12ch spherical microphone arrays. These two microphone arrays were evaluated via numerical simulation with discussions on the appropriate design of microphone arrays.

DOI： 10.1299/jsmermd.2017.1P1-R05

researchmap
多チャネル低ランク・スパース分解に基づく柔軟索状レスキューロボットのためのリアルタイム音声強調

坂東宜昭, 安部祐一, 糸山克寿, 昆陽雅司, 田所諭, 中臺一博, 吉井和佳, 奥乃博

ロボティクス・メカトロニクス講演会講演概要集 2017 ( 0 ) 1P2 - P05 2017年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本機械学会

This paper presents a real-time human-voice enhancement method for a hose-shaped rescue robot based on multi-channel low-rank sparse decomposition. Although microphone arrays equipped on hose-shaped robots are crucial for finding victims under collapsed buildings, human voices captured by the microphone array are contaminated by environment-dependent and non-stationary ego-noise. Our method decomposes multi-channel amplitude spectrograms into sparse and low-rank components (human voice and noise) without any prior training. This decomposition is conducted with a state-space model representing the dynamics of these components in a mini-batch manner. Experimental results show that the performance difference between our method and its offline version is less than 3dB in signal-to-distortion ratio.

DOI： 10.1299/jsmermd.2017.1p2-p05

researchmap
アクティブ周波数レンジフィルタを用いた雑音にロバストな音源定位手法の提案

干場功太郎, 中臺一博, 中臺一博, 公文誠, 奥乃博

人工知能学会AIチャレンジ研究会(Web) 49th 9‐14 (WEB ONLY) 2017年

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
HARK2.3の紹介とタフロボティクスチャレンジへの展開

中臺一博, 中臺一博, 中臺一博, 坂東宜昭, 水本武志, 干場功太郎, 小島諒介, 糸山克寿, 杉山治, 公文誠, 奥乃博

計測自動制御学会システムインテグレーション部門講演会(CD-ROM) 17th ROMBUNNO.3A3‐3 2016年12月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
空間情報を用いた鳥の歌分析招待

小島諒介, 杉山治, 干場功太郎, 鈴木麗璽, 中臺一博

第46回AIチャレンジ研究会予稿集 (SIG-Challenge) 046-05 25-31 2016年11月

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

researchmap
複数のマイクロホンアレイとロボット聴覚ソフトウエアHARKを用いた野鳥の観測精度の検討招待

松林志保, 鈴木麗璽, 小島諒介, 中臺一博

人工知能学会2015年度研究会優秀賞記念講演集 10-15 2016年11月

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

researchmap
Semi-Automatic Bird Song Analysis by Spatial-Cue-Based Integration of Sound Source Detection, Localization, Separation, and Identification 査読

Ryosuke Kojima, Osamu Sugiyama, Reiji Suzuki, Kazuhiro Nakadai, Charles E. Taylor

IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2016) 1287-1292 2016年10月

　詳細を見る

記述言語：英語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

researchmap
広い帯域で位相変化の少ないインパルス応答波形の自動切り出し法

中島弘史, 坂田直人, 村上哲郎, 中臺一博

日本音響学会誌 72 ( 10 ) 627 - 634 2016年10月

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

CiNii Books

researchmap
マイクロホンアレイを用いた森林性野鳥の定位精度の検証とその応用:歌の空間的な位置およびタイミングから知る複数種の棲み分け

松林志保, 鈴木麗璽, 小島諒介, 中臺一博, 中臺一博, 奥乃博

日本鳥学会大会講演要旨集 2016 138 2016年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
マイクロホンアレイを用いたオオヨシキリのソングポスト定位

鈴木麗璽, 松林志保, 斎藤史之, 村手達佳, 増田智久, 山本晃一, 小島諒介, 中臺一博, 中臺一博, 奥乃博

日本鳥学会大会講演要旨集 2016 151 2016年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
音源位置を考慮した音源同定のための確率モデルとその学習

小島諒介, 杉山治, 鈴木麗璽, 中臺一博

第34回日本ロボット学会学術講演会 (RSJ2016)資料 4 pages 2016年9月

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

researchmap
変分ベイズ多チャネルRNMFに基づく柔軟索状レスキューロボットのための音声強調

坂東宜昭, 糸山克寿, 昆陽雅司, 田所諭, 中臺一博, 中臺一博, 吉井和佳, 奥乃博

日本ロボット学会学術講演会予稿集(CD-ROM) 34th ROMBUNNO.1C2‐04 2016年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
変分ベイズ多チャネルロバストNMFに基づくマイクロホンの移動・被覆を許容する音声強調 (音声) -- (オーガナイズドセッション「あらゆる音を対象とした情報処理の実現に向けて」)

坂東宜昭, 糸山克寿, 昆陽雅司, 田所諭, 中臺一博, 吉井和佳, 河原達也, 奥乃博

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 116 ( 189 ) 47 - 52 2016年8月

　詳細を見る

記述言語：日本語出版者・発行元：電子情報通信学会

CiNii Books

researchmap
研究会活動の現在・過去・未来あれから30年，これから30年

和泉潔, 中臺一博, 栗原聡

人工知能 31 ( 4 ) 531 - 549 2016年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人人工知能学会

DOI： 10.11517/jjsai.31.4_531

CiNii Books

researchmap
研究会活動の現在・過去・未来あれから30年,これから30年 (創設30周年記念特集) -- (研究会の変遷)

和泉潔, 中臺一博, 栗原聡

人工知能 : 人工知能学会誌 : journal of the Japanese Society for Artificial Intelligence 31 ( 4 ) 531 - 549,530 2016年7月

　詳細を見る

記述言語：日本語出版者・発行元：人工知能学会 ; 2014-

DOI： 10.11517/jjsai.31.4_531

CiNii Books

CiNii Research

researchmap
柔軟索状レスキューロボットのためのマイクロホン・加速度センサアレイを用いた3次元姿勢推定

坂東宜昭, 糸山克寿, 昆陽雅司, 田所諭, 中臺一博, 吉井和佳, 奥乃博

ロボティクス・メカトロニクス講演会講演概要集 2016 ( 0 ) 1A2 - 10a6 2016年6月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本機械学会

This paper presents an online method that estimates a 3D posture of a hose-shaped rescue robot using a microphone and accelerometer array. Posture (shape) estimation of a self-driving hose-shaped rescue robot is crucial for handling the robot body because the unseen robot posture deforms in narrow spaces under collapsed buildings. Conventional sound-based method that uses time-differences of arrivals (TDOAs) works only on a two-dimensional surface and is often hampered by the rubble around the robot. Our method eliminates the outliers of sound-based TDOA measurements, and compensates the lack of the posture information with the tilt information measured by accelerometers. Experimental results using a 3-m hose-shaped robot that was deployed in a simple 3D structure demonstrate that our method reduces the errors of initial states to about 20cm in the 3D space.

DOI： 10.1299/jsmermd.2016.1A2-10a6

J-GLOBAL

researchmap
ロボット聴覚の極限音響への展開

奥乃博, 中臺一博, 公文誠, 糸山克寿, 吉井和佳, 坂東宜昭, 佐々木洋子

ロボティクス・メカトロニクス講演会講演概要集 2016 ( 0 ) 1A2 - 09b3 2016年6月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本機械学会

The ability of robots to listen to several things at once with their own "ears", i.e., robot audition, is critical in improving the performance of search and rescue activities under severe conditions. This paper introduces "HARK" robot audition open-source software and its capabilities of suppressing ego-noise that is caused by robot's own movements such as motor, propeller and/or flying noise. Then it describes three main applications of robot audition: 1) Unmanned Aerial Vehicle (UAV) with a microphone array to capture sounds can localize a sound source by suppressing ego-noise with either hovering, slow gliding or fast gliding. It can also recognize a sound source by CNN. 2) A serpentine robot with a microphone array can estimate its posture by sound. It can also enhance a voice by Online Robust PCA. 3) A robot with a LiDAR and 32-channel microphone can visualize a sound map by superimposing sound source directions on point clouds.

DOI： 10.1299/jsmermd.2016.1a2-09b3

CiNii Research

J-GLOBAL

researchmap
非同期マイクロホンアレイを搭載した複数ロボットによる音環境マップの協調オンライン推定

関口航平, 坂東宜昭, 中村圭佑, 中臺一博, 糸山克寿, 吉井和佳

日本機械学会ロボティクス・メカトロニクス講演会 (ROBOMEC) 2016 1A2-09b5 2016年6月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本機械学会

DOI： 10.1299/jsmermd.2016.1A2-09b5

CiNii Research

J-GLOBAL

researchmap
合同研究会2015開催報告(研究会報告)

和泉潔, 中臺一博, 山川宏

人工知能:人工知能学会誌 31 ( 2 ) 299 - 304 2016年3月

　詳細を見る

記述言語：日本語出版者・発行元：社団法人人工知能学会

DOI： 10.11517/jjsai.31.2_299

CiNii Books

CiNii Research

researchmap
最先端研究ロボット聴覚オープンソースソフトウェアHARKの開発とその応用

中臺一博, 奥乃博, 水本武志, 中村圭佑

シミュレーション = Journal of the Japan Society for Simulation Technology 35 ( 1 ) 32 - 38 2016年3月

　詳細を見る

記述言語：日本語出版者・発行元：小宮山印刷工業

コレクション : 国立国会図書館デジタルコレクション > 電子書籍・電子雑誌 > 学術機関 > 学協会

CiNii Books

CiNii Research

researchmap
音源到来方向・時間差を用いた非同期複数マイクロホンアレイ位置のオンライン推定

関口航平, 中村圭佑, 坂東宜昭, 糸山克寿, 吉井和佳, 中臺一博

情報処理学会第78回全国大会 2016 ( 1 ) 483 - 484 2016年3月

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）

本稿では非同期複数マイクロホンアレイの同期ずれ・位置推定手法について述べる．マイクロホンアレイを搭載した複数台のロボットを用いた音源定位・分離などの音環境認識技術は，単独のロボットを用いた場合よりも高精度な処理を行うことができる．しかし，複数台のロボットを用いたマイクロホンアレイ信号処理には，各ロボットの位置，マイクロホンアレイ間の同期ずれの推定が不可欠である．本稿では各マイクロホンアレイごとに個別に推定した音源定位・位相情報をもとに，非同期複数マイクロホンアレイ間の同期ずれ・位置推定を行う．ロボットと音源の位置・同期ずれを潜在変数として持つ状態空間モデルを設計し，その事後分布をオンライン推定する．

CiNii Books

CiNii Research

researchmap
Robust Recognition of Simultaneous Speech By a Mobile Robot

Jean-Marc Valin, Shun'ichi Yamamoto, Jean Rouat, Francois Michaud, Kazuhiro Nakadai, Hiroshi G. Okuno

IEEE Transactions on Robotics, Vol. 23, No. 4, pp. 742-752, 2007 2016年2月

　詳細を見る

掲載種別：機関テクニカルレポート，技術報告書，プレプリント等

This paper describes a system that gives a mobile robot the ability to 
perform automatic speech recognition with simultaneous speakers. A microphone 
array is used along with a real-time implementation of Geometric Source 
Separation and a post-filter that gives a further reduction of interference 
from other sources. The post-filter is also used to estimate the reliability of 
spectral features and compute a missing feature mask. The mask is used in a 
missing feature theory-based speech recognition system to recognize the speech 
from simultaneous Japanese speakers in the context of a humanoid robot. 
Recognition rates are presented for three simultaneous speakers located at 2 
meters from the robot. The system was evaluated on a 200 word vocabulary at 
different azimuths between sources, ranging from 10 to 90 degrees. Compared to 
the use of the microphone array source separation alone, we demonstrate an 
average reduction in relative recognition error rate of 24% with the 
post-filter and of 42% when the missing features approach is combined with the 
post-filter. We demonstrate the effectiveness of our multi-source microphone 
array post-filter and the improvement it provides when used in conjunction with 
the missing features theory.

DOI： 10.1109/TRO.2007.900612

arXiv

researchmap
UAV搭載マイクアレイを用いた高雑音環境下における音イベント検出・識別の並列最適化

杉山治, 小島諒介, 中臺一博, 中臺一博

人工知能学会AIチャレンジ研究会(Web) 46th 32‐36 (WEB ONLY) 2016年

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
部分共有アーキテクチャを用いた深層学習ベースの音源同定の検討

森戸隆之, 杉山治, 小島諒介, 中臺一博, 中臺一博

人工知能学会AIチャレンジ研究会(Web) 46th 12‐17 (WEB ONLY) 2016年

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
深層学習による多チャネル音響信号に対する音源同定の検討

森戸隆之, 杉山治, 上村知史, 小島諒介, 中臺一博, 中臺一博

計測自動制御学会システムインテグレーション部門講演会(CD-ROM) 16th ROMBUNNO.2D1‐4 2015年12月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
HARK2.2の新機能とその組込み,SaaSへの展開

中臺一博, 中臺一博, 水本武志, 中村圭佑, 奥乃博

計測自動制御学会システムインテグレーション部門講演会(CD-ROM) 16th ROMBUNNO.2M2‐1 2015年12月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
ロバスト主成分分析を用いた動作雑音抑圧に基づく柔軟索状ロボットのための音声強調

坂東宜昭, 糸山克寿, 昆陽雅司, 田所諭, 中臺一博, 中臺一博, 吉井和佳, 奥乃博

日本ロボット学会学術講演会予稿集(CD-ROM) 33rd ROMBUNNO.2D2-05 2015年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
振幅スペクトルの相対誤差に基づくインパルス応答の自動切りだし法

中島弘史, 坂田直人, 加科優希, 中臺一博

回路とシステムワークショップ論文集 Workshop on Circuits and Systems 28 208 - 213 2015年8月

　詳細を見る

記述言語：日本語出版者・発行元：[電子情報通信学会]

CiNii Research

J-GLOBAL

researchmap
2マイクロホンを用いた線形ビームフォーミングによる風雑音の低減

坂田直人, 村上哲郎, 中島弘史, 中臺一博

回路とシステムワークショップ論文集 Workshop on Circuits and Systems 28 359 - 364 2015年8月

　詳細を見る

記述言語：日本語出版者・発行元：[電子情報通信学会]

CiNii Research

J-GLOBAL

researchmap
両耳聴ロボット聴覚ソフトウェアHARK‐BinauralとRaspberry Pi2を用いたヒューマノイドロボットへの適用

坂東宜昭, 金宜鉉, 糸山克寿, 吉井和佳, 中臺一博, 中臺一博, 奥乃博

情報処理学会研究報告(Web) 2015 ( MUS-107 ) VOL.2015-MUS-107,NO.33 (WEB ONLY) 2015年5月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
柔軟索状レスキューロボットのためのロバスト主成分分析を用いた走行雑音抑圧

坂東宜昭, 池宮由楽, 糸山克寿, 昆陽雅司, 田所諭, 中臺一博, 吉井和佳, 奥乃博

第77回全国大会講演論文集 2015 ( 1 ) 505 - 506 2015年3月

　詳細を見る

記述言語：日本語

本稿では，柔軟索状レスキューロボットのための走行雑音抑圧手法について述べる．人間の侵入が困難な災害現場（例：倒壊家屋）においては，被災者の声を手がかりにしたレスキューロボットによる捜索が有用である．柔軟索状レスキューロボットなどの地上走行型ロボットでは，自身の走行雑音によって被災者の声が聞き取りづらくなるうえ，走行雑音は接地面に依存するため，事前の予測が困難であった．本研究では，この問題を解決するため，繰り返し出現する周波数成分を事前情報を用いずに除去することができるロバスト主成分分析を用いて走行雑音抑圧を行う．実際にロボットを動作させて得られた録音データを用いた実験により，提案法を評価した．

CiNii Books

researchmap
柔軟索状レスキューロボットのためのロバスト主成分分析を用いた走行雑音抑圧

坂東宜昭, 池宮由楽, 糸山克寿, 昆陽雅司, 田所諭, 中臺一博, 吉井和佳, 奥乃博

情報処理学会全国大会講演論文集 77th ( 2 ) 2.505-2.506 2015年3月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
2チャンネル近接マイクロホンを用いた時間領域での風雑音低減 (信号処理)

坂田直人, 中島弘史, 中臺一博

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 114 ( 474 ) 1 - 6 2015年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

本報告では2チャンネルの近接マイクロホンを用いて線形ビームフォーミングによる風雑音の低減を行った.フレーム分割による周波数領域における線形ビームフォーミングをフレーム分割前の時間領域信号に適用し,フレーム分割による処理と風雑音の低減性能を比較した.風雑音の混入した収録信号に対し風雑音の低減処理を行った結果,SN比が2〜13dB改善された.フレーム処理の有無で風雑音の低減性能を比較した結果,単純な信号の遅延のみで構成されるフィルタについてはフレーム処理の有無が与える影響が大きいことが確認された.

CiNii Books

CiNii Research

researchmap
2チャンネル近接マイクロホンを用いた時間領域での風雑音低減 (音声)

坂田直人, 中島弘史, 中臺一博

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 114 ( 475 ) 1 - 6 2015年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

本報告では2チャンネルの近接マイクロホンを用いて線形ビームフォーミングによる風雑音の低減を行った.フレーム分割による周波数領域における線形ビームフォーミングをフレーム分割前の時間領域信号に適用し,フレーム分割による処理と風雑音の低減性能を比較した.風雑音の混入した収録信号に対し風雑音の低減処理を行った結果,SN比が2〜13dB改善された.フレーム処理の有無で風雑音の低減性能を比較した結果,単純な信号の遅延のみで構成されるフィルタについてはフレーム処理の有無が与える影響が大きいことが確認された.

CiNii Books

researchmap
2チャンネル近接マイクロホンを用いた時間領域での風雑音低減 (応用音響)

坂田直人, 中島弘史, 中臺一博

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 114 ( 473 ) 1 - 6 2015年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

本報告では2チャンネルの近接マイクロホンを用いて線形ビームフォーミングによる風雑音の低減を行った.フレーム分割による周波数領域における線形ビームフォーミングをフレーム分割前の時間領域信号に適用し,フレーム分割による処理と風雑音の低減性能を比較した.風雑音の混入した収録信号に対し風雑音の低減処理を行った結果,SN比が2〜13dB改善された.フレーム処理の有無で風雑音の低減性能を比較した結果,単純な信号の遅延のみで構成されるフィルタについてはフレーム処理の有無が与える影響が大きいことが確認された.

CiNii Books

researchmap
TeleCoBot : 発話環境を考慮したテレプレゼンスシステム (クラウドネットワークロボット)

高橋成明, 尾形正泰, 今井倫太, 中村圭佑, 中臺一博

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 114 ( 351 ) 1 - 5 2014年12月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

遠隔地とのコミュニケーションツールとしてテレプレゼンスロボットの研究が行われるようになった.しかし,騒音など音環境の相違を考慮していないため,発話者の音声が的確に伝わらない問題がある.また対話相手が複数人いる場合,状況に応じて発話者の音声を自由に変えたいという要望がある.こうした問題を解決するため,本研究では発話者の音声を雑音レベルや対話者との距離に応じて自動で調節し,かつ会話状況に応じて自由に音量を変更できる機能を提供するテレプレゼンスシステムTeleCoBotを提案する.また会話環境を用意し被験者にタスクを与えた検証実験を行った.結果として,ユーザは音量変更の機能を正しく使えなかったことが判明し,より効果的なUIを提供することが今後の課題となった.

CiNii Books

researchmap
Deep Neural Networkを用いたマルチモーダル音声認識

野田邦昭, 山口雄紀, 中臺一博, 奥乃博, 尾形哲也

日本ロボット学会学術講演会予稿集(CD-ROM) 32nd ROMBUNNO.1I1-04 2014年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
マイクロホンアレイを用いた駆動機構付ホース型ロボットの姿勢推定

坂東宜昭, 糸山克寿, 昆陽雅司, 田所諭, 中臺一博, 吉井和佳, 奥乃博

日本ロボット学会学術講演会予稿集(CD-ROM) 32nd ROMBUNNO.1I2-02 2014年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
HARKによって定位・分離された多方向音声のアノテーションツールの開発 (クラウドネットワークロボット)

杉山治, 糸山克寿, 中臺一博, 奥乃博

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 114 ( 85 ) 23 - 26 2014年6月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

本研究では、ロボット聴覚ソフトウェアHARKに基づいた多方向音声のアノテーションツールの開発について述べる。多方向の音声情報を視覚化し分かりやすく提示する既存研究は存在するが、提示された情報をラベル付けし、セマンティックにアノテーションするまでを一括して行うツールはまだ提案されていない。本研究では、HARKによって音源定位・分離された多方向音声をアノテーションするツールを開発し、アノテーションの負荷を軽減するためにSVMに基づく、自動補完機能を実装した。そして、被験者実験を通じて、その有効性を検証した。

CiNii Books

CiNii Research

researchmap
Deep Neural Networkを用いたマルチモーダル音声認識の為の特徴量学習

山口雄紀, 野田邦昭, 中臺一博, 奥乃博, 尾形哲也

第76回全国大会講演論文集 2014 ( 1 ) 465 - 466 2014年3月

　詳細を見る

記述言語：日本語

本研究の目標は，マルチモーダル音声認識の為の画像特徴量の設計である．マルチモーダル音声認識の精度向上のためには，唇画像からどのようにして音声認識の最小単位である音素や口形素を表現する情報を取り出すかが重要な課題である．本研究では，特徴量学習の新たな手法として注目を集めているDeep Neural Network (DNN)を用いて大量の唇画像から画像特徴量を自己組織的に抽出する手法を構築した．得られた画像特徴量を孤立単語認識タスクで検証するとともに特徴量空間を解析する事で口形素との関連についても考察した．また，得られた画像特徴量と音声を用いた視聴覚統合によるノイズ頑健性の向上について検証を行った．

CiNii Books

researchmap
マイクロホンアレイの位置推定によるホース型ロボットの姿勢推定

坂東宜昭, 大塚琢馬, 糸山克寿, 昆陽雅司, 田所諭, 中臺一博, 奥乃博

第76回全国大会講演論文集 2014 ( 1 ) 189 - 190 2014年3月

　詳細を見る

記述言語：日本語

ホース型ロボットは細長い形状が特徴のレスキューロボットで，倒壊した建築物の隙間などの探索が可能である．操縦の効率化のために加速度センサやカメラ画像などを用いた本ロボットの姿勢推定法が提案されてきたが，累積誤差が生じるなどの問題があった．本稿ではマイクロホンアレイと小型スピーカを本ロボットに装着し，音によるこれらの位置推定によって姿勢を推定する手法について述べる．本手法ではスピーカから発する試験音の各マイクへの到達時間差を用いて姿勢を推定するが，到達時間差は現在のマイクとスピーカの位置関係を表しており，過去の誤差を修正できる．実録音データを用いて本手法の有効性を評価した．

CiNii Books

researchmap
音ランドマークを用いたマルチコプターの定位

ラナシナパヤ, 中村圭佑, 中臺一博, 高橋秀幸, 木下哲男

第76回全国大会講演論文集 2014 ( 1 ) 185 - 186 2014年3月

　詳細を見る

記述言語：英語

We propose a novel approach to multicopter localization, using sound landmarks and one embedded microphone. This approach can benefit to multicopter localization in that it requires less computational power and smaller payloads than image-based approaches. However, the high ego-noise of multicopters is a serious threat for sound-based algorithms. We simulated a 2D localization method based on a Kalman Filter using measurements of acceleration and sound landmarks' intensity. A random walk model is used to update the multicopter's position with the Kalman Filter; the calculated estimation is then corrected using noisy measurements from the embedded microphone and accelerometer. Simulation results show that the proposed algorithm can successfully track the multicopter's motion in a noisy environment. We confirmed the effectiveness of our proposed algorithm by comparing its performance and robustness to a time/phase based algorithm.

CiNii Books

researchmap
DI-1-6 聴覚を中心としたロボットの環境認識技術(DI-1.社会課題を解決するためのパターン認識・メディア理解技術の進展,依頼シンポジウム,ソサイエティ企画)

中臺一博, 中村圭佑, 手塚太貴

電子情報通信学会総合大会講演論文集 2014 ( 2 ) "SS - 18"-"SS-19" 2014年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

CiNii Books

CiNii Research

researchmap
相関行列スケーリングを用いた屋外音源探索手法の解析

大畑琢磨, 長峰諒英, 中村圭佑, 石崎孝幸, 水本武志, 中臺一博, 中臺一博

人工知能学会AIチャレンジ研究会(Web) 41st 2014年

　詳細を見る

J-GLOBAL

researchmap
非同期分散マイクロホンアレイのオンラインキャリブレーションと伝達関数の推定(<小特集>マイクロホンアレイの新しい技術展開)

中臺一博, 中村圭佑

日本音響学会誌 70 ( 7 ) 397 - 402 2014年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本音響学会

DOI： 10.20697/jasj.70.7_397

CiNii Books

CiNii Research

researchmap
マイクロホンアレイとスピーカをもつ柔軟索状ロボットのための動的スピーカ選択による姿勢推定の高速化

坂東宜昭, 糸山克寿, 昆陽雅司, 田所諭, 中臺一博, 吉井和佳, 奥乃博

人工知能学会AIチャレンジ研究会(Web) 41st 8 (WEB ONLY) 2014年

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
TelePaBot : 複数のグループが同時に会話する環境に適したテレプレゼンスシステム (クラウドネットワークロボット)

小池京太郎, 今井倫太, 中村圭佑, 中臺一博

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 113 ( 372 ) 1 - 6 2013年12月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

医療現場など,遠隔地において移動・コミュニケーションが必要な状況下でテレプレゼンスロボットは有用なツールとして一部実用化も始まっている.しかし,複数のグループが同時に会話を行う環境では不要な音声まで聞こえてしまうなど,円滑な遠隔コミュニケーションの支援には依然難しい課題が残る.こうした課題を解決するために,本研究では,発話の位置を可視化し,指定した発話を選択聴取する機能を提供するテレプレゼンスシステム「TelePaBot」を提案する.提案したシステムを用いてケーススタディを行った結果,複数のグループが同時に会話する環境下でも,TelePaBotを使用することで,より円滑な遠隔コミュニケーションが実現できる可能性があることが示唆された.

CiNii Books

researchmap
雑音環境における最適音量のモデル化を利用した音量可視化テレプレゼンスシステム (クラウドネットワークロボット)

速水昭, 今井倫太, 中村圭祐, 中臺一博

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 113 ( 372 ) 35 - 40 2013年12月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

雑音が大きくなると,話者の音量もそれに応じて大きくなるロンバート効果(Lombard effect)という現象が存在する.遠隔コミュニケーションでは,ロンバート効果により,遠隔地の相手話者に対して必要以上に大きな声で話してしまう問題がある.本稿では,実環境下での移動型のテレプレゼンスロボットを介した遠隔コミュニケーションでの操作者の音量を自動で調節する際に必要となるモデルの設計および,モデルを搭載した最適音量調整システムLOMBOTを開発した.実験の結果,遠隔地の騒音に対して音量が適切に調節されていることを確認した.

CiNii Books

researchmap
クワドロコプタ搭載のマイクロホンアレイを用いた屋外音環境理解の逐次雑音推定による向上

奥谷啓太, 吉田尚水, 中村圭佑, 中臺一博

日本ロボット学会誌 31 ( 7 ) 676 - 683 2013年9月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本ロボット学会

This paper addresses sound source localization using an aerial vehicle with a microphone array in an outdoor environment to realize outdoor auditory scene analysis. It, for instance, aims at finding distressed people in a disaster situation. In such an environment, noise is quite loud and dynamically-changing, and conventional microphone array techniques studied in the field of indoor robot audition are of less use. We, thus, proposed MUltiple SIgnal Classification based on incremental Generalized EigenValue Decomposition (iGEVD-MUSIC). It can deal with dynamically-changing high power noise by introducing incrementally-estimated noise correlation matrices. We developed a prototype system for the outdoor auditory scene analysis based on the proposed method using the Parrot AR.Drone with an 8ch microphone array and a Kinect device. Experimental results using the prototype system showed that dynamically-changing noise is properly suppressed with the proposed method even when the signal-to-noise ratio is less than 0dB in an outdoor/indoor environment with the hovering/moving AR.Drone.

DOI： 10.7210/jrsj.31.676

CiNii Books

researchmap
Multirotor UAVを用いた音源定位のための雑音相関行列推定

古川孝太郎, 大塚琢馬, 糸山克寿, 中臺一博, 奥乃博

日本ロボット学会学術講演会予稿集(CD-ROM) 31st ROMBUNNO.3D3-02 2013年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
ホース型ロボットのマイクロホンアレイを用いた姿勢推定

坂東宜昭, 大塚琢馬, 水本武志, 糸山克寿, 中臺一博, 奥乃博

日本ロボット学会学術講演会予稿集(CD-ROM) 31st ROMBUNNO.3D3-01 2013年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
話者ダイアライゼーションシステムのための音声区間検出および到来方向推定の精度向上の検討

黄楊暘, 大塚琢馬, 中臺一博, 奥乃博

第75回全国大会講演論文集 2013 ( 1 ) 479 - 480 2013年3月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

ロボット聴覚では, いつ, どこで, 誰が話したかを解明する音環境理解機能が不可欠である. 本稿では, それらの問題を解決するために, 音声区間検出, 到来方向推定および話者同定技術を組み合わせた処理を話者ダイアライゼーションシステムとする. ロボット聴覚ソフトウエア HARK においては, MUSIC アルゴリズムを前処理として, 音声区間検出および到来方向推定を行っている. しかし, MUSIC スペクトルに基づいて処理を行う際に, 音源数パラメータおよび閾値パラメータが結果を大きく左右する. 本稿では, ブラインド音源分離を前処理とする話者ダイアライゼーションシステムを提案した. 音量閾値パラメータの設定は依然必要であるが, 精度向上したパフォーマンスが得られている.

CiNii Books

CiNii Research

researchmap
チューブ型ロボットの姿勢推定のためのEKF-SLAMを用いた可変マイクロホンアレイ位置推定

坂東宜昭, 水本武志, 中臺一博, 奥乃博

全国大会講演論文集 2013 ( 1 ) 439 - 441 2013年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

災害現場での被災者発見にはがれき内へ進入可能なチューブ型ロボットが有用である.さらにチューブ型ロボットに音源定位機能があれば被災者の声から位置の推定が可能となる.しかし,近年の高精度な音源定位手法は位置が既知のマイクアレイで収録した音声から方向を推定しているが,チューブ型ロボットではマイク配置を事前に計測できない.そこで本稿ではEKF-SLAMによるマイクロフォン位置推定手法提案し,常に変化するロボット姿勢の推定によって本問題を解決する.数値実験と実録音の両方を用いて本手法の有効性を確認した.

CiNii Books

CiNii Research

researchmap
チューブ型ロボットの姿勢推定のためのEKF-SLAMを用いた可変マイクロホンアレイ位置推定

坂東宜昭, 水本武志, 中臺一博, 奥乃博

第75回全国大会講演論文集 2013 ( 1 ) 439 - 440 2013年3月

　詳細を見る

記述言語：日本語

災害現場での被災者発見にはがれき内へ進入可能なチューブ型ロボットが有用である．さらにチューブ型ロボットに音源定位機能があれば被災者の声から位置の推定が可能となる．しかし，近年の高精度な音源定位手法は位置が既知のマイクアレイで収録した音声から方向を推定しているが，チューブ型ロボットではマイク配置を事前に計測できない．そこで本稿ではEKF-SLAMによるマイクロフォン位置推定手法提案し，常に変化するロボット姿勢の推定によって本問題を解決する．数値実験と実録音の両方を用いて本手法の有効性を確認した．

CiNii Books

CiNii Research

researchmap
クアドロコプターを用いた飛行雑音に頑健な音源定位

古川孝太郎, 奥谷啓太, 柳楽浩平, 大塚琢馬, 中臺一博, 奥乃博

第75回全国大会講演論文集 2013 ( 1 ) 489 - 490 2013年3月

　詳細を見る

記述言語：日本語

本研究は多数の回転翼を持つ小型の無人航空機, クアドロコプターにマイクロフォンアレイを搭載し, 周囲の環境における音源定位問題を取り扱う.通常, 飛行時には風圧やローターの駆動に起因する雑音が極めて大であり, 定位精度の劣化原因となり得る.このような雑音環境下では, 一般化固有値分解を用いた MUSIC 法により雑音相関行列を加味することで精度が改善することが知られている.そこで本研究は, 飛行に伴って動的に変化する雑音相関行列の推定へと問題を帰着する.その上で飛行制御などの機体のモニタ情報を用いた推定手法を提案し, 飛行雑音に頑健な音源定位手法を開発する.

CiNii Books

researchmap
ホースの伸び縮みによるマイク位置の変化を許容するマイクロホンアレイを用いたホース型ロボットの姿勢推定

坂東宜昭, 大塚琢馬, 糸山克寿, 中村圭佑, 昆陽雅司, 田所諭, 中臺一博, 奥乃博

人工知能学会AIチャレンジ研究会(Web) 38th 10 (WEB ONLY) 2013年

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
2P1-P24 グループ会話支援のための音源定位システムの開発(コミュニケーション・ロボット)

ムンソンウン, 高木健太郎, 釜島力, 中臺一博, 大武美保子

ロボティクス・メカトロニクス講演会講演概要集 2013 ( 0 ) _2P1 - P24_1-_2P1-P24_2 2013年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本機械学会

This paper presents a sound source localization system that composes a wireless microphone array named Jellyfish-02 and robot audition software HARK. Jellyfish-02 surpasses existing microphone array in design and usability, because it has a cover with rechargeable battery, which can be connected to wireless network. We evaluated sound source localization performance of Jellyfish-02, and investigated the percentage of speech overlapped periods in natural conversation. Prom the results, Jellyfish-02 is potentially applicable for assisting group conversation by measuring duration of speech for each participant.

CiNii Books

J-GLOBAL

researchmap
マイクロホンアレイを用いた複数人対話からの音声区間検出および話者方向推定の評価手法

黄楊暘, 大塚琢馬, 中臺一博, 奥乃博

日本ロボット学会学術講演会予稿集(CD-ROM) 30th ROMBUNNO.3D1-4 2012年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
混合音を聞き分けるセンシング技術

奥乃博, 中臺一博, 水本武志

電子情報通信学会誌 = The journal of the Institute of Electronics, Information and Communication Engineers 95 ( 5 ) 401 - 404 2012年5月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

私たちが日常耳にする音は複数の音や背景雑音が混じった混合音である.実世界で音情報を活用するためには「聞き分ける」機能が不可欠である.聞き分けるセンサ技術は,インストルメンテーション(装置化)という観点から音を収録するデバイス(センサ)と収録音に対する処理ソフトウェアから構成される.本稿では,混合音のセンサ技術の動向を,ロボット聴覚とカエルの合唱の観測について解説を行う.混合音を聞き分けるという立場から,音源定位,音源分離,分離音認識に取り組むべきであると考え,音環境理解という研究を過去15年進めてきた.離れて聞くという技術は,ロボットでは不可欠の技術であり,ロボット聴覚に不可欠な機能を統合的に提供するソフトウェアHARKを開発し,公開している.HARKの設計思想から具体的な実装まで概観し,その応用として,音環境可視化技術と人ロボット共生学への応用について報告する.また,カエルの合唱機構を音を聞き分けて解析する応用では,フィールドで聞こえる様々な音のために,音響処理だけでは難しいので,近傍の音を拾ってLEDを光らせる「カエルホタル」を開発した.カエルホタルを多数並べて実際の田んぼで観測し,カエルの鳴き方の観測実験についても合わせて報告する.以上の報告を通して,混合音を聞き分ける技術が,今後重要な技術になることを提案する.

CiNii Books

CiNii Research

researchmap
Kinectによる楽器マスキングを用いた視聴覚統合ビートトラッキング

糸原達彦, 水本武志, 大塚琢馬, 中臺一博, 尾形哲也, 奥乃博

第74回全国大会講演論文集 2012 ( 1 ) 355 - 356 2012年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

人のギター演奏を対象とした実時間のビートトラッキングでは，シンコペーションのようなビートパターンの複雑さや人の演奏におけるテンポ揺らぎに対応する必要がある．我々はこれまでに音響情報と相関の深い弾き手の軌道を用いた視聴覚統合ビートトラッキングを開発してきた.しかし, ギターと手は色が似ているため, 手の軌道追従及びビートトラッキングの性能は十分ではなかった.本稿では，視聴覚センサに加えて深度センサも持つKinectを用いて,距離による画像マスキングを行い，手の領域を抽出する.本手法により, 手の追従の頑健さが増し, ビートトラッキングの精度が向上することを示す.

CiNii Books

researchmap
Kinectによる楽器マスキングを用いた視聴覚統合ビートトラッキング

糸原達彦, 水本武志, 大塚琢馬, 中臺一博, 尾形哲也, 奥乃博

全国大会講演論文集 2012 ( 1 ) 355 - 357 2012年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

人のギター演奏を対象とした実時間のビートトラッキングでは,シンコペーションのようなビートパターンの複雑さや人の演奏におけるテンポ揺らぎに対応する必要がある.我々はこれまでに音響情報と相関の深い弾き手の軌道を用いた視聴覚統合ビートトラッキングを開発してきた.しかし, ギターと手は色が似ているため, 手の軌道追従及びビートトラッキングの性能は十分ではなかった.本稿では,視聴覚センサに加えて深度センサも持つKinectを用いて,距離による画像マスキングを行い,手の領域を抽出する.本手法により, 手の追従の頑健さが増し, ビートトラッキングの精度が向上することを示す.

CiNii Books

researchmap
多チャンネルマイクロホンアレイを用いた音声区間検出および音源定位の精度の向上の検討

HUANG Yangyang, 大塚琢馬, 中臺一博, 奥乃博

人工知能学会AIチャレンジ研究会(Web) 36th 5 (WEB ONLY) 2012年

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
ロボットのための実環境ロバストな実時間超解像三次元音源定位

中村圭佑, 中臺一博, 奥乃博

人工知能学会AIチャレンジ研究会(Web) 36th 2 (WEB ONLY) 2012年

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
遠隔ユーザの音環境理解を支援するユーザインタフェース

植田俊輔, 今井倫太, 中村圭佑, 中臺一博

人工知能学会全国大会論文集 2012 ( 0 ) 3K1R111 - 3K1R111 2012年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人人工知能学会

人間は雑音が多い環境下であってもある程度どこでどのような会話が行われているかを理解する事が出来るが，遠隔操作を行うロボットアバタでは遠隔操作者が遠隔地の音環境を理解する事は困難である．本稿では，雑音環境下でも操作者と遠隔地がインタラクションをスムーズに行うことを支援するユーザインタフェースUI-ALTを提案する．オフライン実験によりUI-ALTは遠隔操作者の雑音環境理解に有用であることが示された．

DOI： 10.11517/pjsai.jsai2012.0_3k1r111

CiNii Books

CiNii Research

researchmap
マルチモーダル情報統合によるインテリジェント人追跡システム

中村圭佑, 中臺一博, 浅野太, 中島弘史, G&ouml, khan Ince

計測自動制御学会論文集 48 ( 6 ) 349 - 358 2012年

　詳細を見る

記述言語：英語出版者・発行元：公益社団法人計測自動制御学会

Localization and tracking of humans are essential research topics in robotics. In particular, Sound Source Localization (SSL) has been of great interest. Despite the numerous reported methods, SSL in a real environment had mainly three issues; robustness against noise with high power, no framework for selective listening to sound sources, and tracking of inactive and/or noisy sound sources. For the first issue, we extended Multiple SIgnal Classification by incorporating Generalized Eigen Value Decomposition (GEVD-MUSIC) so that it can deal with high power noise and can select target sound sources. For the second issue, we proposed Sound Source Identification (SSI) based on hierarchical Gaussian mixture models and integrated it with GEVD-MUSIC to realize a function to listen to a specific sound source according to the sort of the sound source. For the third issue, auditory and visual human tracking were integrated using particle filtering. These three techniques are integrated into an intelligent human tracking system. Experimental results showed that integration of SSL and SSI successfully achieved human tracking only by audition, and the audio-visual integration showed considerable improvement in tracking by compensating the loss of auditory or visual information.

researchmap
対話行動認識プラットフォーム

塩見昌裕, 岩井儀雄, 角康之, 中壹一博, 萩田紀博

日本ロボット学会誌 29 ( 10 ) 883 - 886 2011年12月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本ロボット学会

DOI： 10.7210/jrsj.29.883

CiNii Books

researchmap
情報統合によるインテリジェント人追跡

中村圭佑, 中臺一博, Ince Gokhan

電子情報通信学会技術研究報告. CNR, クラウドネットワークロボット : IEICE technical report 111 ( 32 ) 35 - 40 2011年5月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

情報統合は,ロボットにおけるロバストな環境理解を実現するための重要な技術であり,このためには,統合のスケーラビリティ,各処理のリユーザビリティを向上するという観点からミドルウェアの導入が不可欠である.本稿では,音源定位と音源同定を提供するロボット聴覚処理,および熱画像カメラと距離画像カメラを組み合わせた人検出処理を統合したインテリジェントでかつロバストな人追跡を実現することを目指し,聴覚,視覚のモダリティ内・モダリティ間情報統合手法を提案する.また,情報統合を行うためのソフトウェアアーキテクチャについて,データフロー指向のミドルウェアFlowDesignerとイベント駆動ベースのミドルウェアROSを用いてHARKを透過的に組み合わせる方式を提案する.提案手法に基づき構築したロボットシステムを通じて,各機能の実環境ロバスト性や実時間動作の検証を行い,その有効性を示す.

CiNii Books

CiNii Research

researchmap
ロボット聴覚用オープンソースソフトウェア HARKの展開

中臺一博, 奥乃博

デジタルプラクティス 2 ( 2 ) 133 - 140 2011年4月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

ロボット聴覚用のオープンソースソフトウェアとして研究開発を行っているHARK (HRI-JP Audition for Robots with Kyoto Univ.) の展開について説明する．HARK は複数のマイクロフォン（マイクロフォンアレイ）からの入力をもとに，音源定位，音源分離，さらに分離音声の認識までをサポートするソフトウェアであり，GUIプログラミング環境上で様々なモジュールを配置・接続することにより，形状やマイクロフォンレイアウトが異なるロボットに対応させたり，用途に合わせたロボット聴覚システムを構築したりすることができる．本稿では，HARK の設計指針を解説し，HARKを用いて構築したシステムの応用例，HARKの展開も併せて報告する．

CiNii Books

CiNii Research

researchmap
累積頻度重みを適用したパーティクルフィルタによる実時間楽譜追従

大塚琢馬, 中臺一博, 高橋徹, 尾形哲也, 奥乃博

第73回全国大会講演論文集 2011 ( 1 ) 305 - 306 2011年3月

　詳細を見る

記述言語：日本語

パーティクルフィルタによる楽譜追従は，音響信号と楽譜との距離に基づくパーティクル重みの計算によって追従性能が大きく左右される．従来のベクトル内積計算やシグモイド関数を用いた重み計算手法では，音響信号の非調波成分や楽器の音色のバリエーションにより，楽譜位置推定が正しい場合，誤った場合でそれぞれの重みに大きな差が生じず，最終的に推定された楽譜位置に誤差が含まれるという問題点があった．本稿では，過去に計算された距離の累積頻度から重みを動的に計算し，正しい楽譜位置ではより高い重みを計算する．評価実験では，累積頻度を用いた重み計算法が，従来の重み計算法よりも楽譜追従精度で改善することが確認された．

CiNii Books

researchmap
Audio-visual musical instrument recognition

AngelicaLim, 中村圭佑, 中臺一博, 尾形哲也, 奥乃博

第73回全国大会講演論文集 2011 ( 1 ) 309 - 310 2011年3月

　詳細を見る

記述言語：英語

Is this person playing a violin or a flute? Classification of musical instrument performances is usually carried out using audio features such as spectral coefficients. We propose augmenting the typical audio feature set with visual features. We show that a combination of audio features and video perform better than audio alone, and verify this multimodal recognition approach on a real-time robot platform.

CiNii Books

researchmap
多数の人の声を一度に聞き分ける聴覚技術 : 聖徳太子ロボットを目指して

奥乃博, 中臺一博

電気学会誌 = The journal of the Institute of Electrical Engineers of Japan 131 ( 3 ) 159 - 163 2011年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電気学会

本記事に「抄録」はありません。

DOI： 10.1541/ieejjournal.131.159

CiNii Books

CiNii Research

researchmap
ロボット聴覚 : 高雑音下でのハンズフリー音声認識

中臺一博, 奥乃博

電子情報通信学会技術研究報告. SP, 音声 110 ( 401 ) 7 - 12 2011年1月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

我々が取り組んでいるロボット聴覚研究について,その位置づけや意義を解説し,これを実現するための高雑音下ハンズフリー音声認識へも適用可能な技術としてマイクロホンアレイを用いた動的環境下の実時間音源分離とその音声認識への適用について紹介する.紹介する技術は,ロボット聴覚ソフトウェアHARKとしてオープンソースで公開を行っている.そこで,これらの技術の有効性を,実際のロボットへのHARKの適用事例を通じて示す.

CiNii Books

CiNii Research

researchmap
マルチロボットによるKinectを用いた同期合奏

糸原達彦, 水本武志, LIM Angelica, 大塚琢馬, 中村圭佑, 長谷川雄二, 中臺一博, 尾形哲也, 奥乃博

人工知能学会AIチャレンジ研究会(Web) 34th B102-10 (WEB ONLY) 2011年

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
音源定位手法MUSICのベイズ拡張

大塚琢馬, 中臺一博, 尾形哲也, 奥乃博

人工知能学会AIチャレンジ研究会(Web) 34th B102-6 (WEB ONLY) 2011年

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
AI-1-3 ロボット聴覚オープンソースソフトウエアHARK(AI-1.マルチモーダル信号処理とその応用,依頼シンポジウム,ソサイエティ企画)

奥乃博, 中臺一博, 高橋徹

電子情報通信学会ソサイエティ大会講演論文集 2010 "SS - 72"-"SS-73" 2010年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

CiNii Books

CiNii Research

researchmap
ロボット聴覚ソフトウエアHARKとそのロボットへの適用

高橋徹, 中臺一博, 奥乃博

電気関係学会東海支部連合大会講演論文集(CD-ROM) 2010 ROMBUNNO.S3-1 2010年8月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
室内マイクロホンアレイを用いた実時間発話方向推定

春原卓也, 中島弘史, 中臺一博, 金田豊

電子情報通信学会技術研究報告. EA, 応用音響 110 ( 131 ) 19 - 24 2010年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

本稿では,大規模マイクロホンアレイを用いた発話方向推定について報告する.筆者らは,先に音源の指向特性に基づいたビームフォーミング法を提案し,スピーカや人の発話方向推定について報告した.さらに,振幅成分の抽出,発話区間検出,周波数マスク,ヒストグラムの4つの改良手法を加えることで,高精度な推定が可能となることを示した.その後,実時間で方向推定が可能なシステムについて報告したが,計算量の制限などにより推定精度が低く,その主原因も不明確であった.本稿では,実時間システムの精度の低い原因を調査し,それをもとに改良を行った実時間システムを提案した.評価実験から,従来の実時間システムよりも実時間性,推定精度に優れていることを示した.

CiNii Books

CiNii Research

researchmap
Score Following by Particle Filtering for Music Robots

OTSUKA Takuma, NAKADAI Kazuhiro, TAKAHASHI Toru, KOMATANI Kazunori, OGATA Tetsuya, OKUNO Hiroshi G

全国大会講演論文集 72 ( 0 ) 913 - 914 2010年3月

　詳細を見る

記述言語：英語

CiNii Books

researchmap
実環境音声認識のためのロボット聴覚システム開発とパラメータチューニング

高橋徹, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博

全国大会講演論文集 72 ( 0 ) 29 - 30 2010年3月

　詳細を見る

記述言語：日本語

CiNii Books

researchmap
ロボット音声対話におけるSemi-blind ICAを用いた自己発話キャンセル

武田龍, 中臺一博, 高橋徹, 駒谷和範, 尾形哲也, 奥乃博

全国大会講演論文集 72 ( 0 ) 27 - 28 2010年3月

　詳細を見る

記述言語：日本語

CiNii Books

researchmap
ロボット聴覚オープンソースソフトウエア HARK

奥乃博, 中臺一博

日本ロボット学会誌(Journal of the Robotics Society of Japan) 28 ( 1 ) 6 - 9 2010年1月

　詳細を見る

記述言語：日本語出版者・発行元：日本ロボット学会

DOI： 10.7210/jrsj.28.6

CiNii Books

CiNii Research

researchmap
「ロボット聴覚」特集について

中臺一博, 宮下敬宏, 奥乃博

日本ロボット学会誌(Journal of the Robotics Society of Japan) 28 ( 1 ) 1 - 1 2010年1月

　詳細を見る

記述言語：日本語出版者・発行元：日本ロボット学会

CiNii Books

CiNii Research

researchmap
「ロボット聴覚」特集について

中臺一博, 宮下敬宏, 奥乃博

日本ロボット学会誌 28 ( 1 ) 1 - 1 2010年1月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本ロボット学会

DOI： 10.7210/jrsj.28.1

CiNii Books

CiNii Research

researchmap
ロボット聴覚オープンソースソフトウエアHARK

奥乃博, 中臺一博

日本ロボット学会誌 28 ( 1 ) 6 - 9 2010年1月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本ロボット学会

DOI： 10.7210/jrsj.28.6

CiNii Books

researchmap
リサンプル‐ブロック処理と並列化に基づくICAの実時間実装

武田龍, 中臺一博, 高橋徹, 尾形哲也, 奥乃博

日本ロボット学会学術講演会予稿集(CD-ROM) 28th ROMBUNNO.1H3-1 2010年

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
打楽器とロボットとの合奏のための結合振動子モデルに基づく打撃時刻予測

水本武志, 中臺一博, 大塚琢馬, 高橋徹, 尾形哲也, 奥乃博

日本ロボット学会学術講演会予稿集(CD-ROM) 28th ROMBUNNO.1H3-2 2010年

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
多段処理によるブラインド残響抑圧処理の性能向上 (応用音響)

中島弘史, 醍醐徹, 中臺一博, 金田豊, 長谷川雄二

電子情報通信学会技術研究報告 109 ( 136 ) 7 - 12 2009年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

本研究では,多入力の残響抑圧処理を1つの処理モジュールと考え,入力チャネルの異なる複数の処理モジュールを多段接続することで高い残響抑圧性能を実現する処理(多段処理)を提案する.今回,残響抑圧処理モジュールとしては,セミブラインドMINT法と適応無相関化逆フィルタの2つを利用した.多段処理の性能は,各モジュールの入力チャネルの組み合わせにより変化する.このため高い性能を実現するための予備的処理として,チャネル選択処理および遅延付加処理についても提案する.8チャネルのマイクアレイによる収録信号を用いた実験により各処理を評価した結果,以下の3つの知見を得た.(1)チャネル選択処理:選択チャネルの違いで抑圧性能に3-10dBの差が発生.適切なチャネル選択により残響抑圧性能を低下させることなくチャネル数の削減が可能(2)遅延付加処理:遅延付加は,特に遅延付加前の性能が低い場合に有効で,2-6dBの性能向上が可能.(3)多段処理:全チャネルを用いた1回の処理の残響抑圧性能がセミブラインドMINT法で14.6dB,適応無相関化逆フィルタで3.5dBであるのに対し,多段処理ではそれぞれ18.2dB(+4.2dB)および13.6dB(+10.1dB)となり,提案法が残響抑圧性能を向上させる手法として有効であることを確認した.

CiNii Books

researchmap
多段処理によるブラインド残響抑圧処理の性能向上

中島弘史, 醍醐徹, 中臺一博, 金田豊, 長谷川雄二

電子情報通信学会技術研究報告. EA, 応用音響 109 ( 136 ) 7 - 12 2009年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

本研究では,多入力の残響抑圧処理を1つの処理モジュールと考え,入力チャネルの異なる複数の処理モジュールを多段接続することで高い残響抑圧性能を実現する処理(多段処理)を提案する.今回,残響抑圧処理モジュールとしては,セミブラインドMINT法と適応無相関化逆フィルタの2つを利用した.多段処理の性能は,各モジュールの入力チャネルの組み合わせにより変化する.このため高い性能を実現するための予備的処理として,チャネル選択処理および遅延付加処理についても提案する.8チャネルのマイクアレイによる収録信号を用いた実験により各処理を評価した結果,以下の3つの知見を得た.(1)チャネル選択処理:選択チャネルの違いで抑圧性能に3-10dBの差が発生.適切なチャネル選択により残響抑圧性能を低下させることなくチャネル数の削減が可能(2)遅延付加処理:遅延付加は,特に遅延付加前の性能が低い場合に有効で,2-6dBの性能向上が可能.(3)多段処理:全チャネルを用いた1回の処理の残響抑圧性能がセミブラインドMINT法で14.6dB,適応無相関化逆フィルタで3.5dBであるのに対し,多段処理ではそれぞれ18.2dB(+4.2dB)および13.6dB(+10.1dB)となり,提案法が残響抑圧性能を向上させる手法として有効であることを確認した.

CiNii Books

CiNii Research

researchmap
波動音響シミュレータによる指向性の精度検証

鈴木淑正, 中島弘史, 中臺一博

聴覚研究会資料 39 ( 4 ) 325 - 330 2009年6月

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会聴覚研究委員会

CiNii Books

CiNii Research

researchmap
波動音響シミュレータによる指向性の精度検証

鈴木淑正, 中島弘史, 中臺一博, 荒井隆行, 長谷川雄二

電子情報通信学会技術研究報告. EA, 応用音響 109 ( 100 ) 109 - 114 2009年6月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

近年、コンピュータの性能向上によって、波動音響理論に基づいた数値シミュレーション(波動音響シミュレーション)が実用的な時間で利用可能になってきた。波動音響シミュレーションは、自由音場などの理想的環境下では、高精度なシミュレーションが報告されている。しかし、実環境の高精度なシミュレーションは非常に困難であり様々な課題がある。その中のひとつとして、多くのシミュレータでは音源を点音源として扱うため、指向性を持つスピーカーなどの音源は高精度に再現できないという課題がある。指向性音源を再現する研究はいくつか報告例があるが、高精度かつ実用的なものは少ない。指向性の再現には、正確な音の伝播が必要となるが、空間を格子上に離散化させる差分法においては、音源から等距離でも伝播方向によっては、数値分散の影響が異なるため計算誤差が生じる。本研究では差分法を用いて、まず、自由音場での無指向性点音源を対象とした精度検証を行った。次に、その応用として指向性を有するスピーカ音源を対象とし、模擬スピーカーモデルを点音源に付加するという比較的簡単なモデル化で、指向性音源をシミュレーションできることを示す。

CiNii Books

researchmap
ソフトマスクと音響モデル適応を用いた3話者同時発話音声認識

高橋徹, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博

全国大会講演論文集 71 ( 0 ) 35 - 36 2009年3月

　詳細を見る

記述言語：日本語

CiNii Books

researchmap
歌唱ロボットのためのビート情報とメロディ・ハーモニー情報の統合による音楽音響信号と楽譜の実時間同期手法の開発

大塚琢馬, 村田和真, 武田龍, 中臺一博, 高橋徹, 尾形哲也, 奥乃博

全国大会講演論文集 71 ( 0 ) 243 - 244 2009年3月

　詳細を見る

記述言語：日本語

CiNii Books

researchmap
人と共存するロボットシステムの展望

中臺一博, 長谷川雄二, 関口達彦, 辻野広司

日本ロボット学会誌 27 ( 1 ) 6 - 9 2009年1月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本ロボット学会

DOI： 10.7210/jrsj.27.6

CiNii Books

researchmap
パネル討論：アプリケーション開発における音声認識

西村竜一, 中野鐵兵, 栗原一貴, 中臺一博, 吉野孝

情報処理学会研究報告音声言語情報処理（SLP） 2008 ( 102 ) 55 - 60 2008年10月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

本パネルディスカッションでは、音声認識アプリケーションの開発事例の紹介、アプリ開発に向き合うための提言を関連研究者の方々にお願いした。音声認識アプリケーションの開発を促すことを目的とする。To induce developments of ASR applications, this panel discussion introduces actual case studies. We also indicate some problems of ASR application developments.

CiNii Books

researchmap
独立成分分析を応用したロボット聴覚による残響下におけるバージイン発話認識

武田龍, 中臺一博, 高橋徹, 駒谷和範, 尾形哲也, 奥乃博

日本ロボット学会学術講演会予稿集(CD-ROM) 26th ROMBUNNO.1A2-02 2008年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
人・ロボットインタラクションに向けたビートトラッキングロボットの開発とその評価

村田和真, 中臺一博, 武田龍, 吉井和佳, 奥乃博, 鳥井豊隆, 長谷川雄二, 辻野広司

日本ロボット学会学術講演会予稿集(CD-ROM) 26th ROMBUNNO.1A1-03 2008年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
ロボット聴覚のためのソフトマスク生成法による周辺話者音声認識率の改善

高橋徹, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博

日本ロボット学会学術講演会予稿集(CD-ROM) 26th ROMBUNNO.1A1-01 2008年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
ミッシングフィーチャ理論に基づく複数話者同時発話音声認識における音響特徴量とマスクの検討

高橋徹, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博

日本音響学会研究発表会講演論文集(CD-ROM) 2008 ROMBUNNO.2-P-16 2008年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
大規模マイクロホンアレイによる発話方向推定の検討

菊池慶子, 醍醐徹, 中島弘史, 中臺一博, 長谷川雄二, 金田豊

電子情報通信学会技術研究報告. EA, 応用音響 108 ( 143 ) 13 - 18 2008年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

本稿では,大規模マイクロホンアレイを用いた発話方向推定について報告する.筆者らは,先に音源の指向特性に基づいたビームフォーミング法を提案し,スピーカや人の発話方向推定について報告した.しかし,この手法において,ビームフォーマーの設計に用いる伝達関数は,対象となる音源の伝達関数を用いないと,性能が劣化するという問題点があった.また,発話区間の検出(VAD)も手動で行われているという問題点があった.前者の問題は異なる音源の伝達関数の位相差が主な原因と考えて,振幅伝達特性のみを利用したヒストグラムによる発話方向推定手法を提案した.後者については,非発話区間など信頼できない時間周波数特徴量のみを自動的にマスクするために,内積値に基づく音声周波数成分検出と自己相関を利用した発話区間検出を導入した.評価実験を通じて,スピーカの伝達関数を用いた場合でも,提案手法により人間の発話方向推定性能が大きく向上することを示した.

CiNii Books

researchmap
ロボット音声対話のためのMFTとICAによるバージイン許容機能の評価

武田龍, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博

全国大会講演論文集 70 ( 0 ) 135 - 136 2008年3月

　詳細を見る

記述言語：日本語

CiNii Books

researchmap
1P1-G13 ロボット聴覚用オープンソースソフトウェアHARKの概要(コミュニケーション・ロボット)

中臺一博, 山本俊一, 奥乃博, 中島弘史, 長谷川雄二, 辻野広司

ロボティクス・メカトロニクス講演会講演概要集 2008 ( 0 ) _1P1 - G13_1-_1P1-G13_4 2008年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本機械学会

This paper describes an open source software system for robot audition called HARK (Honda Research Institute Japan Audition for Robots with Kyoto University). HARK consists of a lot of modules including multi-channel audio input, sound source localization, sound source tracking, sound source separation and recognition of separated speech for robot audition based on the data-flow oriented software programming environment, FlowDesigner. By combining these modules using a GUI environment, a user can easily build a robot audition system for various types of robots and acoustic environments. Through HARK applications to Honda ASIMO and Robovie with different microphone settings, we showed high software portability and reusability of HARK.

CiNii Books

CiNii Research

J-GLOBAL

researchmap
ビートトラッキングロボットの構築と評価

村田和真, 中臺一博, 武田龍, 奥乃博, 長谷川雄二, 辻野広司

人工知能学会AIチャレンジ研究会 28th 13 - 20 2008年

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
E-052 バージインを許容するロボット音声対話のためのICAを用いたセミブラインド音源分離(E分野:自然言語・音声・音楽)

武田龍, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博

情報科学技術フォーラム一般講演論文集 6 ( 2 ) 261 - 262 2007年8月

　詳細を見る

記述言語：日本語出版者・発行元：FIT(電子情報通信学会・情報処理学会)運営委員会

CiNii Books

researchmap
適応ステップサイズパラメータ法による高性能ブラインド音源分離

中島弘史, 中臺一博, 長谷川雄二, 辻野広司

電子情報通信学会技術研究報告. EA, 応用音響 107 ( 120 ) 19 - 24 2007年6月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

本論文では,様々なブラインド音源分離(BSS)に利用可能なステップサイズパラメータの適応調整法を提案する。ステップサイズパラメータは,分離の度合いや周波数によって最適値が異なるものであるが,ほとんどの報告例で,実験的に定めた固定値を利用している。提案法は,多次元のニュートン法に基づく最適値をステップサイズパラメータとして利用することで,適応型のBSSに対し高い収束性と分離度を実現する。提案法の有効性を確認するため,ロボットの頭部に埋め込んだマイクロホンアレイを利用して音源分離の実験を行った。その結果,提案法がさまざまな種類のBSSについて利用でき,高い分離性能が得られる事を確認した。

CiNii Books

CiNii Research

researchmap
マルチドメイン音声対話システムにおける対話履歴を利用したドメイン選択

神田直之, 駒谷和範, 中野幹生, 中臺一博, 辻野広司, 尾形哲也, 奥乃博

情報処理学会論文誌 48 ( 5 ) 1980 - 1989 2007年5月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

複数のドメインを扱う音声対話システムにおいて対話履歴から得られる特徴量を導入してより精度良くドメイン選択を行う手法を開発した.本研究ではドメイン選択問題を応答すべきドメインが (I)1つ前の応答を行ったドメイン (II)音声認識結果に対する最尤のドメイン (III)それ以外のドメインのいずれかという判別問題ととらえる.対話履歴から得られる特徴量を用いて上記を判別する決定木をドメイン選択の正解を与えた対話データから学習しドメイン選択器を構成した.5ドメインのマルチドメイン音声対話システムを実装しこれを用いて10名の被験者から対話データを収集した.この対話データを用いた評価実験の結果音声認識尤度に基づく従来のドメイン選択手法に比べドメイン選択誤りが16.2%削減されることを確認した.We have developed a robust domain selection method using dialogue history in multi-domain spoken dialogue systems. We define domain selection as a classifying problem among (I) the domain in the previous turn, (II) the domain in which N-best speech recognition results can be accepted with the highest recognition score, (III) other domains. We constructed a classifier by decision tree learning with dialogue data. We implemented a multi-domain spoken dialogue system with 5 domains, and collected dialogue data from 10 sub jects. The experimental result showed our method reduced 16.2% of domain selection errors, compared with a conventional method using speech recognition likelihoods only.

CiNii Research

J-GLOBAL

researchmap
AS-6-1 マイクロホンアレイ統合によるロバストな音響ストリーム生成と移動人物追跡(AS-6.実環境における高品質収音のための音声信号処理,シンポジウム)

中臺一博, 中島弘史, 村瀬昌満, 奥乃博, 長谷川雄二, 辻野広司

電子情報通信学会総合大会講演論文集 2007 "S - 65"-"S-66" 2007年3月

　詳細を見る

記述言語：英語出版者・発行元：一般社団法人電子情報通信学会

CiNii Books

researchmap
音を視覚化する録音再生システム

吉田雅敏, 海尻聡, 山本俊一, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博

情報処理学会全国大会講演論文集 69th ( 2 ) 2.577-2.578 2007年3月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
口じゃんけん判定ロボットの開発~ロボット聴覚システムの応用に向けて~

中臺一博, 山本俊一, 奥乃博, 中島弘史, 長谷川雄二, 辻野広司

人工知能学会AIチャレンジ研究会 26th 59 - 64 2007年

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
自然な人・ロボット音声インタラクションに向けたロボット聴覚システムの構築

中臺一博, 山本俊一, 浅野太

人工知能学会全国大会論文集 21 1 - 4 2007年

　詳細を見る

記述言語：日本語出版者・発行元：人工知能学会

CiNii Books

researchmap
人・ロボット音声インタラクションのための情報統合に向けて

中臺一博

電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 106 ( 298 ) 19 - 26 2006年10月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

自然な人・ロボット音声インタラクションを実現する上で聴覚機能を通じ,ロボット周囲の環境を把握する「実環境音環境理解」,ロボットがユーザに対して適切でわかりやすく情報を伝達する「表出」は重要な機能であろう.こうした機能をロバストに実現する上で,筆者が鍵となると考えている「情報統合」アプローチについて述べる.また,このアプローチに基づく研究例として,実環境音環境理解に関しては,ミッシングフィーチャ理論による音源分離と音声認識の統合,マイクロホンアレイ統合による音源追跡のロバスト性の向上について,表出に関しては,韻律情報と頭部色を用いたマルチモーダル表出,指向性スピーカを用いた新しい発話機能の導入に関して紹介する.

researchmap
人・ロボット音声インタラクションのための情報統合に向けて

中臺一博

電子情報通信学会技術研究報告. TL, 思考と言語 106 ( 296 ) 19 - 26 2006年10月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

自然な人・ロボット音声インタラクションを実現する上で聴覚機能を通じ,ロボット周囲の環境を把握する「実環境音環境理解」,ロボットがユーザに対して適切でわかりやすく情報を伝達する「表出」は重要な機能であろう.こうした機能をロバストに実現する上で,筆者が鍵となると考えている「情報統合」アプローチについて述べる.また,このアプローチに基づく研究例として,実環境音環境理解に関しては,ミッシングフィーチャ理論による音源分離と音声認識の統合,マイクロホンアレイ統合による音源追跡のロバスト性の向上について,表出に関しては,韻律情報と頭部色を用いたマルチモーダル表出,指向性スピーカを用いた新しい発話機能の導入に関して紹介する.

CiNii Books

CiNii Research

researchmap
人・ロボット音声インタラクションのための情報統合に向けて

中臺一博

電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 106 ( 300 ) 37 - 44 2006年10月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

自然な人・ロボット音声インタラクションを実現する上で聴覚機能を通じ,ロボット周囲の環境を把握する「実環境音環境理解」,ロボットがユーザに対して適切でわかりやすく情報を伝達する「表出」は重要な機能であろう.こうした機能をロバストに実現する上で,筆者が鍵となると考えている「情報統合」アプローチについて述べる.また,このアプローチに基づく研究例として,実環境音環境理解に関しては,ミッシングフィーチャ理論による音源分離と音声認識の統合,マイクロホンアレイ統合による音源追跡のロバスト性の向上について,表出に関しては,韻律情報と頭部色を用いたマルチモーダル表出,指向性スピーカを用いた新しい発話機能の導入に関して紹介する.

CiNii Books

CiNii Research

researchmap
パラメータ最適化による実環境同時発話認識向上とそのオンライン処理の実装

山本俊一, 中臺一博, 中野幹生, 辻野広司, VALIN Jean‐Marc, 駒谷和範, 尾形哲也, 奥乃博

日本ロボット学会学術講演会予稿集(CD-ROM) 24th 1B12 2006年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
D-14-10 有向性音素グルーピングを用いた音声認識におけるロバスト性向上の検討(D-14.音声・聴覚,一般講演)

隅谷亮太, 中臺一博, 中野幹生, 市毛弘一, 廣瀬靖雄, 辻野広司

電子情報通信学会総合大会講演論文集 2006 ( 1 ) 134 - 134 2006年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

CiNii Books

researchmap
パーティクルフィルタによる音源追跡の性能評価

村瀬昌満, 中台一博, 奥乃博

情報処理学会全国大会講演論文集 68th ( 2 ) 345 - 346 2006年3月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
複数ドメイン音声対話システムにおける対話履歴を利用したドメイン選択の高精度化

神田直之, 駒谷和範, 中野幹生, 中台一博, 辻野広司, 尾形哲也, 奥乃博

情報処理学会全国大会講演論文集 68th ( 2 ) 329 - 330 2006年3月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
GAによる話者位置への同時発話認識システムの最適化

山本俊一, 中台一博, 中野幹生, 辻野広司, VALIN Jean‐Marc, 武田龍, 駒谷和範, 尾形哲也, 奥乃博

情報処理学会全国大会講演論文集 68th ( 2 ) 5 - 6 2006年3月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
複数ドメイン音声対話システムにおける対話履歴を利用したドメイン選択の高精度化

神田直之, 駒谷和範, 中野幹生, 中臺一博, 辻野広司, 尾形哲也, 奥乃博

情報処理学会研究報告音声言語情報処理（SLP） 2006 ( 12 ) 55 - 60 2006年2月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

複数のドメインを扱う音声対話システムにおいて，対話の文脈や進行に関する特徴量を導入してより精度よくドメイン選択を行う手法を開発したので報告する．本稿ではドメイン選択問題を，応答すべきドメインが，(I)ひとつ前の応答を行ったドメイン，(II)音声認識結果に対する最尤のドメイン，(III)それ以外のいずれかのドメイン，のどれに該当するかを判別する問題と捉える．ドメイン選択の正解を与えた対話データから，対話の文脈や進行に関する特徴量を用いて上記を判別する決定木を学習することにより，ドメイン選択器を構成した．5ドメインのマルチドメイン音声対話システムを用いた10名の被験者による評価実験の結果，音声認識尤度に基づく従来のドメイン選択手法に比べ，ドメイン選択誤りが11.6%削減された．We have developed a robust domain selection method using dialogue history in multi-domain spoken dialogue systems. We define domain selection as classifying problem among (I) the domain in the previous turn, (II) the domain in which N-best speech recognition results can be accepted with the highest recognition score, (III) other domains. We constructed a classifier by decision tree learning with dialogue corpus. The experimental result using 10 subjects shows that our method could reduced 11.6% domain selection error, compared with a conventional method using speech recognition likelihoods only.

CiNii Books

researchmap
HRI-JPにおけるヒューマン-ロボットインタラクション研究

辻野広司, 中野幹生, 中臺一博, 長谷川雄二

電子情報通信学会技術研究報告. SIS, スマートインフォメディアシステム 105 ( 426 ) 31 - 36 2005年11月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

コンピュータの発達により高機能化した機械が家庭に入ってくるようになり, 「誰でも使える機械と人とのインターフェース」がますます重要になってきている.そのような機械のひとつの究極であるインテリジェントロボットにおいては, さらに進んだインターフェースの概念や価値観の研究が進められつつある.我々は未来のインテリジェントロボットに求められるインターフェースとして, 人とロボットの関係が双方向であることを前提にした「ヒューマン-ロボットインタラクション」という機能実現を目指し, 研究を進めている.このような観点に基づき, 「ヒューマン-ロボットインタラクションのためのアーキテクチャ」「ロボットによる人の音声の認識」, 「人によるロボットの音声の認識」に関し報告する.

CiNii Books

researchmap
複数のカルマンフィルタを用いた複数移動話者追跡と精度評価

村瀬昌満, 山本俊一, VALIN Jean‐Marc, 中台一博, 山田健太郎, 駒谷和範, 尾形哲也, 奥乃博

日本ロボット学会学術講演会予稿集(CD-ROM) 23rd 3C26 2005年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
ヒューマノイドを対象としたミッシングフィーチャー理論による分離音の連続音声認識の向上

山本俊一, VALIN Jean‐Marc, 中台一博, 中野幹生, 辻野広司, 駒谷和範, 尾形哲也, 奥乃博

日本ロボット学会学術講演会予稿集(CD-ROM) 23rd 3C35 2005年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
聖徳太子ロボット―視聴覚統合によるロボット聴覚―

奥乃博, 中台一博

画像センシングシンポジウム講演論文集 11th 87 - 92 2005年6月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
動的リコンフィギャラブルデバイスDRPを用いた音源分離フィルタの実装と評価

黒瀧俊輔, 鈴木紀章, 中臺一博, 奥乃博, 天野英晴

電子情報通信学会技術研究報告 105 ( 43 ) 67 - 72 2005年5月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

CiNii Research

researchmap
ロボット聴覚の現状と課題

奥乃博, 中臺一博

日本音響学会研究発表会講演論文集 2005 ( 1 ) 633 - 636 2005年3月

　詳細を見る

記述言語：日本語

CiNii Books

CiNii Research

researchmap
マイクロフォンアレイによる分離音声認識のためのミッシングフィーチャーマスク自動生成

山本俊一, VALIN J‐M, 中台一博, 駒谷和範, 尾形哲也, 奥乃博

情報処理学会全国大会講演論文集 67th ( 2 ) 377 - 378 2005年3月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
ミッシングフィーチャ理論を適用した同時発話認識システムの同時発話文による評価

山本俊一, VALIN Jean‐Marc, 中台一博, 中野幹生, 辻野広司, 駒谷和範, 尾形哲也, 奥乃博

人工知能学会AIチャレンジ研究会 22nd 101 - 106 2005年

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
ミッシングフィーチャー理論に基づく音源分離と音声認識のインターフェースの評価

山本俊一, 中台一博, 辻野広司, 駒谷和範, 尾形哲也, 奥乃博

日本ロボット学会学術講演会予稿集(CD-ROM) 22nd 1C33 2004年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
G-007 ミッシングフィーチャー理論による音源分離と混合音声認識の統合型インターフェース(G.音声・音楽)

山本俊一, 中臺一博, 辻野広司, 奥乃博

情報科学技術フォーラム一般講演論文集 3 ( 2 ) 357 - 360 2004年8月

　詳細を見る

記述言語：日本語出版者・発行元：FIT(電子情報通信学会・情報処理学会)運営委員会

CiNii Books

researchmap
マルチモーダル情報統合によるヒューマノイドロボットの挙動選択

戸田充彦, 中台一博, 駒谷和範, 尾形哲也, 奥乃博

情報処理学会全国大会講演論文集 66th ( 2 ) 2.193-2.194 2004年3月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
ミッシングフィーチャー理論による三話者同時発話認識の向上

山本俊一, 中台一博, 辻野広司, 駒谷和範, 尾形哲也, 奥乃博

情報処理学会全国大会講演論文集 66th ( 2 ) 2.287-2.288 2004年3月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
アクティブオーディションによる自然なヒューマン・ロボットインターフェースの実現に関する研究(認知と身体性)(<特集>人工知能分野における博士論文)

中臺一博

人工知能 19 ( 1 ) 106_2 - 106_2 2004年1月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人人工知能学会

これまでロボットの聴覚機能に関する研究は,人間とのソーシャルインタラクションで最も重要であるにもかかわらず,あまり行われていなかった.また,ロボット聴覚を実現するために,実環境・実時間処理という観点から問題点は指摘されてきたものの,これらを体系的にまとめた報告はなかった.そこで,本研究では,まず,ロボット聴覚の課題を体系的に整理し,解決に向けた具体的な方法を議論する.そして,アクティブな動作はロボット聴覚の向上に本質的であると捉え,これをロボット聴覚に適用したアクティブオーディションを提案する.また,複数の聴覚情報の統合,聴覚情報以外の感覚情報との統合を行うことによる知覚向上およびより一般的な処理を目指したロボットによる一般的な音(混合音)の理解についても併せて議論する.実際に上半身ヒューマノイドロボットSIG(http://winnie.kuis.kyoto-u.ac.jp/SIG/)上に構築したシステムは,ロボットに特有な動作時のノイズをキャンセルすることで,アクティブな動作の聴覚処理への利用を可能とした.また,アクティブな動作を効果的に用いることにより,視聴覚統合による話者の定位・追跡,注意を向けた方向の音源を実時間で抽出できるアクティブ方向通過型フィルタによる音源分離,分離音の音声認識といった機能を実現した.システムの各機能およびシステム全体を通した統合評価を通じて,アクティブオーディション,感覚情報の統合,一般音理解の有効性・ロバスト性,ヒューマン・ロボットインタフェースとしての有効性を示した.

DOI： 10.11517/jjsai.19.1_106_2

CiNii Books

CiNii Research

researchmap
ロボット聴覚へのミッシングフィーチャー理論の適用による三話者同時発話認識

山本俊一, 中臺一博, 辻野広司

人工知能学会全国大会論文集 18 1 - 4 2004年

　詳細を見る

記述言語：日本語出版者・発行元：人工知能学会

CiNii Books

researchmap
ロボットに装着したマイクロフォンアレイによる音源分離とミッシングフィーチャー理論に基づく音声認識

山本俊一, VALIN Jean‐Marc, 中台一博, 奥乃博

人工知能学会AIチャレンジ研究会 20th 27 - 32 2004年

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
ロボット聴覚へのミッシングフィーチャー理論の適用による三話者同時発話認識

山本俊一, 中臺一博, 辻野広司, 奥乃博

人工知能学会全国大会論文集 4 ( 0 ) 41 - 41 2004年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人人工知能学会

本稿では，ロボットに搭載された2つのマイクで録音された三話者同時発話音声を音源分離とミッシングフィーチャー理論に基づく音声認識によって行う手法を提案する．2体のロボットにおける実験により提案手法の有効性を確認する．

researchmap
知能ロボットの技術：人工知能からのアプローチ（前編）：5.ロボット聴覚の課題と現状

奥乃博, 中臺一博

情報処理 44 ( 11 ) 1138 - 1144 2003年11月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

ロボットが家庭に入ってくるようになり，ロボットと人とのコミュニケーション，特に，ロボットに装備されたマイクロフォンを用いたコミュニケーションや音による環境知覚がますます重要になってきている．最近，ロボット自身の耳による聴覚機能がようやく活発になってきた．では，ロボットのための聴覚機能にはどのようなものが必要であろうか．

CiNii Books

CiNii Research

researchmap
ロボットを対象とした散乱理論による三話者同時発話の定位・分離・認識の向上

中台一博, 奥乃博, 辻野広司

人工知能学会AIチャレンジ研究会 18th 33 - 38 2003年11月

　詳細を見る

記述言語：日本語出版者・発行元：人工知能学会

CiNii Research

J-GLOBAL

researchmap
階層的な視聴覚統合と散乱理論を利用したロボットによる三話者同時発話認識の向上

中台一博, 松浦大輔, 奥乃博, 辻野広司

日本ロボット学会学術講演会予稿集(CD-ROM) 21st 2K14 2003年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
ヒューマノイドロボットにおける挙動選択の設計と実装

戸田充彦, 中台一博, 宮下敬宏, 奥乃博

日本ロボット学会学術講演会予稿集(CD-ROM) 21st 3F23 2003年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
人間に似た外見を持つロボットReplieにおける挙動選択システム

戸田充彦, 山本俊一, 中台一博, 奥乃博

情報処理学会全国大会講演論文集 65th ( 4 ) 4.211-4.212 2003年3月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
方向通過型音源分離フィルタへのFPGAの応用

鈴木紀章, 中臺一博, 天野英晴, 奥乃博, 北野宏明

情報処理学会研究報告システムLSI設計技術（SLDM） 2003 ( 7 ) 135 - 140 2003年1月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

ロボットの知覚システムを構成する場合、計算コストが高い問題を低消費電力かつある程度の柔軟性を保持して実現するためにはFPGAによるリコンフィギュラブルシステムのアプローチが効果的である。本稿では、聴覚システムを構成する際に用いる方向通過型フィルタの処理の一部である高速フーリエ変換（FFT）、平方根、ArcTanをFPGA上に実装し、ハードウェア処理による小型で低消費電力のシステムを作成するための検討を行う。評価の結果、FPGAに実装したFFT、平方根、ArcTan演算回路は、12MHz動作において１GHzのPentiumIIIの2.9倍、2.9倍、3.3倍の処理速度で演算可能である事が分かった。Reconfigurable systems are efficient for high performance but low cost/power implementation for intelligent systems for robots. In this paper, a part of processing for the direction-pass filter, such as Fast Fourier Transform(FFT), square root, and arc tangent used in auditory system of humanoid robots are implemented on an FPGA, and their peformance is evaluated. Our result shows that FFT, square root and arc tangent implemented on the FPGA of 12MHz are 2.9 times, 2.9 times and 3.3 times faster, respectively, than those in Pentium III of 1GHz.

CiNii Books

researchmap
方向通過型音源分離フィルタへのFPGAの応用

鈴木紀章, 中臺一博, 天野英晴, 奥乃博, 北野宏明

電子情報通信学会技術研究報告. CPSY, コンピュータシステム 102 ( 611 ) 79 - 84 2003年1月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

ロボットの知覚システムを構成する場合、計算コストが高い問題を低消費電力かつある程度の柔軟性を保持して実現するためにはFPGAによるリコンフィギャラブルシステムのアプローチが効果的である。本稿では、聴覚システムを構成する際に用いる方向通過型フィルタの処理の一部である高速フーリエ変換(FFT)、平方根、ArcTanをFPGA上に実装し、ハードウェア処理による小型で低消費電力のシステムを作成するための検討を行う。評価の結果、FPGAに実装したFFT、平方根、ArcTan演算回路は、12MHz 動作において1GHzのPentium IIIの2.9倍、2.9倍、3.3倍の処理速度で演算可能である事が分かった。

CiNii Books

researchmap
方向通過型音源分離フィルタへのFPGAの応用

鈴木紀章, 中臺一博, 天野英晴, 奥乃博, 北野宏明

電子情報通信学会技術研究報告. VLD, VLSI設計技術 102 ( 609 ) 79 - 84 2003年1月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

ロボットの知覚システムを構成する場合、計算コストが高い問題を低消費電力かつある程度の柔軟性を保持して実現するためにはFPGAによるリコンフィギャラブルシステムのアプローチが効果的である。本稿では、聴覚システムを構成する際に用いる方向通過型フィルタの処理の一部である高速フーリエ変換(FFT)、平方根、ArcTariをFPGA上に実装し、ハードウェア処理による小型で低消費電力のシステムを作成するための検討を行う。評価の結果、FPGAに実装したFFT、平方根、ArcTan演算回路は、12MHz動作において1GHzのPentium IIIの2.9倍、2.9倍、3.3倍の処理速度で演算可能である事が分かった。

CiNii Books

CiNii Research

researchmap
Exploiting auditory fovea in humanoid-human interaction

Kazuhiro Nakadai, Hiroshi G. Okuno, Hiroshi G. Okuno, Hiroaki Kitano, Hiroaki Kitano

Proceedings of the National Conference on Artificial Intelligence 431-438 431 - 438 2002年12月

　詳細を見る

Scopus

researchmap
アクティブオーディションによる複数音源の定位・分離・認識

中台一博, 奥乃博, 北野宏明

人工知能学会AIチャレンジ研究会 16th 25 - 32 2002年11月

　詳細を見る

記述言語：日本語出版者・発行元：日本人工知能学会

CiNii Research

J-GLOBAL

researchmap
ロボット聴覚実現に向けて-ヒューマノイドロボットSIG2の開発-

中台一博, 松浦大輔, 宮下敬宏, 奥乃博, 北野宏明

日本ロボット学会学術講演会予稿集(CD-ROM) 20th 1H19 2002年10月

　詳細を見る

記述言語：日本語

CiNii Research

J-GLOBAL

researchmap
サポートベクターマシンを用いた話者トラッキング注意制御

松浦大輔, 中台一博, 奥乃博, 北野宏明

日本ロボット学会学術講演会予稿集(CD-ROM) 20th 1C33 2002年10月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
Auditory fovea based speech enchancement and its application to human-robot dialog system

Kazuhiro Nakadai, Hiroshi G. Okuno, Hiroshi G. Okuno, Hiroaki Kitano, Hiroaki Kitano

7th International Conference on Spoken Language Processing, ICSLP 2002 1817 - 1820 2002年1月

　詳細を見る

Scopus

researchmap
Auditory fovea based speech separation and its application to dialog system

Kazuhiro Nakadai, Hiroshi G. Okuno, Hiroshi G. Okuno, Hiroaki Kitano, Hiroaki Kitano

IEEE International Conference on Intelligent Robots and Systems 2 1320 - 1325 2002年1月

　詳細を見る

Scopus

researchmap
Real-time speaker localization and speech separation by audio-visual integration

Kazuhiro Nakadai, Ken Ichi Hidai, Hiroshi G. Okuno, Hiroaki Kitano

Proceedings - IEEE International Conference on Robotics and Automation 1 1043 - 1049 2002年1月

　詳細を見る

出版者・発行元：IEEE

Scopus

researchmap
アクティブオーディションに基づくヒューマン·ロボットインタラクション

中臺一博, 奥乃博, 北野宏明

計測自動制御学会部門大会／部門学術講演会資料 2002 ( 0 ) 522 - 522 2002年

　詳細を見る

出版者・発行元：公益社団法人計測自動制御学会

Robots to interact with people should understand various events simultaneously. To realize such capabilities in robots, integration of audition, vision and other sensory information and active motion for better perception are essential. This paper describes active audition that improves robot audition to integrate audition, vision and active motion. Our active audition based upper-torso robot can localize and interact with people even when occlusion and simultaneous speech occur.

DOI： 10.11499/siced.si2002.0.522.0

CiNii Research

researchmap
Real-time active human tracking by hierarchical integration of audition and vision

NAKADAI K.

Proc. IEEE-RAS Int. Conf. on Robots and Automation, Washington, DC, 2002 2002年

　詳細を見る

researchmap
ロボットの耳は二つで十分か(<特集>なぜ耳は二つあるか?)

奥乃博, 中臺一博

日本音響学会誌 58 ( 3 ) 205 - 210 2002年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本音響学会

聴覚は人間にとって最も重要な感覚である。言語によるコミュニケーションが聴覚によって成立することは容易に理解されるが,「ヒトは聴覚によってのみ言語を獲得し,そこに文化が生まれ,継承される。書かれた言語は目によって伝承されるが,話す言葉は耳からしか得られない。話し言葉があって書く言葉が生まれる」ことを,多くの人が理解していないのは残念なことである(鈴木淳一,小林武夫共著『耳科学-難聴に挑む』(中公新書1598,2001))。

DOI： 10.20697/jasj.58.3_205

CiNii Books

CiNii Research

researchmap
ロボット聴覚の課題と現状

奥乃博, 中臺一博

情報処理学会研究報告音声言語情報処理（SLP） 2001 ( 123 ) 69 - 74 2001年12月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

ロボットが人間社会の中に入り込み，共生していくためには，混合音が扱えること，アクティブオーディション，動きながら聞く機構，未知環境での音の知覚，画像処理などの他の処理の統合，実時間処理が大きな課題であることを指摘した。混合音の処理では，音源定位が重要であり，頭部伝達関数（HRTF）を使わない手法が必要となる。本稿では，これら課題に対して，マイクロフォン２本が必要であるという考えを述べ，２本のマイクロフォンで実現可能な機能について，解説をした。体を動かして聞くというアクティブオーディション，あるいは，画像処理とモータ処理を統合して，体全体で聞くという情報統合が重要である。そのために，方向通過型フィルタや聴覚エピポーラ幾何学，実時間処理方法を開発して，複数の実験で有効性を確認した。In this paper, we present as active audition system which is implemented on the humanoid robot "SIG the humanoid". The audition system for highly intelligent humanoids localize sound sources and recognize auditory events in teh auditory scene. Active audition reported in this paper enables SIG to track sound sources by integrating auditiion, vision, and motor movements. Given the multiple sound sources in the auditory scene, SIG actively moves its head to improve licalization by aligning microhones orthogonal to the sound source and by capturing the possible sound sources by vision. However, such an active head movement inevitably creates motor noises. The system adaptively cancels motor noises using motor control signals. The experimental result demonstrates that active audition by integration of audition, vision, and motor control attains sound source tracking in variety of conditions.

CiNii Books

CiNii Research

researchmap
ロボット聴覚の課題と現状

奥野博, 中臺一博

電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 101 ( 520 ) 69 - 74 2001年12月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

ロボットが人間社会の中に入り込み, 共生していくためには, 混合音が扱えること, アクティブオーディション, 動きながら聞く機構, 未知環境での音の知覚, 画像処理などの他の処理の統合, 実時間処理が大きな課題であることを指摘した.混合音の処理では, 音源定位が重要であり, 頭部伝達関数(HRTF)を使わない手法が必要となる.本稿では, これら課題に対して, マイクロフォン2本が必要であるという考えを述べ, 2本のマイクロフォンで実現可能な機能について, 解説をした.体を動かして聞くというアクティブオーディション, あるいは, 画像処理とモータ処理を統合して, 体全体で聞くという情報統合が重要である.そのために, 方向通過型フィルタや聴覚エピポーラ幾何学, 実時間処理方法を開発して, 複数の実験で有効性を確認した.

CiNii Books

researchmap
ロボット聴覚の課題と現状

奥乃博, 中臺一博

電子情報通信学会技術研究報告. SP, 音声 101 ( 522 ) 69 - 74 2001年12月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

ロボットが人間社会の中に入り込み, 共生していくためには, 混合音が扱えること, アクティブオーディション, 動きながら聞く機構, 未知環境での音の知覚, 画像処理などの他の処理の統合, 実時間処理が大きな課題であることを指摘した.混合音の処理では, 音源定位が重要であり, 頭部伝達関数(HRTF)を使わない手法が必要となる.本稿では, これら課題に対して, マイクロフォン2本が必要であるという考えを述べ, 2本のマイクロフォンで実現可能な機能について, 解説をした.体を動かして聞くというアクティブオーディション, あるいは, 画像処理とモータ処理を統合して, 体全体で聞くという情報統合が重要である.そのために, 方向通過型フィルタや聴覚エピポーラ幾何学, 実時間処理方法を開発して, 複数の実験で有効性を確認した.

CiNii Books

CiNii Research

researchmap
Human-robot interaction through real-time auditory and visual multiple-talker tracking

Hiroshi G. Okuno, Kazuhiro Nakadai, Ken Ichi Hidai, Hiroshi Mizoguchi, Hiroaki Kitano

IEEE International Conference on Intelligent Robots and Systems 3 1402 - 1409 2001年12月

　詳細を見る

Scopus

researchmap
Epipolar geometry based sound localization and extraction for humanoid audition

Kazuhiro Nakadai, Hiroshi G. Okuno, Hiroaki Kitano

IEEE International Conference on Intelligent Robots and Systems 3 1395 - 1401 2001年12月

　詳細を見る

出版者・発行元：IEEE

Scopus

researchmap
アクティブな視聴覚統合を用いた実時間人物追跡ヒューマノイドSIG

中臺一博, 日台健一, 奥乃博, 北野宏明

情報処理学会研究報告知能と複雑系（ICS） 2001 ( 97 ) 37 - 42 2001年10月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

本稿ではロボットを対象にロバストな知覚機構を実現するため聴覚処理の面からアクティブな動作および視聴覚情報統合の有効性を示す. 一般に実環境では反響雑音が存在しかつ動的に変化するため高精度な音源定位や音源分離を行うことは難しい. 我々は音源定位に関してはアクティブな動作と視聴覚処理を統合し実時間で複数人物(音源)の定位・追跡が可能なシステムを開発している. そこでシステムから得られる方向情報を利用してアクティブ方向通過型フィルタによる音源分離のプロトタイプを実装した. 結果として一般的な部屋において音源に正対するようなアクティブな動きにより2 話者の分離や移動音源の抽出に対してアクティブな動作と視聴覚情報統合の有効性を示した.This paper describes improvement of auditory processing by active motion and audio-visual integration. Generally, environmental noises and reverberation affect sound source localization and separation in the real world badly. Our real-time human tracking system for humanoid robots attained robust sound source licalization in the real world by active audio-visual integration. Then, we propose a new sound source separation method by active direction pass filter. Our experiments proves that active audio-visual integration is essential to robust perception for extraction of tracking sound source.

CiNii Books

CiNii Research

researchmap
ステレオ視による実時間人物追跡システムの高精度化

日台健一, 中台一博, 奥乃博, 北野宏明

日本ロボット学会学術講演会予稿集 19th 155 2001年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
視聴覚のストリームベース統合による実時間人物追跡システム

中台一博, 日台健一, 奥乃博, 北野宏明

日本ロボット学会学術講演会予稿集 19th 583 - 584 2001年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
ステレオ視による実時間人物追跡システムの高精度化

日台健一, 中台一博, 奥乃博, 北野宏明

日本ロボット学会学術講演会予稿集 19th 581 - 582 2001年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
視聴覚のストリームベース統合による実時間人物追跡システム

中台一博, 日台健一, 奥乃博, 北野宏明

日本ロボット学会学術講演会予稿集 19th 155 2001年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
視聴覚情報の階層的統合による実時間アクティブ人物追跡

中台一博, 日台健一, 奥乃博, 北野宏明

人工知能学会AIチャレンジ研究会 13th 35 - 42 2001年6月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
顔認識とアクティブオーディションを利用した実時間人物追跡

中台一博, 日台健一, 溝口博, 奥乃博, 北野宏明

人工知能学会AIチャレンジ研究会 11th 27 - 34 2001年3月

　詳細を見る

記述言語：日本語

CiNii Research

J-GLOBAL

researchmap
Real-time auditory and visual multiple-object tracking for robots

NAKADAI K.

Proceedints of the Seventeenth International Joint Conference on Atificial Intelligence (IJCAI-01) 2001年

　詳細を見る

出版者・発行元：MIT Press

researchmap
Active audition system and humanoid exterior design

K. Nakadai, T. Matsui, H. G. Okuno, H. Kitano

IEEE International Conference on Intelligent Robots and Systems 2 1453 - 1461 2000年12月

　詳細を見る

Scopus

researchmap
動画像と音響を統合したインタラクティブロボットの動的環境での制御

中川友紀子, 中台一博, 奥乃博, 北野宏明

日本ロボット学会学術講演会予稿集 18th 113 - 114 2000年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
ロボットの外装の音響効果を利用したアクティブオーディションシステム

中台一博, 奥乃博, 北野宏明

日本ロボット学会学術講演会予稿集 18th 103 - 104 2000年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
ヒューマノイド聴覚機能のためのアクティブオーディションの提案

中台一博, 奥乃博, 北野宏明

日本ロボット学会学術講演会予稿集 18th 105 - 106 2000年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
BeowulfクラスクラスタERATO - 1のチューニングと評価

奥乃博, 京田耕司, 中臺一博, 北野宏明

情報処理学会研究報告ハイパフォーマンスコンピューティング（HPC） 2000 ( 23 ) 116 - 124 2000年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

Beowulrクラスクラスタは，PCクラスタの論理構成法であり，コモディティハードウェアやソフトウェアによりPCクラスタが容易に構築できる．しかし，それらの組合せによってはうまく動かなかったり，あるいは，性能が全く出ないということがある．本稿では，Beowulfクラスクラスタのチューニングを(1)ネットワーク，(2)プロセッサ間通信ライブラリ（MPIやPVM），(3)応用プログラム，という3つのレベルで分けて，行うことを提案する．具体的には，NetPIPEというネットワーク測定用ツールを用いて，(1)と(2)をチューニングする．次に，線形代数でよく使われるLINPACKの一つScaLAPACKを応用プログラムとして利用し，(1)と(2)から得られたネットワーク特性を用いて，ScaLAPACKのチューニングを行う．とくに，小さな行列に分割することと，最適化された線形代数パッケージを使用することが，ScaLAPACKの性能向上に不可欠であることが判明した．これらの知見を利用することにより，Pentium-II 450 MHz，256 MByteメモリのノード32台で構成されるERATO-1に本手法を適用した結果，ハードウェアの不具合いが発見でき，また，LINPACKベンチマークで6.76GFlopsの性能が得られた．Beowulf-Class cluster is a logical organization of PC clusters composed of mass-market off-the-shelf hardware and software. The user may have problems that their implementation won't work well in hardware level or their implementation provides quite a poor performance. In this paper, we present a new method to tune and evaluation of the Beowulf-Class cluter by focusing on three levels: (1) network level, (2) message passing system level (e.g., MPI, PVM), and (3) application level. The first two performance is measured by NetPIPE developed by Ames Lab. ScaLAPACK (parallel version of LINPACK) is used as benchmarks for application programs, because it is one of the most common linear algebra subprograms and its evaluation is beneficial for numerical computation users. ScaLAPACK is tuned by using parameters determined by NetPIPE. ERATO-1 Beowulf-class cluster, 32 nodes of Pentium-II 450HHz processor with 256MByte of memory, is tuned by the proposed method. First, a network interface card installed in each ERATO-1 node is indentified as the cause of poor performance and finally ERATO-1 attained 6.76 GFlops with LINPACK benchmark.

CiNii Books

researchmap
BeowulfクラスクラスタERATO - 1のチューニングと評価

奥乃博, 京田耕司, 中臺一博, 北野宏明

情報処理学会研究報告計算機アーキテクチャ（ARC） 2000 ( 23 ) 119 - 124 2000年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

Beowulrクラスクラスタは，PCクラスタの論理構成法であり，コモディティハードウェアやソフトウェアによりPCクラスタが容易に構築できる．しかし，それらの組合せによってはうまく動かなかったり，あるいは，性能が全く出ないということがある．本稿では，Beowulfクラスクラスタのチューニングを(1)ネットワーク，(2)プロセッサ間通信ライブラリ（MPIやPVM），(3)応用プログラム，という3つのレベルで分けて，行うことを提案する．具体的には，NetPIPEというネットワーク測定用ツールを用いて，(1)と(2)をチューニングする．次に，線形代数でよく使われるLINPACKの一つScaLAPACKを応用プログラムとして利用し，(1)と(2)から得られたネットワーク特性を用いて，ScaLAPACKのチューニングを行う．とくに，小さな行列に分割することと，最適化された線形代数パッケージを使用することが，ScaLAPACKの性能向上に不可欠であることが判明した．これらの知見を利用することにより，Pentium-II 450 MHz，256 MByteメモリのノード32台で構成されるERATO-1に本手法を適用した結果，ハードウェアの不具合いが発見でき，また，LINPACKベンチマークで6.76GFlopsの性能が得られた．Beowulf-Class cluster is a logical organization of PC clusters composed of mass-market off-the-shelf hardware and software. The user may have problems that their implementation won't work well in hardware level or their implementation provides quite a poor performance. In this paper, we present a new method to tune and evaluation of the Beowulf-Class cluter by focusing on three levels: (1) network level, (2) message passing system level (e.g., MPI, PVM), and (3) application level. The first two performance is measured by NetPIPE developed by Ames Lab. ScaLAPACK (parallel version of LINPACK) is used as benchmarks for application programs, because it is one of the most common linear algebra subprograms and its evaluation is beneficial for numerical computation users. ScaLAPACK is tuned by using parameters determined by NetPIPE. ERATO-1 Beowulf-class cluster, 32 nodes of Pentium-II 450HHz processor with 256MByte of memory, is tuned by the proposed method. First, a network interface card installed in each ERATO-1 node is indentified as the cause of poor performance and finally ERATO-1 attained 6.76 GFlops with LINPACK benchmark.

CiNii Books

CiNii Research

researchmap
Active audition for humanoid

K Nakadai, T Lourens, HG Okuno, H Kitano

SEVENTEENTH NATIONAL CONFERENCE ON ARTIFICIAL INTELLIGENCE (AAAI-2001) / TWELFTH INNOVATIVE APPLICATIONS OF ARTIFICIAL INTELLIGENCE CONFERENCE (IAAI-2000) 832 - 839 2000年

　詳細を見る

記述言語：英語

Web of Science

researchmap
ATMノードの連続高速呼設定処理におけるシステムリソースの保護

渡辺浩史, 中臺一博, 佐藤幸男, 坂口全志, 芦川宏利

電子情報通信学会技術研究報告. CPSY, コンピュータシステム 98 ( 572 ) 1 - 8 1999年1月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

信頼性のあるデータ通信を行う場合、制御を行うためにプロトコルメッセージが使用される。そのメッセージ処理が故意に連続で高速にノードに対して行われた場合、ノードのリソースが枯渇してしまいサービスが提供できなくなる問題がある。本稿ではそのような問題に対して、保守者がマニュアル操作で行う防御処理をATMノードのソフトウェアにルールベースの知識として実装することで自動的に防御を行うことができる有効な手段を提案した。この手段は、インターネットなどのプライベートなネットワークが相互に接続している環境においてノード単体で自己防衛する方法であることが特徴であり、インターネットのTCPにおいても適用できることをあわせて提案した。

CiNii Books

researchmap
音楽情景分析の処理モデルOPTIMAの実装

柏野邦夫, 中臺一博, 木下智義, 田中英彦

全国大会講演論文集 50 ( 0 ) 97 - 98 1995年3月

　詳細を見る

記述言語：日本語

われわれは、聴覚的情景分析を「知覚的な音」の分離抽出(知覚的音源分離)と構造化の問題と捉え、モノラルの楽器演奏の音響信号を題材として、音楽情景分析(音楽音響信号を対象とする聴覚的情景分析)の処理モデルについて検討を行っている。ここで、知覚的音源分離とは、人間がひとつのものとして知覚または認識するような音響エネルギーのまとまり(これを知覚的な音と呼ぶ)を一つのものとして記号化することを指す。われわれは既に、ベイズの定理に基礎を置く定量的かつ階層的な情報統合のメカニズムを備えた音楽情景分析の処理モデルOPTIMA(Organized Processing toward Intelligent Music Scene Analysis)を提案した。この処理モデルに基づき、音楽情景分析の実験システムを実装し検討を行ったので、本稿でその概要を報告する。

CiNii Books

CiNii Research

researchmap
音楽情景分析の処理モデルOPTIMAにおける統計的単音仮説生成処理

中臺一博, 柏野邦夫, 木下智義, 田中英彦

全国大会講演論文集 50 ( 0 ) 101 - 102 1995年3月

　詳細を見る

記述言語：日本語

われわれは、音楽情景分析における処理モデルとしてOPTIMAを提案し、これに基づく音楽情景分析の実験システムの実装・評価を行った。本稿では、実験システムのうち、周波数成分レベル、単音レベル間の処理を行う単音仮説生成処理部の実装および、評価について述べる。

CiNii Books

CiNii Research

researchmap
音楽情景分析の処理モデルOPTIMAにおけるシーン情報の抽出と利用

木下智義, 柏野邦夫, 中臺一博, 田中英彦

全国大会講演論文集 50 ( 0 ) 99 - 100 1995年3月

　詳細を見る

記述言語：日本語

OPTIMAでは、複数の独立したモジュールに確率をもった仮説の組を出力させ、これを確率伝搬によって統合することによって外界の音響的事象に関する最尤推定像を求める。本稿ではOPTIMAにおいて利用される音楽シーン惰報として、拍位置および和音の情報の抽出と利用について議論し、実験システムに対する評価実験の結果を示す。

CiNii Books

CiNii Research

researchmap
処理モデルOPTIMAに基づく音楽情景分析システムの構築 I : 各処理モジュールの実現と評価

中ダイ一博, 柏野邦夫, 木下智義, 田中英彦

日本音響学会研究発表会講演論文集 1995 ( 1 ) 481 - 482 1995年3月

　詳細を見る

記述言語：日本語

CiNii Books

CiNii Research

researchmap
処理モデルOPTIMAに基づく音楽情景分析システムの構築 II : 情報統合の実現と評価

柏野邦夫, 中台一博, 木下智義, 田中英彦

日本音響学会研究発表会講演論文集 1995 ( 1 ) 483 - 484 1995年3月

　詳細を見る

記述言語：日本語

CiNii Books

researchmap
楽器演奏における単音の分離抽出とその音楽情景分析システムへの応用

中臺一博

Master's thesis, 東京大学 1995年

　詳細を見る

CiNii Research

researchmap
OPTIMA : 音楽音響信号から単音記号列を生成するシステムの処理モデル

柏野邦夫, 中台一博, 田中英彦

全国大会講演論文集 49 ( 0 ) 325 - 326 1994年9月

　詳細を見る

記述言語：日本語

われわれは、モノラルの楽器演奏を対象とする音源分離を題材として、知覚的音源分離システムについて検討を進めている。知覚的音源分離においては、観測データに加え、対象に関する知識や記憶に基づく処理を柔軟に組み合わせて最終的な結果を求めることが本質的な課題である。そこで本稿では、情報統合のメカニズムを備えた知覚的音源分離の処理モデル OPTIMA (Organized Processing toward Intelligent Music Scene Analysis)を提案する。

CiNii Books

CiNii Research

researchmap
音楽単音記号列生成システムの処理モデルOPTIMAにおける単音仮説生成処理

中台一博, 柏野邦夫, 田中英彦

全国大会講演論文集 49 ( 0 ) 327 - 328 1994年9月

　詳細を見る

記述言語：日本語

われわれは、音楽単音記号列生成システムにおける処理モデルとしてOPTIMAを提案した。[1]OPTIMAでは、モジュールが確信度をもった仮説の組を出力する場合、これを確率伝搬によって統合することができる。したがって、音楽単音記号列生成システムのように複数の情報を統合する必要がある場合には、有用な処理モデルであるということができる。OPTIMAの処理のうち本稿で扱う単音仮説生成モジュールでは、各仮説に確信度を与えなければならないため、確信度の与え方が問題である。このような確信度を与える単音仮説生成モジュールとして、音記憶を使用したモジュールが実装されている。このモジュールは音記憶から生成した混合音仮説と入力とのマッチングを行うモジュールであり、和音などの混合音の認識に効果的であった。しかし、一音ごとに音記憶が必要であること、および混合音数の増加にともない計算量が爆発してしまうことなど、効率、精度の面で音記憶だけでは限界があった。そこで、これらの問題を解決するために音色としての本質的な特徴を抽出し、音色空間上に表現を行った。このような音色空間を利用した楽器の類別、認識の研究はニューラルネットワークを使用したものなどがあり、単音に関しては良好な結果が得られている。そこで、本稿では音色空間の利用により、確信度をもった仮説の組を出力し、混合音に対しても認識を行うことができる単音仮説生成法を提案する。この手法では、各単音仮説の確信度は統計的手法により算出することができ、知識は音色ごとに与えられるため、音数に対する知識量の爆発、計算量の爆発を抑えることができる。

CiNii Books

CiNii Research

researchmap
音楽音響信号から単音記号列を生成するシステムOPTIMAの全体像

柏野邦夫, 中臺一博, 田中英彦

情報処理学会研究報告音楽情報科学（MUS） 1994 ( 71 ) 57 - 64 1994年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

知覚的音源分離における本質的な課題の一つは、対象に関する知識や記憶に基づく処理を柔軟に組み合わせて最終的な結果を求めることである。本稿では、仮説ネットワークによる階層的な情報統合と最尤推定のメカニズムを備えた、音楽音響信号を対象とする知覚的音源分離の処理モデルOPTIMAを提案する。この処理モデルは、複数種類の楽器音を含むモノラルの音楽音響信号をもとに楽器種類ごとの演奏情報を抽出して、単音記号列などの形で出力するシステムとして応用されている。本稿では処理モデルの全体像を示すとともに、特に情報統合の原理と仮説ネットワークの挙動について詳細に議論する。We describe OPTIMA, a process model for the perceptual sound source separation on computers. Our model consists of four parts: bottom-up processing modules, top-down processing modules, knowledge sources, and a hypothesis network for hierarchical and quantitative integration of multiple bits of information. First we present general description of the model. Since one of the most essential problems in the perceptual sound source separation is integration of multiple bits of information, we then focus our discussion on the hypothesis network: we show that our method has permitted efficient, autonomous and stable construction of an optimal internal model of the outer world.

CiNii Books

CiNii Research

researchmap
音源分離システムにおけるパターン照合モジュールの動的負荷分散を用いた並列実装

中臺一博, 柏野邦夫, 田中英彦

情報処理学会研究報告. 人工知能研究会報告 94 ( 67 ) 59 - 60 1994年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

CiNii Books

CiNii Research

researchmap
音楽音響信号を対象とする音モデルに基づく音源分離システム

柏野邦夫, 中台一博, 田中英彦

東京大学工学部総合試験所年報 ( 52 ) p79 - 84 1993年9月

　詳細を見る

記述言語：日本語出版者・発行元：東京大学工学部総合試験所

資料形態 : テキストデータプレーンテキスト
コレクション : 国立国会図書館デジタルコレクション > デジタル化資料 > 雑誌
記事分類: 振動工学・音響工学

CiNii Books

CiNii Research

researchmap
音楽音響信号を対象とする音源分離システム-音モデルに基づくアプローチ-

中薹一博, 柏野邦夫, 田中英彦

情処学会音情研 1993 ( 32 ) 1 - 8 1993年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

音モデルに基づく音源分離システムについて述べる.本システムは,複数種類の楽器演奏を含むモノラルの音響信号を入力とし,これを楽器種ごとに分離して,演奏情報をMIDIデータおよび画面表示として出力するものである.音源の分離同定は,システムに蓄積された音モデルを用いて混合音仮説を生成し,これと入力音響信号のスペクトログラムとを照合することによって行われる.評価実験の結果,最大同時発音数3音という制限の下で,平均85%以上の認識率を得ることができた.本システムでは,音モデルは予めシステムに与えるものとしている.なお本稿では,スペクトログラムから周波数成分抽出を行う方法に関しても新たな提案を行っている.

CiNii Books

researchmap

▼全件表示

講演・口頭発表等

累積頻度重みを適用したパーティクルフィルタによる実時間楽譜追従

大塚琢馬, 中臺一博, 高橋徹, 尾形哲也, 奥乃博

第73回全国大会講演論文集 2011年3月

　詳細を見る

記述言語：日本語

パーティクルフィルタによる楽譜追従は，音響信号と楽譜との距離に基づくパーティクル重みの計算によって追従性能が大きく左右される．従来のベクトル内積計算やシグモイド関数を用いた重み計算手法では，音響信号の非調波成分や楽器の音色のバリエーションにより，楽譜位置推定が正しい場合，誤った場合でそれぞれの重みに大きな差が生じず，最終的に推定された楽譜位置に誤差が含まれるという問題点があった．本稿では，過去に計算された距離の累積頻度から重みを動的に計算し，正しい楽譜位置ではより高い重みを計算する．評価実験では，累積頻度を用いた重み計算法が，従来の重み計算法よりも楽譜追従精度で改善することが確認された．

researchmap
情報統合によるインテリジェント人追跡

中村圭佑, 中臺一博, Ince Gokhan

電子情報通信学会技術研究報告. CNR, クラウドネットワークロボット : IEICE technical report 2011年5月

　詳細を見る

記述言語：日本語

情報統合は,ロボットにおけるロバストな環境理解を実現するための重要な技術であり,このためには,統合のスケーラビリティ,各処理のリユーザビリティを向上するという観点からミドルウェアの導入が不可欠である.本稿では,音源定位と音源同定を提供するロボット聴覚処理,および熱画像カメラと距離画像カメラを組み合わせた人検出処理を統合したインテリジェントでかつロバストな人追跡を実現することを目指し,聴覚,視覚のモダリティ内・モダリティ間情報統合手法を提案する.また,情報統合を行うためのソフトウェアアーキテクチャについて,データフロー指向のミドルウェアFlowDesignerとイベント駆動ベースのミドルウェアROSを用いてHARKを透過的に組み合わせる方式を提案する.提案手法に基づき構築したロボットシステムを通じて,各機能の実環境ロバスト性や実時間動作の検証を行い,その有効性を示す.

researchmap
遠隔ユーザの音環境理解を支援するユーザインタフェース

植田俊輔, 今井倫太, 中村圭佑, 中臺一博

JSAI大会論文集 2012年

　詳細を見る

記述言語：日本語

人間は雑音が多い環境下であってもある程度どこでどのような会話が行われているかを理解する事が出来るが，遠隔操作を行うロボットアバタでは遠隔操作者が遠隔地の音環境を理解する事は困難である．本稿では，雑音環境下でも操作者と遠隔地がインタラクションをスムーズに行うことを支援するユーザインタフェースUI-ALTを提案する．オフライン実験によりUI-ALTは遠隔操作者の雑音環境理解に有用であることが示された．

researchmap
Kinectによる楽器マスキングを用いた視聴覚統合ビートトラッキング

糸原達彦, 水本武志, 大塚琢馬, 中臺一博, 尾形哲也, 奥乃博

全国大会講演論文集 2012年3月

　詳細を見る

記述言語：日本語

人のギター演奏を対象とした実時間のビートトラッキングでは,シンコペーションのようなビートパターンの複雑さや人の演奏におけるテンポ揺らぎに対応する必要がある.我々はこれまでに音響情報と相関の深い弾き手の軌道を用いた視聴覚統合ビートトラッキングを開発してきた.しかし, ギターと手は色が似ているため, 手の軌道追従及びビートトラッキングの性能は十分ではなかった.本稿では,視聴覚センサに加えて深度センサも持つKinectを用いて,距離による画像マスキングを行い,手の領域を抽出する.本手法により, 手の追従の頑健さが増し, ビートトラッキングの精度が向上することを示す.

researchmap
Kinectによる楽器マスキングを用いた視聴覚統合ビートトラッキング

糸原達彦, 水本武志, 大塚琢馬, 中臺一博, 尾形哲也, 奥乃博

第74回全国大会講演論文集 2012年3月

　詳細を見る

記述言語：日本語

人のギター演奏を対象とした実時間のビートトラッキングでは，シンコペーションのようなビートパターンの複雑さや人の演奏におけるテンポ揺らぎに対応する必要がある．我々はこれまでに音響情報と相関の深い弾き手の軌道を用いた視聴覚統合ビートトラッキングを開発してきた.しかし, ギターと手は色が似ているため, 手の軌道追従及びビートトラッキングの性能は十分ではなかった.本稿では，視聴覚センサに加えて深度センサも持つKinectを用いて,距離による画像マスキングを行い，手の領域を抽出する.本手法により, 手の追従の頑健さが増し, ビートトラッキングの精度が向上することを示す.

researchmap
2P1-P24 グループ会話支援のための音源定位システムの開発(コミュニケーション・ロボット)

ムンソンウン, 高木健太郎, 釜島力, 中臺一博, 大武美保子

ロボティクス・メカトロニクス講演会講演概要集 2013年

　詳細を見る

記述言語：日本語

This paper presents a sound source localization system that composes a wireless microphone array named Jellyfish-02 and robot audition software HARK. Jellyfish-02 surpasses existing microphone array in design and usability, because it has a cover with rechargeable battery, which can be connected to wireless network. We evaluated sound source localization performance of Jellyfish-02, and investigated the percentage of speech overlapped periods in natural conversation. Prom the results, Jellyfish-02 is potentially applicable for assisting group conversation by measuring duration of speech for each participant.

researchmap
方向通過型音源分離フィルタへのFPGAの応用

鈴木紀章, 中臺一博, 天野英晴, 奥乃博, 北野宏明

電子情報通信学会技術研究報告. VLD, VLSI設計技術 2003年1月

　詳細を見る

記述言語：日本語

ロボットの知覚システムを構成する場合、計算コストが高い問題を低消費電力かつある程度の柔軟性を保持して実現するためにはFPGAによるリコンフィギャラブルシステムのアプローチが効果的である。本稿では、聴覚システムを構成する際に用いる方向通過型フィルタの処理の一部である高速フーリエ変換(FFT)、平方根、ArcTariをFPGA上に実装し、ハードウェア処理による小型で低消費電力のシステムを作成するための検討を行う。評価の結果、FPGAに実装したFFT、平方根、ArcTan演算回路は、12MHz動作において1GHzのPentium IIIの2.9倍、2.9倍、3.3倍の処理速度で演算可能である事が分かった。

researchmap
方向通過型音源分離フィルタへのFPGAの応用

鈴木紀章, 中臺一博, 天野英晴, 奥乃博, 北野宏明

電子情報通信学会技術研究報告. CPSY, コンピュータシステム 2003年1月

　詳細を見る

記述言語：日本語

ロボットの知覚システムを構成する場合、計算コストが高い問題を低消費電力かつある程度の柔軟性を保持して実現するためにはFPGAによるリコンフィギャラブルシステムのアプローチが効果的である。本稿では、聴覚システムを構成する際に用いる方向通過型フィルタの処理の一部である高速フーリエ変換(FFT)、平方根、ArcTanをFPGA上に実装し、ハードウェア処理による小型で低消費電力のシステムを作成するための検討を行う。評価の結果、FPGAに実装したFFT、平方根、ArcTan演算回路は、12MHz 動作において1GHzのPentium IIIの2.9倍、2.9倍、3.3倍の処理速度で演算可能である事が分かった。

researchmap
方向通過型音源分離フィルタへのFPGAの応用

鈴木紀章, 中臺一博, 天野英晴, 奥乃博, 北野宏明

情報処理学会研究報告システムLSI設計技術（SLDM） 2003年1月

　詳細を見る

記述言語：日本語

ロボットの知覚システムを構成する場合、計算コストが高い問題を低消費電力かつある程度の柔軟性を保持して実現するためにはFPGAによるリコンフィギュラブルシステムのアプローチが効果的である。本稿では、聴覚システムを構成する際に用いる方向通過型フィルタの処理の一部である高速フーリエ変換（FFT）、平方根、ArcTanをFPGA上に実装し、ハードウェア処理による小型で低消費電力のシステムを作成するための検討を行う。評価の結果、FPGAに実装したFFT、平方根、ArcTan演算回路は、12MHz動作において１GHzのPentiumIIIの2.9倍、2.9倍、3.3倍の処理速度で演算可能である事が分かった。Reconfigurable systems are efficient for high performance but low cost/power implementation for intelligent systems for robots. In this paper, a part of processing for the direction-pass filter, such as Fast Fourier Transform(FFT), square root, and arc tangent used in auditory system of humanoid robots are implemented on an FPGA, and their peformance is evaluated. Our result shows that FFT, square root and arc tangent implemented on the FPGA of 12MHz are 2.9 times, 2.9 times and 3.3 times faster, respectively, than those in Pentium III of 1GHz.

researchmap
ロボット聴覚へのミッシングフィーチャー理論の適用による三話者同時発話認識

山本俊一, 中臺一博, 辻野広司

人工知能学会全国大会論文集 2004年

　詳細を見る

記述言語：日本語

researchmap
ロボット聴覚へのミッシングフィーチャー理論の適用による三話者同時発話認識

山本俊一, 中臺一博, 辻野広司, 奥乃博

人工知能学会全国大会論文集 2004年

　詳細を見る

記述言語：日本語

本稿では，ロボットに搭載された2つのマイクで録音された三話者同時発話音声を音源分離とミッシングフィーチャー理論に基づく音声認識によって行う手法を提案する．2体のロボットにおける実験により提案手法の有効性を確認する．

researchmap
G-007 ミッシングフィーチャー理論による音源分離と混合音声認識の統合型インターフェース(G.音声・音楽)

山本俊一, 中臺一博, 辻野広司, 奥乃博

情報科学技術フォーラム一般講演論文集 2004年8月

　詳細を見る

記述言語：日本語

researchmap
アクティブな視聴覚統合を用いた実時間人物追跡ヒューマノイドSIG

中臺一博, 日台健一, 奥乃博, 北野宏明

情報処理学会研究報告知能と複雑系（ICS） 2001年10月

　詳細を見る

記述言語：日本語

本稿ではロボットを対象にロバストな知覚機構を実現するため聴覚処理の面からアクティブな動作および視聴覚情報統合の有効性を示す. 一般に実環境では反響雑音が存在しかつ動的に変化するため高精度な音源定位や音源分離を行うことは難しい. 我々は音源定位に関してはアクティブな動作と視聴覚処理を統合し実時間で複数人物(音源)の定位・追跡が可能なシステムを開発している. そこでシステムから得られる方向情報を利用してアクティブ方向通過型フィルタによる音源分離のプロトタイプを実装した. 結果として一般的な部屋において音源に正対するようなアクティブな動きにより2 話者の分離や移動音源の抽出に対してアクティブな動作と視聴覚情報統合の有効性を示した.This paper describes improvement of auditory processing by active motion and audio-visual integration. Generally, environmental noises and reverberation affect sound source localization and separation in the real world badly. Our real-time human tracking system for humanoid robots attained robust sound source licalization in the real world by active audio-visual integration. Then, we propose a new sound source separation method by active direction pass filter. Our experiments proves that active audio-visual integration is essential to robust perception for extraction of tracking sound source.

researchmap
ロボット聴覚の課題と現状

奥乃博, 中臺一博

電子情報通信学会技術研究報告. SP, 音声 2001年12月

　詳細を見る

記述言語：日本語

ロボットが人間社会の中に入り込み, 共生していくためには, 混合音が扱えること, アクティブオーディション, 動きながら聞く機構, 未知環境での音の知覚, 画像処理などの他の処理の統合, 実時間処理が大きな課題であることを指摘した.混合音の処理では, 音源定位が重要であり, 頭部伝達関数(HRTF)を使わない手法が必要となる.本稿では, これら課題に対して, マイクロフォン2本が必要であるという考えを述べ, 2本のマイクロフォンで実現可能な機能について, 解説をした.体を動かして聞くというアクティブオーディション, あるいは, 画像処理とモータ処理を統合して, 体全体で聞くという情報統合が重要である.そのために, 方向通過型フィルタや聴覚エピポーラ幾何学, 実時間処理方法を開発して, 複数の実験で有効性を確認した.

researchmap
ロボット聴覚の課題と現状

奥野博, 中臺一博

電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 2001年12月

　詳細を見る

記述言語：日本語

ロボットが人間社会の中に入り込み, 共生していくためには, 混合音が扱えること, アクティブオーディション, 動きながら聞く機構, 未知環境での音の知覚, 画像処理などの他の処理の統合, 実時間処理が大きな課題であることを指摘した.混合音の処理では, 音源定位が重要であり, 頭部伝達関数(HRTF)を使わない手法が必要となる.本稿では, これら課題に対して, マイクロフォン2本が必要であるという考えを述べ, 2本のマイクロフォンで実現可能な機能について, 解説をした.体を動かして聞くというアクティブオーディション, あるいは, 画像処理とモータ処理を統合して, 体全体で聞くという情報統合が重要である.そのために, 方向通過型フィルタや聴覚エピポーラ幾何学, 実時間処理方法を開発して, 複数の実験で有効性を確認した.

researchmap
ロボット聴覚の課題と現状

奥乃博, 中臺一博

情報処理学会研究報告音声言語情報処理（SLP） 2001年12月

　詳細を見る

記述言語：日本語

ロボットが人間社会の中に入り込み，共生していくためには，混合音が扱えること，アクティブオーディション，動きながら聞く機構，未知環境での音の知覚，画像処理などの他の処理の統合，実時間処理が大きな課題であることを指摘した。混合音の処理では，音源定位が重要であり，頭部伝達関数（HRTF）を使わない手法が必要となる。本稿では，これら課題に対して，マイクロフォン２本が必要であるという考えを述べ，２本のマイクロフォンで実現可能な機能について，解説をした。体を動かして聞くというアクティブオーディション，あるいは，画像処理とモータ処理を統合して，体全体で聞くという情報統合が重要である。そのために，方向通過型フィルタや聴覚エピポーラ幾何学，実時間処理方法を開発して，複数の実験で有効性を確認した。In this paper, we present as active audition system which is implemented on the humanoid robot "SIG the humanoid". The audition system for highly intelligent humanoids localize sound sources and recognize auditory events in teh auditory scene. Active audition reported in this paper enables SIG to track sound sources by integrating auditiion, vision, and motor movements. Given the multiple sound sources in the auditory scene, SIG actively moves its head to improve licalization by aligning microhones orthogonal to the sound source and by capturing the possible sound sources by vision. However, such an active head movement inevitably creates motor noises. The system adaptively cancels motor noises using motor control signals. The experimental result demonstrates that active audition by integration of audition, vision, and motor control attains sound source tracking in variety of conditions.

researchmap
音楽音響信号を対象とする音源分離システム～音モデルに基づくアプローチ～

中臺一博, 柏野邦夫, 田中英彦

情報処理学会研究報告音楽情報科学（MUS） 1993年4月

　詳細を見る

記述言語：日本語

音モデルに基づく音源分離システムについて述べる。本システムは、複数種類の楽器演奏を含むモノラルの音響信号を入力とし、これを楽器種ごとに分離して、演奏情報をMIDIデータおよび画面表示として出力するものである。音源の分離同定は、システムに蓄積された音モデルを用いて混合音仮説を生成し、これと入力音響信号のスペクトログラムとを照合することによって行われる。評価実験の結果、最大同時発音数3音という制限の下で、平均85％以上の認識率を得ることができた。本システムでは、音モデルは予めシステムに与えるものとしている。なお本稿では、スペクトログラムから周波数成分抽出を行う方法に関しても新たな提案を行っている。A system configuration, implementation and evaluation of a sound source separation system are described. Input of the system is assumed to be a monaural audio signal of ensemble music, and output is MIDI data which has several MIDI channels, each of which is assigned to one kind of musical instruments. The present approach is based on the matching between registered tone models and sound spectrogram derived from the input signal. Experimental results show that more than 85 % of the notes are correctly identified by the system on average, under the condition that the number of simultaneous notes in the input is three or less.

researchmap
音源分離システムにおけるパターン照合モジュールの動的負荷分散を用いた並列実装

中臺一博, 柏野邦夫, 田中英彦

情報処理学会研究報告知能と複雑系（ICS） 1994年7月

　詳細を見る

記述言語：日本語

researchmap
音楽音響信号から単音記号列を生成するシステムOPTIMAの全体像

柏野邦夫, 中臺一博, 田中英彦

情報処理学会研究報告音楽情報科学（MUS） 1994年8月

　詳細を見る

記述言語：日本語

知覚的音源分離における本質的な課題の一つは、対象に関する知識や記憶に基づく処理を柔軟に組み合わせて最終的な結果を求めることである。本稿では、仮説ネットワークによる階層的な情報統合と最尤推定のメカニズムを備えた、音楽音響信号を対象とする知覚的音源分離の処理モデルOPTIMAを提案する。この処理モデルは、複数種類の楽器音を含むモノラルの音楽音響信号をもとに楽器種類ごとの演奏情報を抽出して、単音記号列などの形で出力するシステムとして応用されている。本稿では処理モデルの全体像を示すとともに、特に情報統合の原理と仮説ネットワークの挙動について詳細に議論する。We describe OPTIMA, a process model for the perceptual sound source separation on computers. Our model consists of four parts: bottom-up processing modules, top-down processing modules, knowledge sources, and a hypothesis network for hierarchical and quantitative integration of multiple bits of information. First we present general description of the model. Since one of the most essential problems in the perceptual sound source separation is integration of multiple bits of information, we then focus our discussion on the hypothesis network: we show that our method has permitted efficient, autonomous and stable construction of an optimal internal model of the outer world.

researchmap
音楽単音記号列生成システムの処理モデルOPTIMAにおける単音仮説生成処理

中台一博, 柏野邦夫, 田中英彦

全国大会講演論文集 1994年9月

　詳細を見る

記述言語：日本語

われわれは、音楽単音記号列生成システムにおける処理モデルとしてOPTIMAを提案した。[1]OPTIMAでは、モジュールが確信度をもった仮説の組を出力する場合、これを確率伝搬によって統合することができる。したがって、音楽単音記号列生成システムのように複数の情報を統合する必要がある場合には、有用な処理モデルであるということができる。OPTIMAの処理のうち本稿で扱う単音仮説生成モジュールでは、各仮説に確信度を与えなければならないため、確信度の与え方が問題である。このような確信度を与える単音仮説生成モジュールとして、音記憶を使用したモジュールが実装されている。このモジュールは音記憶から生成した混合音仮説と入力とのマッチングを行うモジュールであり、和音などの混合音の認識に効果的であった。しかし、一音ごとに音記憶が必要であること、および混合音数の増加にともない計算量が爆発してしまうことなど、効率、精度の面で音記憶だけでは限界があった。そこで、これらの問題を解決するために音色としての本質的な特徴を抽出し、音色空間上に表現を行った。このような音色空間を利用した楽器の類別、認識の研究はニューラルネットワークを使用したものなどがあり、単音に関しては良好な結果が得られている。そこで、本稿では音色空間の利用により、確信度をもった仮説の組を出力し、混合音に対しても認識を行うことができる単音仮説生成法を提案する。この手法では、各単音仮説の確信度は統計的手法により算出することができ、知識は音色ごとに与えられるため、音数に対する知識量の爆発、計算量の爆発を抑えることができる。

researchmap
音楽情景分析の処理モデルOPTIMAにおける統計的単音仮説生成処理

中臺一博, 柏野邦夫, 木下智義, 田中英彦

全国大会講演論文集 1995年3月

　詳細を見る

記述言語：日本語

われわれは、音楽情景分析における処理モデルとしてOPTIMAを提案し、これに基づく音楽情景分析の実験システムの実装・評価を行った。本稿では、実験システムのうち、周波数成分レベル、単音レベル間の処理を行う単音仮説生成処理部の実装および、評価について述べる。

researchmap
音楽情景分析の処理モデルOPTIMAにおけるシーン情報の抽出と利用

木下智義, 柏野邦夫, 中臺一博, 田中英彦

全国大会講演論文集 1995年3月

　詳細を見る

記述言語：日本語

OPTIMAでは、複数の独立したモジュールに確率をもった仮説の組を出力させ、これを確率伝搬によって統合することによって外界の音響的事象に関する最尤推定像を求める。本稿ではOPTIMAにおいて利用される音楽シーン惰報として、拍位置および和音の情報の抽出と利用について議論し、実験システムに対する評価実験の結果を示す。

researchmap
音楽情景分析の処理モデルOPTIMAの実装

柏野邦夫, 中臺一博, 木下智義, 田中英彦

全国大会講演論文集 1995年3月

　詳細を見る

記述言語：日本語

われわれは、聴覚的情景分析を「知覚的な音」の分離抽出(知覚的音源分離)と構造化の問題と捉え、モノラルの楽器演奏の音響信号を題材として、音楽情景分析(音楽音響信号を対象とする聴覚的情景分析)の処理モデルについて検討を行っている。ここで、知覚的音源分離とは、人間がひとつのものとして知覚または認識するような音響エネルギーのまとまり(これを知覚的な音と呼ぶ)を一つのものとして記号化することを指す。われわれは既に、ベイズの定理に基礎を置く定量的かつ階層的な情報統合のメカニズムを備えた音楽情景分析の処理モデルOPTIMA(Organized Processing toward Intelligent Music Scene Analysis)を提案した。この処理モデルに基づき、音楽情景分析の実験システムを実装し検討を行ったので、本稿でその概要を報告する。

researchmap
音楽情景分析における予測に基づく単音の認識

木下智義, 村岡秀哉, 田中英彦

全国大会講演論文集 1998年3月

　詳細を見る

記述言語：日本語

researchmap
ATMノードの連続高速呼設定処理におけるシステムリソースの保護

渡辺浩史, 中臺一博, 佐藤幸男, 坂口全志, 芦川宏利

電子情報通信学会技術研究報告. CPSY, コンピュータシステム 1999年1月

　詳細を見る

記述言語：日本語

信頼性のあるデータ通信を行う場合、制御を行うためにプロトコルメッセージが使用される。そのメッセージ処理が故意に連続で高速にノードに対して行われた場合、ノードのリソースが枯渇してしまいサービスが提供できなくなる問題がある。本稿ではそのような問題に対して、保守者がマニュアル操作で行う防御処理をATMノードのソフトウェアにルールベースの知識として実装することで自動的に防御を行うことができる有効な手段を提案した。この手段は、インターネットなどのプライベートなネットワークが相互に接続している環境においてノード単体で自己防衛する方法であることが特徴であり、インターネットのTCPにおいても適用できることをあわせて提案した。

researchmap
BeowulfクラスクラスタERATO - 1のチューニングと評価

奥乃博, 京田耕司, 中臺一博, 北野宏明

情報処理学会研究報告ハイパフォーマンスコンピューティング（HPC） 2000年3月

　詳細を見る

記述言語：日本語

Beowulrクラスクラスタは，PCクラスタの論理構成法であり，コモディティハードウェアやソフトウェアによりPCクラスタが容易に構築できる．しかし，それらの組合せによってはうまく動かなかったり，あるいは，性能が全く出ないということがある．本稿では，Beowulfクラスクラスタのチューニングを(1)ネットワーク，(2)プロセッサ間通信ライブラリ（MPIやPVM），(3)応用プログラム，という3つのレベルで分けて，行うことを提案する．具体的には，NetPIPEというネットワーク測定用ツールを用いて，(1)と(2)をチューニングする．次に，線形代数でよく使われるLINPACKの一つScaLAPACKを応用プログラムとして利用し，(1)と(2)から得られたネットワーク特性を用いて，ScaLAPACKのチューニングを行う．とくに，小さな行列に分割することと，最適化された線形代数パッケージを使用することが，ScaLAPACKの性能向上に不可欠であることが判明した．これらの知見を利用することにより，Pentium-II 450 MHz，256 MByteメモリのノード32台で構成されるERATO-1に本手法を適用した結果，ハードウェアの不具合いが発見でき，また，LINPACKベンチマークで6.76GFlopsの性能が得られた．Beowulf-Class cluster is a logical organization of PC clusters composed of mass-market off-the-shelf hardware and software. The user may have problems that their implementation won't work well in hardware level or their implementation provides quite a poor performance. In this paper, we present a new method to tune and evaluation of the Beowulf-Class cluter by focusing on three levels: (1) network level, (2) message passing system level (e.g., MPI, PVM), and (3) application level. The first two performance is measured by NetPIPE developed by Ames Lab. ScaLAPACK (parallel version of LINPACK) is used as benchmarks for application programs, because it is one of the most common linear algebra subprograms and its evaluation is beneficial for numerical computation users. ScaLAPACK is tuned by using parameters determined by NetPIPE. ERATO-1 Beowulf-class cluster, 32 nodes of Pentium-II 450HHz processor with 256MByte of memory, is tuned by the proposed method. First, a network interface card installed in each ERATO-1 node is indentified as the cause of poor performance and finally ERATO-1 attained 6.76 GFlops with LINPACK benchmark.

researchmap
BeowulfクラスクラスタERATO - 1のチューニングと評価

奥乃博, 京田耕司, 中臺一博, 北野宏明

情報処理学会研究報告計算機アーキテクチャ（ARC） 2000年3月

　詳細を見る

記述言語：日本語

Beowulrクラスクラスタは，PCクラスタの論理構成法であり，コモディティハードウェアやソフトウェアによりPCクラスタが容易に構築できる．しかし，それらの組合せによってはうまく動かなかったり，あるいは，性能が全く出ないということがある．本稿では，Beowulfクラスクラスタのチューニングを(1)ネットワーク，(2)プロセッサ間通信ライブラリ（MPIやPVM），(3)応用プログラム，という3つのレベルで分けて，行うことを提案する．具体的には，NetPIPEというネットワーク測定用ツールを用いて，(1)と(2)をチューニングする．次に，線形代数でよく使われるLINPACKの一つScaLAPACKを応用プログラムとして利用し，(1)と(2)から得られたネットワーク特性を用いて，ScaLAPACKのチューニングを行う．とくに，小さな行列に分割することと，最適化された線形代数パッケージを使用することが，ScaLAPACKの性能向上に不可欠であることが判明した．これらの知見を利用することにより，Pentium-II 450 MHz，256 MByteメモリのノード32台で構成されるERATO-1に本手法を適用した結果，ハードウェアの不具合いが発見でき，また，LINPACKベンチマークで6.76GFlopsの性能が得られた．Beowulf-Class cluster is a logical organization of PC clusters composed of mass-market off-the-shelf hardware and software. The user may have problems that their implementation won't work well in hardware level or their implementation provides quite a poor performance. In this paper, we present a new method to tune and evaluation of the Beowulf-Class cluter by focusing on three levels: (1) network level, (2) message passing system level (e.g., MPI, PVM), and (3) application level. The first two performance is measured by NetPIPE developed by Ames Lab. ScaLAPACK (parallel version of LINPACK) is used as benchmarks for application programs, because it is one of the most common linear algebra subprograms and its evaluation is beneficial for numerical computation users. ScaLAPACK is tuned by using parameters determined by NetPIPE. ERATO-1 Beowulf-class cluster, 32 nodes of Pentium-II 450HHz processor with 256MByte of memory, is tuned by the proposed method. First, a network interface card installed in each ERATO-1 node is indentified as the cause of poor performance and finally ERATO-1 attained 6.76 GFlops with LINPACK benchmark.

researchmap
OPTIMA : 音楽音響信号から単音記号列を生成するシステムの処理モデル

柏野邦夫, 中台一博, 田中英彦

全国大会講演論文集 1994年9月

　詳細を見る

記述言語：日本語

われわれは、モノラルの楽器演奏を対象とする音源分離を題材として、知覚的音源分離システムについて検討を進めている。知覚的音源分離においては、観測データに加え、対象に関する知識や記憶に基づく処理を柔軟に組み合わせて最終的な結果を求めることが本質的な課題である。そこで本稿では、情報統合のメカニズムを備えた知覚的音源分離の処理モデル OPTIMA (Organized Processing toward Intelligent Music Scene Analysis)を提案する。

researchmap
処理モデルOPTIMAに基づく音楽情景分析システムの構築 II : 情報統合の実現と評価

柏野邦夫, 中台一博, 木下智義, 田中英彦

日本音響学会研究発表会講演論文集 1995年3月

　詳細を見る

記述言語：日本語

researchmap
処理モデルOPTIMAに基づく音楽情景分析システムの構築 I : 各処理モジュールの実現と評価

中臺一博, 柏野邦夫, 木下智義, 田中英彦

日本音響学会研究発表会講演論文集 1995年3月

　詳細を見る

記述言語：日本語

researchmap
Audio-visual musical instrument recognition

AngelicaLim, 中村圭佑, 中臺一博, 尾形哲也, 奥乃博

第73回全国大会講演論文集 2011年3月

　詳細を見る

記述言語：英語

Is this person playing a violin or a flute? Classification of musical instrument performances is usually carried out using audio features such as spectral coefficients. We propose augmenting the typical audio feature set with visual features. We show that a combination of audio features and video perform better than audio alone, and verify this multimodal recognition approach on a real-time robot platform.

researchmap
チューブ型ロボットの姿勢推定のためのEKF-SLAMを用いた可変マイクロホンアレイ位置推定

坂東宜昭, 水本武志, 中臺一博, 奥乃博

第75回全国大会講演論文集 2013年3月

　詳細を見る

記述言語：日本語

災害現場での被災者発見にはがれき内へ進入可能なチューブ型ロボットが有用である．さらにチューブ型ロボットに音源定位機能があれば被災者の声から位置の推定が可能となる．しかし，近年の高精度な音源定位手法は位置が既知のマイクアレイで収録した音声から方向を推定しているが，チューブ型ロボットではマイク配置を事前に計測できない．そこで本稿ではEKF-SLAMによるマイクロフォン位置推定手法提案し，常に変化するロボット姿勢の推定によって本問題を解決する．数値実験と実録音の両方を用いて本手法の有効性を確認した．

researchmap
話者ダイアライゼーションシステムのための音声区間検出および到来方向推定の精度向上の検討

黄楊暘, 大塚琢馬, 中臺一博, 奥乃博

第75回全国大会講演論文集 2013年3月

　詳細を見る

記述言語：日本語

ロボット聴覚では, いつ, どこで, 誰が話したかを解明する音環境理解機能が不可欠である. 本稿では, それらの問題を解決するために, 音声区間検出, 到来方向推定および話者同定技術を組み合わせた処理を話者ダイアライゼーションシステムとする. ロボット聴覚ソフトウエア HARK においては, MUSIC アルゴリズムを前処理として, 音声区間検出および到来方向推定を行っている. しかし, MUSIC スペクトルに基づいて処理を行う際に, 音源数パラメータおよび閾値パラメータが結果を大きく左右する. 本稿では, ブラインド音源分離を前処理とする話者ダイアライゼーションシステムを提案した. 音量閾値パラメータの設定は依然必要であるが, 精度向上したパフォーマンスが得られている.

researchmap
クアドロコプターを用いた飛行雑音に頑健な音源定位

古川孝太郎, 奥谷啓太, 柳楽浩平, 大塚琢馬, 中臺一博, 奥乃博

第75回全国大会講演論文集 2013年3月

　詳細を見る

記述言語：日本語

本研究は多数の回転翼を持つ小型の無人航空機, クアドロコプターにマイクロフォンアレイを搭載し, 周囲の環境における音源定位問題を取り扱う.通常, 飛行時には風圧やローターの駆動に起因する雑音が極めて大であり, 定位精度の劣化原因となり得る.このような雑音環境下では, 一般化固有値分解を用いた MUSIC 法により雑音相関行列を加味することで精度が改善することが知られている.そこで本研究は, 飛行に伴って動的に変化する雑音相関行列の推定へと問題を帰着する.その上で飛行制御などの機体のモニタ情報を用いた推定手法を提案し, 飛行雑音に頑健な音源定位手法を開発する.

researchmap
クワドロコプタ搭載のマイクロホンアレイを用いた屋外音環境理解の逐次雑音推定による向上

奥谷啓太, 吉田尚水, 中村圭佑, 中臺一博

日本ロボット学会誌 2013年9月

　詳細を見る

記述言語：日本語

This paper addresses sound source localization using an aerial vehicle with a microphone array in an outdoor environment to realize outdoor auditory scene analysis. It, for instance, aims at finding distressed people in a disaster situation. In such an environment, noise is quite loud and dynamically-changing, and conventional microphone array techniques studied in the field of indoor robot audition are of less use. We, thus, proposed MUltiple SIgnal Classification based on incremental Generalized EigenValue Decomposition (iGEVD-MUSIC). It can deal with dynamically-changing high power noise by introducing incrementally-estimated noise correlation matrices. We developed a prototype system for the outdoor auditory scene analysis based on the proposed method using the Parrot AR.Drone with an 8ch microphone array and a Kinect device. Experimental results using the prototype system showed that dynamically-changing noise is properly suppressed with the proposed method even when the signal-to-noise ratio is less than 0dB in an outdoor/indoor environment with the hovering/moving AR.Drone.

researchmap
雑音環境における最適音量のモデル化を利用した音量可視化テレプレゼンスシステム (クラウドネットワークロボット)

速水昭, 今井倫太, 中村圭祐, 中臺一博

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 2013年12月

　詳細を見る

記述言語：日本語

雑音が大きくなると,話者の音量もそれに応じて大きくなるロンバート効果(Lombard effect)という現象が存在する.遠隔コミュニケーションでは,ロンバート効果により,遠隔地の相手話者に対して必要以上に大きな声で話してしまう問題がある.本稿では,実環境下での移動型のテレプレゼンスロボットを介した遠隔コミュニケーションでの操作者の音量を自動で調節する際に必要となるモデルの設計および,モデルを搭載した最適音量調整システムLOMBOTを開発した.実験の結果,遠隔地の騒音に対して音量が適切に調節されていることを確認した.

researchmap
TelePaBot : 複数のグループが同時に会話する環境に適したテレプレゼンスシステム (クラウドネットワークロボット)

小池京太郎, 今井倫太, 中村圭佑, 中臺一博

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 2013年12月

　詳細を見る

記述言語：日本語

医療現場など,遠隔地において移動・コミュニケーションが必要な状況下でテレプレゼンスロボットは有用なツールとして一部実用化も始まっている.しかし,複数のグループが同時に会話を行う環境では不要な音声まで聞こえてしまうなど,円滑な遠隔コミュニケーションの支援には依然難しい課題が残る.こうした課題を解決するために,本研究では,発話の位置を可視化し,指定した発話を選択聴取する機能を提供するテレプレゼンスシステム「TelePaBot」を提案する.提案したシステムを用いてケーススタディを行った結果,複数のグループが同時に会話する環境下でも,TelePaBotを使用することで,より円滑な遠隔コミュニケーションが実現できる可能性があることが示唆された.

researchmap
マイクロホンアレイの位置推定によるホース型ロボットの姿勢推定

坂東宜昭, 大塚琢馬, 糸山克寿, 昆陽雅司, 田所諭, 中臺一博, 奥乃博

第76回全国大会講演論文集 2014年3月

　詳細を見る

記述言語：日本語

ホース型ロボットは細長い形状が特徴のレスキューロボットで，倒壊した建築物の隙間などの探索が可能である．操縦の効率化のために加速度センサやカメラ画像などを用いた本ロボットの姿勢推定法が提案されてきたが，累積誤差が生じるなどの問題があった．本稿ではマイクロホンアレイと小型スピーカを本ロボットに装着し，音によるこれらの位置推定によって姿勢を推定する手法について述べる．本手法ではスピーカから発する試験音の各マイクへの到達時間差を用いて姿勢を推定するが，到達時間差は現在のマイクとスピーカの位置関係を表しており，過去の誤差を修正できる．実録音データを用いて本手法の有効性を評価した．

researchmap
音ランドマークを用いたマルチコプターの定位

ラナシナパヤ, 中村圭佑, 中臺一博, 高橋秀幸, 木下哲男

第76回全国大会講演論文集 2014年3月

　詳細を見る

記述言語：英語

We propose a novel approach to multicopter localization, using sound landmarks and one embedded microphone. This approach can benefit to multicopter localization in that it requires less computational power and smaller payloads than image-based approaches. However, the high ego-noise of multicopters is a serious threat for sound-based algorithms. We simulated a 2D localization method based on a Kalman Filter using measurements of acceleration and sound landmarks' intensity. A random walk model is used to update the multicopter's position with the Kalman Filter; the calculated estimation is then corrected using noisy measurements from the embedded microphone and accelerometer. Simulation results show that the proposed algorithm can successfully track the multicopter's motion in a noisy environment. We confirmed the effectiveness of our proposed algorithm by comparing its performance and robustness to a time/phase based algorithm.

researchmap
Deep Neural Networkを用いたマルチモーダル音声認識の為の特徴量学習

山口雄紀, 野田邦昭, 中臺一博, 奥乃博, 尾形哲也

第76回全国大会講演論文集 2014年3月

　詳細を見る

記述言語：日本語

本研究の目標は，マルチモーダル音声認識の為の画像特徴量の設計である．マルチモーダル音声認識の精度向上のためには，唇画像からどのようにして音声認識の最小単位である音素や口形素を表現する情報を取り出すかが重要な課題である．本研究では，特徴量学習の新たな手法として注目を集めているDeep Neural Network (DNN)を用いて大量の唇画像から画像特徴量を自己組織的に抽出する手法を構築した．得られた画像特徴量を孤立単語認識タスクで検証するとともに特徴量空間を解析する事で口形素との関連についても考察した．また，得られた画像特徴量と音声を用いた視聴覚統合によるノイズ頑健性の向上について検証を行った．

researchmap
HARKによって定位・分離された多方向音声のアノテーションツールの開発 (クラウドネットワークロボット)

杉山治, 糸山克寿, 中臺一博, 奥乃博

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 2014年6月

　詳細を見る

記述言語：日本語

本研究では、ロボット聴覚ソフトウェアHARKに基づいた多方向音声のアノテーションツールの開発について述べる。多方向の音声情報を視覚化し分かりやすく提示する既存研究は存在するが、提示された情報をラベル付けし、セマンティックにアノテーションするまでを一括して行うツールはまだ提案されていない。本研究では、HARKによって音源定位・分離された多方向音声をアノテーションするツールを開発し、アノテーションの負荷を軽減するためにSVMに基づく、自動補完機能を実装した。そして、被験者実験を通じて、その有効性を検証した。

researchmap
TeleCoBot : 発話環境を考慮したテレプレゼンスシステム (クラウドネットワークロボット)

高橋成明, 尾形正泰, 今井倫太, 中村圭佑, 中臺一博

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 2014年12月

　詳細を見る

記述言語：日本語

遠隔地とのコミュニケーションツールとしてテレプレゼンスロボットの研究が行われるようになった.しかし,騒音など音環境の相違を考慮していないため,発話者の音声が的確に伝わらない問題がある.また対話相手が複数人いる場合,状況に応じて発話者の音声を自由に変えたいという要望がある.こうした問題を解決するため,本研究では発話者の音声を雑音レベルや対話者との距離に応じて自動で調節し,かつ会話状況に応じて自由に音量を変更できる機能を提供するテレプレゼンスシステムTeleCoBotを提案する.また会話環境を用意し被験者にタスクを与えた検証実験を行った.結果として,ユーザは音量変更の機能を正しく使えなかったことが判明し,より効果的なUIを提供することが今後の課題となった.

researchmap
2チャンネル近接マイクロホンを用いた時間領域での風雑音低減 (応用音響)

坂田直人, 中島弘史, 中臺一博

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 2015年3月

　詳細を見る

記述言語：日本語

本報告では2チャンネルの近接マイクロホンを用いて線形ビームフォーミングによる風雑音の低減を行った.フレーム分割による周波数領域における線形ビームフォーミングをフレーム分割前の時間領域信号に適用し,フレーム分割による処理と風雑音の低減性能を比較した.風雑音の混入した収録信号に対し風雑音の低減処理を行った結果,SN比が2〜13dB改善された.フレーム処理の有無で風雑音の低減性能を比較した結果,単純な信号の遅延のみで構成されるフィルタについてはフレーム処理の有無が与える影響が大きいことが確認された.

researchmap
2マイクロホンを用いた線形ビームフォーミングによる風雑音の低減

坂田直人, 村上哲郎, 中島弘史, 中臺一博

回路とシステムワークショップ論文集 Workshop on Circuits and Systems 2015年8月

　詳細を見る

記述言語：日本語

researchmap
振幅スペクトルの相対誤差に基づくインパルス応答の自動切りだし法

中島弘史, 坂田直人, 加科優希, 中臺一博

回路とシステムワークショップ論文集 Workshop on Circuits and Systems 2015年8月

　詳細を見る

記述言語：日本語

researchmap
変分ベイズ多チャネルロバストNMFに基づくマイクロホンの移動・被覆を許容する音声強調 (音声) -- (オーガナイズドセッション「あらゆる音を対象とした情報処理の実現に向けて」)

坂東宜昭, 糸山克寿, 昆陽雅司, 田所諭, 中臺一博, 吉井和佳, 河原達也, 奥乃博

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 2016年8月

　詳細を見る

記述言語：日本語

researchmap
ロボットとの会話における画像および音声情報を用いた人の身体動作と発話姿勢の関係に関する検討 (クラウドネットワークロボット)

蓮本諒介, 小山大幾, 水本武志, 中村圭佑, 中臺一博, 今井倫太

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 2017年2月

　詳細を見る

記述言語：日本語

researchmap
ロボットとの会話における画像および音声情報を用いた人の身体動作と発話姿勢の関係に関する検討 (パターン認識・メディア理解)

蓮本諒介, 小山大幾, 水本武志, 中村圭佑, 中臺一博, 今井倫太

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 2017年2月

　詳細を見る

記述言語：日本語

researchmap
確率的生成モデルに基づく複数A/Dコンバータのチャネル間同期

糸山克寿, 中臺一博, 中臺一博

日本音響学会研究発表会講演論文集(CD-ROM) 2018年2月

　詳細を見る

記述言語：日本語

researchmap
振動センサを用いた災害時の避難者の属性推定に関する検討

尾崎翔, 浅野太, 中臺一博

電子情報通信学会大会講演論文集(CD-ROM) 2018年3月

　詳細を見る

記述言語：日本語

researchmap
可聴音を用いた周波数自動選択に基づく距離推定法の検討

高尾麻衣子, 干場功太郎, 中臺一博, 中臺一博

情報処理学会全国大会講演論文集 2018年3月

　詳細を見る

記述言語：日本語

researchmap
Quad‐directional LSTMを用いた音楽音響信号修復とその評価

谷口亮輔, 干場功太郎, 中臺一博, 中臺一博

情報処理学会全国大会講演論文集 2018年3月

　詳細を見る

記述言語：日本語

researchmap
ロボット聴覚技術の極限環境への展開

奥乃博, 糸山克寿, 中臺一博, 中臺一博, 公文誠, 坂東宜昭, 干場功太郎

システム制御情報学会研究発表講演会講演論文集(CD-ROM) 2018年5月

　詳細を見る

記述言語：日本語

researchmap
スペクトル伸縮に基づく複数A/Dコンバータのチャネル間同期

糸山克寿, 中臺一博, 中臺一博

日本機械学会ロボティクス・メカトロニクス講演会講演論文集(CD-ROM) 2018年6月

　詳細を見る

記述言語：日本語

researchmap
振動センサを用いた災害時における年少避難者の特定手法に関する検討

尾崎翔, 浅野太, 中臺一博

電子情報通信学会大会講演論文集(CD-ROM) 2018年8月

　詳細を見る

記述言語：日本語

researchmap
CNN-based MultiChannel End-to-End Speech Recognition for everyday home environments

Nelson Yalta, Shinji Watanabe, Takaaki Hori, Kazuhiro Nakadai, Tetsuya Ogata

2018年11月

　詳細を見る

会議種別：口頭発表（一般）

Casual conversations involving multiple speakers and noises from surrounding devices are part of everyday environments and pose challenges for automatic speech recognition systems. These challenges in speech recognition are target for the CHiME-5 challenge. In the present study, an attempt is made to overcome these challenges by employing a convolutional neural network (CNN)-based multichannel end-to-end speech recognition system. The system comprises an attention-based encoder-decoder neural network that directly generates a text as an output from a sound input. The mulitchannel CNN encoder, which uses residual connections and batch renormalization, is trained with augmented data, including white noise injection. The experimental results show that the word error rate (WER) was reduced by 11.9% absolute from the end-to-end baseline.

researchmap
ロボット聴覚の現状と課題

奥乃博, 中臺一博

日本音響学会研究発表会講演論文集 2005年3月

　詳細を見る

記述言語：日本語

researchmap
動的リコンフィギャラブルデバイスDRPを用いた音源分離フィルタの実装と評価

黒瀧俊輔, 鈴木紀章, 中臺一博, 奥乃博, 天野英晴

電子情報通信学会技術研究報告 2005年5月

　詳細を見る

記述言語：日本語

researchmap
HRI-JPにおけるヒューマン-ロボットインタラクション研究

辻野広司, 中野幹生, 中臺一博, 長谷川雄二

電子情報通信学会技術研究報告. SIS, スマートインフォメディアシステム 2005年11月

　詳細を見る

記述言語：日本語

コンピュータの発達により高機能化した機械が家庭に入ってくるようになり, 「誰でも使える機械と人とのインターフェース」がますます重要になってきている.そのような機械のひとつの究極であるインテリジェントロボットにおいては, さらに進んだインターフェースの概念や価値観の研究が進められつつある.我々は未来のインテリジェントロボットに求められるインターフェースとして, 人とロボットの関係が双方向であることを前提にした「ヒューマン-ロボットインタラクション」という機能実現を目指し, 研究を進めている.このような観点に基づき, 「ヒューマン-ロボットインタラクションのためのアーキテクチャ」「ロボットによる人の音声の認識」, 「人によるロボットの音声の認識」に関し報告する.

researchmap
複数ドメイン音声対話システムにおける対話履歴を利用したドメイン選択の高精度化

神田直之, 駒谷和範, 中野幹生, 中臺一博, 辻野広司, 尾形哲也, 奥乃博

情報処理学会研究報告音声言語情報処理（SLP） 2006年2月

　詳細を見る

記述言語：日本語

複数のドメインを扱う音声対話システムにおいて，対話の文脈や進行に関する特徴量を導入してより精度よくドメイン選択を行う手法を開発したので報告する．本稿ではドメイン選択問題を，応答すべきドメインが，(I)ひとつ前の応答を行ったドメイン，(II)音声認識結果に対する最尤のドメイン，(III)それ以外のいずれかのドメイン，のどれに該当するかを判別する問題と捉える．ドメイン選択の正解を与えた対話データから，対話の文脈や進行に関する特徴量を用いて上記を判別する決定木を学習することにより，ドメイン選択器を構成した．5ドメインのマルチドメイン音声対話システムを用いた10名の被験者による評価実験の結果，音声認識尤度に基づく従来のドメイン選択手法に比べ，ドメイン選択誤りが11.6%削減された．We have developed a robust domain selection method using dialogue history in multi-domain spoken dialogue systems. We define domain selection as classifying problem among (I) the domain in the previous turn, (II) the domain in which N-best speech recognition results can be accepted with the highest recognition score, (III) other domains. We constructed a classifier by decision tree learning with dialogue corpus. The experimental result using 10 subjects shows that our method could reduced 11.6% domain selection error, compared with a conventional method using speech recognition likelihoods only.

researchmap
D-14-10 有向性音素グルーピングを用いた音声認識におけるロバスト性向上の検討(D-14.音声・聴覚,一般講演)

隅谷亮太, 中臺一博, 中野幹生, 市毛弘一, 廣瀬靖雄, 辻野広司

電子情報通信学会総合大会講演論文集 2006年3月

　詳細を見る

記述言語：日本語

researchmap
人・ロボット音声インタラクションのための情報統合に向けて

中臺一博

電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 2006年10月

　詳細を見る

記述言語：日本語

自然な人・ロボット音声インタラクションを実現する上で聴覚機能を通じ,ロボット周囲の環境を把握する「実環境音環境理解」,ロボットがユーザに対して適切でわかりやすく情報を伝達する「表出」は重要な機能であろう.こうした機能をロバストに実現する上で,筆者が鍵となると考えている「情報統合」アプローチについて述べる.また,このアプローチに基づく研究例として,実環境音環境理解に関しては,ミッシングフィーチャ理論による音源分離と音声認識の統合,マイクロホンアレイ統合による音源追跡のロバスト性の向上について,表出に関しては,韻律情報と頭部色を用いたマルチモーダル表出,指向性スピーカを用いた新しい発話機能の導入に関して紹介する.

researchmap
人・ロボット音声インタラクションのための情報統合に向けて

中臺一博

電子情報通信学会技術研究報告. TL, 思考と言語 2006年10月

　詳細を見る

記述言語：日本語

自然な人・ロボット音声インタラクションを実現する上で聴覚機能を通じ,ロボット周囲の環境を把握する「実環境音環境理解」,ロボットがユーザに対して適切でわかりやすく情報を伝達する「表出」は重要な機能であろう.こうした機能をロバストに実現する上で,筆者が鍵となると考えている「情報統合」アプローチについて述べる.また,このアプローチに基づく研究例として,実環境音環境理解に関しては,ミッシングフィーチャ理論による音源分離と音声認識の統合,マイクロホンアレイ統合による音源追跡のロバスト性の向上について,表出に関しては,韻律情報と頭部色を用いたマルチモーダル表出,指向性スピーカを用いた新しい発話機能の導入に関して紹介する.

researchmap
人・ロボット音声インタラクションのための情報統合に向けて

中臺一博

電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 2006年10月

　詳細を見る

記述言語：日本語

自然な人・ロボット音声インタラクションを実現する上で聴覚機能を通じ,ロボット周囲の環境を把握する「実環境音環境理解」,ロボットがユーザに対して適切でわかりやすく情報を伝達する「表出」は重要な機能であろう.こうした機能をロバストに実現する上で,筆者が鍵となると考えている「情報統合」アプローチについて述べる.また,このアプローチに基づく研究例として,実環境音環境理解に関しては,ミッシングフィーチャ理論による音源分離と音声認識の統合,マイクロホンアレイ統合による音源追跡のロバスト性の向上について,表出に関しては,韻律情報と頭部色を用いたマルチモーダル表出,指向性スピーカを用いた新しい発話機能の導入に関して紹介する.

researchmap
自然な人・ロボット音声インタラクションに向けたロボット聴覚システムの構築

中臺一博, 山本俊一, 浅野太

人工知能学会全国大会論文集 2007年

　詳細を見る

記述言語：日本語

researchmap
AS-6-1 マイクロホンアレイ統合によるロバストな音響ストリーム生成と移動人物追跡(AS-6.実環境における高品質収音のための音声信号処理,シンポジウム)

中臺一博, 中島弘史, 村瀬昌満, 奥乃博, 長谷川雄二, 辻野広司

電子情報通信学会総合大会講演論文集 2007年3月

　詳細を見る

記述言語：英語

researchmap
適応ステップサイズパラメータ法による高性能ブラインド音源分離

中島弘史, 中臺一博, 長谷川雄二, 辻野広司

電子情報通信学会技術研究報告. EA, 応用音響 2007年6月

　詳細を見る

記述言語：日本語

本論文では,様々なブラインド音源分離(BSS)に利用可能なステップサイズパラメータの適応調整法を提案する。ステップサイズパラメータは,分離の度合いや周波数によって最適値が異なるものであるが,ほとんどの報告例で,実験的に定めた固定値を利用している。提案法は,多次元のニュートン法に基づく最適値をステップサイズパラメータとして利用することで,適応型のBSSに対し高い収束性と分離度を実現する。提案法の有効性を確認するため,ロボットの頭部に埋め込んだマイクロホンアレイを利用して音源分離の実験を行った。その結果,提案法がさまざまな種類のBSSについて利用でき,高い分離性能が得られる事を確認した。

researchmap
ロボット音声対話のためのMFTとICAによるバージイン許容機能の評価

武田龍, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博

全国大会講演論文集 2008年3月

　詳細を見る

記述言語：日本語

researchmap
大規模マイクロホンアレイによる発話方向推定の検討

菊池慶子, 醍醐徹, 中島弘史, 中臺一博, 長谷川雄二, 金田豊

電子情報通信学会技術研究報告. EA, 応用音響 2008年7月

　詳細を見る

記述言語：日本語

本稿では,大規模マイクロホンアレイを用いた発話方向推定について報告する.筆者らは,先に音源の指向特性に基づいたビームフォーミング法を提案し,スピーカや人の発話方向推定について報告した.しかし,この手法において,ビームフォーマーの設計に用いる伝達関数は,対象となる音源の伝達関数を用いないと,性能が劣化するという問題点があった.また,発話区間の検出(VAD)も手動で行われているという問題点があった.前者の問題は異なる音源の伝達関数の位相差が主な原因と考えて,振幅伝達特性のみを利用したヒストグラムによる発話方向推定手法を提案した.後者については,非発話区間など信頼できない時間周波数特徴量のみを自動的にマスクするために,内積値に基づく音声周波数成分検出と自己相関を利用した発話区間検出を導入した.評価実験を通じて,スピーカの伝達関数を用いた場合でも,提案手法により人間の発話方向推定性能が大きく向上することを示した.

researchmap
パネル討論：アプリケーション開発における音声認識

西村竜一, 中野鐵兵, 栗原一貴, 中臺一博, 吉野孝

情報処理学会研究報告音声言語情報処理（SLP） 2008年10月

　詳細を見る

記述言語：日本語

本パネルディスカッションでは、音声認識アプリケーションの開発事例の紹介、アプリ開発に向き合うための提言を関連研究者の方々にお願いした。音声認識アプリケーションの開発を促すことを目的とする。To induce developments of ASR applications, this panel discussion introduces actual case studies. We also indicate some problems of ASR application developments.

researchmap
歌唱ロボットのためのビート情報とメロディ・ハーモニー情報の統合による音楽音響信号と楽譜の実時間同期手法の開発

大塚琢馬, 村田和真, 武田龍, 中臺一博, 高橋徹, 尾形哲也, 奥乃博

全国大会講演論文集 2009年3月

　詳細を見る

記述言語：日本語

researchmap
ソフトマスクと音響モデル適応を用いた3話者同時発話音声認識

高橋徹, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博

全国大会講演論文集 2009年3月

　詳細を見る

記述言語：日本語

researchmap
波動音響シミュレータによる指向性の精度検証

鈴木淑正, 中島弘史, 中臺一博, 荒井隆行, 長谷川雄二

電子情報通信学会技術研究報告. EA, 応用音響 2009年6月

　詳細を見る

記述言語：日本語

近年、コンピュータの性能向上によって、波動音響理論に基づいた数値シミュレーション(波動音響シミュレーション)が実用的な時間で利用可能になってきた。波動音響シミュレーションは、自由音場などの理想的環境下では、高精度なシミュレーションが報告されている。しかし、実環境の高精度なシミュレーションは非常に困難であり様々な課題がある。その中のひとつとして、多くのシミュレータでは音源を点音源として扱うため、指向性を持つスピーカーなどの音源は高精度に再現できないという課題がある。指向性音源を再現する研究はいくつか報告例があるが、高精度かつ実用的なものは少ない。指向性の再現には、正確な音の伝播が必要となるが、空間を格子上に離散化させる差分法においては、音源から等距離でも伝播方向によっては、数値分散の影響が異なるため計算誤差が生じる。本研究では差分法を用いて、まず、自由音場での無指向性点音源を対象とした精度検証を行った。次に、その応用として指向性を有するスピーカ音源を対象とし、模擬スピーカーモデルを点音源に付加するという比較的簡単なモデル化で、指向性音源をシミュレーションできることを示す。

researchmap
多段処理によるブラインド残響抑圧処理の性能向上

中島弘史, 醍醐徹, 中臺一博, 金田豊, 長谷川雄二

電子情報通信学会技術研究報告. EA, 応用音響 2009年7月

　詳細を見る

記述言語：日本語

researchmap
多段処理によるブラインド残響抑圧処理の性能向上 (応用音響)

中島弘史, 醍醐徹, 中臺一博, 金田豊, 長谷川雄二

電子情報通信学会技術研究報告 2009年7月

　詳細を見る

記述言語：日本語

本研究では,多入力の残響抑圧処理を1つの処理モジュールと考え,入力チャネルの異なる複数の処理モジュールを多段接続することで高い残響抑圧性能を実現する処理(多段処理)を提案する.今回,残響抑圧処理モジュールとしては,セミブラインドMINT法と適応無相関化逆フィルタの2つを利用した.多段処理の性能は,各モジュールの入力チャネルの組み合わせにより変化する.このため高い性能を実現するための予備的処理として,チャネル選択処理および遅延付加処理についても提案する.8チャネルのマイクアレイによる収録信号を用いた実験により各処理を評価した結果,以下の3つの知見を得た.(1)チャネル選択処理:選択チャネルの違いで抑圧性能に3-10dBの差が発生.適切なチャネル選択により残響抑圧性能を低下させることなくチャネル数の削減が可能(2)遅延付加処理:遅延付加は,特に遅延付加前の性能が低い場合に有効で,2-6dBの性能向上が可能.(3)多段処理:全チャネルを用いた1回の処理の残響抑圧性能がセミブラインドMINT法で14.6dB,適応無相関化逆フィルタで3.5dBであるのに対し,多段処理ではそれぞれ18.2dB(+4.2dB)および13.6dB(+10.1dB)となり,提案法が残響抑圧性能を向上させる手法として有効であることを確認した.

researchmap
実環境音声認識のためのロボット聴覚システム開発とパラメータチューニング

高橋徹, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博

全国大会講演論文集 2010年3月

　詳細を見る

記述言語：日本語

researchmap
ロボット音声対話におけるSemi-blind ICAを用いた自己発話キャンセル

武田龍, 中臺一博, 高橋徹, 駒谷和範, 尾形哲也, 奥乃博

全国大会講演論文集 2010年3月

　詳細を見る

記述言語：日本語

researchmap
室内マイクロホンアレイを用いた実時間発話方向推定

春原卓也, 中島弘史, 中臺一博, 金田豊

電子情報通信学会技術研究報告. EA, 応用音響 2010年7月

　詳細を見る

記述言語：日本語

本稿では,大規模マイクロホンアレイを用いた発話方向推定について報告する.筆者らは,先に音源の指向特性に基づいたビームフォーミング法を提案し,スピーカや人の発話方向推定について報告した.さらに,振幅成分の抽出,発話区間検出,周波数マスク,ヒストグラムの4つの改良手法を加えることで,高精度な推定が可能となることを示した.その後,実時間で方向推定が可能なシステムについて報告したが,計算量の制限などにより推定精度が低く,その主原因も不明確であった.本稿では,実時間システムの精度の低い原因を調査し,それをもとに改良を行った実時間システムを提案した.評価実験から,従来の実時間システムよりも実時間性,推定精度に優れていることを示した.

researchmap
ロボット聴覚 : 高雑音下でのハンズフリー音声認識

中臺一博, 奥乃博

電子情報通信学会技術研究報告. SP, 音声 2011年1月

　詳細を見る

記述言語：日本語

我々が取り組んでいるロボット聴覚研究について,その位置づけや意義を解説し,これを実現するための高雑音下ハンズフリー音声認識へも適用可能な技術としてマイクロホンアレイを用いた動的環境下の実時間音源分離とその音声認識への適用について紹介する.紹介する技術は,ロボット聴覚ソフトウェアHARKとしてオープンソースで公開を行っている.そこで,これらの技術の有効性を,実際のロボットへのHARKの適用事例を通じて示す.

researchmap

▼全件表示

産業財産権

音声処理装置、音声処理方法及びプログラム

中臺一博, 佐畑智幸

　詳細を見る

出願人：本田技研工業株式会社

出願番号：特願2017-062795 出願日：2017年3月

公開番号：特開2018-165761 公開日：2018年10月

J-GLOBAL

researchmap
会話支援装置、会話支援装置の制御方法、及び会話支援装置のプログラム

中臺一博, 中村圭佑

　詳細を見る

出願人：本田技研工業株式会社

出願番号：特願2017-042240 出願日：2017年3月

公開番号：特開2017-129873 公開日：2017年7月

J-GLOBAL

researchmap
音声処理装置、ウェアラブル端末、携帯端末、および音声処理方法

水本武志, 中臺一博

　詳細を見る

出願人：本田技研工業株式会社

出願番号：特願2016-203690 出願日：2016年10月

公開番号：特開2018-067050 公開日：2018年4月

J-GLOBAL

researchmap
音響処理装置および音響処理方法

中臺一博, 小島諒介

　詳細を見る

出願人：本田技研工業株式会社

出願番号：特願2016-172985 出願日：2016年9月

公開番号：特開2018-040848 公開日：2018年3月

J-GLOBAL

researchmap
音声処理装置、音声処理方法及び音声処理プログラム

ゴメスランディ, 中臺一博

　詳細を見る

出願人：本田技研工業株式会社

出願番号：特願2016-164608 出願日：2016年8月

公開番号：特開2018-031909 公開日：2018年3月

J-GLOBAL

researchmap
検査装置および検査方法

水本武志, 中村圭佑, 中臺一博

　詳細を見る

出願人：本田技研工業株式会社

出願番号：特願2016-065005 出願日：2016年3月

公開番号：特開2017-183861 公開日：2017年10月

J-GLOBAL

researchmap
受付システム及び受付方法

近藤宏, 住田直亮, 椎名あす香, 山本俊一, 中臺一博, 中村圭佑

　詳細を見る

出願人：本田技研工業株式会社

出願番号：特願2016-066568 出願日：2016年3月

公開番号：特開2017-182334 公開日：2017年10月

J-GLOBAL

researchmap
受付システムおよび受付方法

住田直亮, 近藤宏, 椎名あす香, 山本俊一, 中臺一博, 中村圭佑

　詳細を見る

出願人：本田技研工業株式会社

出願番号：特願2016-062556 出願日：2016年3月

公開番号：特開2017-174346 公開日：2017年9月

J-GLOBAL

researchmap
音声処理装置および音声処理方法

山本俊一, 住田直亮, 近藤宏, 椎名あす香, 中臺一博, 中村圭佑

　詳細を見る

出願人：本田技研工業株式会社

出願番号：特願2016-051137 出願日：2016年3月

公開番号：特開2017-167270 公開日：2017年9月

J-GLOBAL

researchmap
音声処理装置および音声処理方法

水本武志, 中村圭佑, 中臺一博

　詳細を見る

出願人：本田技研工業株式会社

出願番号：特願2015-191879 出願日：2015年9月

公開番号：特開2017-067948 公開日：2017年4月

J-GLOBAL

researchmap
ロボット聴覚装置

中臺一博, 奥乃博, 北野宏明

　詳細を見る

出願人：科学技術振興事業団

出願番号：特願2000-022678 出願日：2000年1月

公開番号：特開2001-215990 公開日：2001年8月

J-GLOBAL

researchmap
ロボット聴覚装置

中臺一博, 松井龍哉, 奥乃博, 北野宏明

　詳細を見る

出願人：科学技術振興事業団

出願番号：特願2000-022679 出願日：2000年1月

公開番号：特開2001-215991 公開日：2001年8月

J-GLOBAL

researchmap
ロボット聴覚システム

中臺一博, 奥乃博, 北野宏明

　詳細を見る

出願人：科学技術振興事業団

出願番号：特願2000-022677 出願日：2000年1月

公開番号：特開2001-215989 公開日：2001年8月

J-GLOBAL

researchmap
ロボット聴覚装置

中臺一博, 奥乃博, 北野宏明

　詳細を見る

出願人：科学技術振興事業団

出願番号：特願平11-341240 出願日：1999年11月

公開番号：特開2001-157988 公開日：2001年6月

J-GLOBAL

researchmap
ロボット聴覚装置

中臺一博, 奥乃博, 北野宏明

　詳細を見る

出願人：科学技術振興事業団

出願番号：特願平11-341240 出願日：1999年11月

公開番号：特開2001-157988 公開日：2001年6月

特許番号/登録番号：特許第3277279号発行日：2002年2月

J-GLOBAL

researchmap

▼全件表示

受賞

学会誌論文賞

2023年9月日本ロボット学会

　詳細を見る

researchmap
Fellow

2023年1月 IEEE

　詳細を見る

researchmap
2021 IEEE/SICE International Symposium on System Integration (SII 2021) Best Paper Finalist Award

2022年1月 IEEE

　詳細を見る

researchmap
日本ロボット学会フェロー

2021年9月日本ロボット学会

　詳細を見る

researchmap
日本ロボット学会功労賞

2021年9月日本ロボット学会

　詳細を見る

researchmap
双葉電子財団衛藤細矢記念賞

2021年5月双葉電子財団

　詳細を見る

researchmap
10th International Conference on Cloud Computing, Data Science & Engineering (Confluence-2020), Amity Research Award for Significant contribution in the field of Artificial Intelligence

2021年1月

　詳細を見る

researchmap
Amity 大学 Amity School of Engineering and Technology, Honorary Professor

2021年1月

　詳細を見る

researchmap
日本景観生態学会第２９回大会ベストポスター賞

2020年3月

　詳細を見る

researchmap
情報処理学会第81回全国大会奨励賞

2019年3月

　詳細を見る

researchmap
2019 IEEE/SICE International Symposium on System Integration (SII 2019) Best Paper Finalist Award

2019年1月 IEEE

　詳細を見る

researchmap
異能(inno)vation ジェネレーションアワード部門分野賞受賞

2018年10月総務省

中臺一博

　詳細を見る

researchmap
The 36th Annual Conference of the Robotics Society of Japan (RSJ 2018) International Session BEST PAPER AWARD

2018年9月日本ロボット学会

中臺一博

　詳細を見る

researchmap
IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2017) Best Paper Award Finalist on Safety, Security, and Rescue Robotics (in memory of Motohiro Kisoi)

2017年9月 IEEE

中臺一博

　詳細を見る

researchmap
第４回 Advanced Robotics 誌論文賞

2016年9月日本ロボット学会

中臺一博

　詳細を見る

researchmap
研究会優秀賞

2016年6月人工知能学会

中臺一博

　詳細を見る

researchmap
IEEE-RAS International Symposium on Safety, Security, and Rescue Robotics (SSRR) Innovative Paper Award

2015年10月 IEEE

中臺一博

　詳細を見る

researchmap
IEEE-RAS International Symposium on Safety, Security, and Rescue Robotics Best Demonstration Award

2015年10月 IEEE

中臺一博

　詳細を見る

researchmap
第二回Advanced Robotics 誌論文賞

2014年9月日本ロボット学会

中臺一博

　詳細を見る

researchmap
Best Paper Award (1st Prize), International Conference on Industrial Engineering & Other Applications of Applied Intelligent Systems(IEA/AIE 2013)

2013年6月 International Society of Applied Intelligence (ISAI)

中臺一博

　詳細を見る

researchmap
研究会優秀賞

2012年6月人工知能学会

中臺一博

　詳細を見る

researchmap
International Conference on Intellignet Robots and Systems (IROS 2011) BEST PAPER Nomination Finalist

2011年10月 IEEE

中臺一博

　詳細を見る

researchmap
A Best Paper Award, International Conference on Industrial Engineering & Other Applications of Applied Intelligent Systems(IEA/AIE 2010)

2010年6月 International Society of Applied Intelligence (ISAI)

中臺一博

　詳細を見る

researchmap
研究会優秀賞

2009年6月人工知能学会

中臺一博

　詳細を見る

researchmap
Best paper award (3rd place)

2009年6月 IEEE Vail Computer Elements Workshop

中臺一博

　詳細を見る

researchmap
International Conference on Intelligent Robots and Systems (IROS 2008) New Technology Foundation (NTF) Award For Entertainment Robots and Systems Finalist

2008年10月 IEEE

中臺一博

　詳細を見る

researchmap
システムインテグレーション部門講演会優秀講演賞

2006年12月計測自動制御学会

中臺一博

　詳細を見る

researchmap
船井情報科学振興賞

2003年3月 (財)船井情報科学振興財団

中臺一博

　詳細を見る

researchmap
International Conference on Intellignet Robots and Systems (IROS 2001) BEST PAPER Nomination Finalist

2002年10月 IEEE

中臺一博

　詳細を見る

researchmap
テレコムシステム技術賞

2002年3月 (財)電気通信普及財団

中臺一博

　詳細を見る

researchmap
Best Paper Award (1st Prize), International Conference on Industrial Engineering & Other Applications of Applied Intelligent Systems(IEA/AIE 2001)

2001年6月 International Society of Applied Intelligence (ISAI)

中臺一博

　詳細を見る

researchmap
Best Paper Award, International Conference on Information Society (IS-2000)

2000年10月

中臺一博

　詳細を見る

researchmap

▼全件表示

共同研究・競争的資金等の研究課題

スマートドローン聴覚：聴覚コミュニケーション機能を有する災害救助ドローンシステム

研究課題/領域番号：22KF0141 2023年3月 - 2025年3月

日本学術振興会科学研究費助成事業特別研究員奨励費

中臺一博, YEN BENJAMIN

　詳細を見る

配分額：2200000円（直接経費：2200000円）

This research year, we developed and implemented a real-life sound source tracking system using drones equipped with microphone arrays. Previously, such systems were only demonstrated in simulations. Due to strict drone flight regulations in Japan, we designed an indoor system with miniature drones and custom microphones to navigate these restrictions. We also enhanced the system with a drone navigation setup that continuously adjusts drone positions to maximize sound tracking accuracy. Further modifications to the sound tracking algorithms were necessary to address real-life constraints and challenges.
Additionally, we have advanced drone noise reduction techniques for improved sound source tracking, showing promising results in simulations. Real-life testing, however, unveiled unforeseen challenges not anticipated in the simulation phase, necessitating further simulations and experimental tests to refine our approach and meet these new requirements.
These developments contribute to our smart drone audition research theme, utilizing multiple drones with autonomous navigation to enhance sound source tracking performance. This system not only aims to improve the accuracy of locating sound sources but also enhances the quality of recorded audio by minimizing drone noise interference. These advancements are expected to significantly benefit applications where audio clarity and quality are critical.

researchmap
野鳥行動解析のためのマルチモーダル生態環境理解・解析技術の構築

研究課題/領域番号：20H00475 2020年4月 - 2023年3月

日本学術振興会科学研究費助成事業基盤研究(A)

中臺一博, 井手一郎, 鈴木麗璽, 森本元, 松林志保, 小島諒介

　詳細を見る

配分額：45500000円（直接経費：35000000円、間接経費：10500000円）

本研究課題は，ロボット分野で研究開発されてきた「ロボット聴覚技術」を発展させ，視覚処理技術や機械学習技術と統合，生態学・環境学に適用可能な「マルチモーダル環境理解技術」を確立し，野生動物の観測データを質・量ともに数百倍に引き上げる次世代野生動物観測技術の開発により，生態学・環境学を新たなレベルへ導くことをゴールに，野鳥の鳴き声と画像から複数野鳥同時三次元追跡技術を開発し，群れ中の個体間コミュニケーション行動，夜間行動，配偶行動解析に適用すること，実フィールド背景音解析を通じ，音景解析技術を確立，環境・人による野鳥生態系・世代間伝承への影響評価，いずれも手法構築と実フィールド観測・解析の両面から取り組むことを目標としている．初年度については，コロナ禍，ならびにこれに端を発する半導体不足の影響を大きく受け，屋外観測作業が遂行できず，また予定していた新規観測デバイスの構築が遅れた．このため，１年間の繰り越し処理を行ったが，2021年度も大きな状況の好転は見られず，全体として遅延がみられる．この中にあっても，創意工夫を行い，進められる項目について研究を推進し，以下のような実績を上げることができた．
技術的な実績：複数マイクアレイによる三次元追跡技術，校正技術の構築, カメラ付き長期収録デバイスの開発と長期定点観測開始，音景解析技術として，低次元埋め込み手法構築
論文的な実績：雑誌論文7, 国際会議11，国内会議22, 受賞5
その他の実績：本研究課題の国際的なアピール活動として国際会議IEEE/SICE SII 2021 にてオーガナイズドセッション実施，人工知能学会AIチャレンジ研究会で本研究課題をテーマに2回研究会を開催，アウトリーチ活動としてロボット聴覚ソフトウェアHARK講習会を国内外の学会内 (IJCAI2020,人工知能学会合同研究会) で計2回開催．

researchmap
鳥類の鳴き声を題材としたロボット聴覚技術のマルチスケール行動生態観測への応用

研究課題/領域番号：19KK0260 2019年10月 - 2023年3月

日本学術振興会科学研究費助成事業国際共同研究加速基金(国際共同研究強化(B))

鈴木麗璽, 松林志保, 藤田素子, 小島諒介, 中臺一博

　詳細を見る

配分額：18460000円（直接経費：14200000円、間接経費：4260000円）

本課題は，マイクアレイを用いて音を聞き分けるロボット聴覚技術を活用して，「個体・集団・音風景」という時間・空間スケールの異なる鳥類生態の観測に革新的な貢献をもたらすことを目的とする．
本年度は，昨年度から続く新型コロナウイルスの影響により，予定していた米国カリフォルニア州，テキサス州，インドネシアスマトラ島に出向いて行う調査が実施できなかった．カリフォルニアにおいては，一部共同研究者による遠隔での録音サンプルの収録を行いそれに基づく鳴き声分析手法の検討を進めたが，インドネシアに関しては諸々の事情により調査が難しくなった．
このような状況を踏まえ，継続して調査・観測を続けている国内の調査地での録音等も活用して実験観測分析手法の洗練に注力した．具体的には次のとおりである．屋外長期設置が可能な16チャネルマイクアレイの試用．最新の次元圧縮手法を元にした大量のデータにおいても適用可能な識別・定位，教師なし分類手法を検討した．Webベースの録音分析ツールの試作を行った．多数のマイクアレイによる統合的な個体間相互作用分析手法の検討のため，屋外テント内での複数のキンカチョウの鳴き声相互作用を観測・分析した．音源定位方向を反映した疑似色スペクトログラムによる音風景の可視化や，鳥類とセミに関する鳴き声観測手法の検討等を行った．複数マイクアレイを統合，野鳥種類／雌雄の聞き分けを考慮した複数野鳥の三次元追跡技術の性能向上等や，バイオフォニー・ジオフォニー・アンソロフォニーを考慮できる音景解析手法の構築と実フィールドデータによる有効性の検証を行った．国内の希少種を対象としたマイクアレイによる行動観測を複数実施した．
また，コロナ禍終息後の各調査地での調査に関して，研究補助期間の延長を含めた将来の計画について検討した．テキサス州での遠隔調査協力や，カナダでの庁舎協力についても検討を進めた．

researchmap
無人航空機による地上物体認識のための視聴覚統合

研究課題/領域番号：17K00365 2017年4月 - 2020年3月

日本学術振興会科学研究費助成事業基盤研究(C)

公文誠, 中臺一博

　詳細を見る

配分額：4550000円（直接経費：3500000円、間接経費：1050000円）

本課題ではドローンから地上音源を検知する上で、ドローン自身の発する騒音が大きく、また対象音源が遠くにあって、マイクロホンからの信号だけで音源を正確に認識することは難しいことを想定し、カメラとマイクロホンアレイを搭載した無人航空機で安定かつ高精度に対象を認識する技術を目的とした。
間欠的な音情報と連続的だが音源の外見について不確かな動画情報を相補的に統合し、音源の三次元位置推定、複数移動音源の識別・追跡などを実現した。

researchmap
対ロボット認知に基づくインタラクションの「間」の実践的意味づけモデル

研究課題/領域番号：16H02884 2016年4月 - 2020年3月

日本学術振興会科学研究費助成事業基盤研究(B)

今井倫太, 小野哲雄, 中臺一博

　詳細を見る

配分額：16250000円（直接経費：12500000円、間接経費：3750000円）

人とロボットのコミュニケーションにおいて、タイミングや「間」の観点から研究を行い、円滑なコミュニケーションの実現方法の研究を行う。成果の一つ目は、人がロボットとのコミュニケーションに対して感じる飽きを推定する手法を構築した。人の顔の向きから、コミュニケーションの飽きが推定でき、ロボットの会話の質を向上できた。二つ目は、リアルタイムで人の体動を模倣し、「間」を生成する手法を構築した。従来は時間遅延によって体動模倣を人に気がつかれないようにしていたのに対して、本研究では、体動模倣の大きさを変化させる方法を考案した。リアルタイムに気付かれずに体動模倣をし、人とのコミュニケーションを向上できた。

researchmap
野鳥の歌声解析を対象とした屋外音環境理解

研究課題/領域番号：16K00294 2016年4月 - 2019年3月

日本学術振興会科学研究費助成事業基盤研究(C)

中臺一博, 鈴木麗璽, 小島諒介

　詳細を見る

配分額：4550000円（直接経費：3500000円、間接経費：1050000円）

複数のマイクロホンアレイで収録した野鳥の歌声音響信号から，何の野鳥がいつ，どこから，どのように歌っているかを歌声イベントとして抽出し，歌声イベント間の関係から野鳥同士の関係性を構造化・可視化するロボット聴覚と機械学習技術の融合した屋外音環境理解技術を開発した．また，専門家でなくても使いやすい野鳥歌声解析用の屋外音環境理解システムを構築し，人手で行われてきた野鳥の歌声解析作業の負担を軽減し，動物行動学・生物音響学分野に貢献した．

researchmap
ロボット聴覚の実環境理解に向けた多面的展開

研究課題/領域番号：24220006 2012年5月 - 2017年3月

日本学術振興会科学研究費助成事業基盤研究(S)

奥乃博, 中臺一博, 公文誠, 糸山克寿, 吉井和佳, 佐々木洋子, 昆陽雅司, 合原一究, 鈴木麗璽, 加賀美聡, 田所諭

　詳細を見る

配分額：218140000円（直接経費：167800000円、間接経費：50340000円）

本研究では，ロボット聴覚ソフトHARKの「聞き分ける技術」を基に，自然環境・災害現場でも通用するように，豊富な機能拡充・高性能化と応用に取り組んだ．HARKはWindows版提供により9万件弱のダウンロードがあった．多人数インタラクション，音楽共演ロボットの可能性を示し， iGSVD-MUSICの開発によるUAV用音源定位の頑健化，索状ロボット用に姿勢推定・音声強調の開発により，レスキューロボットへの音利用の可能性を示し，さらに，カエルの合唱の解明，野鳥の鳴交解析のためのHARKBirdの開発と実地検証により音響生態学への可能性を実証し，ロボット聴覚の多面的展開のための基礎技術が確立できた．

researchmap
聴覚インタラクションの実現に向けた実環境ロボット聴覚の研究

研究課題/領域番号：24118702 2012年4月 - 2014年3月

日本学術振興会科学研究費助成事業新学術領域研究(研究領域提案型)

中臺一博

　詳細を見る

配分額：9360000円（直接経費：7200000円、間接経費：2160000円）

人とロボットが実環境で，より自然にインタラクションを行う「人ロボット共生のための聴覚インタラクション」実現のため，実環境ロボット聴覚技術を開発することを目的とし，当該年度は，個別基礎技術の洗練化とその統合技術に取り組んだ．
（１）実環境ロボット聴覚のためのセンサ同期技術については，自己雑音推定技術のロボット実機上での評価にフォーカスをあて研究を行った．非負値行列分解をノンパラメトリックベイズモデルを用いて拡張した自己雑音抑圧は，マイクロホン１本で，動作リファレンスを必要としない手法であるため，①マイクロホン間同期処理，②音―動作間同期処理が不要になるというメリットがある．まず，移動台車付ヒューマノイドロボット Hearboで，従来手法の中で高い性能が報告されているテンプレート法と比較を行ったところ，信号対雑音比，信号対妨害音比において，従来手法を上回る性能を確認できた．また，実際に人ロボット共生学のターゲットロボットの一つであるRovbovie Wを用いて評価を行ったところ，Hearbo とほぼ同等の性能が得られた．Robovie W は関節角情報が得られないため，従来法は適用できないことを考慮すると，提案法は，高性能かつ適用範囲が広いといえる．
（２）よい聞き手ロボット構築のための実環境ロボット聴覚技術については，これまで研究開発を行ってきた，①音声の聞き分けを行うためのノンパラメトリックベイズモデルに基づく音源同定手法，および，② 音環境理解のためのマイクロホンアレイを用いた定位・分離・認識の統合技術を構築し，オープンソースのロボット聴覚ソフトHARK上で動作可能とした．さらに，③ 可視化技術に関しては，千葉大学大武研究室と共同で，卓上型マイクロホンアレイ「くらげ君」を開発し，上述のHARKを動作させることで，発話の方向やタイミングを，直感的でわかりやすく視覚化するツールを構築した．

researchmap
ロボット聴覚の実環境理解に向けた多面的展開

研究課題/領域番号：24240035 2012年

日本学術振興会科学研究費助成事業基盤研究(A)

奥乃博, 加賀美聡, 糸山克寿, 公文誠, 中臺一博

　詳細を見る

配分額：21060000円（直接経費：16200000円、間接経費：4860000円）

音は画像と比べ拡散性が強いので,ロボット聴覚による音環境理解は,画像だけでは捉えきれない環境でも理解できる一方,広域から得られる情報の活用方法が課題となる.本研究課題では,既開発のロボット聴覚を基に,実環境音環境理解が可能な安全安心のためのロボット聴覚技術の多面的展開を目的とする.
具体的には,
WP1:多様なマイクロフォンコンフィグレーションへの展開,HARK-16の性能向上や分散設置された複数のマイクロホンアレイの同期方法,
WP2:室内から屋外への展開,室内での音響マップ作成から無人飛行機による空中からの音の取得と音源定位,
WP3:音声から楽音・環境音を含めた音一般への展開,特にノンパラメトリックベイズ信号処理,音光変換による動物音響学,楽器演奏音からの楽器音実時間分離,環境音の擬音語認識,
に取り組むことになっていた.研究開始から辞退までの2ヶ月間で,実験装置の準備と,無人ヘリコプタの使用の詳細化,無人ヘリコプタ搭載用のマルチチャネルAD装置の設計,特に,非同期分散マイクの処理を高性能化するための時間情報付き音響データ転送方式の設計を行った.また,
HARK-Binauralの洗練化,移動音源を対象とした音源定位のベイズ手法の開発,ベイズ手法による突発音や反射音を抑制したMUSIC(Multiple Signal Classification)法の開発,音源の活動状況と音源分離とを同時に推定するノンパラメトリックベイズ手法によるIVA法の開発,楽器音の音モデルのゆらぎを許容する多重演奏曲の楽器音分離法の開発,バンドパスフィルタを用いたカエルホタルの高機能化などに取り組んだ.

researchmap
アクティブ視聴覚統合による動的変化環境下での音環境認識

研究課題/領域番号：22700165 2010年 - 2012年

日本学術振興会科学研究費助成事業若手研究(B)

中臺一博

　詳細を見る

配分額：4030000円（直接経費：3100000円、間接経費：930000円）

ロボットのカメラ・マイクから得られる視聴覚情報をその認識のしやすさ(情報量レベル)に応じて,適切に統合を行い,ロボットの知覚を向上する枠組みを因果ベイズモデルに基づき,提案・構築した.さらに,ロボットの動作をアクティブに制御し,情報量レベル自体を向上させる「アクティブ視聴覚統合」を提案し,構築した枠組みを拡張した.提案した枠組みの有効性を,実機ロボットを用いた音声認識・発話区間検出タスクを通じて実証した.

researchmap
音楽を通じた人とロボットの共生

研究課題/領域番号：22118502 2010年 - 2011年

日本学術振興会科学研究費助成事業新学術領域研究(研究領域提案型)

中臺一博

　詳細を見る

配分額：11960000円（直接経費：9200000円、間接経費：2760000円）

H23年度については,これまでに構築した音楽処理に関連する個々の機能(楽譜情報を利用した頑健なビートトラッキング技術,自己雑音抑制技術,Kinectを用いた手の動き検出技術,フルート奏者のフルートの動き検出を利用した曲の開始・終了検出技術,振動子を用いた人・ロボット合奏モデル)を統合して,実機ロボットを用いた合奏デモを構築した.具体的には,人型ロボット2台,演奏者(人間)2名の4者によるカルテットを実現し,ロボットが人に,また人がロボットに合わせることにより調和のとれた人ロボット音楽インタラクションを実現した.また,人の楽器演奏に合わせてテルミンを演奏するロボットを構築し,ロボット分野で最高峰の国際会議であるIEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2011)のExhibition Sessionや人工知能学会AI-Challenge研究会において実機デモを行い,その有効性を示した.さらに,より人ロボット共生学領域に貢献すべく,ATRで開発した16チャンネル屋内設置型マイクロホンアレイを用いて,複数名が自発的に行う会話に対して,各話者の位置や発話区間を推定する技術を開発した.また,誤推定を測る指標を提案し,その有効性を明らかにした.計画時に提案した音楽インタラクションにとどまらず,マイクロホンアレイを用いたよい聞き手ロボット実現に向けた基礎技術を開発することもでき,計画以上に研究を進めることができた.

researchmap
音環境理解に基づくロボット聴覚の構築

研究課題/領域番号：19100003 2007年 - 2011年

日本学術振興会科学研究費助成事業基盤研究(S)

奥乃博, 尾形哲也, 駒谷和範, 高橋徹, 白松俊, 中臺一博, 北原鉄朗, 糸山克寿, 浅野太, 浅野太

　詳細を見る

配分額：119340000円（直接経費：91800000円、間接経費：27540000円）

音環境理解の主要機能である混合音の音源定位・分離・認識技術を開発し,ロボット聴覚ソフトウエアHARKとして公開し,国内外で複数の講習会を実施した. HARKを応用し,複数話者同時発話を認識する聖徳太子ロボット,ユーザの割込発話を許容する対話処理などを開発し,その有効性を実証した.さらに,多重奏音楽演奏から書くパート演奏を聞き分ける技術,実時間楽譜追跡機能を開発し,人と共演をする音楽ロボットなどに応用した。

researchmap
ロボットを対象とした視聴覚音声認識の研究

研究課題/領域番号：19700158 2007年 - 2008年

日本学術振興会科学研究費助成事業若手研究(B)

中臺一博

　詳細を見る

配分額：3480000円（直接経費：3300000円、間接経費：180000円）

本研究では、実環境でのロボット音声認識を向上させるため、リップリーディングを用いた視聴覚統合、低信頼度の視聴覚情報でも最適な統合を実現するミッシングフィーチャ理論、認識単位を動的に変更するCoarse-to-Fine認識を用いた。この結果、最大50ポイント単語正解率を向上できることを示した。また、研究の過程で得られた課題に対応するため、計画変更を行い、対雑音頑健性および変化への即応性を両立したビートトラッキング手法を開発し、これを用いて歌って踊るロボットを開発した。以上の成果に対して国内外で計4件の賞を受けた。

researchmap

▼全件表示