2026/03/05 更新

写真a

ナカダイ カズヒロ
中臺 一博
nakadai kazuhiro
所属
工学院 教授
職名
教授
プロフィール

1993年東京大学工学部電気工学科卒業,1995年同大学院工学系研究科情報工学専攻修了.1995年から1999年までNTT および NTTコムウェア,1999年から2003年までJST ERATO 北野プロジェクト,2003年から2022年まで(株)ホンダ・リサーチ・インスティチュート・ジャパンに勤務.2022年より東京工業大学工学院システム制御系教授.博士(工学).その間,2006年から2015年まで,東京工業大学大学院情報理工学研究科客員准教授,連携准教授,連携教授兼務.2016年より,東京工業大学工学院システム制御系特定教授, 2017 年より同特任教授を兼務.2011-2018年,早稲田大学理工学術院創造理工学研究科客員教授を兼務.ロボット聴覚,実時間情報統合,音環境理解の研究に従事.2015-2016年,2024-2025年人工知能学会理事,2017-2018年日本ロボット学会理事.IEEE Fellow,日本ロボット学会フェロー.

外部リンク

News & Topics
  • Listening drone helps find victims needing rescue in disasters

    2017/12/22

    掲載言語: 英語

      詳細を見る

    As part of the ImPACT Tough Robotics Challenge Program, an initiative of the Cabinet Office of Japan, a Japanese research group has developed the first system worldwide that is able to detect acoustic signals such as voices from victims needing rescue, even when they are difficult to find or are in places cameras cannot be used. This system was developed using three technological elements: a microphone array technology for the robot ears, an interface for visualization of invisible sounds, and a microphone array that is easily connected to a drone, even in rainy weather.

  • ドローンが耳を澄まして要救助者の位置を検出 ―災害発生時の迅速な救助につながる技術を開発―

    2017/12/08

    掲載言語: 日本語

      詳細を見る

    ドローンのようなロボットによる人命救助はカメラなど視覚的な方法が主 集音方法を工夫して雑音減らし、瓦礫の下の人の声などを検出 迅速かつ効率的な人命救助に活用できる全天候型システムを開発 暗くても、うるさくても、見えない場所でも、音を検出可

学位

  • Ph. D. ( The Univ. of Tokyo )

研究キーワード

  • ロボット聴覚

  • 音環境理解

  • 音響信号処理

  • ロボティクス

  • 人工知能

研究分野

  • 情報通信 / 知能ロボティクス  / ロボット聴覚

  • 情報通信 / 知能情報学  / 音環境理解

  • 情報通信 / ヒューマンインタフェース、インタラクション  / HMI. HRI

  • 情報通信 / ソフトウェア  / オープンソースソフトウェア

学歴

  • 東京大学 大学院   情報工学専攻

    1993年4月 - 1995年3月

      詳細を見る

  • 東京大学   工学部   電気工学科

    1991年4月 - 1993年3月

      詳細を見る

  • 東京大学   教養学部   理科一類

    1989年4月 - 1991年3月

      詳細を見る

経歴

  • 東京科学大学   工学院システム制御系   教授   博士(工学)

    2024年10月 - 現在

      詳細を見る

    国名:日本国

    researchmap

  • 東京工業大学   工学院システム制御系   教授   博士(工学)

    2022年4月 - 2022年9月

      詳細を見る

    国名:日本国

    researchmap

  • 東京工業大学   工学院 システム制御系(大学院 情報理工学研究科からの改組による)   特定教授→特任教授(2017.6)

    2016年4月 - 2022年3月

      詳細を見る

  • 早稲田大学   理工学術院 創造理工学研究科   客員教授

    2011年4月 - 2018年3月

      詳細を見る

  • 東京工業大学   大学院 情報理工学研究科   客員助教授→客員准教授(2008)→連携准教授(2009)→連携教授(2012)

    2006年4月 - 2016年3月

      詳細を見る

  • 株式会社 ホンダ・リサーチ・インスティチュート・ジャパン   プリンシパル・サイエンティスト

    2003年5月 - 2022年3月

      詳細を見る

  • 独立行政法人 科学技術振興事業団 ERATO北野共生システムプロジェクト   研究員

    1999年7月 - 2003年4月

      詳細を見る

  • NTTコミュニケーションウェア株式会社   社員

    1997年9月 - 1999年6月

      詳細を見る

  • 日本電信電話株式会社   社員

    1995年4月 - 1999年6月

      詳細を見る

▼全件表示

所属学協会

▼全件表示

委員歴

  • 日本ロボット学会   理事  

    2025年3月 - 2027年3月   

      詳細を見る

    団体区分:学協会

    researchmap

  • 人工知能学会   理事  

    2024年7月 - 2026年6月   

      詳細を見る

    団体区分:学協会

    researchmap

  • 日本ロボット学会   理事  

    2017年4月 - 2019年3月   

      詳細を見る

    団体区分:学協会

    researchmap

  • 人工知能学会   理事  

    2015年7月 - 2017年6月   

      詳細を見る

    団体区分:学協会

    researchmap

論文

▼全件表示

書籍等出版物

  • AIの活用と感情に寄り添う音声認識・合成の新展開 査読

    伊藤, 彰則, 森川, 大輔, 上江洲, 安史, 鳥谷, 輝樹, 高野, 佐代子, 河原, 達也, 鵜木, 祐史, 齊藤, 剛史, 吉村, 奈津江, 平井, 重行, 中島, 佐和子, 大河内, 直之, 中臺, 一博, 糸山, 克寿, 福森, 隆寛, 周藤, 唯, 松田, 裕之, 渡辺, 光太朗, 白土, 浩司, 三井, 祥幹, 鳥居, 崇, 中川, 達也, 高橋, 敏, 加藤, 集平

    エヌ・ティー・エス  2025年4月  ( ISBN:9784860439361

     詳細を見る

    総ページ数:1, 7, 254, 6p, 図版5p   記述言語:日本語  

    CiNii Books

    researchmap

  • ロボット聴覚の基礎 : 実環境での音源定位・分離技術 査読

    中臺, 一博, 糸山, 克寿

    オーム社  2025年2月  ( ISBN:9784274232527

     詳細を見る

    総ページ数:vi, 214p   記述言語:日本語  

    CiNii Books

    researchmap

  • 感覚デバイス開発―機器が担うヒト感覚の生成・拡張・代替技術 査読

    廣瀬通孝, 小柳光正, 石鍋隆宏, 川上徹, 小澤史朗, 八木康史, 長原一, 鏡慎吾, 徐剛, 奥乃博, 中臺一博, ホンダ・リサーチ, インスティチュート・ジャパン, ほか執筆者

    エヌティーエス  2014年11月  ( ISBN:4864690642

     詳細を見る

    総ページ数:424   記述言語:日本語  

    ASIN

    researchmap

MISC

  • 野鳥の歌分析用マイクロホンアレイの開発とその応用

    中臺 一博

    人工知能学会第二種研究会資料   2024 ( Challenge-064 )   01   2024年3月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)   出版者・発行元:一般社団法人 人工知能学会  

    DOI: 10.11517/jsaisigtwo.2024.challenge-064_01

    CiNii Research

    J-GLOBAL

    researchmap

  • Video Vision Transformerに基づく音源定位の提案

    横田遥大, BOZKURTLAR Mert, BOZKURTLAR Mert, YEN Benjamin, 糸山克寿, 西田健次, 中臺一博

    日本ロボット学会学術講演会予稿集(CD-ROM)   42nd   2024年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    J-GLOBAL

    researchmap

  • 屋外環境下でのドローンのローターノイズによる地表材質推定手法の検討

    矢野翼, YEN Benjamin, 糸山克寿, 中臺一博

    日本ロボット学会学術講演会予稿集(CD-ROM)   42nd   2024年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    J-GLOBAL

    researchmap

  • 動画中の稀少イベントとしての小領域移動物体の検出手法

    西田健次, 糸山克寿, 糸山克寿, 中臺一博

    人工知能学会第二種研究会資料(Web)   2024 ( Challenge-064 )   05   2024年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)   出版者・発行元:一般社団法人 人工知能学会  

    DOI: 10.11517/jsaisigtwo.2024.challenge-064_05

    CiNii Research

    J-GLOBAL

    researchmap

  • 複数のドローンを用いた音源探査のためのROSネットワークの構築

    山本拓実, 干場功太郎, YEN Benjamin, 中臺一博

    日本ロボット学会学術講演会予稿集(CD-ROM)   42nd   2024年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    J-GLOBAL

    researchmap

  • 距離学習を用いた話者識別に基づく話者ダイアライゼーションの検討

    阿坂脩平, 西田健次, 糸山克寿, 中臺一博

    日本ロボット学会学術講演会予稿集(CD-ROM)   42nd   2024年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    J-GLOBAL

    researchmap

  • LCMVベースのScan-and-Sum Beamformerによる面領域内音源の抽出

    安江蒼人, YEN Benjamin, 糸山克寿, 中臺一博

    日本ロボット学会学術講演会予稿集(CD-ROM)   42nd   2024年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    J-GLOBAL

    researchmap

  • ガウス過程回帰を用いた音響伝達関数の環境変化適応

    藤田侑樹, 糸山克寿, 西田健次, 中臺一博

    日本ロボット学会学術講演会予稿集(CD-ROM)   42nd ( Challenge-066 )   06   2024年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)   出版者・発行元:一般社団法人 人工知能学会  

    DOI: 10.11517/jsaisigtwo.2024.challenge-066_06

    CiNii Research

    J-GLOBAL

    researchmap

  • Biasing Networkを用いた音声認識の雑音耐性向上

    大崎崇博, 周藤唯, 糸山克寿, 中臺一博

    日本ロボット学会学術講演会予稿集(CD-ROM)   42nd   2024年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    J-GLOBAL

    researchmap

  • 自他ドローン雑音を考慮した複数ドローンによる音源追跡性能の向上

    三好智大, 山田泰基, 山田泰基, YEN Benjamin, 中臺一博

    計測自動制御学会システムインテグレーション部門講演会(CD-ROM)   25th   2024年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    J-GLOBAL

    researchmap

  • ドローン搭載マイクロホンを用いた環境音識別

    野島稔生, 大崎崇博, 矢野翼, YEN Benjamin, 中臺一博

    計測自動制御学会システムインテグレーション部門講演会(CD-ROM)   25th   2024年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    J-GLOBAL

    researchmap

  • 話者情報を利用した距離ベース 時間周波数マスク推定による音声強調の向上

    田口鐵人, 石井遼平, 大崎崇博, 阿坂脩平, YEN Benjamin, 糸山克寿, 中臺一博

    計測自動制御学会システムインテグレーション部門講演会(CD-ROM)   25th   2024年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    J-GLOBAL

    researchmap

  • HARK3.6およびそのアクティブドローン聴覚への応用

    中臺一博, 公文誠, 佐々木洋子, 干場功太郎, YEN Benjamin, 糸山克寿, 瀧ヶ平将行, 寺門直哉, LIN Zirui, GULZAR Haris, BUSTO Monikka Rosalianna, 江田毅晴, 天野英晴

    計測自動制御学会システムインテグレーション部門講演会(CD-ROM)   25th   2024年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    J-GLOBAL

    researchmap

  • 気配センシングに向けた磁束密度センサと風速センサを用いた動作検出

    川口洋慶, SHAKEEL Muhammad, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

    日本ロボット学会学術講演会予稿集(CD-ROM)   41st   2023年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    J-GLOBAL

    researchmap

  • ロボット聴覚のための音源定位と深層ブラインド音源分離の統合

    合澤隆拓, 合澤隆拓, 坂東宜昭, 糸山克寿, 糸山克寿, 西田健次, 中臺一博, 大西正輝

    日本ロボット学会学術講演会予稿集(CD-ROM)   41st   2023年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    J-GLOBAL

    researchmap

  • 面音源抽出のための複数拘束MVDRビームフォーマーの逐次計算による高速化

    安江蒼人, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

    日本ロボット学会学術講演会予稿集(CD-ROM)   41st   2023年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    J-GLOBAL

    researchmap

  • フォンミーゼス分布に基づく音響伝達関数オンライン適応の向上

    藤田侑樹, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

    日本ロボット学会学術講演会予稿集(CD-ROM)   41st   2023年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    J-GLOBAL

    researchmap

  • 音声強調ネットワークとアダプターを用いた音声認識の耐雑音ロバスト性向上

    大崎崇博, 周藤唯, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

    日本ロボット学会学術講演会予稿集(CD-ROM)   41st   2023年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    J-GLOBAL

    researchmap

  • ロボット聴覚オープンソースソフトウェアHARKのPython化,および組込み向け実装の紹介

    中臺一博, LIN Zirui, 糸山克寿, 糸山克寿, 瀧ヶ平将行, 寺門直哉, GULZAR Haris, BUSTO Monikka Rosalianna, 江田毅晴, 天野英晴

    計測自動制御学会システムインテグレーション部門講演会(CD-ROM)   24th   2023年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    J-GLOBAL

    researchmap

  • 自然な音声対話AIに向けたシステム応答法の検討

    阿坂脩平, 西田健次, 糸山克寿, 糸山克寿, 中臺一博

    計測自動制御学会システムインテグレーション部門講演会(CD-ROM)   24th   2023年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    J-GLOBAL

    researchmap

  • ドローンのローターノイズによる地表材質推定手法の検討

    矢野翼, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

    計測自動制御学会システムインテグレーション部門講演会(CD-ROM)   24th   2023年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    J-GLOBAL

    researchmap

  • 可聴音ベースの反響定位に基づく3次元空間認識の5チャネルマイクロホンアレイによる向上

    小林宙輝, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

    計測自動制御学会システムインテグレーション部門講演会(CD-ROM)   24th   2023年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    J-GLOBAL

    researchmap

  • フーリエ級数展開を用いた軽量伝達関数のオンライン適応による音源定位・分離の向上

    周藤唯, 瀧ケ平将行, 中臺一博, 中島弘史

    人工知能学会第二種研究会資料(Web)   2023 ( Challenge-063 )   08   2023年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)   出版者・発行元:一般社団法人 人工知能学会  

    DOI: 10.11517/jsaisigtwo.2023.challenge-063_08

    CiNii Research

    J-GLOBAL

    researchmap

  • Parallel Adapter ModelとNear-Identity初期化を用いた音声認識の雑音耐性向上

    大崎崇博, 周藤唯, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

    人工知能学会第二種研究会資料(Web)   2023 ( Challenge-063 )   2023年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    J-GLOBAL

    researchmap

  • 生成モデルによる形質表現を活用した鳥類の鳴き声に関する進化モデルとフィールド実験の融合の試み

    鈴木麗璽, 古山諒, HARLOW Zachary, 中臺一博, 有田隆也

    人工知能学会第二種研究会資料(Web)   2023 ( Challenge-063 )   07   2023年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)   出版者・発行元:一般社団法人 人工知能学会  

    DOI: 10.11517/jsaisigtwo.2023.challenge-063_07

    CiNii Research

    J-GLOBAL

    researchmap

  • 鳥類の鳴き声行動の理解に対するロボット聴覚に基づく観測と生成進化モデル

    古山諒, 鈴木麗璽, 中臺一博, 有田隆也

    日本鳥学会大会講演要旨集   2023   2023年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    J-GLOBAL

    researchmap

  • 鳴き声の音源定位によるシマフクロウの生息位置把握の試み

    土門優介, 鈴木祐太郎, 石塚正仁, 内山秀樹, 矢野幹也, 鈴木麗璽, 中臺一博

    日本鳥学会大会講演要旨集   2023   2023年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    J-GLOBAL

    researchmap

  • マイクロホンアレイを用いた渡り鳥の群れの飛行ルート推定

    山本悠貴, 鈴木麗璽, 中臺一博, 東信行

    日本鳥学会大会講演要旨集   2023   2023年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    J-GLOBAL

    researchmap

  • 一夫一妻制鳥類のリュウキュウコノハズクは交尾声で異性を惹きつけるのか?

    金杉尚紀, 澤田明, 佐々木瑠太, 細江隼平, 中臺一博, 高木昌興

    日本鳥学会大会講演要旨集   2023   2023年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    J-GLOBAL

    researchmap

  • ヒバリの求愛飛行実測の試み

    松林志保, 斎藤史之, 鈴木麗璽, 中臺一博, 奥乃博

    日本鳥学会大会講演要旨集   2023   2023年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    J-GLOBAL

    researchmap

  • 深層フルランク空間相関分析に基づく遠隔音声認識のフロントエンド

    合澤, 隆拓, 坂東, 宜昭, 糸山, 克寿, 西田, 健次, 中臺, 一博

    第84回全国大会講演論文集   2022 ( 1 )   285 - 286   2022年2月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    雑踏環境下でも頑健な音声認識をする実現するには,音源分離により目的音源を抽出するフロントエンドが不可欠である.このような音源分離は,学習コストの観点から教師なしでの動作が望ましく,混合複素角度中心ガウス法や多チャネル非負値行列因子分解といった線形型確率モデルに基づく手法が提案されていた.本稿では,より高い表現能力をもつ深層フルランク空間相関分析 (neural FCA) に基づくフロントエンドを提案する.Neural FCAは,フルランク空間モデルと深層音源モデルを統合した非線形型確率モデルであり,従来の枠組みより精緻な分離性能を教師なしで獲得できる.Neural FCAを多人数対話のための音声認識フロントエンドとして拡張し,拡散性雑音を含む複数話者の混合音で評価した認識性能を報告する.

    CiNii Books

    CiNii Research

    researchmap

  • Blockwiseストリーミング音声認識と発話区間検出の統合 国際共著

    周藤唯, SHAKEEL Muhammad, 中臺一博, SHI Jiatong, 渡部晋二

    人工知能学会第二種研究会資料(Web)   2022 ( Challenge-061 )   10   2022年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)   出版者・発行元:一般社団法人 人工知能学会  

    DOI: 10.11517/jsaisigtwo.2022.challenge-061_10

    CiNii Research

    J-GLOBAL

    researchmap

  • PyHARK:HARKのオンライン・オフライン処理用Pythonパッケージ

    中臺一博, 瀧ヶ平将行, 糸山克寿, 糸山克寿

    人工知能学会第二種研究会資料(Web)   2022 ( Challenge-061 )   04   2022年

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 人工知能学会  

    本稿では,ロボット聴覚オープンソースソフトウェア HARK 3.4 で新規に導入されるPyHARK をHARK講習会に先立ち紹介する。PyHARK は HARK の Python インタフェースを提供するパッケージであり,Python から HARK の機能のオンライン・オフライン呼び出しを可能にする実装である。そのアーキテクチャ,既存のHARKとの違い,使い方を中心に解説する。

    DOI: 10.11517/jsaisigtwo.2022.challenge-061_04

    CiNii Research

    J-GLOBAL

    researchmap

  • 低解像度画像からの小領域物体の検出手法の検討

    西田健次, 糸山克寿, 糸山克寿, 中臺一博

    人工知能学会第二種研究会資料(Web)   2022 ( Challenge-061 )   03   2022年

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 人工知能学会  

    野鳥の生態観測のための全天録画画像から、実際に野鳥の録画されている時間帯を切り出す手法について検討を行った。野鳥に対する画像解像度が低く、また、樹木の枝などでのオクルージョンが繰り返されるため、通常の物体検出、物体追跡手法では対応が難しい。野鳥自体の動き、野鳥による樹木の枝の動きを手掛かりとして、検出・追跡を行う手法について検討した。

    DOI: 10.11517/jsaisigtwo.2022.challenge-061_03

    CiNii Research

    J-GLOBAL

    researchmap

  • 音声に基づくヒクイナの個体数推定と生息地利用状況の可視化

    松林志保, 斎藤史之, 鈴木麗璽, 中臺一博, 奥乃博

    日本鳥学会大会講演要旨集   2022   2022年

     詳細を見る

  • 野外鳥類集団における音声相互作用分析のためのマイクロホンアレイに基づく自動観測の検討

    鈴木麗璽, 炭谷晋司, 有田隆也, 松林志保, 中臺一博, 奥乃博

    日本鳥学会大会講演要旨集   2022   2022年

     詳細を見る

  • ロボット聴覚用音響処理ソフトウェアHARKを用いたサウンドスケープの解析

    山本遼, 西田健次, 糸山克寿, 糸山克寿, 松林志穂, 鈴木麗璽, 中臺一博

    日本鳥学会大会講演要旨集   2022   2022年

     詳細を見る

  • 複数マイクロホンアレイのパラメータ同時最適化

    杉山地塩, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

    日本ロボット学会学術講演会予稿集(CD-ROM)   40th   2022年

     詳細を見る

  • 音源定位結果の3D可視化とmAPベースの評価指標の提案

    山本遼, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

    日本ロボット学会学術講演会予稿集(CD-ROM)   40th   2022年

     詳細を見る

  • 環境イベント識別学習フレームワークの提案とその日本語テキスト入力からの音響シーン生成部の実装

    露口弘毅, MUHAMMAD Shakeel, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

    日本ロボット学会学術講演会予稿集(CD-ROM)   40th   2022年

     詳細を見る

  • アンサンブル時間周波数マスクを用いた複数の音声強調手法の統合

    藤田雅彦, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

    日本ロボット学会学術講演会予稿集(CD-ROM)   40th   2022年

     詳細を見る

  • 複数のマイクロホンアレイ搭載ドローンの配置最適化による音源追跡性能の向上

    山田泰基, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

    日本ロボット学会学術講演会予稿集(CD-ROM)   40th   2022年

     詳細を見る

  • 音源分離処理のFPGA上での実装

    QIN Ziquan, WEI Kaijie, 天野英晴, 中臺一博

    電子情報通信学会技術研究報告(Web)   122 ( 174(RECONF2022 26-41) )   2022年

     詳細を見る

  • 最頻値フィルタを用いた音響伝達関数の環境適応手法の検討

    藤田侑樹, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

    計測自動制御学会システムインテグレーション部門講演会(CD-ROM)   23rd   2022年

     詳細を見る

  • 音響伝達関数の二次元補間手法の提案とその音源定位への適用

    大崎崇博, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

    計測自動制御学会システムインテグレーション部門講演会(CD-ROM)   23rd   2022年

     詳細を見る

  • HARK3.4~PyHARKの紹介~

    中臺一博, 糸山克寿, 糸山克寿

    計測自動制御学会システムインテグレーション部門講演会(CD-ROM)   23rd   2022年

     詳細を見る

  • Scan-and-Sum Beamformerの拡張による二次元領域抽出の検討

    安江蒼人, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

    計測自動制御学会システムインテグレーション部門講演会(CD-ROM)   23rd   2022年

     詳細を見る

  • 複数音源追跡におけるドローン群の行動計画の検討

    山田泰基, 糸山克寿, 糸山克寿, 西田健次, 中臺一博

    人工知能学会第二種研究会資料(Web)   2022 ( Challenge-061 )   07   2022年

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 人工知能学会  

    DOI: 10.11517/jsaisigtwo.2022.challenge-061_07

    CiNii Research

    J-GLOBAL

    researchmap

  • 任意の混合音を入力としたマイクロホンアレイ形状のキャリブレーション

    糸山克寿, 糸山克寿, 中臺一博

    人工知能学会第二種研究会資料(Web)   2022 ( Challenge-061 )   11   2022年

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 人工知能学会  

    本稿では,マイクロホンアレイの形状,すなわち各マイクロホンの位置をキャリブレーションする手法について述べる.特殊な試験音ではなく任意の混合音を入力とするため,(1)基準位置に基づくマイクロホン位置の事前確率、(2)音源スペクトルの事前確率、(3)録音スペクトルの条件付確率の3つの確率の積として定義されるスペクトルの確率的生成モデルに基づく反復アルゴリズムで推定を行う.

    DOI: 10.11517/jsaisigtwo.2022.challenge-061_11

    CiNii Research

    J-GLOBAL

    researchmap

  • 音源位置特定処理のFPGAボードへのオフロード

    HOU Zhongyang, WEI Kaijie, 天野英晴, 中臺一博

    電子情報通信学会技術研究報告(Web)   122 ( 174(RECONF2022 26-41) )   2022年

     詳細を見る

  • ロボット聴覚用音響処理ソフトウェアHARKを用いたサウンドスケープの分析および考察

    山本遼, 西田健次, 糸山克寿, 中臺一博, 中臺一博

    日本生態学会大会講演要旨(Web)   69th   2022年

     詳細を見る

  • 音源定位技術を用いた野外鳥類の音声相互作用の分析手法の検討

    鈴木麗璽, 炭谷晋司, 松林志保, 有田隆也, 中臺一博, 中臺一博, 奥乃博

    日本生態学会大会講演要旨(Web)   69th   2022年

     詳細を見る

  • 野外での鳥類鳴き声観測のためのWebベース録音ユニットと可視化ツールの試作

    炭谷晋司, 大和祐介, 鈴木麗璽, 小島諒介, 有田隆也, 中臺一博, 中臺一博, 奥乃博, 奥乃博

    日本ロボット学会学術講演会予稿集(CD-ROM)   39th   2021年

     詳細を見る

  • 鳥類の鳴き声観測に対するロボット聴覚アプローチ

    鈴木麗璽, 炭谷晋司, 松林志保, 有田隆也, 中臺一博, 中臺一博, 奥乃博, 奥乃博

    日本生態学会大会講演要旨(Web)   68th   2021年

     詳細を見る

  • 類似度行列を考慮した野鳥の歌自動識別の検討

    山本遼, 中臺一博, 中臺一博, 西田健次, 糸山克寿

    日本ロボット学会学術講演会予稿集(CD-ROM)   39th   2021年

     詳細を見る

  • エコロケーションに基づく視覚シーンの再構成手法の提案と入力特徴量の検討

    岸波華彦, 糸山克寿, 西田健次, 中臺一博, 中臺一博

    日本ロボット学会学術講演会予稿集(CD-ROM)   39th   2021年

     詳細を見る

  • 複数マイクアレイを用いたキンカチョウの時空間的発声パターンに基づく個体間相互作用の調査

    炭谷晋司, 鈴木麗璽, 有田隆也, 和多和宏, 松林志保, 中臺一博, 中臺一博, 奥乃博

    人工知能学会第二種研究会資料(Web)   2021 ( Challenge-058 )   2021年

     詳細を見る

  • 伝達関数の常時オンライン適応による音源定位・分離の向上

    中臺一博, 中臺一博, 瀧ケ平雅行, 河合熊輔, 中島弘史

    人工知能学会第二種研究会資料(Web)   2021 ( Challenge-058 )   2021年

     詳細を見る

  • 複数マイクロホンアレイを用いたNMFによる空間音源分離法の残響下での評価

    鍵本泰宏, 糸山克寿, 西田健次, 中臺一博, 中臺一博

    人工知能学会第二種研究会資料(Web)   2021 ( Challenge-058 )   05   2021年

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 人工知能学会  

    DOI: 10.11517/jsaisigtwo.2021.challenge-058_05

    CiNii Research

    J-GLOBAL

    researchmap

  • 転移学習を用いた音響クラス分類の検討

    露口弘毅, 西田健次, 糸山克寿, 中臺一博, 中臺一博

    計測自動制御学会システムインテグレーション部門講演会(CD-ROM)   22nd   2021年

     詳細を見る

  • ロボット聴覚5.0~変遷と展望~

    中臺一博, 中臺一博

    計測自動制御学会システムインテグレーション部門講演会(CD-ROM)   22nd   2021年

     詳細を見る

  • スポットフォーミングによる音声認識性能向上の評価

    合澤隆拓, 鍵本泰宏, 西田健次, 糸山克寿, 中臺一博, 中臺一博

    計測自動制御学会システムインテグレーション部門講演会(CD-ROM)   22nd   2021年

     詳細を見る

  • 複数マイクロホンアレイの同期および3次元位置・姿勢推定の同時最適化の検討

    杉山地塩, 糸山克寿, 西田健次, 中臺一博, 中臺一博

    日本ロボット学会学術講演会予稿集(CD-ROM)   39th   2021年

     詳細を見る

  • アンサンブル時間周波数マスクによる音声強調手法の評価

    藤田雅彦, 糸山克寿, 西田健次, 中臺一博, 中臺一博

    日本ロボット学会学術講演会予稿集(CD-ROM)   39th   2021年

     詳細を見る

  • ヒクイナの鳴き声自動観測の可能性と今後の課題

    松林志保, 斎藤史之, 鈴木麗璽, 中臺一博, 中臺一博, 奥乃博, 奥乃博

    日本鳥学会大会講演要旨集   2021 (CD-ROM)   2021年

     詳細を見る

  • 類似度行列による野鳥の歌識別器の検討

    山本遼, 中臺一博, 中臺一博, 糸山克寿, 西田健次, 鈴木麗璽, 松林志保

    日本鳥学会大会講演要旨集   2021 (CD-ROM)   2021年

     詳細を見る

  • ロボット聴覚技術に基づく鳥類音声の方位角・仰角に関する音源定位と音風景の観測

    鈴木麗璽, 林晃一郎, 大坂英樹, 松林志保, 有田隆也, 中臺一博, 中臺一博, 奥乃博, 奥乃博

    日本鳥学会大会講演要旨集   2021 (CD-ROM)   2021年

     詳細を見る

  • 音で追跡するフクロウの巣立ち

    松林 志保, 斎藤 史之, 鈴木 麗璽, 中臺 一博, 奥乃 博

    景観生態学 = Landscape ecology and management   25 ( 1 )   87 - 89   2020年6月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本景観生態学会  

    CiNii Books

    J-GLOBAL

    researchmap

  • ロボット聴覚技術を用いた鳥類の鳴き声観測に対するマルチスケールアプローチ

    鈴木麗璽, 炭谷晋司, 松林志保, 有田隆也, 中臺一博, 奥乃博

    第67回日本生態学会大会   67th   2020年3月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • ロボット聴覚からのクロスモーダルへの期待—メディアエクスペリエンス・バーチャル環境基礎

    中臺 一博

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   119 ( 386 )   107 - 112   2020年1月

     詳細を見る

    記述言語:日本語   出版者・発行元:東京 : 電子情報通信学会  

    CiNii Research

    researchmap

    その他リンク: https://ndlsearch.ndl.go.jp/books/R000000004-I030249880

  • ドローン搭載マイクロホンアレイを用いた音源探査の高精度化に向けた静音プロペラの開発

    干場功太郎, 野田龍介, 中田敏是, 劉浩, 泉田啓, 中臺一博, 中臺一博, 公文誠, 奥乃博, 奥乃博

    日本ロボット学会学術講演会予稿集(CD-ROM)   38th   2020年

     詳細を見る

  • 表情による感情推定と音声による感情推定手法の検討

    西田健次, 山田亨, 糸山克寿, 中臺一博, 中臺一博

    人工知能学会AIチャレンジ研究会(Web)   57th   2020年

     詳細を見る

  • 重み付け尤度関数と定在波を用いた可聴音による二次元環境認識

    岸波華彦, 糸山克寿, 西田健次, 中臺一博, 中臺一博

    日本ロボット学会学術講演会予稿集(CD-ROM)   38th   2020年

     詳細を見る

  • テニスの打球音による球種識別の検討

    山本修己, 西田健次, 糸山克寿, 中臺一博, 中臺一博

    日本ロボット学会学術講演会予稿集(CD-ROM)   38th   2020年

     詳細を見る

  • ロボット聴覚技術の活用による鳥類音声の到来方向に基づく音風景の可視化の検討

    鈴木麗璽, ZHAO Hao, 炭谷晋司, 松林志保, 有田隆也, 中臺一博, 中臺一博, 奥乃博, 奥乃博

    日本ロボット学会学術講演会予稿集(CD-ROM)   38th   2020年

     詳細を見る

  • 複数マイクロホンアレイを用いたNMFによる空間音源分離法の提案と評価

    鍵本泰宏, 糸山克寿, 西田健次, 中臺一博, 中臺一博

    日本ロボット学会学術講演会予稿集(CD-ROM)   38th   2020年

     詳細を見る

  • 環境音情報と画像情報を用いた物体検出による音ラベル付きセグメントの生成

    鈴木啓, 糸山克寿, 西田健次, 中臺一博, 中臺一博

    日本ロボット学会学術講演会予稿集(CD-ROM)   38th   2020年

     詳細を見る

  • The 31st IEEE/RSJ International Conference on Intelligent Systems and Robots (IROS 2018)

    中臺 一博

    日本ロボット学会誌   37 ( 1 )   70 - 72   2019年

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 日本ロボット学会  

    DOI: 10.7210/jrsj.37.70

    CiNii Books

    CiNii Research

    researchmap

    その他リンク: https://ndlsearch.ndl.go.jp/books/R000000004-I029462341

  • 柔軟索状レスキューロボットのための空気噴射音下での単チャネル音声強調

    坂東宜昭, 安部祐一, 糸山克寿, 糸山克寿, 昆陽雅司, 田所諭, 中臺一博, 中臺一博, 奥乃博

    日本機械学会ロボティクス・メカトロニクス講演会講演論文集(CD-ROM)   2019   2019年

     詳細を見る

  • 「見えない」鳥を音で追う:定位技術を活用した鳥類観測

    松林志保, 斎藤史之, 鈴木麗璽, 中臺一博, 奧乃博

    日本景観生態学会大会発表要旨集(Web)   29th   2019年

     詳細を見る

  • ドローンによる地上音源の位置推定―HARKを用いたドローン聴覚の取り組み―

    公文誠, 若林瑞保, 干場功太郎, 中臺一博, 中臺一博, 奥乃博

    計測自動制御学会システムインテグレーション部門講演会(CD-ROM)   19th   ROMBUNNO.2E3‐09   2018年12月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 920MHz帯マルチホップ無線通信システムを用いたドローン制御およびセンサデータ伝送の実証実験

    加川敏規, 小野文枝, SHAN Lin, 三浦龍, 中臺一博, 干場功太郎, 公文誠, 奥乃博, 加藤晋, 児島史秀

    電子情報通信学会技術研究報告   118 ( 344(RCC2018 58-106) )   217‐221   2018年11月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • Fine-scale observations of spatiotemporal dynamics and vocalization type of birdsongs using microphone arrays and unsupervised feature mapping

    Reiji Suzuki, Shinji Sumitani, Shiho Matsubayashi, Takaya Arita, Kazuhiro Nakadai, Hiroshi G. Okuno

    Proceedings of the 10th International Conference on Ecological Informatics   72-73   2018年9月

     詳細を見る

    記述言語:英語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    researchmap

  • Spatial localization of vocalizations of Spotted Towhee (Pipilo maculatus) in playback experiments using robot audition techniques 査読

    Shinji Sumitani, Reiji Suzuki, Shiho Matsubayashi, Takaya Arita, Kazuhiro Nakadai, Hiroshi G. Okuno

    Proceedings of the 10th International Conference on Ecological Informatics   265   2018年9月

     詳細を見る

    記述言語:英語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    researchmap

  • 音情報を活用したフクロウの歌行動観測の試み

    松林志保, 斎藤史之, 鈴木麗璽, 中臺一博, 中臺一博, 奥乃博

    日本鳥学会大会講演要旨集   2018   72   2018年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • ロボット聴覚技術に基づく鳥類の歌行動の二次元定位精度改善と次元圧縮に基づく分類支援

    炭谷晋司, 鈴木麗璽, 松林志保, 有田隆也, 中臺一博, 中臺一博, 奥乃博

    日本鳥学会大会講演要旨集   2018   73   2018年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • マイクロホンアレイを用いた鳥類の歌行動の三次元音源到来方向推定

    林晃一郎, 鈴木麗璽, 松林志保, 有田隆也, 小島諒介, 中臺一博, 中臺一博, 奥乃博

    日本鳥学会大会講演要旨集   2018   74   2018年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 複数のマイクロホンアレイの遠隔制御に基づく鳥類の歌行動の二次元定位

    森松健充, 炭谷晋司, 鈴木麗璽, 松林志保, 有田隆也, 中臺一博, 中臺一博, 奥乃博

    日本鳥学会大会講演要旨集   2018   72   2018年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 複数のマイクロホンアレイをネットワーク制御可能な鳥類の歌行動観測システムの構築

    森松健充, 炭谷晋司, 鈴木麗璽, 松林志保, 有田隆也, 中臺一博, 中臺一博, 奥乃博

    日本ロボット学会学術講演会予稿集(CD-ROM)   36th   ROMBUNNO.2J2‐03   2018年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 音響センサによるサイバー救助犬のパンディングの検出

    鈴木拓也, 中臺一博, 中臺一博, 奥乃博, 星達也, 水野直希, 大貫和也, 濱田龍之介, 大野和則, 干場功太郎

    日本ロボット学会学術講演会予稿集(CD-ROM)   36th   ROMBUNNO.2J2‐05   2018年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • マイクロホンアレイを用いた鳥類の3次元音源到来方向推定

    林晃一郎, 鈴木麗璽, 松林志保, 有田隆也, 小島諒介, 中臺一博, 奧乃博

    日本鳥学会2018年度大会講演要旨集   74   2018年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • Understanding relationships between spatial movements and bird song-types using a robot audition system HARK with microphone arrays 査読

    Shinji Sumitani, Reiji Suzuki, Shiho Matsubayashi, Takaya Arita, Kazuhiro Nakadai, Hiroshi G. Okuno

    Proc. of the 27th International Ornithological Congress   188   2018年8月

     詳細を見る

    記述言語:英語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    researchmap

  • Acoustic monitoring of the nocturnal owl (Strix uralensis) using microphone arrays and a robot audition system, HARK: A case study in the Ikoma mountains, Japan 査読

    Shiho Matsubayashi, Fumiyuki Saito, Reiji Suzuki, Kazuhiro Nakadai, Hiroshi G. Okuno

    Proc. of the 27th International Ornithological Congress   213   2018年8月

     詳細を見る

    記述言語:英語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    researchmap

  • マイクロホンアレイを用いた音源定位・分離ソフトウェア入門

    中臺 一博

    システム/制御/情報   62 ( 2 )   42 - 49   2018年8月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 システム制御情報学会  

    DOI: 10.11509/isciesci.62.2_42

    CiNii Books

    CiNii Research

    researchmap

  • Understanding ecoacoustic interactions among songbirds as complex systems using robot audition techniques

    Reiji Suzuki, Shinji Sumitani, Shiho Matsubayashi, Takaya Arita, Kazuhiro Nakadai, Hiroshi G. Okuno

    Abstract Booklet of EVOSLACE: Workshop on the emergence and evolution of social learning, communication, language and culture in natural and artificial agents in ALIFE2018   22   2018年7月

     詳細を見る

    記述言語:英語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    researchmap

  • 音響信号処理の変遷と最先端――ロボット聴覚の視点から―― 査読

    中臺 一博

    日本音響学会誌   74 ( 7 )   394 - 400   2018年7月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 日本音響学会  

    DOI: 10.20697/jasj.74.7_394

    CiNii Books

    CiNii Research

    J-GLOBAL

    researchmap

  • Field observations of ecoacoustic dynamics of a Japanese bush warbler using an open-source software for robot audition HARK 査読

    Reiji Suzuki, Shinji Sumitani, Shiho Matsubayashi, Takaya Arita, Kazuhiro Nakadai, Hiroshi G. Okuno

    Journal of Ecoacoustics   2   EYAJ46   2018年6月

     詳細を見る

    記述言語:英語   掲載種別:速報,短報,研究ノート等(学術雑誌)  

    researchmap

  • ロボット聴覚技術の極限環境への展開

    奥乃博, 糸山克寿, 中臺一博, 中臺一博, 公文誠, 坂東宜昭, 干場功太郎

    システム制御情報学会研究発表講演会講演論文集(CD-ROM)   62nd   ROMBUNNO.221‐1   2018年5月

     詳細を見る

    記述言語:日本語   出版者・発行元:システム制御情報学会  

    J-GLOBAL

    researchmap

  • ロボット聴覚技術を活用した鳥類の行動観測

    鈴木麗璽, 中臺一博, 奥乃博

    日本鳥学会誌(フォーラム)   67 ( 1 )   155-157   2018年5月

     詳細を見る

    記述言語:日本語   掲載種別:機関テクニカルレポート,技術報告書,プレプリント等  

    researchmap

  • ロボット聴覚技術を用いた鳥類の歌行動分析の試み―複数のマイクロホンアレイを用いた二次元リアルタイム歌定位―

    鈴木麗璽, 炭谷晋司, 中臺一博, 中臺一博, 奥乃博

    計測自動制御学会システムインテグレーション部門講演会(CD-ROM)   18th   ROMBUNNO.1D6‐04   2017年12月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 人間とロボットとの対話環境における対話終了タイミングの検討 (情報ネットワーク)

    北川 遼, 蓮本 諒介, 今井 倫太, 中臺 一博

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   117 ( 306 )   31 - 34   2017年11月

     詳細を見る

    記述言語:日本語   出版者・発行元:電子情報通信学会  

    CiNii Books

    CiNii Research

    researchmap

  • コミュニケーションロボットのための遠隔音声認識システムの構築と実証実験

    山本 俊一, 住田 直亮, 中臺 一博

    Honda R&D technical review   29 ( 2 )   110 - 117   2017年10月

     詳細を見る

    記述言語:日本語   出版者・発行元:本田技術研究所  

    CiNii Books

    CiNii Research

    researchmap

  • マイクロホンアレイを利用したウグイスの歌行動の時空間分析

    炭谷晋司, 鈴木麗璽, 有田隆也, 松林志保, 中臺一博, 中臺一博, 奥乃博

    日本鳥学会大会講演要旨集   2017   92   2017年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • マイクロフォンアレイを用いた野鳥観測:ソウシチョウの歌行動をめぐる予備的調査報告

    松林志保, 斎藤史之, 鈴木麗璽, 中臺一博, 中臺一博, 奥乃博

    日本鳥学会大会講演要旨集   2017   92   2017年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • ロボット聴覚技術を活用した野鳥の歌行動観測・分析ツールHARKBirdの機能強化

    千葉尚彬, 炭谷晋司, 松林志保, 鈴木麗璽, 有田隆也, 中臺一博, 中臺一博, 奥乃博

    日本ロボット学会学術講演会予稿集(CD-ROM)   35th   ROMBUNNO.3A3‐03   2017年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • UAV搭載マイクロホンアレイを用いた組み込みシステムによる音源探査性能の評価

    干場功太郎, 中臺一博, 中臺一博, 公文誠, 奥乃博

    日本ロボット学会学術講演会予稿集(CD-ROM)   35th   ROMBUNNO.3A2‐04   2017年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • マルチロータヘリコプタ収録音の音源分離におけるシステムパラメータと分離性能について―GHDSSとBNP‐MAPの比較

    鷲崎海, 公文誠, 大塚琢馬, 奥乃博, 干場功太郎, 中臺一博, 中臺一博

    日本ロボット学会学術講演会予稿集(CD-ROM)   35th   ROMBUNNO.3A2‐05   2017年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 災害救助犬の呼吸音と周囲の音を同時に計測するサイバスーツの開発

    水野直希, 大貫和也, 星達也, 山口竣平, 濱田龍之介, 大野和則, 中臺一博, 奥乃博, 田所諭

    日本ロボット学会学術講演会予稿集(CD-ROM)   35th   ROMBUNNO.3A3‐02   2017年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • オープンソースコミュニティに貢献するということ

    中臺 一博

    映像情報メディア学会誌 = The journal of the Institute of Image Information and Television Engineers   71 ( 5 )   647 - 653   2017年9月

     詳細を見る

    記述言語:日本語   出版者・発行元:映像情報メディア学会  

    DOI: 10.3169/itej.71.647

    CiNii Books

    CiNii Research

    researchmap

  • 風雑音の相関を用いたパッシブ型音響風向風速計の検討

    村上 哲郎, 坂田 直人, 横尾 佳紀, 中島 弘史, 中臺 一博

    日本音響学会誌   73 ( 8 )   472 - 479   2017年8月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    CiNii Books

    researchmap

  • Field observations and virtual experiences of bird songs in the soundscape using an open-source software for robot audition HARK

    Shinji Sumitani, Reiji Suzuki, Takaya Arita, Naren, Shiho Matsubayashi, Kazuhiro Nakadai, Hiroshi G. Okuno

    Abstract Book of 4th International Symposium on Acoustic Communication by Animals   116-117   2017年7月

     詳細を見る

    記述言語:英語   掲載種別:速報,短報,研究ノート等(学術雑誌)  

    researchmap

  • Bird song explorer: 野鳥の歌行動体験のための立体音響に基づく仮想森林アプリケーション

    娜 仁, 鈴木 麗璽, 有田 隆也, 中臺 一博, 奥乃 博

    第79回全国大会講演論文集   2017 ( 1 )   239 - 240   2017年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:情報処理学会  

    我々は,マイクロホンアレイとロボット聴覚ソフトウェアHARKを用いて野鳥の歌行動を観測・分析する簡易なシステムHARKBirdを開発している.観測した音空間を臨場的に体験することは,野鳥の生態理解への貢献をはじめ,教育や啓蒙など幅広い活用が期待される.本発表では,ゲームエンジンであるUnityを用いて,野鳥が棲息し歌う様子を3次元空間上の仮想的な森林等で表現するアプリケーションを提案する.具体的には,いくつかの調査地で録音し音源定位・分離した野鳥の歌を,実環境と同じタイミングと方位で仮想的なフィールドに配置し再生する.ユーザはアバターを動かして野鳥を探索しながら立体音響で臨場的に歌を聴くことができる.目的に応じて任意の歌を配置することも可能である.

    CiNii Books

    CiNii Research

    researchmap

  • マイクロホンアレイ搭載UAVを用いた屋外実環境実時間音源探査

    干場功太郎, 若林瑞保, 鷲崎海, 石木隆洋, 公文誠, GABRIEL Daniel, 中臺一博, 中臺一博, 奥乃博

    情報処理学会全国大会講演論文集   79th ( 1 )   1.199‐1.200   2017年3月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • Bird song explorer:野鳥の歌行動体験のための立体音響に基づく仮想森林アプリケーション

    NARAN, 鈴木麗璽, 有田隆也, 中臺一博, 中臺一博, 奥乃博

    情報処理学会全国大会講演論文集   79th ( 4 )   4.239‐4.240   2017年3月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 合同研究会2016開催報告

    中臺 一博, 小林 一郎, 和泉 潔

    人工知能 : 人工知能学会誌 : journal of the Japanese Society for Artificial Intelligence   32 ( 2 )   297 - 304   2017年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:人工知能学会 ; 2014-  

    DOI: 10.11517/jjsai.32.2_297

    CiNii Books

    CiNii Research

    researchmap

  • ロボットとの会話における画像および音声情報を用いた人の身体動作と発話姿勢の関係に関する検討 (パターン認識・メディア理解)

    蓮本 諒介, 小山 大幾, 水本 武志, 中村 圭佑, 中臺 一博, 今井 倫太

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   116 ( 461 )   19 - 22   2017年2月

     詳細を見る

    記述言語:日本語   出版者・発行元:電子情報通信学会  

    CiNii Books

    researchmap

  • ロボットとの会話における画像および音声情報を用いた人の身体動作と発話姿勢の関係に関する検討 (クラウドネットワークロボット)

    蓮本 諒介, 小山 大幾, 水本 武志, 中村 圭佑, 中臺 一博, 今井 倫太

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   116 ( 462 )   19 - 22   2017年2月

     詳細を見る

    記述言語:日本語   出版者・発行元:電子情報通信学会  

    CiNii Books

    researchmap

  • 外来種ソウシチョウが在来種の歌行動へ与える影響を探る:マイクロフォンアレイを用いた森林性鳥類の観測実例

    松林志保, 斉藤史之, 鈴木麗璽, 千葉尚彬, 中臺一博, 中臺一博, 奥乃博

    人工知能学会AIチャレンジ研究会(Web)   49th   23‐28 (WEB ONLY)   2017年

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • UAVを用いた音源探査におけるマイクロホンアレイの性能評価

    干場 功太郎, 鷲崎 海, 若林 瑞保, 公文 誠, 中臺 一博

    ロボティクス・メカトロニクス講演会講演概要集   2017 ( 0 )   1P1 - R05   2017年

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 日本機械学会  

    <p>Sound source localization using a microphone array embedded on an unmanned aerial vehicle has been studied to detect and localize people who need help in a disaster-stricken area. Because such sound source localization should work in outdoor environments, the design of the microphone array is crucial. We thus developed two types of microphone array; 16ch two-storied hexagonal and 12ch spherical microphone arrays. These two microphone arrays were evaluated via numerical simulation with discussions on the appropriate design of microphone arrays.</p>

    DOI: 10.1299/jsmermd.2017.1P1-R05

    researchmap

  • 多チャネル低ランク・スパース分解に基づく柔軟索状レスキューロボットのためのリアルタイム音声強調

    坂東 宜昭, 安部 祐一, 糸山 克寿, 昆陽 雅司, 田所 諭, 中臺 一博, 吉井 和佳, 奥乃 博

    ロボティクス・メカトロニクス講演会講演概要集   2017 ( 0 )   1P2 - P05   2017年

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 日本機械学会  

    <p>This paper presents a real-time human-voice enhancement method for a hose-shaped rescue robot based on multi-channel low-rank sparse decomposition. Although microphone arrays equipped on hose-shaped robots are crucial for finding victims under collapsed buildings, human voices captured by the microphone array are contaminated by environment-dependent and non-stationary ego-noise. Our method decomposes multi-channel amplitude spectrograms into sparse and low-rank components (human voice and noise) without any prior training. This decomposition is conducted with a state-space model representing the dynamics of these components in a mini-batch manner. Experimental results show that the performance difference between our method and its offline version is less than 3dB in signal-to-distortion ratio.</p>

    DOI: 10.1299/jsmermd.2017.1p2-p05

    researchmap

  • アクティブ周波数レンジフィルタを用いた雑音にロバストな音源定位手法の提案

    干場功太郎, 中臺一博, 中臺一博, 公文誠, 奥乃博

    人工知能学会AIチャレンジ研究会(Web)   49th   9‐14 (WEB ONLY)   2017年

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • HARK2.3の紹介とタフロボティクスチャレンジへの展開

    中臺一博, 中臺一博, 中臺一博, 坂東宜昭, 水本武志, 干場功太郎, 小島諒介, 糸山克寿, 杉山治, 公文誠, 奥乃博

    計測自動制御学会システムインテグレーション部門講演会(CD-ROM)   17th   ROMBUNNO.3A3‐3   2016年12月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 空間情報を用いた鳥の歌分析 招待

    小島 諒介, 杉山 治, 干場 功太郎, 鈴木 麗璽, 中臺 一博

    第46回AIチャレンジ研究会予稿集 (SIG-Challenge)   046-05   25-31   2016年11月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    researchmap

  • 複数のマイクロホンアレイとロボット聴覚ソフトウエアHARKを用いた野鳥の観測精度の検討 招待

    松林志保, 鈴木麗璽, 小島諒介, 中臺一博

    人工知能学会2015年度研究会優秀賞記念講演集   10-15   2016年11月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    researchmap

  • Semi-Automatic Bird Song Analysis by Spatial-Cue-Based Integration of Sound Source Detection, Localization, Separation, and Identification 査読

    Ryosuke Kojima, Osamu Sugiyama, Reiji Suzuki, Kazuhiro Nakadai, Charles E. Taylor

    IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2016)   1287-1292   2016年10月

     詳細を見る

    記述言語:英語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    researchmap

  • 広い帯域で位相変化の少ないインパルス応答波形の自動切り出し法

    中島 弘史, 坂田 直人, 村上 哲郎, 中臺 一博

    日本音響学会誌   72 ( 10 )   627 - 634   2016年10月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    CiNii Books

    researchmap

  • マイクロホンアレイを用いた森林性野鳥の定位精度の検証とその応用:歌の空間的な位置およびタイミングから知る複数種の棲み分け

    松林志保, 鈴木麗璽, 小島諒介, 中臺一博, 中臺一博, 奥乃博

    日本鳥学会大会講演要旨集   2016   138   2016年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • マイクロホンアレイを用いたオオヨシキリのソングポスト定位

    鈴木麗璽, 松林志保, 斎藤史之, 村手達佳, 増田智久, 山本晃一, 小島諒介, 中臺一博, 中臺一博, 奥乃博

    日本鳥学会大会講演要旨集   2016   151   2016年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 音源位置を考慮した音源同定のための確率モデルとその学習

    小島諒介, 杉山治, 鈴木麗璽, 中臺一博

    第34回日本ロボット学会学術講演会 (RSJ2016)資料   4 pages   2016年9月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    researchmap

  • 変分ベイズ多チャネルRNMFに基づく柔軟索状レスキューロボットのための音声強調

    坂東宜昭, 糸山克寿, 昆陽雅司, 田所諭, 中臺一博, 中臺一博, 吉井和佳, 奥乃博

    日本ロボット学会学術講演会予稿集(CD-ROM)   34th   ROMBUNNO.1C2‐04   2016年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 変分ベイズ多チャネルロバストNMFに基づくマイクロホンの移動・被覆を許容する音声強調 (音声) -- (オーガナイズドセッション「あらゆる音を対象とした情報処理の実現に向けて」)

    坂東 宜昭, 糸山 克寿, 昆陽 雅司, 田所 諭, 中臺 一博, 吉井 和佳, 河原 達也, 奥乃 博

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   116 ( 189 )   47 - 52   2016年8月

     詳細を見る

    記述言語:日本語   出版者・発行元:電子情報通信学会  

    CiNii Books

    researchmap

  • 研究会活動の現在・過去・未来 あれから30年,これから30年

    和泉 潔, 中臺 一博, 栗原 聡

    人工知能   31 ( 4 )   531 - 549   2016年7月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 人工知能学会  

    DOI: 10.11517/jjsai.31.4_531

    CiNii Books

    researchmap

  • 研究会活動の現在・過去・未来 あれから30年,これから30年 (創設30周年記念特集) -- (研究会の変遷)

    和泉 潔, 中臺 一博, 栗原 聡

    人工知能 : 人工知能学会誌 : journal of the Japanese Society for Artificial Intelligence   31 ( 4 )   531 - 549,530   2016年7月

     詳細を見る

    記述言語:日本語   出版者・発行元:人工知能学会 ; 2014-  

    DOI: 10.11517/jjsai.31.4_531

    CiNii Books

    CiNii Research

    researchmap

  • 柔軟索状レスキューロボットのためのマイクロホン・加速度センサアレイを用いた3次元姿勢推定

    坂東 宜昭, 糸山 克寿, 昆陽 雅司, 田所 諭, 中臺 一博, 吉井 和佳, 奥乃 博

    ロボティクス・メカトロニクス講演会講演概要集   2016 ( 0 )   1A2 - 10a6   2016年6月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 日本機械学会  

    <p>This paper presents an online method that estimates a 3D posture of a hose-shaped rescue robot using a microphone and accelerometer array. Posture (shape) estimation of a self-driving hose-shaped rescue robot is crucial for handling the robot body because the unseen robot posture deforms in narrow spaces under collapsed buildings. Conventional sound-based method that uses time-differences of arrivals (TDOAs) works only on a two-dimensional surface and is often hampered by the rubble around the robot. Our method eliminates the outliers of sound-based TDOA measurements, and compensates the lack of the posture information with the tilt information measured by accelerometers. Experimental results using a 3-m hose-shaped robot that was deployed in a simple 3D structure demonstrate that our method reduces the errors of initial states to about 20cm in the 3D space.</p>

    DOI: 10.1299/jsmermd.2016.1A2-10a6

    J-GLOBAL

    researchmap

  • ロボット聴覚の極限音響への展開

    奥乃 博, 中臺 一博, 公文 誠, 糸山 克寿, 吉井 和佳, 坂東 宜昭, 佐々木 洋子

    ロボティクス・メカトロニクス講演会講演概要集   2016 ( 0 )   1A2 - 09b3   2016年6月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 日本機械学会  

    <p>The ability of robots to listen to several things at once with their own "ears", i.e., <i>robot audition</i>, is critical in improving the performance of search and rescue activities under severe conditions. This paper introduces "HARK" robot audition open-source software and its capabilities of suppressing ego-noise that is caused by robot's own movements such as motor, propeller and/or flying noise. Then it describes three main applications of robot audition: 1) Unmanned Aerial Vehicle (UAV) with a microphone array to capture sounds can localize a sound source by suppressing ego-noise with either hovering, slow gliding or fast gliding. It can also recognize a sound source by CNN. 2) A serpentine robot with a microphone array can estimate its posture by sound. It can also enhance a voice by Online Robust PCA. 3) A robot with a LiDAR and 32-channel microphone can visualize a sound map by superimposing sound source directions on point clouds.</p>

    DOI: 10.1299/jsmermd.2016.1a2-09b3

    CiNii Research

    J-GLOBAL

    researchmap

  • 非同期マイクロホンアレイを搭載した複数ロボットによる音環境マップの協調オンライン推定

    関口 航平, 坂東 宜昭, 中村 圭佑, 中臺 一博, 糸山 克寿, 吉井 和佳

    日本機械学会 ロボティクス・メカトロニクス講演会 (ROBOMEC)   2016   1A2-09b5   2016年6月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 日本機械学会  

    DOI: 10.1299/jsmermd.2016.1A2-09b5

    CiNii Research

    J-GLOBAL

    researchmap

  • 合同研究会2015開催報告(研究会報告)

    和泉 潔, 中臺 一博, 山川 宏

    人工知能:人工知能学会誌   31 ( 2 )   299 - 304   2016年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:社団法人人工知能学会  

    DOI: 10.11517/jjsai.31.2_299

    CiNii Books

    CiNii Research

    researchmap

  • 最先端研究 ロボット聴覚オープンソースソフトウェアHARKの開発とその応用

    中臺 一博, 奥乃 博, 水本 武志, 中村 圭佑

    シミュレーション = Journal of the Japan Society for Simulation Technology   35 ( 1 )   32 - 38   2016年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:小宮山印刷工業  

    コレクション : 国立国会図書館デジタルコレクション > 電子書籍・電子雑誌 > 学術機関 > 学協会

    CiNii Books

    CiNii Research

    researchmap

  • 音源到来方向・時間差を用いた非同期複数マイクロホンアレイ位置のオンライン推定

    関口 航平, 中村 圭佑, 坂東 宜昭, 糸山 克寿, 吉井 和佳, 中臺 一博

    情報処理学会 第78回全国大会   2016 ( 1 )   483 - 484   2016年3月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    本稿では非同期複数マイクロホンアレイの同期ずれ・位置推定手法について述べる.マイクロホンアレイを搭載した複数台のロボットを用いた音源定位・分離などの音環境認識技術は,単独のロボットを用いた場合よりも高精度な処理を行うことができる.しかし,複数台のロボットを用いたマイクロホンアレイ信号処理には,各ロボットの位置,マイクロホンアレイ間の同期ずれの推定が不可欠である.本稿では各マイクロホンアレイごとに個別に推定した音源定位・位相情報をもとに,非同期複数マイクロホンアレイ間の同期ずれ・位置推定を行う.ロボットと音源の位置・同期ずれを潜在変数として持つ状態空間モデルを設計し,その事後分布をオンライン推定する.

    CiNii Books

    CiNii Research

    researchmap

  • Robust Recognition of Simultaneous Speech By a Mobile Robot

    Jean-Marc Valin, Shun'ichi Yamamoto, Jean Rouat, Francois Michaud, Kazuhiro Nakadai, Hiroshi G. Okuno

    IEEE Transactions on Robotics, Vol. 23, No. 4, pp. 742-752, 2007   2016年2月

     詳細を見る

    掲載種別:機関テクニカルレポート,技術報告書,プレプリント等  

    This paper describes a system that gives a mobile robot the ability to<br />
    perform automatic speech recognition with simultaneous speakers. A microphone<br />
    array is used along with a real-time implementation of Geometric Source<br />
    Separation and a post-filter that gives a further reduction of interference<br />
    from other sources. The post-filter is also used to estimate the reliability of<br />
    spectral features and compute a missing feature mask. The mask is used in a<br />
    missing feature theory-based speech recognition system to recognize the speech<br />
    from simultaneous Japanese speakers in the context of a humanoid robot.<br />
    Recognition rates are presented for three simultaneous speakers located at 2<br />
    meters from the robot. The system was evaluated on a 200 word vocabulary at<br />
    different azimuths between sources, ranging from 10 to 90 degrees. Compared to<br />
    the use of the microphone array source separation alone, we demonstrate an<br />
    average reduction in relative recognition error rate of 24% with the<br />
    post-filter and of 42% when the missing features approach is combined with the<br />
    post-filter. We demonstrate the effectiveness of our multi-source microphone<br />
    array post-filter and the improvement it provides when used in conjunction with<br />
    the missing features theory.

    DOI: 10.1109/TRO.2007.900612

    arXiv

    researchmap

  • UAV搭載マイクアレイを用いた高雑音環境下における音イベント検出・識別の並列最適化

    杉山治, 小島諒介, 中臺一博, 中臺一博

    人工知能学会AIチャレンジ研究会(Web)   46th   32‐36 (WEB ONLY)   2016年

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 部分共有アーキテクチャを用いた深層学習ベースの音源同定の検討

    森戸隆之, 杉山治, 小島諒介, 中臺一博, 中臺一博

    人工知能学会AIチャレンジ研究会(Web)   46th   12‐17 (WEB ONLY)   2016年

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 深層学習による多チャネル音響信号に対する音源同定の検討

    森戸隆之, 杉山治, 上村知史, 小島諒介, 中臺一博, 中臺一博

    計測自動制御学会システムインテグレーション部門講演会(CD-ROM)   16th   ROMBUNNO.2D1‐4   2015年12月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • HARK2.2の新機能とその組込み,SaaSへの展開

    中臺一博, 中臺一博, 水本武志, 中村圭佑, 奥乃博

    計測自動制御学会システムインテグレーション部門講演会(CD-ROM)   16th   ROMBUNNO.2M2‐1   2015年12月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • ロバスト主成分分析を用いた動作雑音抑圧に基づく柔軟索状ロボットのための音声強調

    坂東宜昭, 糸山克寿, 昆陽雅司, 田所諭, 中臺一博, 中臺一博, 吉井和佳, 奥乃博

    日本ロボット学会学術講演会予稿集(CD-ROM)   33rd   ROMBUNNO.2D2-05   2015年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 振幅スペクトルの相対誤差に基づくインパルス応答の自動切りだし法

    中島 弘史, 坂田 直人, 加科 優希, 中臺 一博

    回路とシステムワークショップ論文集 Workshop on Circuits and Systems   28   208 - 213   2015年8月

     詳細を見る

    記述言語:日本語   出版者・発行元:[電子情報通信学会]  

    CiNii Research

    J-GLOBAL

    researchmap

  • 2マイクロホンを用いた線形ビームフォーミングによる風雑音の低減

    坂田 直人, 村上 哲郎, 中島 弘史, 中臺 一博

    回路とシステムワークショップ論文集 Workshop on Circuits and Systems   28   359 - 364   2015年8月

     詳細を見る

    記述言語:日本語   出版者・発行元:[電子情報通信学会]  

    CiNii Research

    J-GLOBAL

    researchmap

  • 両耳聴ロボット聴覚ソフトウェアHARK‐BinauralとRaspberry Pi2を用いたヒューマノイドロボットへの適用

    坂東宜昭, 金宜鉉, 糸山克寿, 吉井和佳, 中臺一博, 中臺一博, 奥乃博

    情報処理学会研究報告(Web)   2015 ( MUS-107 )   VOL.2015-MUS-107,NO.33 (WEB ONLY)   2015年5月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 柔軟索状レスキューロボットのためのロバスト主成分分析を用いた走行雑音抑圧

    坂東 宜昭, 池宮 由楽, 糸山 克寿, 昆陽 雅司, 田所 諭, 中臺 一博, 吉井 和佳, 奥乃 博

    第77回全国大会講演論文集   2015 ( 1 )   505 - 506   2015年3月

     詳細を見る

    記述言語:日本語  

    本稿では,柔軟索状レスキューロボットのための走行雑音抑圧手法について述べる.人間の侵入が困難な災害現場(例:倒壊家屋)においては,被災者の声を手がかりにしたレスキューロボットによる捜索が有用である.柔軟索状レスキューロボットなどの地上走行型ロボットでは,自身の走行雑音によって被災者の声が聞き取りづらくなるうえ,走行雑音は接地面に依存するため,事前の予測が困難であった.本研究では,この問題を解決するため,繰り返し出現する周波数成分を事前情報を用いずに除去することができるロバスト主成分分析を用いて走行雑音抑圧を行う.実際にロボットを動作させて得られた録音データを用いた実験により,提案法を評価した.

    CiNii Books

    researchmap

  • 柔軟索状レスキューロボットのためのロバスト主成分分析を用いた走行雑音抑圧

    坂東宜昭, 池宮由楽, 糸山克寿, 昆陽雅司, 田所諭, 中臺一博, 吉井和佳, 奥乃博

    情報処理学会全国大会講演論文集   77th ( 2 )   2.505-2.506   2015年3月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 2チャンネル近接マイクロホンを用いた時間領域での風雑音低減 (信号処理)

    坂田 直人, 中島 弘史, 中臺 一博

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   114 ( 474 )   1 - 6   2015年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    本報告では2チャンネルの近接マイクロホンを用いて線形ビームフォーミングによる風雑音の低減を行った.フレーム分割による周波数領域における線形ビームフォーミングをフレーム分割前の時間領域信号に適用し,フレーム分割による処理と風雑音の低減性能を比較した.風雑音の混入した収録信号に対し風雑音の低減処理を行った結果,SN比が2〜13dB改善された.フレーム処理の有無で風雑音の低減性能を比較した結果,単純な信号の遅延のみで構成されるフィルタについてはフレーム処理の有無が与える影響が大きいことが確認された.

    CiNii Books

    CiNii Research

    researchmap

  • 2チャンネル近接マイクロホンを用いた時間領域での風雑音低減 (音声)

    坂田 直人, 中島 弘史, 中臺 一博

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   114 ( 475 )   1 - 6   2015年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    本報告では2チャンネルの近接マイクロホンを用いて線形ビームフォーミングによる風雑音の低減を行った.フレーム分割による周波数領域における線形ビームフォーミングをフレーム分割前の時間領域信号に適用し,フレーム分割による処理と風雑音の低減性能を比較した.風雑音の混入した収録信号に対し風雑音の低減処理を行った結果,SN比が2〜13dB改善された.フレーム処理の有無で風雑音の低減性能を比較した結果,単純な信号の遅延のみで構成されるフィルタについてはフレーム処理の有無が与える影響が大きいことが確認された.

    CiNii Books

    researchmap

  • 2チャンネル近接マイクロホンを用いた時間領域での風雑音低減 (応用音響)

    坂田 直人, 中島 弘史, 中臺 一博

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   114 ( 473 )   1 - 6   2015年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    本報告では2チャンネルの近接マイクロホンを用いて線形ビームフォーミングによる風雑音の低減を行った.フレーム分割による周波数領域における線形ビームフォーミングをフレーム分割前の時間領域信号に適用し,フレーム分割による処理と風雑音の低減性能を比較した.風雑音の混入した収録信号に対し風雑音の低減処理を行った結果,SN比が2〜13dB改善された.フレーム処理の有無で風雑音の低減性能を比較した結果,単純な信号の遅延のみで構成されるフィルタについてはフレーム処理の有無が与える影響が大きいことが確認された.

    CiNii Books

    researchmap

  • TeleCoBot : 発話環境を考慮したテレプレゼンスシステム (クラウドネットワークロボット)

    高橋 成明, 尾形 正泰, 今井 倫太, 中村 圭佑, 中臺 一博

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   114 ( 351 )   1 - 5   2014年12月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    遠隔地とのコミュニケーションツールとしてテレプレゼンスロボットの研究が行われるようになった.しかし,騒音など音環境の相違を考慮していないため,発話者の音声が的確に伝わらない問題がある.また対話相手が複数人いる場合,状況に応じて発話者の音声を自由に変えたいという要望がある.こうした問題を解決するため,本研究では発話者の音声を雑音レベルや対話者との距離に応じて自動で調節し,かつ会話状況に応じて自由に音量を変更できる機能を提供するテレプレゼンスシステムTeleCoBotを提案する.また会話環境を用意し被験者にタスクを与えた検証実験を行った.結果として,ユーザは音量変更の機能を正しく使えなかったことが判明し,より効果的なUIを提供することが今後の課題となった.

    CiNii Books

    researchmap

  • Deep Neural Networkを用いたマルチモーダル音声認識

    野田邦昭, 山口雄紀, 中臺一博, 奥乃博, 尾形哲也

    日本ロボット学会学術講演会予稿集(CD-ROM)   32nd   ROMBUNNO.1I1-04   2014年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • マイクロホンアレイを用いた駆動機構付ホース型ロボットの姿勢推定

    坂東宜昭, 糸山克寿, 昆陽雅司, 田所諭, 中臺一博, 吉井和佳, 奥乃博

    日本ロボット学会学術講演会予稿集(CD-ROM)   32nd   ROMBUNNO.1I2-02   2014年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • HARKによって定位・分離された多方向音声のアノテーションツールの開発 (クラウドネットワークロボット)

    杉山 治, 糸山 克寿, 中臺 一博, 奥乃 博

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   114 ( 85 )   23 - 26   2014年6月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    本研究では、ロボット聴覚ソフトウェアHARKに基づいた多方向音声のアノテーションツールの開発について述べる。多方向の音声情報を視覚化し分かりやすく提示する既存研究は存在するが、提示された情報をラベル付けし、セマンティックにアノテーションするまでを一括して行うツールはまだ提案されていない。本研究では、HARKによって音源定位・分離された多方向音声をアノテーションするツールを開発し、アノテーションの負荷を軽減するためにSVMに基づく、自動補完機能を実装した。そして、被験者実験を通じて、その有効性を検証した。

    CiNii Books

    CiNii Research

    researchmap

  • Deep Neural Networkを用いたマルチモーダル音声認識の為の特徴量学習

    山口雄紀, 野田邦昭, 中臺一博, 奥乃博, 尾形哲也

    第76回全国大会講演論文集   2014 ( 1 )   465 - 466   2014年3月

     詳細を見る

    記述言語:日本語  

    本研究の目標は,マルチモーダル音声認識の為の画像特徴量の設計である.マルチモーダル音声認識の精度向上のためには,唇画像からどのようにして音声認識の最小単位である音素や口形素を表現する情報を取り出すかが重要な課題である.本研究では,特徴量学習の新たな手法として注目を集めているDeep Neural Network (DNN)を用いて大量の唇画像から画像特徴量を自己組織的に抽出する手法を構築した.得られた画像特徴量を孤立単語認識タスクで検証するとともに特徴量空間を解析する事で口形素との関連についても考察した.また,得られた画像特徴量と音声を用いた視聴覚統合によるノイズ頑健性の向上について検証を行った.

    CiNii Books

    researchmap

  • マイクロホンアレイの位置推定によるホース型ロボットの姿勢推定

    坂東宜昭, 大塚琢馬, 糸山克寿, 昆陽雅司, 田所諭, 中臺一博, 奥乃博

    第76回全国大会講演論文集   2014 ( 1 )   189 - 190   2014年3月

     詳細を見る

    記述言語:日本語  

    ホース型ロボットは細長い形状が特徴のレスキューロボットで,倒壊した建築物の隙間などの探索が可能である.操縦の効率化のために加速度センサやカメラ画像などを用いた本ロボットの姿勢推定法が提案されてきたが,累積誤差が生じるなどの問題があった.本稿ではマイクロホンアレイと小型スピーカを本ロボットに装着し,音によるこれらの位置推定によって姿勢を推定する手法について述べる.本手法ではスピーカから発する試験音の各マイクへの到達時間差を用いて姿勢を推定するが,到達時間差は現在のマイクとスピーカの位置関係を表しており,過去の誤差を修正できる.実録音データを用いて本手法の有効性を評価した.

    CiNii Books

    researchmap

  • 音ランドマークを用いたマルチコプターの定位

    ラナシナパヤ, 中村圭佑, 中臺一博, 高橋秀幸, 木下哲男

    第76回全国大会講演論文集   2014 ( 1 )   185 - 186   2014年3月

     詳細を見る

    記述言語:英語  

    We propose a novel approach to multicopter localization, using sound landmarks and one embedded microphone. This approach can benefit to multicopter localization in that it requires less computational power and smaller payloads than image-based approaches. However, the high ego-noise of multicopters is a serious threat for sound-based algorithms. We simulated a 2D localization method based on a Kalman Filter using measurements of acceleration and sound landmarks&#039; intensity. A random walk model is used to update the multicopter&#039;s position with the Kalman Filter; the calculated estimation is then corrected using noisy measurements from the embedded microphone and accelerometer. Simulation results show that the proposed algorithm can successfully track the multicopter&#039;s motion in a noisy environment. We confirmed the effectiveness of our proposed algorithm by comparing its performance and robustness to a time/phase based algorithm.

    CiNii Books

    researchmap

  • DI-1-6 聴覚を中心としたロボットの環境認識技術(DI-1.社会課題を解決するためのパターン認識・メディア理解技術の進展,依頼シンポジウム,ソサイエティ企画)

    中臺 一博, 中村 圭佑, 手塚 太貴

    電子情報通信学会総合大会講演論文集   2014 ( 2 )   "SS - 18"-"SS-19"   2014年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    CiNii Books

    CiNii Research

    researchmap

  • 相関行列スケーリングを用いた屋外音源探索手法の解析

    大畑琢磨, 長峰諒英, 中村圭佑, 石崎孝幸, 水本武志, 中臺一博, 中臺一博

    人工知能学会AIチャレンジ研究会(Web)   41st   2014年

     詳細を見る

  • 非同期分散マイクロホンアレイのオンラインキャリブレーションと伝達関数の推定(<小特集>マイクロホンアレイの新しい技術展開)

    中臺 一博, 中村 圭佑

    日本音響学会誌   70 ( 7 )   397 - 402   2014年

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 日本音響学会  

    DOI: 10.20697/jasj.70.7_397

    CiNii Books

    CiNii Research

    researchmap

  • マイクロホンアレイとスピーカをもつ柔軟索状ロボットのための動的スピーカ選択による姿勢推定の高速化

    坂東宜昭, 糸山克寿, 昆陽雅司, 田所諭, 中臺一博, 吉井和佳, 奥乃博

    人工知能学会AIチャレンジ研究会(Web)   41st   8 (WEB ONLY)   2014年

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • TelePaBot : 複数のグループが同時に会話する環境に適したテレプレゼンスシステム (クラウドネットワークロボット)

    小池 京太郎, 今井 倫太, 中村 圭佑, 中臺 一博

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   113 ( 372 )   1 - 6   2013年12月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    医療現場など,遠隔地において移動・コミュニケーションが必要な状況下でテレプレゼンスロボットは有用なツールとして一部実用化も始まっている.しかし,複数のグループが同時に会話を行う環境では不要な音声まで聞こえてしまうなど,円滑な遠隔コミュニケーションの支援には依然難しい課題が残る.こうした課題を解決するために,本研究では,発話の位置を可視化し,指定した発話を選択聴取する機能を提供するテレプレゼンスシステム「TelePaBot」を提案する.提案したシステムを用いてケーススタディを行った結果,複数のグループが同時に会話する環境下でも,TelePaBotを使用することで,より円滑な遠隔コミュニケーションが実現できる可能性があることが示唆された.

    CiNii Books

    researchmap

  • 雑音環境における最適音量のモデル化を利用した音量可視化テレプレゼンスシステム (クラウドネットワークロボット)

    速水 昭, 今井 倫太, 中村 圭祐, 中臺 一博

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   113 ( 372 )   35 - 40   2013年12月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    雑音が大きくなると,話者の音量もそれに応じて大きくなるロンバート効果(Lombard effect)という現象が存在する.遠隔コミュニケーションでは,ロンバート効果により,遠隔地の相手話者に対して必要以上に大きな声で話してしまう問題がある.本稿では,実環境下での移動型のテレプレゼンスロボットを介した遠隔コミュニケーションでの操作者の音量を自動で調節する際に必要となるモデルの設計および,モデルを搭載した最適音量調整システムLOMBOTを開発した.実験の結果,遠隔地の騒音に対して音量が適切に調節されていることを確認した.

    CiNii Books

    researchmap

  • クワドロコプタ搭載のマイクロホンアレイを用いた屋外音環境理解の逐次雑音推定による向上

    奥谷 啓太, 吉田 尚水, 中村 圭佑, 中臺 一博

    日本ロボット学会誌   31 ( 7 )   676 - 683   2013年9月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 日本ロボット学会  

    This paper addresses sound source localization using an aerial vehicle with a microphone array in an outdoor environment to realize outdoor auditory scene analysis. It, for instance, aims at finding distressed people in a disaster situation. In such an environment, noise is quite loud and dynamically-changing, and conventional microphone array techniques studied in the field of indoor robot audition are of less use. We, thus, proposed MUltiple SIgnal Classification based on incremental Generalized EigenValue Decomposition (iGEVD-MUSIC). It can deal with dynamically-changing high power noise by introducing incrementally-estimated noise correlation matrices. We developed a prototype system for the outdoor auditory scene analysis based on the proposed method using the Parrot AR.Drone with an 8ch microphone array and a Kinect device. Experimental results using the prototype system showed that dynamically-changing noise is properly suppressed with the proposed method even when the signal-to-noise ratio is less than 0dB in an outdoor/indoor environment with the hovering/moving AR.Drone.

    DOI: 10.7210/jrsj.31.676

    CiNii Books

    researchmap

  • Multirotor UAVを用いた音源定位のための雑音相関行列推定

    古川孝太郎, 大塚琢馬, 糸山克寿, 中臺一博, 奥乃博

    日本ロボット学会学術講演会予稿集(CD-ROM)   31st   ROMBUNNO.3D3-02   2013年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • ホース型ロボットのマイクロホンアレイを用いた姿勢推定

    坂東宜昭, 大塚琢馬, 水本武志, 糸山克寿, 中臺一博, 奥乃博

    日本ロボット学会学術講演会予稿集(CD-ROM)   31st   ROMBUNNO.3D3-01   2013年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 話者ダイアライゼーションシステムのための音声区間検出および到来方向推定の精度向上の検討

    黄楊暘, 大塚琢馬, 中臺一博, 奥乃博

    第75回全国大会講演論文集   2013 ( 1 )   479 - 480   2013年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:情報処理学会  

    ロボット聴覚では, いつ, どこで, 誰が話したかを解明する音環境理解機能が不可欠である. 本稿では, それらの問題を解決するために, 音声区間検出, 到来方向推定および話者同定技術を組み合わせた処理を話者ダイアライゼーションシステムとする. ロボット聴覚ソフトウエア HARK においては, MUSIC アルゴリズムを前処理として, 音声区間検出および到来方向推定を行っている. しかし, MUSIC スペクトルに基づいて処理を行う際に, 音源数パラメータおよび閾値パラメータが結果を大きく左右する. 本稿では, ブラインド音源分離を前処理とする話者ダイアライゼーションシステムを提案した. 音量閾値パラメータの設定は依然必要であるが, 精度向上したパフォーマンスが得られている.

    CiNii Books

    CiNii Research

    researchmap

  • チューブ型ロボットの姿勢推定のためのEKF-SLAMを用いた可変マイクロホンアレイ位置推定

    坂東宜昭, 水本武志, 中臺一博, 奥乃博

    全国大会講演論文集   2013 ( 1 )   439 - 441   2013年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    災害現場での被災者発見にはがれき内へ進入可能なチューブ型ロボットが有用である.さらにチューブ型ロボットに音源定位機能があれば被災者の声から位置の推定が可能となる.しかし,近年の高精度な音源定位手法は位置が既知のマイクアレイで収録した音声から方向を推定しているが,チューブ型ロボットではマイク配置を事前に計測できない.そこで本稿ではEKF-SLAMによるマイクロフォン位置推定手法提案し,常に変化するロボット姿勢の推定によって本問題を解決する.数値実験と実録音の両方を用いて本手法の有効性を確認した.

    CiNii Books

    CiNii Research

    researchmap

  • チューブ型ロボットの姿勢推定のためのEKF-SLAMを用いた可変マイクロホンアレイ位置推定

    坂東宜昭, 水本武志, 中臺一博, 奥乃博

    第75回全国大会講演論文集   2013 ( 1 )   439 - 440   2013年3月

     詳細を見る

    記述言語:日本語  

    災害現場での被災者発見にはがれき内へ進入可能なチューブ型ロボットが有用である.さらにチューブ型ロボットに音源定位機能があれば被災者の声から位置の推定が可能となる.しかし,近年の高精度な音源定位手法は位置が既知のマイクアレイで収録した音声から方向を推定しているが,チューブ型ロボットではマイク配置を事前に計測できない.そこで本稿ではEKF-SLAMによるマイクロフォン位置推定手法提案し,常に変化するロボット姿勢の推定によって本問題を解決する.数値実験と実録音の両方を用いて本手法の有効性を確認した.

    CiNii Books

    CiNii Research

    researchmap

  • クアドロコプターを用いた飛行雑音に頑健な音源定位

    古川孝太郎, 奥谷啓太, 柳楽浩平, 大塚琢馬, 中臺一博, 奥乃博

    第75回全国大会講演論文集   2013 ( 1 )   489 - 490   2013年3月

     詳細を見る

    記述言語:日本語  

    本研究は多数の回転翼を持つ小型の無人航空機, クアドロコプターにマイクロフォンアレイを搭載し, 周囲の環境における音源定位問題を取り扱う.通常, 飛行時には風圧やローターの駆動に起因する雑音が極めて大であり, 定位精度の劣化原因となり得る.このような雑音環境下では, 一般化固有値分解を用いた MUSIC 法により雑音相関行列を加味することで精度が改善することが知られている.そこで本研究は, 飛行に伴って動的に変化する雑音相関行列の推定へと問題を帰着する.その上で飛行制御などの機体のモニタ情報を用いた推定手法を提案し, 飛行雑音に頑健な音源定位手法を開発する.

    CiNii Books

    researchmap

  • ホースの伸び縮みによるマイク位置の変化を許容するマイクロホンアレイを用いたホース型ロボットの姿勢推定

    坂東宜昭, 大塚琢馬, 糸山克寿, 中村圭佑, 昆陽雅司, 田所諭, 中臺一博, 奥乃博

    人工知能学会AIチャレンジ研究会(Web)   38th   10 (WEB ONLY)   2013年

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 2P1-P24 グループ会話支援のための音源定位システムの開発(コミュニケーション・ロボット)

    ムン ソンウン, 高木 健太郎, 釜島 力, 中臺 一博, 大武 美保子

    ロボティクス・メカトロニクス講演会講演概要集   2013 ( 0 )   _2P1 - P24_1-_2P1-P24_2   2013年

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 日本機械学会  

    This paper presents a sound source localization system that composes a wireless microphone array named Jellyfish-02 and robot audition software HARK. Jellyfish-02 surpasses existing microphone array in design and usability, because it has a cover with rechargeable battery, which can be connected to wireless network. We evaluated sound source localization performance of Jellyfish-02, and investigated the percentage of speech overlapped periods in natural conversation. Prom the results, Jellyfish-02 is potentially applicable for assisting group conversation by measuring duration of speech for each participant.

    CiNii Books

    J-GLOBAL

    researchmap

  • マイクロホンアレイを用いた複数人対話からの音声区間検出および話者方向推定の評価手法

    黄楊暘, 大塚琢馬, 中臺一博, 奥乃博

    日本ロボット学会学術講演会予稿集(CD-ROM)   30th   ROMBUNNO.3D1-4   2012年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 混合音を聞き分けるセンシング技術

    奥乃 博, 中臺 一博, 水本 武志

    電子情報通信学会誌 = The journal of the Institute of Electronics, Information and Communication Engineers   95 ( 5 )   401 - 404   2012年5月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    私たちが日常耳にする音は複数の音や背景雑音が混じった混合音である.実世界で音情報を活用するためには「聞き分ける」機能が不可欠である.聞き分けるセンサ技術は,インストルメンテーション(装置化)という観点から音を収録するデバイス(センサ)と収録音に対する処理ソフトウェアから構成される.本稿では,混合音のセンサ技術の動向を,ロボット聴覚とカエルの合唱の観測について解説を行う.混合音を聞き分けるという立場から,音源定位,音源分離,分離音認識に取り組むべきであると考え,音環境理解という研究を過去15年進めてきた.離れて聞くという技術は,ロボットでは不可欠の技術であり,ロボット聴覚に不可欠な機能を統合的に提供するソフトウェアHARKを開発し,公開している.HARKの設計思想から具体的な実装まで概観し,その応用として,音環境可視化技術と人ロボット共生学への応用について報告する.また,カエルの合唱機構を音を聞き分けて解析する応用では,フィールドで聞こえる様々な音のために,音響処理だけでは難しいので,近傍の音を拾ってLEDを光らせる「カエルホタル」を開発した.カエルホタルを多数並べて実際の田んぼで観測し,カエルの鳴き方の観測実験についても合わせて報告する.以上の報告を通して,混合音を聞き分ける技術が,今後重要な技術になることを提案する.

    CiNii Books

    CiNii Research

    researchmap

  • Kinectによる楽器マスキングを用いた視聴覚統合ビートトラッキング

    糸原達彦, 水本武志, 大塚琢馬, 中臺一博, 尾形哲也, 奥乃博

    第74回全国大会講演論文集   2012 ( 1 )   355 - 356   2012年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    人のギター演奏を対象とした実時間のビートトラッキングでは,シンコペーションのようなビートパターンの複雑さや人の演奏におけるテンポ揺らぎに対応する必要がある.我々はこれまでに音響情報と相関の深い弾き手の軌道を用いた視聴覚統合ビートトラッキングを開発してきた.しかし, ギターと手は色が似ているため, 手の軌道追従及びビートトラッキングの性能は十分ではなかった.本稿では,視聴覚センサに加えて深度センサも持つKinectを用いて,距離による画像マスキングを行い,手の領域を抽出する.本手法により, 手の追従の頑健さが増し, ビートトラッキングの精度が向上することを示す.

    CiNii Books

    researchmap

  • Kinectによる楽器マスキングを用いた視聴覚統合ビートトラッキング

    糸原達彦, 水本武志, 大塚琢馬, 中臺一博, 尾形哲也, 奥乃博

    全国大会講演論文集   2012 ( 1 )   355 - 357   2012年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    人のギター演奏を対象とした実時間のビートトラッキングでは,シンコペーションのようなビートパターンの複雑さや人の演奏におけるテンポ揺らぎに対応する必要がある.我々はこれまでに音響情報と相関の深い弾き手の軌道を用いた視聴覚統合ビートトラッキングを開発してきた.しかし, ギターと手は色が似ているため, 手の軌道追従及びビートトラッキングの性能は十分ではなかった.本稿では,視聴覚センサに加えて深度センサも持つKinectを用いて,距離による画像マスキングを行い,手の領域を抽出する.本手法により, 手の追従の頑健さが増し, ビートトラッキングの精度が向上することを示す.

    CiNii Books

    researchmap

  • 多チャンネルマイクロホンアレイを用いた音声区間検出および音源定位の精度の向上の検討

    HUANG Yangyang, 大塚琢馬, 中臺一博, 奥乃博

    人工知能学会AIチャレンジ研究会(Web)   36th   5 (WEB ONLY)   2012年

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • ロボットのための実環境ロバストな実時間超解像三次元音源定位

    中村圭佑, 中臺一博, 奥乃博

    人工知能学会AIチャレンジ研究会(Web)   36th   2 (WEB ONLY)   2012年

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 遠隔ユーザの音環境理解を支援するユーザインタフェース

    植田 俊輔, 今井 倫太, 中村 圭佑, 中臺 一博

    人工知能学会全国大会論文集   2012 ( 0 )   3K1R111 - 3K1R111   2012年

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 人工知能学会  

    &lt;p&gt;人間は雑音が多い環境下であってもある程度どこでどのような会話が行われているかを理解する事が出来るが,遠隔操作を行うロボットアバタでは遠隔操作者が遠隔地の音環境を理解する事は困難である.本稿では,雑音環境下でも操作者と遠隔地がインタラクションをスムーズに行うことを支援するユーザインタフェースUI-ALTを提案する.オフライン実験によりUI-ALTは遠隔操作者の雑音環境理解に有用であることが示された.&lt;/p&gt;

    DOI: 10.11517/pjsai.jsai2012.0_3k1r111

    CiNii Books

    CiNii Research

    researchmap

  • マルチモーダル情報統合によるインテリジェント人追跡システム

    中村 圭佑, 中臺 一博, 浅野 太, 中島 弘史, G&ouml, khan Ince

    計測自動制御学会論文集   48 ( 6 )   349 - 358   2012年

     詳細を見る

    記述言語:英語   出版者・発行元:公益社団法人 計測自動制御学会  

    Localization and tracking of humans are essential research topics in robotics. In particular, Sound Source Localization (SSL) has been of great interest. Despite the numerous reported methods, SSL in a real environment had mainly three issues; robustness against noise with high power, no framework for selective listening to sound sources, and tracking of inactive and/or noisy sound sources. For the first issue, we extended Multiple SIgnal Classification by incorporating Generalized Eigen Value Decomposition (GEVD-MUSIC) so that it can deal with high power noise and can select target sound sources. For the second issue, we proposed Sound Source Identification (SSI) based on hierarchical Gaussian mixture models and integrated it with GEVD-MUSIC to realize a function to listen to a specific sound source according to the sort of the sound source. For the third issue, auditory and visual human tracking were integrated using particle filtering. These three techniques are integrated into an intelligent human tracking system. Experimental results showed that integration of SSL and SSI successfully achieved human tracking only by audition, and the audio-visual integration showed considerable improvement in tracking by compensating the loss of auditory or visual information.

    researchmap

  • 対話行動認識プラットフォーム

    塩見 昌裕, 岩井 儀雄, 角 康之, 中壹 一博, 萩田 紀博

    日本ロボット学会誌   29 ( 10 )   883 - 886   2011年12月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 日本ロボット学会  

    DOI: 10.7210/jrsj.29.883

    CiNii Books

    researchmap

  • 情報統合によるインテリジェント人追跡

    中村 圭佑, 中臺 一博, Ince Gokhan

    電子情報通信学会技術研究報告. CNR, クラウドネットワークロボット : IEICE technical report   111 ( 32 )   35 - 40   2011年5月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    情報統合は,ロボットにおけるロバストな環境理解を実現するための重要な技術であり,このためには,統合のスケーラビリティ,各処理のリユーザビリティを向上するという観点からミドルウェアの導入が不可欠である.本稿では,音源定位と音源同定を提供するロボット聴覚処理,および熱画像カメラと距離画像カメラを組み合わせた人検出処理を統合したインテリジェントでかつロバストな人追跡を実現することを目指し,聴覚,視覚のモダリティ内・モダリティ間情報統合手法を提案する.また,情報統合を行うためのソフトウェアアーキテクチャについて,データフロー指向のミドルウェアFlowDesignerとイベント駆動ベースのミドルウェアROSを用いてHARKを透過的に組み合わせる方式を提案する.提案手法に基づき構築したロボットシステムを通じて,各機能の実環境ロバスト性や実時間動作の検証を行い,その有効性を示す.

    CiNii Books

    CiNii Research

    researchmap

  • ロボット聴覚用オープンソースソフトウェア HARKの展開

    中臺一博, 奥乃博

    デジタルプラクティス   2 ( 2 )   133 - 140   2011年4月

     詳細を見る

    記述言語:日本語   出版者・発行元:情報処理学会  

    ロボット聴覚用のオープンソースソフトウェアとして研究開発を行っているHARK (HRI-JP Audition for Robots with Kyoto Univ.) の展開について説明する.HARK は複数のマイクロフォン(マイクロフォンアレイ)からの入力をもとに,音源定位,音源分離,さらに分離音声の認識までをサポートするソフトウェアであり,GUIプログラミング環境上で様々なモジュールを配置・接続することにより,形状やマイクロフォンレイアウトが異なるロボットに対応させたり,用途に合わせたロボット聴覚システムを構築したりすることができる.本稿では,HARK の設計指針を解説し,HARKを用いて構築したシステムの応用例,HARKの展開も併せて報告する.

    CiNii Books

    CiNii Research

    researchmap

  • 累積頻度重みを適用したパーティクルフィルタによる実時間楽譜追従

    大塚琢馬, 中臺一博, 高橋徹, 尾形哲也, 奥乃博

    第73回全国大会講演論文集   2011 ( 1 )   305 - 306   2011年3月

     詳細を見る

    記述言語:日本語  

    パーティクルフィルタによる楽譜追従は,音響信号と楽譜との距離に基づくパーティクル重みの計算によって追従性能が大きく左右される.従来のベクトル内積計算やシグモイド関数を用いた重み計算手法では,音響信号の非調波成分や楽器の音色のバリエーションにより,楽譜位置推定が正しい場合,誤った場合でそれぞれの重みに大きな差が生じず,最終的に推定された楽譜位置に誤差が含まれるという問題点があった.本稿では,過去に計算された距離の累積頻度から重みを動的に計算し,正しい楽譜位置ではより高い重みを計算する.評価実験では,累積頻度を用いた重み計算法が,従来の重み計算法よりも楽譜追従精度で改善することが確認された.

    CiNii Books

    researchmap

  • Audio-visual musical instrument recognition

    AngelicaLim, 中村圭佑, 中臺一博, 尾形哲也, 奥乃博

    第73回全国大会講演論文集   2011 ( 1 )   309 - 310   2011年3月

     詳細を見る

    記述言語:英語  

    Is this person playing a violin or a flute? Classification of musical instrument performances is usually carried out using audio features such as spectral coefficients. We propose augmenting the typical audio feature set with visual features. We show that a combination of audio features and video perform better than audio alone, and verify this multimodal recognition approach on a real-time robot platform.

    CiNii Books

    researchmap

  • 多数の人の声を一度に聞き分ける聴覚技術 : 聖徳太子ロボットを目指して

    奥乃 博, 中臺 一博

    電気学会誌 = The journal of the Institute of Electrical Engineers of Japan   131 ( 3 )   159 - 163   2011年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 電気学会  

    本記事に「抄録」はありません。

    DOI: 10.1541/ieejjournal.131.159

    CiNii Books

    CiNii Research

    researchmap

  • ロボット聴覚 : 高雑音下でのハンズフリー音声認識

    中臺 一博, 奥乃 博

    電子情報通信学会技術研究報告. SP, 音声   110 ( 401 )   7 - 12   2011年1月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    我々が取り組んでいるロボット聴覚研究について,その位置づけや意義を解説し,これを実現するための高雑音下ハンズフリー音声認識へも適用可能な技術としてマイクロホンアレイを用いた動的環境下の実時間音源分離とその音声認識への適用について紹介する.紹介する技術は,ロボット聴覚ソフトウェアHARKとしてオープンソースで公開を行っている.そこで,これらの技術の有効性を,実際のロボットへのHARKの適用事例を通じて示す.

    CiNii Books

    CiNii Research

    researchmap

  • マルチロボットによるKinectを用いた同期合奏

    糸原達彦, 水本武志, LIM Angelica, 大塚琢馬, 中村圭佑, 長谷川雄二, 中臺一博, 尾形哲也, 奥乃博

    人工知能学会AIチャレンジ研究会(Web)   34th   B102-10 (WEB ONLY)   2011年

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 音源定位手法MUSICのベイズ拡張

    大塚琢馬, 中臺一博, 尾形哲也, 奥乃博

    人工知能学会AIチャレンジ研究会(Web)   34th   B102-6 (WEB ONLY)   2011年

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • AI-1-3 ロボット聴覚オープンソースソフトウエアHARK(AI-1.マルチモーダル信号処理とその応用,依頼シンポジウム,ソサイエティ企画)

    奥乃 博, 中臺 一博, 高橋 徹

    電子情報通信学会ソサイエティ大会講演論文集   2010   "SS - 72"-"SS-73"   2010年8月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    CiNii Books

    CiNii Research

    researchmap

  • ロボット聴覚ソフトウエアHARKとそのロボットへの適用

    高橋徹, 中臺一博, 奥乃博

    電気関係学会東海支部連合大会講演論文集(CD-ROM)   2010   ROMBUNNO.S3-1   2010年8月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 室内マイクロホンアレイを用いた実時間発話方向推定

    春原 卓也, 中島 弘史, 中臺 一博, 金田 豊

    電子情報通信学会技術研究報告. EA, 応用音響   110 ( 131 )   19 - 24   2010年7月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    本稿では,大規模マイクロホンアレイを用いた発話方向推定について報告する.筆者らは,先に音源の指向特性に基づいたビームフォーミング法を提案し,スピーカや人の発話方向推定について報告した.さらに,振幅成分の抽出,発話区間検出,周波数マスク,ヒストグラムの4つの改良手法を加えることで,高精度な推定が可能となることを示した.その後,実時間で方向推定が可能なシステムについて報告したが,計算量の制限などにより推定精度が低く,その主原因も不明確であった.本稿では,実時間システムの精度の低い原因を調査し,それをもとに改良を行った実時間システムを提案した.評価実験から,従来の実時間システムよりも実時間性,推定精度に優れていることを示した.

    CiNii Books

    CiNii Research

    researchmap

  • Score Following by Particle Filtering for Music Robots

    OTSUKA Takuma, NAKADAI Kazuhiro, TAKAHASHI Toru, KOMATANI Kazunori, OGATA Tetsuya, OKUNO Hiroshi G

    全国大会講演論文集   72 ( 0 )   913 - 914   2010年3月

     詳細を見る

    記述言語:英語  

    CiNii Books

    researchmap

  • 実環境音声認識のためのロボット聴覚システム開発とパラメータチューニング

    高橋 徹, 中臺 一博, 駒谷 和範, 尾形 哲也, 奥乃 博

    全国大会講演論文集   72 ( 0 )   29 - 30   2010年3月

     詳細を見る

    記述言語:日本語  

    CiNii Books

    researchmap

  • ロボット音声対話におけるSemi-blind ICAを用いた自己発話キャンセル

    武田 龍, 中臺 一博, 高橋 徹, 駒谷 和範, 尾形 哲也, 奥乃 博

    全国大会講演論文集   72 ( 0 )   27 - 28   2010年3月

     詳細を見る

    記述言語:日本語  

    CiNii Books

    researchmap

  • ロボット聴覚オープンソースソフトウエア HARK

    奥乃 博, 中臺 一博

    日本ロボット学会誌(Journal of the Robotics Society of Japan)   28 ( 1 )   6 - 9   2010年1月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本ロボット学会  

    DOI: 10.7210/jrsj.28.6

    CiNii Books

    CiNii Research

    researchmap

  • 「ロボット聴覚」特集について

    中臺 一博, 宮下 敬宏, 奥乃 博

    日本ロボット学会誌(Journal of the Robotics Society of Japan)   28 ( 1 )   1 - 1   2010年1月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本ロボット学会  

    CiNii Books

    CiNii Research

    researchmap

  • 「ロボット聴覚」特集について

    中臺 一博, 宮下 敬宏, 奥乃 博

    日本ロボット学会誌   28 ( 1 )   1 - 1   2010年1月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 日本ロボット学会  

    DOI: 10.7210/jrsj.28.1

    CiNii Books

    CiNii Research

    researchmap

  • ロボット聴覚オープンソースソフトウエアHARK

    奥乃 博, 中臺 一博

    日本ロボット学会誌   28 ( 1 )   6 - 9   2010年1月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 日本ロボット学会  

    DOI: 10.7210/jrsj.28.6

    CiNii Books

    researchmap

  • リサンプル‐ブロック処理と並列化に基づくICAの実時間実装

    武田龍, 中臺一博, 高橋徹, 尾形哲也, 奥乃博

    日本ロボット学会学術講演会予稿集(CD-ROM)   28th   ROMBUNNO.1H3-1   2010年

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 打楽器とロボットとの合奏のための結合振動子モデルに基づく打撃時刻予測

    水本武志, 中臺一博, 大塚琢馬, 高橋徹, 尾形哲也, 奥乃博

    日本ロボット学会学術講演会予稿集(CD-ROM)   28th   ROMBUNNO.1H3-2   2010年

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 多段処理によるブラインド残響抑圧処理の性能向上 (応用音響)

    中島 弘史, 醍醐 徹, 中臺 一博, 金田 豊, 長谷川 雄二

    電子情報通信学会技術研究報告   109 ( 136 )   7 - 12   2009年7月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    本研究では,多入力の残響抑圧処理を1つの処理モジュールと考え,入力チャネルの異なる複数の処理モジュールを多段接続することで高い残響抑圧性能を実現する処理(多段処理)を提案する.今回,残響抑圧処理モジュールとしては,セミブラインドMINT法と適応無相関化逆フィルタの2つを利用した.多段処理の性能は,各モジュールの入力チャネルの組み合わせにより変化する.このため高い性能を実現するための予備的処理として,チャネル選択処理および遅延付加処理についても提案する.8チャネルのマイクアレイによる収録信号を用いた実験により各処理を評価した結果,以下の3つの知見を得た.(1)チャネル選択処理:選択チャネルの違いで抑圧性能に3-10dBの差が発生.適切なチャネル選択により残響抑圧性能を低下させることなくチャネル数の削減が可能(2)遅延付加処理:遅延付加は,特に遅延付加前の性能が低い場合に有効で,2-6dBの性能向上が可能.(3)多段処理:全チャネルを用いた1回の処理の残響抑圧性能がセミブラインドMINT法で14.6dB,適応無相関化逆フィルタで3.5dBであるのに対し,多段処理ではそれぞれ18.2dB(+4.2dB)および13.6dB(+10.1dB)となり,提案法が残響抑圧性能を向上させる手法として有効であることを確認した.

    CiNii Books

    researchmap

  • 多段処理によるブラインド残響抑圧処理の性能向上

    中島 弘史, 醍醐 徹, 中臺 一博, 金田 豊, 長谷川 雄二

    電子情報通信学会技術研究報告. EA, 応用音響   109 ( 136 )   7 - 12   2009年7月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    本研究では,多入力の残響抑圧処理を1つの処理モジュールと考え,入力チャネルの異なる複数の処理モジュールを多段接続することで高い残響抑圧性能を実現する処理(多段処理)を提案する.今回,残響抑圧処理モジュールとしては,セミブラインドMINT法と適応無相関化逆フィルタの2つを利用した.多段処理の性能は,各モジュールの入力チャネルの組み合わせにより変化する.このため高い性能を実現するための予備的処理として,チャネル選択処理および遅延付加処理についても提案する.8チャネルのマイクアレイによる収録信号を用いた実験により各処理を評価した結果,以下の3つの知見を得た.(1)チャネル選択処理:選択チャネルの違いで抑圧性能に3-10dBの差が発生.適切なチャネル選択により残響抑圧性能を低下させることなくチャネル数の削減が可能(2)遅延付加処理:遅延付加は,特に遅延付加前の性能が低い場合に有効で,2-6dBの性能向上が可能.(3)多段処理:全チャネルを用いた1回の処理の残響抑圧性能がセミブラインドMINT法で14.6dB,適応無相関化逆フィルタで3.5dBであるのに対し,多段処理ではそれぞれ18.2dB(+4.2dB)および13.6dB(+10.1dB)となり,提案法が残響抑圧性能を向上させる手法として有効であることを確認した.

    CiNii Books

    CiNii Research

    researchmap

  • 波動音響シミュレータによる指向性の精度検証

    鈴木 淑正, 中島 弘史, 中臺 一博

    聴覚研究会資料   39 ( 4 )   325 - 330   2009年6月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会聴覚研究委員会  

    CiNii Books

    CiNii Research

    researchmap

  • 波動音響シミュレータによる指向性の精度検証

    鈴木 淑正, 中島 弘史, 中臺 一博, 荒井 隆行, 長谷川 雄二

    電子情報通信学会技術研究報告. EA, 応用音響   109 ( 100 )   109 - 114   2009年6月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    近年、コンピュータの性能向上によって、波動音響理論に基づいた数値シミュレーション(波動音響シミュレーション)が実用的な時間で利用可能になってきた。波動音響シミュレーションは、自由音場などの理想的環境下では、高精度なシミュレーションが報告されている。しかし、実環境の高精度なシミュレーションは非常に困難であり様々な課題がある。その中のひとつとして、多くのシミュレータでは音源を点音源として扱うため、指向性を持つスピーカーなどの音源は高精度に再現できないという課題がある。指向性音源を再現する研究はいくつか報告例があるが、高精度かつ実用的なものは少ない。指向性の再現には、正確な音の伝播が必要となるが、空間を格子上に離散化させる差分法においては、音源から等距離でも伝播方向によっては、数値分散の影響が異なるため計算誤差が生じる。本研究では差分法を用いて、まず、自由音場での無指向性点音源を対象とした精度検証を行った。次に、その応用として指向性を有するスピーカ音源を対象とし、模擬スピーカーモデルを点音源に付加するという比較的簡単なモデル化で、指向性音源をシミュレーションできることを示す。

    CiNii Books

    researchmap

  • ソフトマスクと音響モデル適応を用いた3話者同時発話音声認識

    高橋 徹, 中臺 一博, 駒谷 和範, 尾形 哲也, 奥乃 博

    全国大会講演論文集   71 ( 0 )   35 - 36   2009年3月

     詳細を見る

    記述言語:日本語  

    CiNii Books

    researchmap

  • 歌唱ロボットのためのビート情報とメロディ・ハーモニー情報の統合による音楽音響信号と楽譜の実時間同期手法の開発

    大塚 琢馬, 村田 和真, 武田 龍, 中臺 一博, 高橋 徹, 尾形 哲也, 奥乃 博

    全国大会講演論文集   71 ( 0 )   243 - 244   2009年3月

     詳細を見る

    記述言語:日本語  

    CiNii Books

    researchmap

  • 人と共存するロボットシステムの展望

    中臺 一博, 長谷川 雄二, 関口 達彦, 辻野 広司

    日本ロボット学会誌   27 ( 1 )   6 - 9   2009年1月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 日本ロボット学会  

    DOI: 10.7210/jrsj.27.6

    CiNii Books

    researchmap

  • パネル討論:アプリケーション開発における音声認識

    西村 竜一, 中野 鐵兵, 栗原 一貴, 中臺 一博, 吉野 孝

    情報処理学会研究報告音声言語情報処理(SLP)   2008 ( 102 )   55 - 60   2008年10月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    本パネルディスカッションでは、音声認識アプリケーションの開発事例の紹介、アプリ開発に向き合うための提言を関連研究者の方々にお願いした。音声認識アプリケーションの開発を促すことを目的とする。To induce developments of ASR applications, this panel discussion introduces actual case studies. We also indicate some problems of ASR application developments.

    CiNii Books

    researchmap

  • 独立成分分析を応用したロボット聴覚による残響下におけるバージイン発話認識

    武田龍, 中臺一博, 高橋徹, 駒谷和範, 尾形哲也, 奥乃博

    日本ロボット学会学術講演会予稿集(CD-ROM)   26th   ROMBUNNO.1A2-02   2008年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 人・ロボットインタラクションに向けたビートトラッキングロボットの開発とその評価

    村田和真, 中臺一博, 武田龍, 吉井和佳, 奥乃博, 鳥井豊隆, 長谷川雄二, 辻野広司

    日本ロボット学会学術講演会予稿集(CD-ROM)   26th   ROMBUNNO.1A1-03   2008年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • ロボット聴覚のためのソフトマスク生成法による周辺話者音声認識率の改善

    高橋徹, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博

    日本ロボット学会学術講演会予稿集(CD-ROM)   26th   ROMBUNNO.1A1-01   2008年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • ミッシングフィーチャ理論に基づく複数話者同時発話音声認識における音響特徴量とマスクの検討

    高橋徹, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博

    日本音響学会研究発表会講演論文集(CD-ROM)   2008   ROMBUNNO.2-P-16   2008年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 大規模マイクロホンアレイによる発話方向推定の検討

    菊池 慶子, 醍醐 徹, 中島 弘史, 中臺 一博, 長谷川 雄二, 金田 豊

    電子情報通信学会技術研究報告. EA, 応用音響   108 ( 143 )   13 - 18   2008年7月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    本稿では,大規模マイクロホンアレイを用いた発話方向推定について報告する.筆者らは,先に音源の指向特性に基づいたビームフォーミング法を提案し,スピーカや人の発話方向推定について報告した.しかし,この手法において,ビームフォーマーの設計に用いる伝達関数は,対象となる音源の伝達関数を用いないと,性能が劣化するという問題点があった.また,発話区間の検出(VAD)も手動で行われているという問題点があった.前者の問題は異なる音源の伝達関数の位相差が主な原因と考えて,振幅伝達特性のみを利用したヒストグラムによる発話方向推定手法を提案した.後者については,非発話区間など信頼できない時間周波数特徴量のみを自動的にマスクするために,内積値に基づく音声周波数成分検出と自己相関を利用した発話区間検出を導入した.評価実験を通じて,スピーカの伝達関数を用いた場合でも,提案手法により人間の発話方向推定性能が大きく向上することを示した.

    CiNii Books

    researchmap

  • ロボット音声対話のためのMFTとICAによるバージイン許容機能の評価

    武田 龍, 中臺 一博, 駒谷 和範, 尾形 哲也, 奥乃 博

    全国大会講演論文集   70 ( 0 )   135 - 136   2008年3月

     詳細を見る

    記述言語:日本語  

    CiNii Books

    researchmap

  • 1P1-G13 ロボット聴覚用オープンソースソフトウェアHARKの概要(コミュニケーション・ロボット)

    中臺 一博, 山本 俊一, 奥乃 博, 中島 弘史, 長谷川 雄二, 辻野 広司

    ロボティクス・メカトロニクス講演会講演概要集   2008 ( 0 )   _1P1 - G13_1-_1P1-G13_4   2008年

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 日本機械学会  

    This paper describes an open source software system for robot audition called HARK (Honda Research Institute Japan Audition for Robots with Kyoto University). HARK consists of a lot of modules including multi-channel audio input, sound source localization, sound source tracking, sound source separation and recognition of separated speech for robot audition based on the data-flow oriented software programming environment, FlowDesigner. By combining these modules using a GUI environment, a user can easily build a robot audition system for various types of robots and acoustic environments. Through HARK applications to Honda ASIMO and Robovie with different microphone settings, we showed high software portability and reusability of HARK.

    CiNii Books

    CiNii Research

    J-GLOBAL

    researchmap

  • ビートトラッキングロボットの構築と評価

    村田和真, 中臺一博, 武田龍, 奥乃博, 長谷川雄二, 辻野広司

    人工知能学会AIチャレンジ研究会   28th   13 - 20   2008年

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • E-052 バージインを許容するロボット音声対話のためのICAを用いたセミブラインド音源分離(E分野:自然言語・音声・音楽)

    武田 龍, 中臺 一博, 駒谷 和範, 尾形 哲也, 奥乃 博

    情報科学技術フォーラム一般講演論文集   6 ( 2 )   261 - 262   2007年8月

     詳細を見る

    記述言語:日本語   出版者・発行元:FIT(電子情報通信学会・情報処理学会)運営委員会  

    CiNii Books

    researchmap

  • 適応ステップサイズパラメータ法による高性能ブラインド音源分離

    中島 弘史, 中臺 一博, 長谷川 雄二, 辻野 広司

    電子情報通信学会技術研究報告. EA, 応用音響   107 ( 120 )   19 - 24   2007年6月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    本論文では,様々なブラインド音源分離(BSS)に利用可能なステップサイズパラメータの適応調整法を提案する。ステップサイズパラメータは,分離の度合いや周波数によって最適値が異なるものであるが,ほとんどの報告例で,実験的に定めた固定値を利用している。提案法は,多次元のニュートン法に基づく最適値をステップサイズパラメータとして利用することで,適応型のBSSに対し高い収束性と分離度を実現する。提案法の有効性を確認するため,ロボットの頭部に埋め込んだマイクロホンアレイを利用して音源分離の実験を行った。その結果,提案法がさまざまな種類のBSSについて利用でき,高い分離性能が得られる事を確認した。

    CiNii Books

    CiNii Research

    researchmap

  • マルチドメイン音声対話システムにおける対話履歴を利用したドメイン選択

    神田直之, 駒谷和範, 中野幹生, 中臺一博, 辻野広司, 尾形哲也, 奥乃博

    情報処理学会論文誌   48 ( 5 )   1980 - 1989   2007年5月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    複数のドメインを扱う音声対話システムにおいて 対話履歴から得られる特徴量を導入してより精度良くドメイン選択を行う手法を開発した.本研究ではドメイン選択問題を 応答すべきドメインが (I)1つ前の応答を行ったドメイン (II)音声認識結果に対する最尤のドメイン (III)それ以外のドメイン のいずれかという判別問題ととらえる.対話履歴から得られる特徴量を用いて上記を判別する決定木を ドメイン選択の正解を与えた対話データから学習し ドメイン選択器を構成した.5ドメインのマルチドメイン音声対話システムを実装し これを用いて10名の被験者から対話データを収集した.この対話データを用いた評価実験の結果 音声認識尤度に基づく従来のドメイン選択手法に比べ ドメイン選択誤りが16.2%削減されることを確認した.We have developed a robust domain selection method using dialogue history in multi-domain spoken dialogue systems. We define domain selection as a classifying problem among (I) the domain in the previous turn, (II) the domain in which N-best speech recognition results can be accepted with the highest recognition score, (III) other domains. We constructed a classifier by decision tree learning with dialogue data. We implemented a multi-domain spoken dialogue system with 5 domains, and collected dialogue data from 10 sub jects. The experimental result showed our method reduced 16.2% of domain selection errors, compared with a conventional method using speech recognition likelihoods only.

    CiNii Research

    J-GLOBAL

    researchmap

  • AS-6-1 マイクロホンアレイ統合によるロバストな音響ストリーム生成と移動人物追跡(AS-6.実環境における高品質収音のための音声信号処理,シンポジウム)

    中臺 一博, 中島 弘史, 村瀬 昌満, 奥乃 博, 長谷川 雄二, 辻野 広司

    電子情報通信学会総合大会講演論文集   2007   "S - 65"-"S-66"   2007年3月

     詳細を見る

    記述言語:英語   出版者・発行元:一般社団法人電子情報通信学会  

    CiNii Books

    researchmap

  • 音を視覚化する録音再生システム

    吉田雅敏, 海尻聡, 山本俊一, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博

    情報処理学会全国大会講演論文集   69th ( 2 )   2.577-2.578   2007年3月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 口じゃんけん判定ロボットの開発~ロボット聴覚システムの応用に向けて~

    中臺一博, 山本俊一, 奥乃博, 中島弘史, 長谷川雄二, 辻野広司

    人工知能学会AIチャレンジ研究会   26th   59 - 64   2007年

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 自然な人・ロボット音声インタラクションに向けた ロボット聴覚システムの構築

    中臺 一博, 山本 俊一, 浅野 太

    人工知能学会全国大会論文集   21   1 - 4   2007年

     詳細を見る

    記述言語:日本語   出版者・発行元:人工知能学会  

    CiNii Books

    researchmap

  • 人・ロボット音声インタラクションのための情報統合に向けて

    中臺 一博

    電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション   106 ( 298 )   19 - 26   2006年10月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    自然な人・ロボット音声インタラクションを実現する上で聴覚機能を通じ,ロボット周囲の環境を把握する「実環境音環境理解」,ロボットがユーザに対して適切でわかりやすく情報を伝達する「表出」は重要な機能であろう.こうした機能をロバストに実現する上で,筆者が鍵となると考えている「情報統合」アプローチについて述べる.また,このアプローチに基づく研究例として,実環境音環境理解に関しては,ミッシングフィーチャ理論による音源分離と音声認識の統合,マイクロホンアレイ統合による音源追跡のロバスト性の向上について,表出に関しては,韻律情報と頭部色を用いたマルチモーダル表出,指向性スピーカを用いた新しい発話機能の導入に関して紹介する.

    researchmap

  • 人・ロボット音声インタラクションのための情報統合に向けて

    中臺 一博

    電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解   106 ( 300 )   37 - 44   2006年10月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    自然な人・ロボット音声インタラクションを実現する上で聴覚機能を通じ,ロボット周囲の環境を把握する「実環境音環境理解」,ロボットがユーザに対して適切でわかりやすく情報を伝達する「表出」は重要な機能であろう.こうした機能をロバストに実現する上で,筆者が鍵となると考えている「情報統合」アプローチについて述べる.また,このアプローチに基づく研究例として,実環境音環境理解に関しては,ミッシングフィーチャ理論による音源分離と音声認識の統合,マイクロホンアレイ統合による音源追跡のロバスト性の向上について,表出に関しては,韻律情報と頭部色を用いたマルチモーダル表出,指向性スピーカを用いた新しい発話機能の導入に関して紹介する.

    CiNii Books

    CiNii Research

    researchmap

  • 人・ロボット音声インタラクションのための情報統合に向けて

    中臺 一博

    電子情報通信学会技術研究報告. TL, 思考と言語   106 ( 296 )   19 - 26   2006年10月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    自然な人・ロボット音声インタラクションを実現する上で聴覚機能を通じ,ロボット周囲の環境を把握する「実環境音環境理解」,ロボットがユーザに対して適切でわかりやすく情報を伝達する「表出」は重要な機能であろう.こうした機能をロバストに実現する上で,筆者が鍵となると考えている「情報統合」アプローチについて述べる.また,このアプローチに基づく研究例として,実環境音環境理解に関しては,ミッシングフィーチャ理論による音源分離と音声認識の統合,マイクロホンアレイ統合による音源追跡のロバスト性の向上について,表出に関しては,韻律情報と頭部色を用いたマルチモーダル表出,指向性スピーカを用いた新しい発話機能の導入に関して紹介する.

    CiNii Books

    CiNii Research

    researchmap

  • パラメータ最適化による実環境同時発話認識向上とそのオンライン処理の実装

    山本俊一, 中臺一博, 中野幹生, 辻野広司, VALIN Jean‐Marc, 駒谷和範, 尾形哲也, 奥乃博

    日本ロボット学会学術講演会予稿集(CD-ROM)   24th   1B12   2006年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • D-14-10 有向性音素グルーピングを用いた音声認識におけるロバスト性向上の検討(D-14.音声・聴覚,一般講演)

    隅谷 亮太, 中臺 一博, 中野 幹生, 市毛 弘一, 廣瀬 靖雄, 辻野 広司

    電子情報通信学会総合大会講演論文集   2006 ( 1 )   134 - 134   2006年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    CiNii Books

    researchmap

  • パーティクルフィルタによる音源追跡の性能評価

    村瀬昌満, 中台一博, 奥乃博

    情報処理学会全国大会講演論文集   68th ( 2 )   345 - 346   2006年3月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 複数ドメイン音声対話システムにおける対話履歴を利用したドメイン選択の高精度化

    神田直之, 駒谷和範, 中野幹生, 中台一博, 辻野広司, 尾形哲也, 奥乃博

    情報処理学会全国大会講演論文集   68th ( 2 )   329 - 330   2006年3月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • GAによる話者位置への同時発話認識システムの最適化

    山本俊一, 中台一博, 中野幹生, 辻野広司, VALIN Jean‐Marc, 武田龍, 駒谷和範, 尾形哲也, 奥乃博

    情報処理学会全国大会講演論文集   68th ( 2 )   5 - 6   2006年3月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 複数ドメイン音声対話システムにおける対話履歴を利用したドメイン選択の高精度化

    神田 直之, 駒谷 和範, 中野 幹生, 中臺 一博, 辻野 広司, 尾形 哲也, 奥乃 博

    情報処理学会研究報告音声言語情報処理(SLP)   2006 ( 12 )   55 - 60   2006年2月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    複数のドメインを扱う音声対話システムにおいて,対話の文脈や進行に関する特徴量を導入してより精度よくドメイン選択を行う手法を開発したので報告する.本稿ではドメイン選択問題を,応答すべきドメインが,(I)ひとつ前の応答を行ったドメイン,(II)音声認識結果に対する最尤のドメイン,(III)それ以外のいずれかのドメイン,のどれに該当するかを判別する問題と捉える.ドメイン選択の正解を与えた対話データから,対話の文脈や進行に関する特徴量を用いて上記を判別する決定木を学習することにより,ドメイン選択器を構成した.5ドメインのマルチドメイン音声対話システムを用いた10名の被験者による評価実験の結果,音声認識尤度に基づく従来のドメイン選択手法に比べ,ドメイン選択誤りが11.6%削減された.We have developed a robust domain selection method using dialogue history in multi-domain spoken dialogue systems. We define domain selection as classifying problem among (I) the domain in the previous turn, (II) the domain in which N-best speech recognition results can be accepted with the highest recognition score, (III) other domains. We constructed a classifier by decision tree learning with dialogue corpus. The experimental result using 10 subjects shows that our method could reduced 11.6% domain selection error, compared with a conventional method using speech recognition likelihoods only.

    CiNii Books

    researchmap

  • HRI-JPにおけるヒューマン-ロボットインタラクション研究

    辻野 広司, 中野 幹生, 中臺 一博, 長谷川 雄二

    電子情報通信学会技術研究報告. SIS, スマートインフォメディアシステム   105 ( 426 )   31 - 36   2005年11月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    コンピュータの発達により高機能化した機械が家庭に入ってくるようになり, 「誰でも使える機械と人とのインターフェース」がますます重要になってきている.そのような機械のひとつの究極であるインテリジェントロボットにおいては, さらに進んだインターフェースの概念や価値観の研究が進められつつある.我々は未来のインテリジェントロボットに求められるインターフェースとして, 人とロボットの関係が双方向であることを前提にした「ヒューマン-ロボットインタラクション」という機能実現を目指し, 研究を進めている.このような観点に基づき, 「ヒューマン-ロボットインタラクションのためのアーキテクチャ」「ロボットによる人の音声の認識」, 「人によるロボットの音声の認識」に関し報告する.

    CiNii Books

    researchmap

  • 複数のカルマンフィルタを用いた複数移動話者追跡と精度評価

    村瀬昌満, 山本俊一, VALIN Jean‐Marc, 中台一博, 山田健太郎, 駒谷和範, 尾形哲也, 奥乃博

    日本ロボット学会学術講演会予稿集(CD-ROM)   23rd   3C26   2005年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • ヒューマノイドを対象としたミッシングフィーチャー理論による分離音の連続音声認識の向上

    山本俊一, VALIN Jean‐Marc, 中台一博, 中野幹生, 辻野広司, 駒谷和範, 尾形哲也, 奥乃博

    日本ロボット学会学術講演会予稿集(CD-ROM)   23rd   3C35   2005年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 聖徳太子ロボット―視聴覚統合によるロボット聴覚―

    奥乃博, 中台一博

    画像センシングシンポジウム講演論文集   11th   87 - 92   2005年6月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 動的リコンフィギャラブルデバイスDRPを用いた音源分離フィルタの実装と評価

    黒瀧 俊輔, 鈴木 紀章, 中臺 一博, 奥乃 博, 天野 英晴

    電子情報通信学会技術研究報告   105 ( 43 )   67 - 72   2005年5月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    CiNii Research

    researchmap

  • ロボット聴覚の現状と課題

    奥乃 博, 中臺 一博

    日本音響学会研究発表会講演論文集   2005 ( 1 )   633 - 636   2005年3月

     詳細を見る

  • マイクロフォンアレイによる分離音声認識のためのミッシングフィーチャーマスク自動生成

    山本俊一, VALIN J‐M, 中台一博, 駒谷和範, 尾形哲也, 奥乃博

    情報処理学会全国大会講演論文集   67th ( 2 )   377 - 378   2005年3月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • ミッシングフィーチャ理論を適用した同時発話認識システムの同時発話文による評価

    山本俊一, VALIN Jean‐Marc, 中台一博, 中野幹生, 辻野広司, 駒谷和範, 尾形哲也, 奥乃博

    人工知能学会AIチャレンジ研究会   22nd   101 - 106   2005年

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • ミッシングフィーチャー理論に基づく音源分離と音声認識のインターフェースの評価

    山本俊一, 中台一博, 辻野広司, 駒谷和範, 尾形哲也, 奥乃博

    日本ロボット学会学術講演会予稿集(CD-ROM)   22nd   1C33   2004年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • G-007 ミッシングフィーチャー理論による音源分離と混合音声認識の統合型インターフェース(G.音声・音楽)

    山本 俊一, 中臺 一博, 辻野 広司, 奥乃 博

    情報科学技術フォーラム一般講演論文集   3 ( 2 )   357 - 360   2004年8月

     詳細を見る

    記述言語:日本語   出版者・発行元:FIT(電子情報通信学会・情報処理学会)運営委員会  

    CiNii Books

    researchmap

  • マルチモーダル情報統合によるヒューマノイドロボットの挙動選択

    戸田充彦, 中台一博, 駒谷和範, 尾形哲也, 奥乃博

    情報処理学会全国大会講演論文集   66th ( 2 )   2.193-2.194   2004年3月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • ミッシングフィーチャー理論による三話者同時発話認識の向上

    山本俊一, 中台一博, 辻野広司, 駒谷和範, 尾形哲也, 奥乃博

    情報処理学会全国大会講演論文集   66th ( 2 )   2.287-2.288   2004年3月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • アクティブオーディションによる自然なヒューマン・ロボットインターフェースの実現に関する研究(認知と身体性)(<特集>人工知能分野における博士論文)

    中臺 一博

    人工知能   19 ( 1 )   106_2 - 106_2   2004年1月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 人工知能学会  

    これまでロボットの聴覚機能に関する研究は,人間とのソーシャルインタラクションで最も重要であるにもかかわらず,あまり行われていなかった.また,ロボット聴覚を実現するために,実環境・実時間処理という観点から問題点は指摘されてきたものの,これらを体系的にまとめた報告はなかった.そこで,本研究では,まず,ロボット聴覚の課題を体系的に整理し,解決に向けた具体的な方法を議論する.そして,アクティブな動作はロボット聴覚の向上に本質的であると捉え,これをロボット聴覚に適用したアクティブオーディションを提案する.また,複数の聴覚情報の統合,聴覚情報以外の感覚情報との統合を行うことによる知覚向上およびより一般的な処理を目指したロボットによる一般的な音(混合音)の理解についても併せて議論する.実際に上半身ヒューマノイドロボットSIG(http://winnie.kuis.kyoto-u.ac.jp/SIG/)上に構築したシステムは,ロボットに特有な動作時のノイズをキャンセルすることで,アクティブな動作の聴覚処理への利用を可能とした.また,アクティブな動作を効果的に用いることにより,視聴覚統合による話者の定位・追跡,注意を向けた方向の音源を実時間で抽出できるアクティブ方向通過型フィルタによる音源分離,分離音の音声認識といった機能を実現した.システムの各機能およびシステム全体を通した統合評価を通じて,アクティブオーディション,感覚情報の統合,一般音理解の有効性・ロバスト性,ヒューマン・ロボットインタフェースとしての有効性を示した.

    DOI: 10.11517/jjsai.19.1_106_2

    CiNii Books

    CiNii Research

    researchmap

  • ロボット聴覚へのミッシングフィーチャー理論の適用による三話者同時発話認識

    山本 俊一, 中臺 一博, 辻野 広司

    人工知能学会全国大会論文集   18   1 - 4   2004年

     詳細を見る

    記述言語:日本語   出版者・発行元:人工知能学会  

    CiNii Books

    researchmap

  • ロボット聴覚へのミッシングフィーチャー理論の適用による三話者同時発話認識

    山本 俊一, 中臺 一博, 辻野 広司, 奥乃 博

    人工知能学会全国大会論文集   4 ( 0 )   41 - 41   2004年

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 人工知能学会  

    本稿では,ロボットに搭載された2つのマイクで録音された三話者同時発話音声を音源分離とミッシングフィーチャー理論に基づく音声認識によって行う手法を提案する.2体のロボットにおける実験により提案手法の有効性を確認する.

    researchmap

  • ロボットに装着したマイクロフォンアレイによる音源分離とミッシングフィーチャー理論に基づく音声認識

    山本俊一, VALIN Jean‐Marc, 中台一博, 奥乃博

    人工知能学会AIチャレンジ研究会   20th   27 - 32   2004年

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 知能ロボットの技術:人工知能からのアプローチ(前編):5.ロボット聴覚の課題と現状

    奥乃 博, 中臺 一博

    情報処理   44 ( 11 )   1138 - 1144   2003年11月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    ロボットが家庭に入ってくるようになり, ロボットと人とのコミュニケーション, 特に, ロボットに装備されたマイクロフォンを用いたコミュニケーションや音による環境知覚がますます重要になってきている. 最近, ロボット自身の耳による聴覚機能がようやく活発になってきた. では, ロボットのための聴覚機能にはどのようなものが必要であろうか.

    CiNii Books

    CiNii Research

    researchmap

  • ロボットを対象とした散乱理論による三話者同時発話の定位・分離・認識の向上

    中台一博, 奥乃博, 辻野広司

    人工知能学会AIチャレンジ研究会   18th   33 - 38   2003年11月

     詳細を見る

    記述言語:日本語   出版者・発行元:人工知能学会  

    CiNii Research

    J-GLOBAL

    researchmap

  • 階層的な視聴覚統合と散乱理論を利用したロボットによる三話者同時発話認識の向上

    中台一博, 松浦大輔, 奥乃博, 辻野広司

    日本ロボット学会学術講演会予稿集(CD-ROM)   21st   2K14   2003年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • ヒューマノイドロボットにおける挙動選択の設計と実装

    戸田充彦, 中台一博, 宮下敬宏, 奥乃博

    日本ロボット学会学術講演会予稿集(CD-ROM)   21st   3F23   2003年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 人間に似た外見を持つロボットReplieにおける挙動選択システム

    戸田充彦, 山本俊一, 中台一博, 奥乃博

    情報処理学会全国大会講演論文集   65th ( 4 )   4.211-4.212   2003年3月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 方向通過型音源分離フィルタへのFPGAの応用

    鈴木 紀章, 中臺 一博, 天野 英晴, 奥乃 博, 北野 宏明

    情報処理学会研究報告システムLSI設計技術(SLDM)   2003 ( 7 )   135 - 140   2003年1月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    ロボットの知覚システムを構成する場合、計算コストが高い問題を低消費電力かつある程度の柔軟性を保持して実現するためにはFPGAによるリコンフィギュラブルシステムのアプローチが効果的である。本稿では、聴覚システムを構成する際に用いる方向通過型フィルタの処理の一部である高速フーリエ変換(FFT)、平方根、ArcTanをFPGA上に実装し、ハードウェア処理による小型で低消費電力のシステムを作成するための検討を行う。評価の結果、FPGAに実装したFFT、平方根、ArcTan演算回路は、12MHz動作において1GHzのPentiumIIIの2.9倍、2.9倍、3.3倍の処理速度で演算可能である事が分かった。Reconfigurable systems are efficient for high performance but low cost/power implementation for intelligent systems for robots. In this paper, a part of processing for the direction-pass filter, such as Fast Fourier Transform(FFT), square root, and arc tangent used in auditory system of humanoid robots are implemented on an FPGA, and their peformance is evaluated. Our result shows that FFT, square root and arc tangent implemented on the FPGA of 12MHz are 2.9 times, 2.9 times and 3.3 times faster, respectively, than those in Pentium III of 1GHz.

    CiNii Books

    researchmap

  • 方向通過型音源分離フィルタへのFPGAの応用

    鈴木 紀章, 中臺 一博, 天野 英晴, 奥乃 博, 北野 宏明

    電子情報通信学会技術研究報告. CPSY, コンピュータシステム   102 ( 611 )   79 - 84   2003年1月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    ロボットの知覚システムを構成する場合、計算コストが高い問題を低消費電力かつある程度の柔軟性を保持して実現するためにはFPGAによるリコンフィギャラブルシステムのアプローチが効果的である。本稿では、聴覚システムを構成する際に用いる方向通過型フィルタの処理の一部である高速フーリエ変換(FFT)、平方根、ArcTanをFPGA上に実装し、ハードウェア処理による小型で低消費電力のシステムを作成するための検討を行う。評価の結果、FPGAに実装したFFT、平方根、ArcTan演算回路は、12MHz 動作において1GHzのPentium IIIの2.9倍、2.9倍、3.3倍の処理速度で演算可能である事が分かった。

    CiNii Books

    researchmap

  • 方向通過型音源分離フィルタへのFPGAの応用

    鈴木 紀章, 中臺 一博, 天野 英晴, 奥乃 博, 北野 宏明

    電子情報通信学会技術研究報告. VLD, VLSI設計技術   102 ( 609 )   79 - 84   2003年1月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    ロボットの知覚システムを構成する場合、計算コストが高い問題を低消費電力かつある程度の柔軟性を保持して実現するためにはFPGAによるリコンフィギャラブルシステムのアプローチが効果的である。本稿では、聴覚システムを構成する際に用いる方向通過型フィルタの処理の一部である高速フーリエ変換(FFT)、平方根、ArcTariをFPGA上に実装し、ハードウェア処理による小型で低消費電力のシステムを作成するための検討を行う。評価の結果、FPGAに実装したFFT、平方根、ArcTan演算回路は、12MHz動作において1GHzのPentium IIIの2.9倍、2.9倍、3.3倍の処理速度で演算可能である事が分かった。

    CiNii Books

    CiNii Research

    researchmap

  • Exploiting auditory fovea in humanoid-human interaction

    Kazuhiro Nakadai, Hiroshi G. Okuno, Hiroshi G. Okuno, Hiroaki Kitano, Hiroaki Kitano

    Proceedings of the National Conference on Artificial Intelligence   431-438   431 - 438   2002年12月

     詳細を見る

  • アクティブオーディションによる複数音源の定位・分離・認識

    中台一博, 奥乃博, 北野宏明

    人工知能学会AIチャレンジ研究会   16th   25 - 32   2002年11月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本人工知能学会  

    CiNii Research

    J-GLOBAL

    researchmap

  • ロボット聴覚実現に向けて-ヒューマノイドロボットSIG2の開発-

    中台一博, 松浦大輔, 宮下敬宏, 奥乃博, 北野宏明

    日本ロボット学会学術講演会予稿集(CD-ROM)   20th   1H19   2002年10月

     詳細を見る

    記述言語:日本語  

    CiNii Research

    J-GLOBAL

    researchmap

  • サポートベクターマシンを用いた話者トラッキング注意制御

    松浦大輔, 中台一博, 奥乃博, 北野宏明

    日本ロボット学会学術講演会予稿集(CD-ROM)   20th   1C33   2002年10月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • Auditory fovea based speech enchancement and its application to human-robot dialog system

    Kazuhiro Nakadai, Hiroshi G. Okuno, Hiroshi G. Okuno, Hiroaki Kitano, Hiroaki Kitano

    7th International Conference on Spoken Language Processing, ICSLP 2002   1817 - 1820   2002年1月

     詳細を見る

  • Auditory fovea based speech separation and its application to dialog system

    Kazuhiro Nakadai, Hiroshi G. Okuno, Hiroshi G. Okuno, Hiroaki Kitano, Hiroaki Kitano

    IEEE International Conference on Intelligent Robots and Systems   2   1320 - 1325   2002年1月

     詳細を見る

  • Real-time speaker localization and speech separation by audio-visual integration

    Kazuhiro Nakadai, Ken Ichi Hidai, Hiroshi G. Okuno, Hiroaki Kitano

    Proceedings - IEEE International Conference on Robotics and Automation   1   1043 - 1049   2002年1月

     詳細を見る

    出版者・発行元:IEEE  

    Scopus

    researchmap

  • アクティブオーディションに基づくヒューマン&middot;ロボットインタラクション

    中臺 一博, 奥乃 博, 北野 宏明

    計測自動制御学会 部門大会/部門学術講演会資料   2002 ( 0 )   522 - 522   2002年

     詳細を見る

    出版者・発行元:公益社団法人 計測自動制御学会  

    Robots to interact with people should understand various events simultaneously. To realize such capabilities in robots, integration of audition, vision and other sensory information and active motion for better perception are essential. This paper describes active audition that improves robot audition to integrate audition, vision and active motion. Our active audition based upper-torso robot can localize and interact with people even when occlusion and simultaneous speech occur.

    DOI: 10.11499/siced.si2002.0.522.0

    CiNii Research

    researchmap

  • Real-time active human tracking by hierarchical integration of audition and vision

    NAKADAI K.

    Proc. IEEE-RAS Int. Conf. on Robots and Automation, Washington, DC, 2002   2002年

     詳細を見る

  • ロボットの耳は二つで十分か(<特集>なぜ耳は二つあるか?)

    奥乃 博, 中臺 一博

    日本音響学会誌   58 ( 3 )   205 - 210   2002年

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 日本音響学会  

    聴覚は人間にとって最も重要な感覚である。言語によるコミュニケーションが聴覚によって成立することは容易に理解されるが,「ヒトは聴覚によってのみ言語を獲得し,そこに文化が生まれ,継承される。書かれた言語は目によって伝承されるが,話す言葉は耳からしか得られない。話し言葉があって書く言葉が生まれる」ことを,多くの人が理解していないのは残念なことである(鈴木淳一,小林武夫共著『耳科学-難聴に挑む』(中公新書1598,2001))。

    DOI: 10.20697/jasj.58.3_205

    CiNii Books

    CiNii Research

    researchmap

  • ロボット聴覚の課題と現状

    奥乃 博, 中臺 一博

    情報処理学会研究報告音声言語情報処理(SLP)   2001 ( 123 )   69 - 74   2001年12月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    ロボットが人間社会の中に入り込み,共生していくためには,混合音が扱えること,アクティブオーディション,動きながら聞く機構,未知環境での音の知覚,画像処理などの他の処理の統合,実時間処理が大きな課題であることを指摘した。混合音の処理では,音源定位が重要であり,頭部伝達関数(HRTF)を使わない手法が必要となる。本稿では,これら課題に対して,マイクロフォン2本が必要であるという考えを述べ,2本のマイクロフォンで実現可能な機能について,解説をした。体を動かして聞くというアクティブオーディション,あるいは,画像処理とモータ処理を統合して,体全体で聞くという情報統合が重要である。そのために,方向通過型フィルタや聴覚エピポーラ幾何学,実時間処理方法を開発して,複数の実験で有効性を確認した。In this paper, we present as active audition system which is implemented on the humanoid robot &quot;SIG the humanoid&quot;. The audition system for highly intelligent humanoids localize sound sources and recognize auditory events in teh auditory scene. Active audition reported in this paper enables SIG to track sound sources by integrating auditiion, vision, and motor movements. Given the multiple sound sources in the auditory scene, SIG actively moves its head to improve licalization by aligning microhones orthogonal to the sound source and by capturing the possible sound sources by vision. However, such an active head movement inevitably creates motor noises. The system adaptively cancels motor noises using motor control signals. The experimental result demonstrates that active audition by integration of audition, vision, and motor control attains sound source tracking in variety of conditions.

    CiNii Books

    CiNii Research

    researchmap

  • ロボット聴覚の課題と現状

    奥野 博, 中臺 一博

    電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション   101 ( 520 )   69 - 74   2001年12月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    ロボットが人間社会の中に入り込み, 共生していくためには, 混合音が扱えること, アクティブオーディション, 動きながら聞く機構, 未知環境での音の知覚, 画像処理などの他の処理の統合, 実時間処理が大きな課題であることを指摘した.混合音の処理では, 音源定位が重要であり, 頭部伝達関数(HRTF)を使わない手法が必要となる.本稿では, これら課題に対して, マイクロフォン2本が必要であるという考えを述べ, 2本のマイクロフォンで実現可能な機能について, 解説をした.体を動かして聞くというアクティブオーディション, あるいは, 画像処理とモータ処理を統合して, 体全体で聞くという情報統合が重要である.そのために, 方向通過型フィルタや聴覚エピポーラ幾何学, 実時間処理方法を開発して, 複数の実験で有効性を確認した.

    CiNii Books

    researchmap

  • ロボット聴覚の課題と現状

    奥乃 博, 中臺 一博

    電子情報通信学会技術研究報告. SP, 音声   101 ( 522 )   69 - 74   2001年12月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    ロボットが人間社会の中に入り込み, 共生していくためには, 混合音が扱えること, アクティブオーディション, 動きながら聞く機構, 未知環境での音の知覚, 画像処理などの他の処理の統合, 実時間処理が大きな課題であることを指摘した.混合音の処理では, 音源定位が重要であり, 頭部伝達関数(HRTF)を使わない手法が必要となる.本稿では, これら課題に対して, マイクロフォン2本が必要であるという考えを述べ, 2本のマイクロフォンで実現可能な機能について, 解説をした.体を動かして聞くというアクティブオーディション, あるいは, 画像処理とモータ処理を統合して, 体全体で聞くという情報統合が重要である.そのために, 方向通過型フィルタや聴覚エピポーラ幾何学, 実時間処理方法を開発して, 複数の実験で有効性を確認した.

    CiNii Books

    CiNii Research

    researchmap

  • Human-robot interaction through real-time auditory and visual multiple-talker tracking

    Hiroshi G. Okuno, Kazuhiro Nakadai, Ken Ichi Hidai, Hiroshi Mizoguchi, Hiroaki Kitano

    IEEE International Conference on Intelligent Robots and Systems   3   1402 - 1409   2001年12月

     詳細を見る

  • Epipolar geometry based sound localization and extraction for humanoid audition

    Kazuhiro Nakadai, Hiroshi G. Okuno, Hiroaki Kitano

    IEEE International Conference on Intelligent Robots and Systems   3   1395 - 1401   2001年12月

     詳細を見る

    出版者・発行元:IEEE  

    Scopus

    researchmap

  • アクティブな視聴覚統合を用いた実時間人物追跡ヒューマノイドSIG

    中臺 一博, 日台健一, 奥乃 博, 北野 宏明

    情報処理学会研究報告知能と複雑系(ICS)   2001 ( 97 )   37 - 42   2001年10月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    本稿では ロボットを対象にロバストな知覚機構を実現するため 聴覚処理の面から アクティブな動作 および 視聴覚情報統合の有効性を示す. 一般に 実環境では 反響 雑音が存在し かつ動的に変化するため 高精度な音源定位や音源分離を行うことは難しい. 我々は 音源定位に関しては アクティブな動作と視聴覚処理を統合し 実時間で複数人物(音源)の定位・追跡が可能なシステムを開発している. そこで システムから得られる方向情報を利用して アクティブ方向通過型フィルタによる音源分離のプロトタイプを実装した. 結果として 一般的な部屋において 音源に正対するようなアクティブな動きにより2 話者の分離や 移動音源の抽出に対してアクティブな動作と視聴覚情報統合の有効性を示した.This paper describes improvement of auditory processing by active motion and audio-visual integration. Generally, environmental noises and reverberation affect sound source localization and separation in the real world badly. Our real-time human tracking system for humanoid robots attained robust sound source licalization in the real world by active audio-visual integration. Then, we propose a new sound source separation method by active direction pass filter. Our experiments proves that active audio-visual integration is essential to robust perception for extraction of tracking sound source.

    CiNii Books

    CiNii Research

    researchmap

  • ステレオ視による実時間人物追跡システムの高精度化

    日台健一, 中台一博, 奥乃博, 北野宏明

    日本ロボット学会学術講演会予稿集   19th   155   2001年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 視聴覚のストリームベース統合による実時間人物追跡システム

    中台一博, 日台健一, 奥乃博, 北野宏明

    日本ロボット学会学術講演会予稿集   19th   583 - 584   2001年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • ステレオ視による実時間人物追跡システムの高精度化

    日台健一, 中台一博, 奥乃博, 北野宏明

    日本ロボット学会学術講演会予稿集   19th   581 - 582   2001年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 視聴覚のストリームベース統合による実時間人物追跡システム

    中台一博, 日台健一, 奥乃博, 北野宏明

    日本ロボット学会学術講演会予稿集   19th   155   2001年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 視聴覚情報の階層的統合による実時間アクティブ人物追跡

    中台一博, 日台健一, 奥乃博, 北野宏明

    人工知能学会AIチャレンジ研究会   13th   35 - 42   2001年6月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 顔認識とアクティブオーディションを利用した実時間人物追跡

    中台一博, 日台健一, 溝口博, 奥乃博, 北野宏明

    人工知能学会AIチャレンジ研究会   11th   27 - 34   2001年3月

     詳細を見る

    記述言語:日本語  

    CiNii Research

    J-GLOBAL

    researchmap

  • Real-time auditory and visual multiple-object tracking for robots

    NAKADAI K.

    Proceedints of the Seventeenth International Joint Conference on Atificial Intelligence (IJCAI-01)   2001年

     詳細を見る

    出版者・発行元:MIT Press  

    researchmap

  • Active audition system and humanoid exterior design

    K. Nakadai, T. Matsui, H. G. Okuno, H. Kitano

    IEEE International Conference on Intelligent Robots and Systems   2   1453 - 1461   2000年12月

     詳細を見る

  • 動画像と音響を統合したインタラクティブロボットの動的環境での制御

    中川友紀子, 中台一博, 奥乃博, 北野宏明

    日本ロボット学会学術講演会予稿集   18th   113 - 114   2000年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • ロボットの外装の音響効果を利用したアクティブオーディションシステム

    中台一博, 奥乃博, 北野宏明

    日本ロボット学会学術講演会予稿集   18th   103 - 104   2000年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • ヒューマノイド聴覚機能のためのアクティブオーディションの提案

    中台一博, 奥乃博, 北野宏明

    日本ロボット学会学術講演会予稿集   18th   105 - 106   2000年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • BeowulfクラスクラスタERATO - 1のチューニングと評価

    奥乃 博, 京田耕司, 中臺 一博, 北野 宏明

    情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC)   2000 ( 23 )   116 - 124   2000年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    Beowulrクラスクラスタは,PCクラスタの論理構成法であり,コモディティハードウェアやソフトウェアによりPCクラスタが容易に構築できる.しかし,それらの組合せによってはうまく動かなかったり,あるいは,性能が全く出ないということがある.本稿では,Beowulfクラスクラスタのチューニングを(1)ネットワーク,(2)プロセッサ間通信ライブラリ(MPIやPVM),(3)応用プログラム,という3つのレベルで分けて,行うことを提案する.具体的には,NetPIPEというネットワーク測定用ツールを用いて,(1)と(2)をチューニングする.次に,線形代数でよく使われるLINPACKの一つScaLAPACKを応用プログラムとして利用し,(1)と(2)から得られたネットワーク特性を用いて,ScaLAPACKのチューニングを行う.とくに,小さな行列に分割することと,最適化された線形代数パッケージを使用することが,ScaLAPACKの性能向上に不可欠であることが判明した.これらの知見を利用することにより,Pentium-II 450 MHz,256 MByteメモリのノード32台で構成されるERATO-1に本手法を適用した結果,ハードウェアの不具合いが発見でき,また,LINPACKベンチマークで6.76GFlopsの性能が得られた.Beowulf-Class cluster is a logical organization of PC clusters composed of mass-market off-the-shelf hardware and software. The user may have problems that their implementation won&#039;t work well in hardware level or their implementation provides quite a poor performance. In this paper, we present a new method to tune and evaluation of the Beowulf-Class cluter by focusing on three levels: (1) network level, (2) message passing system level (e.g., MPI, PVM), and (3) application level. The first two performance is measured by NetPIPE developed by Ames Lab. ScaLAPACK (parallel version of LINPACK) is used as benchmarks for application programs, because it is one of the most common linear algebra subprograms and its evaluation is beneficial for numerical computation users. ScaLAPACK is tuned by using parameters determined by NetPIPE. ERATO-1 Beowulf-class cluster, 32 nodes of Pentium-II 450HHz processor with 256MByte of memory, is tuned by the proposed method. First, a network interface card installed in each ERATO-1 node is indentified as the cause of poor performance and finally ERATO-1 attained 6.76 GFlops with LINPACK benchmark.

    CiNii Books

    researchmap

  • BeowulfクラスクラスタERATO - 1のチューニングと評価

    奥乃 博, 京田耕司, 中臺 一博, 北野 宏明

    情報処理学会研究報告計算機アーキテクチャ(ARC)   2000 ( 23 )   119 - 124   2000年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    Beowulrクラスクラスタは,PCクラスタの論理構成法であり,コモディティハードウェアやソフトウェアによりPCクラスタが容易に構築できる.しかし,それらの組合せによってはうまく動かなかったり,あるいは,性能が全く出ないということがある.本稿では,Beowulfクラスクラスタのチューニングを(1)ネットワーク,(2)プロセッサ間通信ライブラリ(MPIやPVM),(3)応用プログラム,という3つのレベルで分けて,行うことを提案する.具体的には,NetPIPEというネットワーク測定用ツールを用いて,(1)と(2)をチューニングする.次に,線形代数でよく使われるLINPACKの一つScaLAPACKを応用プログラムとして利用し,(1)と(2)から得られたネットワーク特性を用いて,ScaLAPACKのチューニングを行う.とくに,小さな行列に分割することと,最適化された線形代数パッケージを使用することが,ScaLAPACKの性能向上に不可欠であることが判明した.これらの知見を利用することにより,Pentium-II 450 MHz,256 MByteメモリのノード32台で構成されるERATO-1に本手法を適用した結果,ハードウェアの不具合いが発見でき,また,LINPACKベンチマークで6.76GFlopsの性能が得られた.Beowulf-Class cluster is a logical organization of PC clusters composed of mass-market off-the-shelf hardware and software. The user may have problems that their implementation won&#039;t work well in hardware level or their implementation provides quite a poor performance. In this paper, we present a new method to tune and evaluation of the Beowulf-Class cluter by focusing on three levels: (1) network level, (2) message passing system level (e.g., MPI, PVM), and (3) application level. The first two performance is measured by NetPIPE developed by Ames Lab. ScaLAPACK (parallel version of LINPACK) is used as benchmarks for application programs, because it is one of the most common linear algebra subprograms and its evaluation is beneficial for numerical computation users. ScaLAPACK is tuned by using parameters determined by NetPIPE. ERATO-1 Beowulf-class cluster, 32 nodes of Pentium-II 450HHz processor with 256MByte of memory, is tuned by the proposed method. First, a network interface card installed in each ERATO-1 node is indentified as the cause of poor performance and finally ERATO-1 attained 6.76 GFlops with LINPACK benchmark.

    CiNii Books

    CiNii Research

    researchmap

  • Active audition for humanoid

    K Nakadai, T Lourens, HG Okuno, H Kitano

    SEVENTEENTH NATIONAL CONFERENCE ON ARTIFICIAL INTELLIGENCE (AAAI-2001) / TWELFTH INNOVATIVE APPLICATIONS OF ARTIFICIAL INTELLIGENCE CONFERENCE (IAAI-2000)   832 - 839   2000年

     詳細を見る

    記述言語:英語  

    Web of Science

    researchmap

  • ATMノードの連続高速呼設定処理におけるシステムリソースの保護

    渡辺 浩史, 中臺 一博, 佐藤 幸男, 坂口 全志, 芦川 宏利

    電子情報通信学会技術研究報告. CPSY, コンピュータシステム   98 ( 572 )   1 - 8   1999年1月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    信頼性のあるデータ通信を行う場合、制御を行うためにプロトコルメッセージが使用される。そのメッセージ処理が故意に連続で高速にノードに対して行われた場合、ノードのリソースが枯渇してしまいサービスが提供できなくなる問題がある。本稿ではそのような問題に対して、保守者がマニュアル操作で行う防御処理をATMノードのソフトウェアにルールベースの知識として実装することで自動的に防御を行うことができる有効な手段を提案した。この手段は、インターネットなどのプライベートなネットワークが相互に接続している環境においてノード単体で自己防衛する方法であることが特徴であり、インターネットのTCPにおいても適用できることをあわせて提案した。

    CiNii Books

    researchmap

  • 音楽情景分析の処理モデルOPTIMAの実装

    柏野 邦夫, 中臺 一博, 木下 智義, 田中 英彦

    全国大会講演論文集   50 ( 0 )   97 - 98   1995年3月

     詳細を見る

    記述言語:日本語  

    われわれは、聴覚的情景分析を「知覚的な音」の分離抽出(知覚的音源分離)と構造化の問題と捉え、モノラルの楽器演奏の音響信号を題材として、音楽情景分析(音楽音響信号を対象とする聴覚的情景分析)の処理モデルについて検討を行っている。ここで、知覚的音源分離とは、人間がひとつのものとして知覚または認識するような音響エネルギーのまとまり(これを知覚的な音と呼ぶ)を一つのものとして記号化することを指す。われわれは既に、ベイズの定理に基礎を置く定量的かつ階層的な情報統合のメカニズムを備えた音楽情景分析の処理モデルOPTIMA(Organized Processing toward Intelligent Music Scene Analysis)を提案した。この処理モデルに基づき、音楽情景分析の実験システムを実装し検討を行ったので、本稿でその概要を報告する。

    CiNii Books

    CiNii Research

    researchmap

  • 音楽情景分析の処理モデルOPTIMAにおける統計的単音仮説生成処理

    中臺 一博, 柏野 邦夫, 木下 智義, 田中 英彦

    全国大会講演論文集   50 ( 0 )   101 - 102   1995年3月

     詳細を見る

    記述言語:日本語  

    われわれは、音楽情景分析における処理モデルとしてOPTIMAを提案し、これに基づく音楽情景分析の実験システムの実装・評価を行った。本稿では、実験システムのうち、周波数成分レベル、単音レベル間の処理を行う単音仮説生成処理部の実装および、評価について述べる。

    CiNii Books

    CiNii Research

    researchmap

  • 音楽情景分析の処理モデルOPTIMAにおけるシーン情報の抽出と利用

    木下 智義, 柏野 邦夫, 中臺 一博, 田中 英彦

    全国大会講演論文集   50 ( 0 )   99 - 100   1995年3月

     詳細を見る

    記述言語:日本語  

    OPTIMAでは、複数の独立したモジュールに確率をもった仮説の組を出力させ、これを確率伝搬によって統合することによって外界の音響的事象に関する最尤推定像を求める。本稿ではOPTIMAにおいて利用される音楽シーン惰報として、拍位置および和音の情報の抽出と利用について議論し、実験システムに対する評価実験の結果を示す。

    CiNii Books

    CiNii Research

    researchmap

  • 処理モデルOPTIMAに基づく音楽情景分析システムの構築 I : 各処理モジュールの実現と評価

    中ダイ 一博, 柏野 邦夫, 木下 智義, 田中 英彦

    日本音響学会研究発表会講演論文集   1995 ( 1 )   481 - 482   1995年3月

     詳細を見る

  • 処理モデルOPTIMAに基づく音楽情景分析システムの構築 II : 情報統合の実現と評価

    柏野 邦夫, 中台 一博, 木下 智義, 田中 英彦

    日本音響学会研究発表会講演論文集   1995 ( 1 )   483 - 484   1995年3月

     詳細を見る

    記述言語:日本語  

    CiNii Books

    researchmap

  • 楽器演奏における単音の分離抽出とその音楽情景分析システムへの応用

    中臺一博

    Master's thesis, 東京大学   1995年

  • OPTIMA : 音楽音響信号から単音記号列を生成するシステムの処理モデル

    柏野 邦夫, 中台 一博, 田中 英彦

    全国大会講演論文集   49 ( 0 )   325 - 326   1994年9月

     詳細を見る

    記述言語:日本語  

    われわれは、モノラルの楽器演奏を対象とする音源分離を題材として、知覚的音源分離システムについて検討を進めている。知覚的音源分離においては、観測データに加え、対象に関する知識や記憶に基づく処理を柔軟に組み合わせて最終的な結果を求めることが本質的な課題である。そこで本稿では、情報統合のメカニズムを備えた知覚的音源分離の処理モデル OPTIMA (Organized Processing toward Intelligent Music Scene Analysis)を提案する。

    CiNii Books

    CiNii Research

    researchmap

  • 音楽単音記号列生成システムの処理モデルOPTIMAにおける単音仮説生成処理

    中台 一博, 柏野 邦夫, 田中 英彦

    全国大会講演論文集   49 ( 0 )   327 - 328   1994年9月

     詳細を見る

    記述言語:日本語  

    われわれは、音楽単音記号列生成システムにおける処理モデルとしてOPTIMAを提案した。[1]OPTIMAでは、モジュールが確信度をもった仮説の組を出力する場合、これを確率伝搬によって統合することができる。したがって、音楽単音記号列生成システムのように複数の情報を統合する必要がある場合には、有用な処理モデルであるということができる。OPTIMAの処理のうち本稿で扱う単音仮説生成モジュールでは、各仮説に確信度を与えなければならないため、確信度の与え方が問題である。このような確信度を与える単音仮説生成モジュールとして、音記憶を使用したモジュールが実装されている。このモジュールは音記憶から生成した混合音仮説と入力とのマッチングを行うモジュールであり、和音などの混合音の認識に効果的であった。しかし、一音ごとに音記憶が必要であること、および混合音数の増加にともない計算量が爆発してしまうことなど、効率、精度の面で音記憶だけでは限界があった。そこで、これらの問題を解決するために音色としての本質的な特徴を抽出し、音色空間上に表現を行った。このような音色空間を利用した楽器の類別、認識の研究はニューラルネットワークを使用したものなどがあり、単音に関しては良好な結果が得られている。そこで、本稿では音色空間の利用により、確信度をもった仮説の組を出力し、混合音に対しても認識を行うことができる単音仮説生成法を提案する。この手法では、各単音仮説の確信度は統計的手法により算出することができ、知識は音色ごとに与えられるため、音数に対する知識量の爆発、計算量の爆発を抑えることができる。

    CiNii Books

    CiNii Research

    researchmap

  • 音楽音響信号から単音記号列を生成するシステムOPTIMAの全体像

    柏野 邦夫, 中臺 一博, 田中 英彦

    情報処理学会研究報告音楽情報科学(MUS)   1994 ( 71 )   57 - 64   1994年8月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    知覚的音源分離における本質的な課題の一つは、対象に関する知識や記憶に基づく処理を柔軟に組み合わせて最終的な結果を求めることである。本稿では、仮説ネットワークによる階層的な情報統合と最尤推定のメカニズムを備えた、音楽音響信号を対象とする知覚的音源分離の処理モデルOPTIMAを提案する。この処理モデルは、複数種類の楽器音を含むモノラルの音楽音響信号をもとに楽器種類ごとの演奏情報を抽出して、単音記号列などの形で出力するシステムとして応用されている。本稿では処理モデルの全体像を示すとともに、特に情報統合の原理と仮説ネットワークの挙動について詳細に議論する。We describe OPTIMA, a process model for the perceptual sound source separation on computers. Our model consists of four parts: bottom-up processing modules, top-down processing modules, knowledge sources, and a hypothesis network for hierarchical and quantitative integration of multiple bits of information. First we present general description of the model. Since one of the most essential problems in the perceptual sound source separation is integration of multiple bits of information, we then focus our discussion on the hypothesis network: we show that our method has permitted efficient, autonomous and stable construction of an optimal internal model of the outer world.

    CiNii Books

    CiNii Research

    researchmap

  • 音源分離システムにおけるパターン照合モジュールの動的負荷分散を用いた並列実装

    中臺 一博, 柏野 邦夫, 田中 英彦

    情報処理学会研究報告. 人工知能研究会報告   94 ( 67 )   59 - 60   1994年7月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    CiNii Books

    CiNii Research

    researchmap

  • 音楽音響信号を対象とする音モデルに基づく音源分離システム

    柏野 邦夫, 中台 一博, 田中 英彦

    東京大学工学部総合試験所年報   ( 52 )   p79 - 84   1993年9月

     詳細を見る

    記述言語:日本語   出版者・発行元:東京大学工学部総合試験所  

    資料形態 : テキストデータ プレーンテキスト
    コレクション : 国立国会図書館デジタルコレクション > デジタル化資料 > 雑誌
    記事分類: 振動工学・音響工学

    CiNii Books

    CiNii Research

    researchmap

  • 音楽音響信号を対象とする音源分離システム-音モデルに基づくアプローチ-

    中薹一博, 柏野 邦夫, 田中 英彦

    情処学会 音情研   1993 ( 32 )   1 - 8   1993年

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    音モデルに基づく音源分離システムについて述べる.本システムは,複数種類の楽器演奏を含むモノラルの音響信号を入力とし,これを楽器種ごとに分離して,演奏情報をMIDIデータおよび画面表示として出力するものである.音源の分離同定は,システムに蓄積された音モデルを用いて混合音仮説を生成し,これと入力音響信号のスペクトログラムとを照合することによって行われる.評価実験の結果,最大同時発音数3音という制限の下で,平均85%以上の認識率を得ることができた.本システムでは,音モデルは予めシステムに与えるものとしている.なお本稿では,スペクトログラムから周波数成分抽出を行う方法に関しても新たな提案を行っている.

    CiNii Books

    researchmap

▼全件表示

講演・口頭発表等

  • チューブ型ロボットの姿勢推定のためのEKF-SLAMを用いた可変マイクロホンアレイ位置推定

    坂東宜昭, 水本武志, 中臺一博, 奥乃博

    第75回全国大会講演論文集  2013年3月 

     詳細を見る

    記述言語:日本語  

    災害現場での被災者発見にはがれき内へ進入可能なチューブ型ロボットが有用である.さらにチューブ型ロボットに音源定位機能があれば被災者の声から位置の推定が可能となる.しかし,近年の高精度な音源定位手法は位置が既知のマイクアレイで収録した音声から方向を推定しているが,チューブ型ロボットではマイク配置を事前に計測できない.そこで本稿ではEKF-SLAMによるマイクロフォン位置推定手法提案し,常に変化するロボット姿勢の推定によって本問題を解決する.数値実験と実録音の両方を用いて本手法の有効性を確認した.

    researchmap

  • 話者ダイアライゼーションシステムのための音声区間検出および到来方向推定の精度向上の検討

    黄楊暘, 大塚琢馬, 中臺一博, 奥乃博

    第75回全国大会講演論文集  2013年3月 

     詳細を見る

    記述言語:日本語  

    ロボット聴覚では, いつ, どこで, 誰が話したかを解明する音環境理解機能が不可欠である. 本稿では, それらの問題を解決するために, 音声区間検出, 到来方向推定および話者同定技術を組み合わせた処理を話者ダイアライゼーションシステムとする. ロボット聴覚ソフトウエア HARK においては, MUSIC アルゴリズムを前処理として, 音声区間検出および到来方向推定を行っている. しかし, MUSIC スペクトルに基づいて処理を行う際に, 音源数パラメータおよび閾値パラメータが結果を大きく左右する. 本稿では, ブラインド音源分離を前処理とする話者ダイアライゼーションシステムを提案した. 音量閾値パラメータの設定は依然必要であるが, 精度向上したパフォーマンスが得られている.

    researchmap

  • クアドロコプターを用いた飛行雑音に頑健な音源定位

    古川孝太郎, 奥谷啓太, 柳楽浩平, 大塚琢馬, 中臺一博, 奥乃博

    第75回全国大会講演論文集  2013年3月 

     詳細を見る

    記述言語:日本語  

    本研究は多数の回転翼を持つ小型の無人航空機, クアドロコプターにマイクロフォンアレイを搭載し, 周囲の環境における音源定位問題を取り扱う.通常, 飛行時には風圧やローターの駆動に起因する雑音が極めて大であり, 定位精度の劣化原因となり得る.このような雑音環境下では, 一般化固有値分解を用いた MUSIC 法により雑音相関行列を加味することで精度が改善することが知られている.そこで本研究は, 飛行に伴って動的に変化する雑音相関行列の推定へと問題を帰着する.その上で飛行制御などの機体のモニタ情報を用いた推定手法を提案し, 飛行雑音に頑健な音源定位手法を開発する.

    researchmap

  • クワドロコプタ搭載のマイクロホンアレイを用いた屋外音環境理解の逐次雑音推定による向上

    奥谷 啓太, 吉田 尚水, 中村 圭佑, 中臺 一博

    日本ロボット学会誌  2013年9月 

     詳細を見る

    記述言語:日本語  

    This paper addresses sound source localization using an aerial vehicle with a microphone array in an outdoor environment to realize outdoor auditory scene analysis. It, for instance, aims at finding distressed people in a disaster situation. In such an environment, noise is quite loud and dynamically-changing, and conventional microphone array techniques studied in the field of indoor robot audition are of less use. We, thus, proposed MUltiple SIgnal Classification based on incremental Generalized EigenValue Decomposition (iGEVD-MUSIC). It can deal with dynamically-changing high power noise by introducing incrementally-estimated noise correlation matrices. We developed a prototype system for the outdoor auditory scene analysis based on the proposed method using the Parrot AR.Drone with an 8ch microphone array and a Kinect device. Experimental results using the prototype system showed that dynamically-changing noise is properly suppressed with the proposed method even when the signal-to-noise ratio is less than 0dB in an outdoor/indoor environment with the hovering/moving AR.Drone.

    researchmap

  • 雑音環境における最適音量のモデル化を利用した音量可視化テレプレゼンスシステム (クラウドネットワークロボット)

    速水 昭, 今井 倫太, 中村 圭祐, 中臺 一博

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報  2013年12月 

     詳細を見る

    記述言語:日本語  

    雑音が大きくなると,話者の音量もそれに応じて大きくなるロンバート効果(Lombard effect)という現象が存在する.遠隔コミュニケーションでは,ロンバート効果により,遠隔地の相手話者に対して必要以上に大きな声で話してしまう問題がある.本稿では,実環境下での移動型のテレプレゼンスロボットを介した遠隔コミュニケーションでの操作者の音量を自動で調節する際に必要となるモデルの設計および,モデルを搭載した最適音量調整システムLOMBOTを開発した.実験の結果,遠隔地の騒音に対して音量が適切に調節されていることを確認した.

    researchmap

  • TelePaBot : 複数のグループが同時に会話する環境に適したテレプレゼンスシステム (クラウドネットワークロボット)

    小池 京太郎, 今井 倫太, 中村 圭佑, 中臺 一博

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報  2013年12月 

     詳細を見る

    記述言語:日本語  

    医療現場など,遠隔地において移動・コミュニケーションが必要な状況下でテレプレゼンスロボットは有用なツールとして一部実用化も始まっている.しかし,複数のグループが同時に会話を行う環境では不要な音声まで聞こえてしまうなど,円滑な遠隔コミュニケーションの支援には依然難しい課題が残る.こうした課題を解決するために,本研究では,発話の位置を可視化し,指定した発話を選択聴取する機能を提供するテレプレゼンスシステム「TelePaBot」を提案する.提案したシステムを用いてケーススタディを行った結果,複数のグループが同時に会話する環境下でも,TelePaBotを使用することで,より円滑な遠隔コミュニケーションが実現できる可能性があることが示唆された.

    researchmap

  • マイクロホンアレイの位置推定によるホース型ロボットの姿勢推定

    坂東宜昭, 大塚琢馬, 糸山克寿, 昆陽雅司, 田所諭, 中臺一博, 奥乃博

    第76回全国大会講演論文集  2014年3月 

     詳細を見る

    記述言語:日本語  

    ホース型ロボットは細長い形状が特徴のレスキューロボットで,倒壊した建築物の隙間などの探索が可能である.操縦の効率化のために加速度センサやカメラ画像などを用いた本ロボットの姿勢推定法が提案されてきたが,累積誤差が生じるなどの問題があった.本稿ではマイクロホンアレイと小型スピーカを本ロボットに装着し,音によるこれらの位置推定によって姿勢を推定する手法について述べる.本手法ではスピーカから発する試験音の各マイクへの到達時間差を用いて姿勢を推定するが,到達時間差は現在のマイクとスピーカの位置関係を表しており,過去の誤差を修正できる.実録音データを用いて本手法の有効性を評価した.

    researchmap

  • 音ランドマークを用いたマルチコプターの定位

    ラナシナパヤ, 中村圭佑, 中臺一博, 高橋秀幸, 木下哲男

    第76回全国大会講演論文集  2014年3月 

     詳細を見る

    記述言語:英語  

    We propose a novel approach to multicopter localization, using sound landmarks and one embedded microphone. This approach can benefit to multicopter localization in that it requires less computational power and smaller payloads than image-based approaches. However, the high ego-noise of multicopters is a serious threat for sound-based algorithms. We simulated a 2D localization method based on a Kalman Filter using measurements of acceleration and sound landmarks' intensity. A random walk model is used to update the multicopter's position with the Kalman Filter; the calculated estimation is then corrected using noisy measurements from the embedded microphone and accelerometer. Simulation results show that the proposed algorithm can successfully track the multicopter's motion in a noisy environment. We confirmed the effectiveness of our proposed algorithm by comparing its performance and robustness to a time/phase based algorithm.

    researchmap

  • Deep Neural Networkを用いたマルチモーダル音声認識の為の特徴量学習

    山口雄紀, 野田邦昭, 中臺一博, 奥乃博, 尾形哲也

    第76回全国大会講演論文集  2014年3月 

     詳細を見る

    記述言語:日本語  

    本研究の目標は,マルチモーダル音声認識の為の画像特徴量の設計である.マルチモーダル音声認識の精度向上のためには,唇画像からどのようにして音声認識の最小単位である音素や口形素を表現する情報を取り出すかが重要な課題である.本研究では,特徴量学習の新たな手法として注目を集めているDeep Neural Network (DNN)を用いて大量の唇画像から画像特徴量を自己組織的に抽出する手法を構築した.得られた画像特徴量を孤立単語認識タスクで検証するとともに特徴量空間を解析する事で口形素との関連についても考察した.また,得られた画像特徴量と音声を用いた視聴覚統合によるノイズ頑健性の向上について検証を行った.

    researchmap

  • HARKによって定位・分離された多方向音声のアノテーションツールの開発 (クラウドネットワークロボット)

    杉山 治, 糸山 克寿, 中臺 一博, 奥乃 博

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報  2014年6月 

     詳細を見る

    記述言語:日本語  

    本研究では、ロボット聴覚ソフトウェアHARKに基づいた多方向音声のアノテーションツールの開発について述べる。多方向の音声情報を視覚化し分かりやすく提示する既存研究は存在するが、提示された情報をラベル付けし、セマンティックにアノテーションするまでを一括して行うツールはまだ提案されていない。本研究では、HARKによって音源定位・分離された多方向音声をアノテーションするツールを開発し、アノテーションの負荷を軽減するためにSVMに基づく、自動補完機能を実装した。そして、被験者実験を通じて、その有効性を検証した。

    researchmap

  • TeleCoBot : 発話環境を考慮したテレプレゼンスシステム (クラウドネットワークロボット)

    高橋 成明, 尾形 正泰, 今井 倫太, 中村 圭佑, 中臺 一博

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報  2014年12月 

     詳細を見る

    記述言語:日本語  

    遠隔地とのコミュニケーションツールとしてテレプレゼンスロボットの研究が行われるようになった.しかし,騒音など音環境の相違を考慮していないため,発話者の音声が的確に伝わらない問題がある.また対話相手が複数人いる場合,状況に応じて発話者の音声を自由に変えたいという要望がある.こうした問題を解決するため,本研究では発話者の音声を雑音レベルや対話者との距離に応じて自動で調節し,かつ会話状況に応じて自由に音量を変更できる機能を提供するテレプレゼンスシステムTeleCoBotを提案する.また会話環境を用意し被験者にタスクを与えた検証実験を行った.結果として,ユーザは音量変更の機能を正しく使えなかったことが判明し,より効果的なUIを提供することが今後の課題となった.

    researchmap

  • 2チャンネル近接マイクロホンを用いた時間領域での風雑音低減 (応用音響)

    坂田 直人, 中島 弘史, 中臺 一博

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報  2015年3月 

     詳細を見る

    記述言語:日本語  

    本報告では2チャンネルの近接マイクロホンを用いて線形ビームフォーミングによる風雑音の低減を行った.フレーム分割による周波数領域における線形ビームフォーミングをフレーム分割前の時間領域信号に適用し,フレーム分割による処理と風雑音の低減性能を比較した.風雑音の混入した収録信号に対し風雑音の低減処理を行った結果,SN比が2〜13dB改善された.フレーム処理の有無で風雑音の低減性能を比較した結果,単純な信号の遅延のみで構成されるフィルタについてはフレーム処理の有無が与える影響が大きいことが確認された.

    researchmap

  • 2マイクロホンを用いた線形ビームフォーミングによる風雑音の低減

    坂田 直人, 村上 哲郎, 中島 弘史, 中臺 一博

    回路とシステムワークショップ論文集 Workshop on Circuits and Systems  2015年8月 

     詳細を見る

    記述言語:日本語  

    researchmap

  • 振幅スペクトルの相対誤差に基づくインパルス応答の自動切りだし法

    中島 弘史, 坂田 直人, 加科 優希, 中臺 一博

    回路とシステムワークショップ論文集 Workshop on Circuits and Systems  2015年8月 

     詳細を見る

    記述言語:日本語  

    researchmap

  • 変分ベイズ多チャネルロバストNMFに基づくマイクロホンの移動・被覆を許容する音声強調 (音声) -- (オーガナイズドセッション「あらゆる音を対象とした情報処理の実現に向けて」)

    坂東 宜昭, 糸山 克寿, 昆陽 雅司, 田所 諭, 中臺 一博, 吉井 和佳, 河原 達也, 奥乃 博

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報  2016年8月 

     詳細を見る

    記述言語:日本語  

    researchmap

  • ロボットとの会話における画像および音声情報を用いた人の身体動作と発話姿勢の関係に関する検討 (クラウドネットワークロボット)

    蓮本 諒介, 小山 大幾, 水本 武志, 中村 圭佑, 中臺 一博, 今井 倫太

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報  2017年2月 

     詳細を見る

    記述言語:日本語  

    researchmap

  • ロボットとの会話における画像および音声情報を用いた人の身体動作と発話姿勢の関係に関する検討 (パターン認識・メディア理解)

    蓮本 諒介, 小山 大幾, 水本 武志, 中村 圭佑, 中臺 一博, 今井 倫太

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報  2017年2月 

     詳細を見る

    記述言語:日本語  

    researchmap

  • 確率的生成モデルに基づく複数A/Dコンバータのチャネル間同期

    糸山克寿, 中臺一博, 中臺一博

    日本音響学会研究発表会講演論文集(CD-ROM)  2018年2月 

     詳細を見る

    記述言語:日本語  

    researchmap

  • 振動センサを用いた災害時の避難者の属性推定に関する検討

    尾崎翔, 浅野太, 中臺一博

    電子情報通信学会大会講演論文集(CD-ROM)  2018年3月 

     詳細を見る

    記述言語:日本語  

    researchmap

  • 可聴音を用いた周波数自動選択に基づく距離推定法の検討

    高尾麻衣子, 干場功太郎, 中臺一博, 中臺一博

    情報処理学会全国大会講演論文集  2018年3月 

     詳細を見る

    記述言語:日本語  

    researchmap

  • Quad‐directional LSTMを用いた音楽音響信号修復とその評価

    谷口亮輔, 干場功太郎, 中臺一博, 中臺一博

    情報処理学会全国大会講演論文集  2018年3月 

     詳細を見る

    記述言語:日本語  

    researchmap

  • ロボット聴覚技術の極限環境への展開

    奥乃博, 糸山克寿, 中臺一博, 中臺一博, 公文誠, 坂東宜昭, 干場功太郎

    システム制御情報学会研究発表講演会講演論文集(CD-ROM)  2018年5月 

     詳細を見る

    記述言語:日本語  

    researchmap

  • スペクトル伸縮に基づく複数A/Dコンバータのチャネル間同期

    糸山克寿, 中臺一博, 中臺一博

    日本機械学会ロボティクス・メカトロニクス講演会講演論文集(CD-ROM)  2018年6月 

     詳細を見る

    記述言語:日本語  

    researchmap

  • 振動センサを用いた災害時における年少避難者の特定手法に関する検討

    尾崎翔, 浅野太, 中臺一博

    電子情報通信学会大会講演論文集(CD-ROM)  2018年8月 

     詳細を見る

    記述言語:日本語  

    researchmap

  • CNN-based MultiChannel End-to-End Speech Recognition for everyday home environments

    Nelson Yalta, Shinji Watanabe, Takaaki Hori, Kazuhiro Nakadai, Tetsuya Ogata

    2018年11月 

     詳細を見る

    会議種別:口頭発表(一般)  

    Casual conversations involving multiple speakers and noises from surrounding devices are part of everyday environments and pose challenges for automatic speech recognition systems. These challenges in speech recognition are target for the CHiME-5 challenge. In the present study, an attempt is made to overcome these challenges by employing a convolutional neural network (CNN)-based multichannel end-to-end speech recognition system. The system comprises an attention-based encoder-decoder neural network that directly generates a text as an output from a sound input. The mulitchannel CNN encoder, which uses residual connections and batch renormalization, is trained with augmented data, including white noise injection. The experimental results show that the word error rate (WER) was reduced by 11.9% absolute from the end-to-end baseline.

    researchmap

  • ロボット聴覚の現状と課題

    奥乃 博, 中臺 一博

    日本音響学会研究発表会講演論文集  2005年3月 

     詳細を見る

    記述言語:日本語  

    researchmap

  • 動的リコンフィギャラブルデバイスDRPを用いた音源分離フィルタの実装と評価

    黒瀧 俊輔, 鈴木 紀章, 中臺 一博, 奥乃 博, 天野 英晴

    電子情報通信学会技術研究報告  2005年5月 

     詳細を見る

    記述言語:日本語  

    researchmap

  • HRI-JPにおけるヒューマン-ロボットインタラクション研究

    辻野 広司, 中野 幹生, 中臺 一博, 長谷川 雄二

    電子情報通信学会技術研究報告. SIS, スマートインフォメディアシステム  2005年11月 

     詳細を見る

    記述言語:日本語  

    コンピュータの発達により高機能化した機械が家庭に入ってくるようになり, 「誰でも使える機械と人とのインターフェース」がますます重要になってきている.そのような機械のひとつの究極であるインテリジェントロボットにおいては, さらに進んだインターフェースの概念や価値観の研究が進められつつある.我々は未来のインテリジェントロボットに求められるインターフェースとして, 人とロボットの関係が双方向であることを前提にした「ヒューマン-ロボットインタラクション」という機能実現を目指し, 研究を進めている.このような観点に基づき, 「ヒューマン-ロボットインタラクションのためのアーキテクチャ」「ロボットによる人の音声の認識」, 「人によるロボットの音声の認識」に関し報告する.

    researchmap

  • 複数ドメイン音声対話システムにおける対話履歴を利用したドメイン選択の高精度化

    神田 直之, 駒谷 和範, 中野 幹生, 中臺 一博, 辻野 広司, 尾形 哲也, 奥乃 博

    情報処理学会研究報告音声言語情報処理(SLP)  2006年2月 

     詳細を見る

    記述言語:日本語  

    複数のドメインを扱う音声対話システムにおいて,対話の文脈や進行に関する特徴量を導入してより精度よくドメイン選択を行う手法を開発したので報告する.本稿ではドメイン選択問題を,応答すべきドメインが,(I)ひとつ前の応答を行ったドメイン,(II)音声認識結果に対する最尤のドメイン,(III)それ以外のいずれかのドメイン,のどれに該当するかを判別する問題と捉える.ドメイン選択の正解を与えた対話データから,対話の文脈や進行に関する特徴量を用いて上記を判別する決定木を学習することにより,ドメイン選択器を構成した.5ドメインのマルチドメイン音声対話システムを用いた10名の被験者による評価実験の結果,音声認識尤度に基づく従来のドメイン選択手法に比べ,ドメイン選択誤りが11.6%削減された.We have developed a robust domain selection method using dialogue history in multi-domain spoken dialogue systems. We define domain selection as classifying problem among (I) the domain in the previous turn, (II) the domain in which N-best speech recognition results can be accepted with the highest recognition score, (III) other domains. We constructed a classifier by decision tree learning with dialogue corpus. The experimental result using 10 subjects shows that our method could reduced 11.6% domain selection error, compared with a conventional method using speech recognition likelihoods only.

    researchmap

  • D-14-10 有向性音素グルーピングを用いた音声認識におけるロバスト性向上の検討(D-14.音声・聴覚,一般講演)

    隅谷 亮太, 中臺 一博, 中野 幹生, 市毛 弘一, 廣瀬 靖雄, 辻野 広司

    電子情報通信学会総合大会講演論文集  2006年3月 

     詳細を見る

    記述言語:日本語  

    researchmap

  • 人・ロボット音声インタラクションのための情報統合に向けて

    中臺 一博

    電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解  2006年10月 

     詳細を見る

    記述言語:日本語  

    自然な人・ロボット音声インタラクションを実現する上で聴覚機能を通じ,ロボット周囲の環境を把握する「実環境音環境理解」,ロボットがユーザに対して適切でわかりやすく情報を伝達する「表出」は重要な機能であろう.こうした機能をロバストに実現する上で,筆者が鍵となると考えている「情報統合」アプローチについて述べる.また,このアプローチに基づく研究例として,実環境音環境理解に関しては,ミッシングフィーチャ理論による音源分離と音声認識の統合,マイクロホンアレイ統合による音源追跡のロバスト性の向上について,表出に関しては,韻律情報と頭部色を用いたマルチモーダル表出,指向性スピーカを用いた新しい発話機能の導入に関して紹介する.

    researchmap

  • 人・ロボット音声インタラクションのための情報統合に向けて

    中臺 一博

    電子情報通信学会技術研究報告. TL, 思考と言語  2006年10月 

     詳細を見る

    記述言語:日本語  

    自然な人・ロボット音声インタラクションを実現する上で聴覚機能を通じ,ロボット周囲の環境を把握する「実環境音環境理解」,ロボットがユーザに対して適切でわかりやすく情報を伝達する「表出」は重要な機能であろう.こうした機能をロバストに実現する上で,筆者が鍵となると考えている「情報統合」アプローチについて述べる.また,このアプローチに基づく研究例として,実環境音環境理解に関しては,ミッシングフィーチャ理論による音源分離と音声認識の統合,マイクロホンアレイ統合による音源追跡のロバスト性の向上について,表出に関しては,韻律情報と頭部色を用いたマルチモーダル表出,指向性スピーカを用いた新しい発話機能の導入に関して紹介する.

    researchmap

  • 人・ロボット音声インタラクションのための情報統合に向けて

    中臺 一博

    電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション  2006年10月 

     詳細を見る

    記述言語:日本語  

    自然な人・ロボット音声インタラクションを実現する上で聴覚機能を通じ,ロボット周囲の環境を把握する「実環境音環境理解」,ロボットがユーザに対して適切でわかりやすく情報を伝達する「表出」は重要な機能であろう.こうした機能をロバストに実現する上で,筆者が鍵となると考えている「情報統合」アプローチについて述べる.また,このアプローチに基づく研究例として,実環境音環境理解に関しては,ミッシングフィーチャ理論による音源分離と音声認識の統合,マイクロホンアレイ統合による音源追跡のロバスト性の向上について,表出に関しては,韻律情報と頭部色を用いたマルチモーダル表出,指向性スピーカを用いた新しい発話機能の導入に関して紹介する.

    researchmap

  • 自然な人・ロボット音声インタラクションに向けた ロボット聴覚システムの構築

    中臺 一博, 山本 俊一, 浅野 太

    人工知能学会全国大会論文集  2007年 

     詳細を見る

    記述言語:日本語  

    researchmap

  • AS-6-1 マイクロホンアレイ統合によるロバストな音響ストリーム生成と移動人物追跡(AS-6.実環境における高品質収音のための音声信号処理,シンポジウム)

    中臺 一博, 中島 弘史, 村瀬 昌満, 奥乃 博, 長谷川 雄二, 辻野 広司

    電子情報通信学会総合大会講演論文集  2007年3月 

     詳細を見る

    記述言語:英語  

    researchmap

  • 適応ステップサイズパラメータ法による高性能ブラインド音源分離

    中島 弘史, 中臺 一博, 長谷川 雄二, 辻野 広司

    電子情報通信学会技術研究報告. EA, 応用音響  2007年6月 

     詳細を見る

    記述言語:日本語  

    本論文では,様々なブラインド音源分離(BSS)に利用可能なステップサイズパラメータの適応調整法を提案する。ステップサイズパラメータは,分離の度合いや周波数によって最適値が異なるものであるが,ほとんどの報告例で,実験的に定めた固定値を利用している。提案法は,多次元のニュートン法に基づく最適値をステップサイズパラメータとして利用することで,適応型のBSSに対し高い収束性と分離度を実現する。提案法の有効性を確認するため,ロボットの頭部に埋め込んだマイクロホンアレイを利用して音源分離の実験を行った。その結果,提案法がさまざまな種類のBSSについて利用でき,高い分離性能が得られる事を確認した。

    researchmap

  • ロボット音声対話のためのMFTとICAによるバージイン許容機能の評価

    武田 龍, 中臺 一博, 駒谷 和範, 尾形 哲也, 奥乃 博

    全国大会講演論文集  2008年3月 

     詳細を見る

    記述言語:日本語  

    researchmap

  • 大規模マイクロホンアレイによる発話方向推定の検討

    菊池 慶子, 醍醐 徹, 中島 弘史, 中臺 一博, 長谷川 雄二, 金田 豊

    電子情報通信学会技術研究報告. EA, 応用音響  2008年7月 

     詳細を見る

    記述言語:日本語  

    本稿では,大規模マイクロホンアレイを用いた発話方向推定について報告する.筆者らは,先に音源の指向特性に基づいたビームフォーミング法を提案し,スピーカや人の発話方向推定について報告した.しかし,この手法において,ビームフォーマーの設計に用いる伝達関数は,対象となる音源の伝達関数を用いないと,性能が劣化するという問題点があった.また,発話区間の検出(VAD)も手動で行われているという問題点があった.前者の問題は異なる音源の伝達関数の位相差が主な原因と考えて,振幅伝達特性のみを利用したヒストグラムによる発話方向推定手法を提案した.後者については,非発話区間など信頼できない時間周波数特徴量のみを自動的にマスクするために,内積値に基づく音声周波数成分検出と自己相関を利用した発話区間検出を導入した.評価実験を通じて,スピーカの伝達関数を用いた場合でも,提案手法により人間の発話方向推定性能が大きく向上することを示した.

    researchmap

  • パネル討論:アプリケーション開発における音声認識

    西村 竜一, 中野 鐵兵, 栗原 一貴, 中臺 一博, 吉野 孝

    情報処理学会研究報告音声言語情報処理(SLP)  2008年10月 

     詳細を見る

    記述言語:日本語  

    本パネルディスカッションでは、音声認識アプリケーションの開発事例の紹介、アプリ開発に向き合うための提言を関連研究者の方々にお願いした。音声認識アプリケーションの開発を促すことを目的とする。To induce developments of ASR applications, this panel discussion introduces actual case studies. We also indicate some problems of ASR application developments.

    researchmap

  • 歌唱ロボットのためのビート情報とメロディ・ハーモニー情報の統合による音楽音響信号と楽譜の実時間同期手法の開発

    大塚 琢馬, 村田 和真, 武田 龍, 中臺 一博, 高橋 徹, 尾形 哲也, 奥乃 博

    全国大会講演論文集  2009年3月 

     詳細を見る

    記述言語:日本語  

    researchmap

  • ソフトマスクと音響モデル適応を用いた3話者同時発話音声認識

    高橋 徹, 中臺 一博, 駒谷 和範, 尾形 哲也, 奥乃 博

    全国大会講演論文集  2009年3月 

     詳細を見る

    記述言語:日本語  

    researchmap

  • 波動音響シミュレータによる指向性の精度検証

    鈴木 淑正, 中島 弘史, 中臺 一博, 荒井 隆行, 長谷川 雄二

    電子情報通信学会技術研究報告. EA, 応用音響  2009年6月 

     詳細を見る

    記述言語:日本語  

    近年、コンピュータの性能向上によって、波動音響理論に基づいた数値シミュレーション(波動音響シミュレーション)が実用的な時間で利用可能になってきた。波動音響シミュレーションは、自由音場などの理想的環境下では、高精度なシミュレーションが報告されている。しかし、実環境の高精度なシミュレーションは非常に困難であり様々な課題がある。その中のひとつとして、多くのシミュレータでは音源を点音源として扱うため、指向性を持つスピーカーなどの音源は高精度に再現できないという課題がある。指向性音源を再現する研究はいくつか報告例があるが、高精度かつ実用的なものは少ない。指向性の再現には、正確な音の伝播が必要となるが、空間を格子上に離散化させる差分法においては、音源から等距離でも伝播方向によっては、数値分散の影響が異なるため計算誤差が生じる。本研究では差分法を用いて、まず、自由音場での無指向性点音源を対象とした精度検証を行った。次に、その応用として指向性を有するスピーカ音源を対象とし、模擬スピーカーモデルを点音源に付加するという比較的簡単なモデル化で、指向性音源をシミュレーションできることを示す。

    researchmap

  • 多段処理によるブラインド残響抑圧処理の性能向上

    中島 弘史, 醍醐 徹, 中臺 一博, 金田 豊, 長谷川 雄二

    電子情報通信学会技術研究報告. EA, 応用音響  2009年7月 

     詳細を見る

    記述言語:日本語  

    researchmap

  • 多段処理によるブラインド残響抑圧処理の性能向上 (応用音響)

    中島 弘史, 醍醐 徹, 中臺 一博, 金田 豊, 長谷川 雄二

    電子情報通信学会技術研究報告  2009年7月 

     詳細を見る

    記述言語:日本語  

    本研究では,多入力の残響抑圧処理を1つの処理モジュールと考え,入力チャネルの異なる複数の処理モジュールを多段接続することで高い残響抑圧性能を実現する処理(多段処理)を提案する.今回,残響抑圧処理モジュールとしては,セミブラインドMINT法と適応無相関化逆フィルタの2つを利用した.多段処理の性能は,各モジュールの入力チャネルの組み合わせにより変化する.このため高い性能を実現するための予備的処理として,チャネル選択処理および遅延付加処理についても提案する.8チャネルのマイクアレイによる収録信号を用いた実験により各処理を評価した結果,以下の3つの知見を得た.(1)チャネル選択処理:選択チャネルの違いで抑圧性能に3-10dBの差が発生.適切なチャネル選択により残響抑圧性能を低下させることなくチャネル数の削減が可能(2)遅延付加処理:遅延付加は,特に遅延付加前の性能が低い場合に有効で,2-6dBの性能向上が可能.(3)多段処理:全チャネルを用いた1回の処理の残響抑圧性能がセミブラインドMINT法で14.6dB,適応無相関化逆フィルタで3.5dBであるのに対し,多段処理ではそれぞれ18.2dB(+4.2dB)および13.6dB(+10.1dB)となり,提案法が残響抑圧性能を向上させる手法として有効であることを確認した.

    researchmap

  • 実環境音声認識のためのロボット聴覚システム開発とパラメータチューニング

    高橋 徹, 中臺 一博, 駒谷 和範, 尾形 哲也, 奥乃 博

    全国大会講演論文集  2010年3月 

     詳細を見る

    記述言語:日本語  

    researchmap

  • ロボット音声対話におけるSemi-blind ICAを用いた自己発話キャンセル

    武田 龍, 中臺 一博, 高橋 徹, 駒谷 和範, 尾形 哲也, 奥乃 博

    全国大会講演論文集  2010年3月 

     詳細を見る

    記述言語:日本語  

    researchmap

  • 室内マイクロホンアレイを用いた実時間発話方向推定

    春原 卓也, 中島 弘史, 中臺 一博, 金田 豊

    電子情報通信学会技術研究報告. EA, 応用音響  2010年7月 

     詳細を見る

    記述言語:日本語  

    本稿では,大規模マイクロホンアレイを用いた発話方向推定について報告する.筆者らは,先に音源の指向特性に基づいたビームフォーミング法を提案し,スピーカや人の発話方向推定について報告した.さらに,振幅成分の抽出,発話区間検出,周波数マスク,ヒストグラムの4つの改良手法を加えることで,高精度な推定が可能となることを示した.その後,実時間で方向推定が可能なシステムについて報告したが,計算量の制限などにより推定精度が低く,その主原因も不明確であった.本稿では,実時間システムの精度の低い原因を調査し,それをもとに改良を行った実時間システムを提案した.評価実験から,従来の実時間システムよりも実時間性,推定精度に優れていることを示した.

    researchmap

  • ロボット聴覚 : 高雑音下でのハンズフリー音声認識

    中臺 一博, 奥乃 博

    電子情報通信学会技術研究報告. SP, 音声  2011年1月 

     詳細を見る

    記述言語:日本語  

    我々が取り組んでいるロボット聴覚研究について,その位置づけや意義を解説し,これを実現するための高雑音下ハンズフリー音声認識へも適用可能な技術としてマイクロホンアレイを用いた動的環境下の実時間音源分離とその音声認識への適用について紹介する.紹介する技術は,ロボット聴覚ソフトウェアHARKとしてオープンソースで公開を行っている.そこで,これらの技術の有効性を,実際のロボットへのHARKの適用事例を通じて示す.

    researchmap

  • Audio-visual musical instrument recognition

    AngelicaLim, 中村圭佑, 中臺一博, 尾形哲也, 奥乃博

    第73回全国大会講演論文集  2011年3月 

     詳細を見る

    記述言語:英語  

    Is this person playing a violin or a flute? Classification of musical instrument performances is usually carried out using audio features such as spectral coefficients. We propose augmenting the typical audio feature set with visual features. We show that a combination of audio features and video perform better than audio alone, and verify this multimodal recognition approach on a real-time robot platform.

    researchmap

  • 累積頻度重みを適用したパーティクルフィルタによる実時間楽譜追従

    大塚琢馬, 中臺一博, 高橋徹, 尾形哲也, 奥乃博

    第73回全国大会講演論文集  2011年3月 

     詳細を見る

    記述言語:日本語  

    パーティクルフィルタによる楽譜追従は,音響信号と楽譜との距離に基づくパーティクル重みの計算によって追従性能が大きく左右される.従来のベクトル内積計算やシグモイド関数を用いた重み計算手法では,音響信号の非調波成分や楽器の音色のバリエーションにより,楽譜位置推定が正しい場合,誤った場合でそれぞれの重みに大きな差が生じず,最終的に推定された楽譜位置に誤差が含まれるという問題点があった.本稿では,過去に計算された距離の累積頻度から重みを動的に計算し,正しい楽譜位置ではより高い重みを計算する.評価実験では,累積頻度を用いた重み計算法が,従来の重み計算法よりも楽譜追従精度で改善することが確認された.

    researchmap

  • 情報統合によるインテリジェント人追跡

    中村 圭佑, 中臺 一博, Ince Gokhan

    電子情報通信学会技術研究報告. CNR, クラウドネットワークロボット : IEICE technical report  2011年5月 

     詳細を見る

    記述言語:日本語  

    情報統合は,ロボットにおけるロバストな環境理解を実現するための重要な技術であり,このためには,統合のスケーラビリティ,各処理のリユーザビリティを向上するという観点からミドルウェアの導入が不可欠である.本稿では,音源定位と音源同定を提供するロボット聴覚処理,および熱画像カメラと距離画像カメラを組み合わせた人検出処理を統合したインテリジェントでかつロバストな人追跡を実現することを目指し,聴覚,視覚のモダリティ内・モダリティ間情報統合手法を提案する.また,情報統合を行うためのソフトウェアアーキテクチャについて,データフロー指向のミドルウェアFlowDesignerとイベント駆動ベースのミドルウェアROSを用いてHARKを透過的に組み合わせる方式を提案する.提案手法に基づき構築したロボットシステムを通じて,各機能の実環境ロバスト性や実時間動作の検証を行い,その有効性を示す.

    researchmap

  • 遠隔ユーザの音環境理解を支援するユーザインタフェース

    植田 俊輔, 今井 倫太, 中村 圭佑, 中臺 一博

    JSAI大会論文集  2012年 

     詳細を見る

    記述言語:日本語  

    <p>人間は雑音が多い環境下であってもある程度どこでどのような会話が行われているかを理解する事が出来るが,遠隔操作を行うロボットアバタでは遠隔操作者が遠隔地の音環境を理解する事は困難である.本稿では,雑音環境下でも操作者と遠隔地がインタラクションをスムーズに行うことを支援するユーザインタフェースUI-ALTを提案する.オフライン実験によりUI-ALTは遠隔操作者の雑音環境理解に有用であることが示された.</p>

    researchmap

  • Kinectによる楽器マスキングを用いた視聴覚統合ビートトラッキング

    糸原達彦, 水本武志, 大塚琢馬, 中臺一博, 尾形哲也, 奥乃博

    全国大会講演論文集  2012年3月 

     詳細を見る

    記述言語:日本語  

    人のギター演奏を対象とした実時間のビートトラッキングでは,シンコペーションのようなビートパターンの複雑さや人の演奏におけるテンポ揺らぎに対応する必要がある.我々はこれまでに音響情報と相関の深い弾き手の軌道を用いた視聴覚統合ビートトラッキングを開発してきた.しかし, ギターと手は色が似ているため, 手の軌道追従及びビートトラッキングの性能は十分ではなかった.本稿では,視聴覚センサに加えて深度センサも持つKinectを用いて,距離による画像マスキングを行い,手の領域を抽出する.本手法により, 手の追従の頑健さが増し, ビートトラッキングの精度が向上することを示す.

    researchmap

  • Kinectによる楽器マスキングを用いた視聴覚統合ビートトラッキング

    糸原達彦, 水本武志, 大塚琢馬, 中臺一博, 尾形哲也, 奥乃博

    第74回全国大会講演論文集  2012年3月 

     詳細を見る

    記述言語:日本語  

    人のギター演奏を対象とした実時間のビートトラッキングでは,シンコペーションのようなビートパターンの複雑さや人の演奏におけるテンポ揺らぎに対応する必要がある.我々はこれまでに音響情報と相関の深い弾き手の軌道を用いた視聴覚統合ビートトラッキングを開発してきた.しかし, ギターと手は色が似ているため, 手の軌道追従及びビートトラッキングの性能は十分ではなかった.本稿では,視聴覚センサに加えて深度センサも持つKinectを用いて,距離による画像マスキングを行い,手の領域を抽出する.本手法により, 手の追従の頑健さが増し, ビートトラッキングの精度が向上することを示す.

    researchmap

  • 2P1-P24 グループ会話支援のための音源定位システムの開発(コミュニケーション・ロボット)

    ムン ソンウン, 高木 健太郎, 釜島 力, 中臺 一博, 大武 美保子

    ロボティクス・メカトロニクス講演会講演概要集  2013年 

     詳細を見る

    記述言語:日本語  

    This paper presents a sound source localization system that composes a wireless microphone array named Jellyfish-02 and robot audition software HARK. Jellyfish-02 surpasses existing microphone array in design and usability, because it has a cover with rechargeable battery, which can be connected to wireless network. We evaluated sound source localization performance of Jellyfish-02, and investigated the percentage of speech overlapped periods in natural conversation. Prom the results, Jellyfish-02 is potentially applicable for assisting group conversation by measuring duration of speech for each participant.

    researchmap

  • 方向通過型音源分離フィルタへのFPGAの応用

    鈴木 紀章, 中臺 一博, 天野 英晴, 奥乃 博, 北野 宏明

    電子情報通信学会技術研究報告. VLD, VLSI設計技術  2003年1月 

     詳細を見る

    記述言語:日本語  

    ロボットの知覚システムを構成する場合、計算コストが高い問題を低消費電力かつある程度の柔軟性を保持して実現するためにはFPGAによるリコンフィギャラブルシステムのアプローチが効果的である。本稿では、聴覚システムを構成する際に用いる方向通過型フィルタの処理の一部である高速フーリエ変換(FFT)、平方根、ArcTariをFPGA上に実装し、ハードウェア処理による小型で低消費電力のシステムを作成するための検討を行う。評価の結果、FPGAに実装したFFT、平方根、ArcTan演算回路は、12MHz動作において1GHzのPentium IIIの2.9倍、2.9倍、3.3倍の処理速度で演算可能である事が分かった。

    researchmap

  • 方向通過型音源分離フィルタへのFPGAの応用

    鈴木 紀章, 中臺 一博, 天野 英晴, 奥乃 博, 北野 宏明

    電子情報通信学会技術研究報告. CPSY, コンピュータシステム  2003年1月 

     詳細を見る

    記述言語:日本語  

    ロボットの知覚システムを構成する場合、計算コストが高い問題を低消費電力かつある程度の柔軟性を保持して実現するためにはFPGAによるリコンフィギャラブルシステムのアプローチが効果的である。本稿では、聴覚システムを構成する際に用いる方向通過型フィルタの処理の一部である高速フーリエ変換(FFT)、平方根、ArcTanをFPGA上に実装し、ハードウェア処理による小型で低消費電力のシステムを作成するための検討を行う。評価の結果、FPGAに実装したFFT、平方根、ArcTan演算回路は、12MHz 動作において1GHzのPentium IIIの2.9倍、2.9倍、3.3倍の処理速度で演算可能である事が分かった。

    researchmap

  • 方向通過型音源分離フィルタへのFPGAの応用

    鈴木 紀章, 中臺 一博, 天野 英晴, 奥乃 博, 北野 宏明

    情報処理学会研究報告システムLSI設計技術(SLDM)  2003年1月 

     詳細を見る

    記述言語:日本語  

    ロボットの知覚システムを構成する場合、計算コストが高い問題を低消費電力かつある程度の柔軟性を保持して実現するためにはFPGAによるリコンフィギュラブルシステムのアプローチが効果的である。本稿では、聴覚システムを構成する際に用いる方向通過型フィルタの処理の一部である高速フーリエ変換(FFT)、平方根、ArcTanをFPGA上に実装し、ハードウェア処理による小型で低消費電力のシステムを作成するための検討を行う。評価の結果、FPGAに実装したFFT、平方根、ArcTan演算回路は、12MHz動作において1GHzのPentiumIIIの2.9倍、2.9倍、3.3倍の処理速度で演算可能である事が分かった。Reconfigurable systems are efficient for high performance but low cost/power implementation for intelligent systems for robots. In this paper, a part of processing for the direction-pass filter, such as Fast Fourier Transform(FFT), square root, and arc tangent used in auditory system of humanoid robots are implemented on an FPGA, and their peformance is evaluated. Our result shows that FFT, square root and arc tangent implemented on the FPGA of 12MHz are 2.9 times, 2.9 times and 3.3 times faster, respectively, than those in Pentium III of 1GHz.

    researchmap

  • ロボット聴覚へのミッシングフィーチャー理論の適用による三話者同時発話認識

    山本 俊一, 中臺 一博, 辻野 広司

    人工知能学会全国大会論文集  2004年 

     詳細を見る

    記述言語:日本語  

    researchmap

  • ロボット聴覚へのミッシングフィーチャー理論の適用による三話者同時発話認識

    山本 俊一, 中臺 一博, 辻野 広司, 奥乃 博

    人工知能学会全国大会論文集  2004年 

     詳細を見る

    記述言語:日本語  

    本稿では,ロボットに搭載された2つのマイクで録音された三話者同時発話音声を音源分離とミッシングフィーチャー理論に基づく音声認識によって行う手法を提案する.2体のロボットにおける実験により提案手法の有効性を確認する.

    researchmap

  • G-007 ミッシングフィーチャー理論による音源分離と混合音声認識の統合型インターフェース(G.音声・音楽)

    山本 俊一, 中臺 一博, 辻野 広司, 奥乃 博

    情報科学技術フォーラム一般講演論文集  2004年8月 

     詳細を見る

    記述言語:日本語  

    researchmap

  • アクティブな視聴覚統合を用いた実時間人物追跡ヒューマノイドSIG

    中臺 一博, 日台健一, 奥乃 博, 北野 宏明

    情報処理学会研究報告知能と複雑系(ICS)  2001年10月 

     詳細を見る

    記述言語:日本語  

    本稿では ロボットを対象にロバストな知覚機構を実現するため 聴覚処理の面から アクティブな動作 および 視聴覚情報統合の有効性を示す. 一般に 実環境では 反響 雑音が存在し かつ動的に変化するため 高精度な音源定位や音源分離を行うことは難しい. 我々は 音源定位に関しては アクティブな動作と視聴覚処理を統合し 実時間で複数人物(音源)の定位・追跡が可能なシステムを開発している. そこで システムから得られる方向情報を利用して アクティブ方向通過型フィルタによる音源分離のプロトタイプを実装した. 結果として 一般的な部屋において 音源に正対するようなアクティブな動きにより2 話者の分離や 移動音源の抽出に対してアクティブな動作と視聴覚情報統合の有効性を示した.This paper describes improvement of auditory processing by active motion and audio-visual integration. Generally, environmental noises and reverberation affect sound source localization and separation in the real world badly. Our real-time human tracking system for humanoid robots attained robust sound source licalization in the real world by active audio-visual integration. Then, we propose a new sound source separation method by active direction pass filter. Our experiments proves that active audio-visual integration is essential to robust perception for extraction of tracking sound source.

    researchmap

  • ロボット聴覚の課題と現状

    奥乃 博, 中臺 一博

    電子情報通信学会技術研究報告. SP, 音声  2001年12月 

     詳細を見る

    記述言語:日本語  

    ロボットが人間社会の中に入り込み, 共生していくためには, 混合音が扱えること, アクティブオーディション, 動きながら聞く機構, 未知環境での音の知覚, 画像処理などの他の処理の統合, 実時間処理が大きな課題であることを指摘した.混合音の処理では, 音源定位が重要であり, 頭部伝達関数(HRTF)を使わない手法が必要となる.本稿では, これら課題に対して, マイクロフォン2本が必要であるという考えを述べ, 2本のマイクロフォンで実現可能な機能について, 解説をした.体を動かして聞くというアクティブオーディション, あるいは, 画像処理とモータ処理を統合して, 体全体で聞くという情報統合が重要である.そのために, 方向通過型フィルタや聴覚エピポーラ幾何学, 実時間処理方法を開発して, 複数の実験で有効性を確認した.

    researchmap

  • ロボット聴覚の課題と現状

    奥野 博, 中臺 一博

    電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション  2001年12月 

     詳細を見る

    記述言語:日本語  

    ロボットが人間社会の中に入り込み, 共生していくためには, 混合音が扱えること, アクティブオーディション, 動きながら聞く機構, 未知環境での音の知覚, 画像処理などの他の処理の統合, 実時間処理が大きな課題であることを指摘した.混合音の処理では, 音源定位が重要であり, 頭部伝達関数(HRTF)を使わない手法が必要となる.本稿では, これら課題に対して, マイクロフォン2本が必要であるという考えを述べ, 2本のマイクロフォンで実現可能な機能について, 解説をした.体を動かして聞くというアクティブオーディション, あるいは, 画像処理とモータ処理を統合して, 体全体で聞くという情報統合が重要である.そのために, 方向通過型フィルタや聴覚エピポーラ幾何学, 実時間処理方法を開発して, 複数の実験で有効性を確認した.

    researchmap

  • ロボット聴覚の課題と現状

    奥乃 博, 中臺 一博

    情報処理学会研究報告音声言語情報処理(SLP)  2001年12月 

     詳細を見る

    記述言語:日本語  

    ロボットが人間社会の中に入り込み,共生していくためには,混合音が扱えること,アクティブオーディション,動きながら聞く機構,未知環境での音の知覚,画像処理などの他の処理の統合,実時間処理が大きな課題であることを指摘した。混合音の処理では,音源定位が重要であり,頭部伝達関数(HRTF)を使わない手法が必要となる。本稿では,これら課題に対して,マイクロフォン2本が必要であるという考えを述べ,2本のマイクロフォンで実現可能な機能について,解説をした。体を動かして聞くというアクティブオーディション,あるいは,画像処理とモータ処理を統合して,体全体で聞くという情報統合が重要である。そのために,方向通過型フィルタや聴覚エピポーラ幾何学,実時間処理方法を開発して,複数の実験で有効性を確認した。In this paper, we present as active audition system which is implemented on the humanoid robot "SIG the humanoid". The audition system for highly intelligent humanoids localize sound sources and recognize auditory events in teh auditory scene. Active audition reported in this paper enables SIG to track sound sources by integrating auditiion, vision, and motor movements. Given the multiple sound sources in the auditory scene, SIG actively moves its head to improve licalization by aligning microhones orthogonal to the sound source and by capturing the possible sound sources by vision. However, such an active head movement inevitably creates motor noises. The system adaptively cancels motor noises using motor control signals. The experimental result demonstrates that active audition by integration of audition, vision, and motor control attains sound source tracking in variety of conditions.

    researchmap

  • 音楽音響信号を対象とする音源分離システム ~音モデルに基づくアプローチ~

    中臺 一博, 柏野 邦夫, 田中 英彦

    情報処理学会研究報告音楽情報科学(MUS)  1993年4月 

     詳細を見る

    記述言語:日本語  

    音モデルに基づく音源分離システムについて述べる。本システムは、複数種類の楽器演奏を含むモノラルの音響信号を入力とし、これを楽器種ごとに分離して、演奏情報をMIDIデータおよび画面表示として出力するものである。音源の分離同定は、システムに蓄積された音モデルを用いて混合音仮説を生成し、これと入力音響信号のスペクトログラムとを照合することによって行われる。評価実験の結果、最大同時発音数3音という制限の下で、平均85%以上の認識率を得ることができた。本システムでは、音モデルは予めシステムに与えるものとしている。なお本稿では、スペクトログラムから周波数成分抽出を行う方法に関しても新たな提案を行っている。A system configuration, implementation and evaluation of a sound source separation system are described. Input of the system is assumed to be a monaural audio signal of ensemble music, and output is MIDI data which has several MIDI channels, each of which is assigned to one kind of musical instruments. The present approach is based on the matching between registered tone models and sound spectrogram derived from the input signal. Experimental results show that more than 85 % of the notes are correctly identified by the system on average, under the condition that the number of simultaneous notes in the input is three or less.

    researchmap

  • 音源分離システムにおけるパターン照合モジュールの動的負荷分散を用いた並列実装

    中臺一博, 柏野邦夫, 田中英彦

    情報処理学会研究報告知能と複雑系(ICS)  1994年7月 

     詳細を見る

    記述言語:日本語  

    researchmap

  • 音楽音響信号から単音記号列を生成するシステムOPTIMAの全体像

    柏野 邦夫, 中臺 一博, 田中 英彦

    情報処理学会研究報告音楽情報科学(MUS)  1994年8月 

     詳細を見る

    記述言語:日本語  

    知覚的音源分離における本質的な課題の一つは、対象に関する知識や記憶に基づく処理を柔軟に組み合わせて最終的な結果を求めることである。本稿では、仮説ネットワークによる階層的な情報統合と最尤推定のメカニズムを備えた、音楽音響信号を対象とする知覚的音源分離の処理モデルOPTIMAを提案する。この処理モデルは、複数種類の楽器音を含むモノラルの音楽音響信号をもとに楽器種類ごとの演奏情報を抽出して、単音記号列などの形で出力するシステムとして応用されている。本稿では処理モデルの全体像を示すとともに、特に情報統合の原理と仮説ネットワークの挙動について詳細に議論する。We describe OPTIMA, a process model for the perceptual sound source separation on computers. Our model consists of four parts: bottom-up processing modules, top-down processing modules, knowledge sources, and a hypothesis network for hierarchical and quantitative integration of multiple bits of information. First we present general description of the model. Since one of the most essential problems in the perceptual sound source separation is integration of multiple bits of information, we then focus our discussion on the hypothesis network: we show that our method has permitted efficient, autonomous and stable construction of an optimal internal model of the outer world.

    researchmap

  • 音楽単音記号列生成システムの処理モデルOPTIMAにおける単音仮説生成処理

    中台 一博, 柏野 邦夫, 田中 英彦

    全国大会講演論文集  1994年9月 

     詳細を見る

    記述言語:日本語  

    われわれは、音楽単音記号列生成システムにおける処理モデルとしてOPTIMAを提案した。[1]OPTIMAでは、モジュールが確信度をもった仮説の組を出力する場合、これを確率伝搬によって統合することができる。したがって、音楽単音記号列生成システムのように複数の情報を統合する必要がある場合には、有用な処理モデルであるということができる。OPTIMAの処理のうち本稿で扱う単音仮説生成モジュールでは、各仮説に確信度を与えなければならないため、確信度の与え方が問題である。このような確信度を与える単音仮説生成モジュールとして、音記憶を使用したモジュールが実装されている。このモジュールは音記憶から生成した混合音仮説と入力とのマッチングを行うモジュールであり、和音などの混合音の認識に効果的であった。しかし、一音ごとに音記憶が必要であること、および混合音数の増加にともない計算量が爆発してしまうことなど、効率、精度の面で音記憶だけでは限界があった。そこで、これらの問題を解決するために音色としての本質的な特徴を抽出し、音色空間上に表現を行った。このような音色空間を利用した楽器の類別、認識の研究はニューラルネットワークを使用したものなどがあり、単音に関しては良好な結果が得られている。そこで、本稿では音色空間の利用により、確信度をもった仮説の組を出力し、混合音に対しても認識を行うことができる単音仮説生成法を提案する。この手法では、各単音仮説の確信度は統計的手法により算出することができ、知識は音色ごとに与えられるため、音数に対する知識量の爆発、計算量の爆発を抑えることができる。

    researchmap

  • 音楽情景分析の処理モデルOPTIMAにおける統計的単音仮説生成処理

    中臺 一博, 柏野 邦夫, 木下 智義, 田中 英彦

    全国大会講演論文集  1995年3月 

     詳細を見る

    記述言語:日本語  

    われわれは、音楽情景分析における処理モデルとしてOPTIMAを提案し、これに基づく音楽情景分析の実験システムの実装・評価を行った。本稿では、実験システムのうち、周波数成分レベル、単音レベル間の処理を行う単音仮説生成処理部の実装および、評価について述べる。

    researchmap

  • 音楽情景分析の処理モデルOPTIMAにおけるシーン情報の抽出と利用

    木下 智義, 柏野 邦夫, 中臺 一博, 田中 英彦

    全国大会講演論文集  1995年3月 

     詳細を見る

    記述言語:日本語  

    OPTIMAでは、複数の独立したモジュールに確率をもった仮説の組を出力させ、これを確率伝搬によって統合することによって外界の音響的事象に関する最尤推定像を求める。本稿ではOPTIMAにおいて利用される音楽シーン惰報として、拍位置および和音の情報の抽出と利用について議論し、実験システムに対する評価実験の結果を示す。

    researchmap

  • 音楽情景分析の処理モデルOPTIMAの実装

    柏野 邦夫, 中臺 一博, 木下 智義, 田中 英彦

    全国大会講演論文集  1995年3月 

     詳細を見る

    記述言語:日本語  

    われわれは、聴覚的情景分析を「知覚的な音」の分離抽出(知覚的音源分離)と構造化の問題と捉え、モノラルの楽器演奏の音響信号を題材として、音楽情景分析(音楽音響信号を対象とする聴覚的情景分析)の処理モデルについて検討を行っている。ここで、知覚的音源分離とは、人間がひとつのものとして知覚または認識するような音響エネルギーのまとまり(これを知覚的な音と呼ぶ)を一つのものとして記号化することを指す。われわれは既に、ベイズの定理に基礎を置く定量的かつ階層的な情報統合のメカニズムを備えた音楽情景分析の処理モデルOPTIMA(Organized Processing toward Intelligent Music Scene Analysis)を提案した。この処理モデルに基づき、音楽情景分析の実験システムを実装し検討を行ったので、本稿でその概要を報告する。

    researchmap

  • 音楽情景分析における予測に基づく単音の認識

    木下 智義, 村岡 秀哉, 田中 英彦

    全国大会講演論文集  1998年3月 

     詳細を見る

    記述言語:日本語  

    researchmap

  • ATMノードの連続高速呼設定処理におけるシステムリソースの保護

    渡辺 浩史, 中臺 一博, 佐藤 幸男, 坂口 全志, 芦川 宏利

    電子情報通信学会技術研究報告. CPSY, コンピュータシステム  1999年1月 

     詳細を見る

    記述言語:日本語  

    信頼性のあるデータ通信を行う場合、制御を行うためにプロトコルメッセージが使用される。そのメッセージ処理が故意に連続で高速にノードに対して行われた場合、ノードのリソースが枯渇してしまいサービスが提供できなくなる問題がある。本稿ではそのような問題に対して、保守者がマニュアル操作で行う防御処理をATMノードのソフトウェアにルールベースの知識として実装することで自動的に防御を行うことができる有効な手段を提案した。この手段は、インターネットなどのプライベートなネットワークが相互に接続している環境においてノード単体で自己防衛する方法であることが特徴であり、インターネットのTCPにおいても適用できることをあわせて提案した。

    researchmap

  • BeowulfクラスクラスタERATO - 1のチューニングと評価

    奥乃 博, 京田耕司, 中臺 一博, 北野 宏明

    情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC)  2000年3月 

     詳細を見る

    記述言語:日本語  

    Beowulrクラスクラスタは,PCクラスタの論理構成法であり,コモディティハードウェアやソフトウェアによりPCクラスタが容易に構築できる.しかし,それらの組合せによってはうまく動かなかったり,あるいは,性能が全く出ないということがある.本稿では,Beowulfクラスクラスタのチューニングを(1)ネットワーク,(2)プロセッサ間通信ライブラリ(MPIやPVM),(3)応用プログラム,という3つのレベルで分けて,行うことを提案する.具体的には,NetPIPEというネットワーク測定用ツールを用いて,(1)と(2)をチューニングする.次に,線形代数でよく使われるLINPACKの一つScaLAPACKを応用プログラムとして利用し,(1)と(2)から得られたネットワーク特性を用いて,ScaLAPACKのチューニングを行う.とくに,小さな行列に分割することと,最適化された線形代数パッケージを使用することが,ScaLAPACKの性能向上に不可欠であることが判明した.これらの知見を利用することにより,Pentium-II 450 MHz,256 MByteメモリのノード32台で構成されるERATO-1に本手法を適用した結果,ハードウェアの不具合いが発見でき,また,LINPACKベンチマークで6.76GFlopsの性能が得られた.Beowulf-Class cluster is a logical organization of PC clusters composed of mass-market off-the-shelf hardware and software. The user may have problems that their implementation won't work well in hardware level or their implementation provides quite a poor performance. In this paper, we present a new method to tune and evaluation of the Beowulf-Class cluter by focusing on three levels: (1) network level, (2) message passing system level (e.g., MPI, PVM), and (3) application level. The first two performance is measured by NetPIPE developed by Ames Lab. ScaLAPACK (parallel version of LINPACK) is used as benchmarks for application programs, because it is one of the most common linear algebra subprograms and its evaluation is beneficial for numerical computation users. ScaLAPACK is tuned by using parameters determined by NetPIPE. ERATO-1 Beowulf-class cluster, 32 nodes of Pentium-II 450HHz processor with 256MByte of memory, is tuned by the proposed method. First, a network interface card installed in each ERATO-1 node is indentified as the cause of poor performance and finally ERATO-1 attained 6.76 GFlops with LINPACK benchmark.

    researchmap

  • BeowulfクラスクラスタERATO - 1のチューニングと評価

    奥乃 博, 京田耕司, 中臺 一博, 北野 宏明

    情報処理学会研究報告計算機アーキテクチャ(ARC)  2000年3月 

     詳細を見る

    記述言語:日本語  

    Beowulrクラスクラスタは,PCクラスタの論理構成法であり,コモディティハードウェアやソフトウェアによりPCクラスタが容易に構築できる.しかし,それらの組合せによってはうまく動かなかったり,あるいは,性能が全く出ないということがある.本稿では,Beowulfクラスクラスタのチューニングを(1)ネットワーク,(2)プロセッサ間通信ライブラリ(MPIやPVM),(3)応用プログラム,という3つのレベルで分けて,行うことを提案する.具体的には,NetPIPEというネットワーク測定用ツールを用いて,(1)と(2)をチューニングする.次に,線形代数でよく使われるLINPACKの一つScaLAPACKを応用プログラムとして利用し,(1)と(2)から得られたネットワーク特性を用いて,ScaLAPACKのチューニングを行う.とくに,小さな行列に分割することと,最適化された線形代数パッケージを使用することが,ScaLAPACKの性能向上に不可欠であることが判明した.これらの知見を利用することにより,Pentium-II 450 MHz,256 MByteメモリのノード32台で構成されるERATO-1に本手法を適用した結果,ハードウェアの不具合いが発見でき,また,LINPACKベンチマークで6.76GFlopsの性能が得られた.Beowulf-Class cluster is a logical organization of PC clusters composed of mass-market off-the-shelf hardware and software. The user may have problems that their implementation won't work well in hardware level or their implementation provides quite a poor performance. In this paper, we present a new method to tune and evaluation of the Beowulf-Class cluter by focusing on three levels: (1) network level, (2) message passing system level (e.g., MPI, PVM), and (3) application level. The first two performance is measured by NetPIPE developed by Ames Lab. ScaLAPACK (parallel version of LINPACK) is used as benchmarks for application programs, because it is one of the most common linear algebra subprograms and its evaluation is beneficial for numerical computation users. ScaLAPACK is tuned by using parameters determined by NetPIPE. ERATO-1 Beowulf-class cluster, 32 nodes of Pentium-II 450HHz processor with 256MByte of memory, is tuned by the proposed method. First, a network interface card installed in each ERATO-1 node is indentified as the cause of poor performance and finally ERATO-1 attained 6.76 GFlops with LINPACK benchmark.

    researchmap

  • OPTIMA : 音楽音響信号から単音記号列を生成するシステムの処理モデル

    柏野 邦夫, 中台 一博, 田中 英彦

    全国大会講演論文集  1994年9月 

     詳細を見る

    記述言語:日本語  

    われわれは、モノラルの楽器演奏を対象とする音源分離を題材として、知覚的音源分離システムについて検討を進めている。知覚的音源分離においては、観測データに加え、対象に関する知識や記憶に基づく処理を柔軟に組み合わせて最終的な結果を求めることが本質的な課題である。そこで本稿では、情報統合のメカニズムを備えた知覚的音源分離の処理モデル OPTIMA (Organized Processing toward Intelligent Music Scene Analysis)を提案する。

    researchmap

  • 処理モデルOPTIMAに基づく音楽情景分析システムの構築 II : 情報統合の実現と評価

    柏野 邦夫, 中台 一博, 木下 智義, 田中 英彦

    日本音響学会研究発表会講演論文集  1995年3月 

     詳細を見る

    記述言語:日本語  

    researchmap

  • 処理モデルOPTIMAに基づく音楽情景分析システムの構築 I : 各処理モジュールの実現と評価

    中臺 一博, 柏野 邦夫, 木下 智義, 田中 英彦

    日本音響学会研究発表会講演論文集  1995年3月 

     詳細を見る

    記述言語:日本語  

    researchmap

▼全件表示

産業財産権

▼全件表示

受賞

  • 学会誌論文賞

    2023年9月   日本ロボット学会  

     詳細を見る

  • Fellow

    2023年1月   IEEE  

     詳細を見る

  • 2021 IEEE/SICE International Symposium on System Integration (SII 2021) Best Paper Finalist Award

    2022年1月   IEEE  

     詳細を見る

  • 日本ロボット学会 フェロー

    2021年9月   日本ロボット学会  

     詳細を見る

  • 日本ロボット学会 功労賞

    2021年9月   日本ロボット学会  

     詳細を見る

  • 双葉電子財団 衛藤細矢記念賞

    2021年5月   双葉電子財団  

     詳細を見る

  • 10th International Conference on Cloud Computing, Data Science & Engineering (Confluence-2020), Amity Research Award for Significant contribution in the field of Artificial Intelligence

    2021年1月  

     詳細を見る

  • Amity 大学 Amity School of Engineering and Technology, Honorary Professor

    2021年1月  

     詳細を見る

  • 日本景観生態学会第29回大会ベストポスター賞

    2020年3月  

     詳細を見る

  • 情報処理学会第81回全国大会奨励賞

    2019年3月  

     詳細を見る

  • 2019 IEEE/SICE International Symposium on System Integration (SII 2019) Best Paper Finalist Award

    2019年1月   IEEE  

     詳細を見る

  • 異能(inno)vation ジェネレーションアワード部門分野賞受賞

    2018年10月   総務省  

    中臺一博

     詳細を見る

  • The 36th Annual Conference of the Robotics Society of Japan (RSJ 2018) International Session BEST PAPER AWARD

    2018年9月   日本ロボット学会  

    中臺一博

     詳細を見る

  • IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2017) Best Paper Award Finalist on Safety, Security, and Rescue Robotics (in memory of Motohiro Kisoi)

    2017年9月   IEEE  

    中臺一博

     詳細を見る

  • 第4回 Advanced Robotics 誌論文賞

    2016年9月   日本ロボット学会  

    中臺一博

     詳細を見る

  • 研究会優秀賞

    2016年6月   人工知能学会  

    中臺一博

     詳細を見る

  • IEEE-RAS International Symposium on Safety, Security, and Rescue Robotics (SSRR) Innovative Paper Award

    2015年10月   IEEE  

    中臺一博

     詳細を見る

  • IEEE-RAS International Symposium on Safety, Security, and Rescue Robotics Best Demonstration Award

    2015年10月   IEEE  

    中臺一博

     詳細を見る

  • 第二回Advanced Robotics 誌論文賞

    2014年9月   日本ロボット学会  

    中臺一博

     詳細を見る

  • Best Paper Award (1st Prize), International Conference on Industrial Engineering & Other Applications of Applied Intelligent Systems(IEA/AIE 2013)

    2013年6月   International Society of Applied Intelligence (ISAI)  

    中臺一博

     詳細を見る

  • 研究会優秀賞

    2012年6月   人工知能学会  

    中臺一博

     詳細を見る

  • International Conference on Intellignet Robots and Systems (IROS 2011) BEST PAPER Nomination Finalist

    2011年10月   IEEE  

    中臺一博

     詳細を見る

  • A Best Paper Award, International Conference on Industrial Engineering & Other Applications of Applied Intelligent Systems(IEA/AIE 2010)

    2010年6月   International Society of Applied Intelligence (ISAI)  

    中臺一博

     詳細を見る

  • 研究会優秀賞

    2009年6月   人工知能学会  

    中臺一博

     詳細を見る

  • Best paper award (3rd place)

    2009年6月   IEEE Vail Computer Elements Workshop  

    中臺一博

     詳細を見る

  • International Conference on Intelligent Robots and Systems (IROS 2008) New Technology Foundation (NTF) Award For Entertainment Robots and Systems Finalist

    2008年10月   IEEE  

    中臺一博

     詳細を見る

  • システムインテグレーション部門講演会 優秀講演賞

    2006年12月   計測自動制御学会  

    中臺一博

     詳細を見る

  • 船井情報科学振興賞

    2003年3月   (財)船井情報科学振興財団  

    中臺一博

     詳細を見る

  • International Conference on Intellignet Robots and Systems (IROS 2001) BEST PAPER Nomination Finalist

    2002年10月   IEEE  

    中臺一博

     詳細を見る

  • テレコムシステム技術賞

    2002年3月   (財)電気通信普及財団  

    中臺一博

     詳細を見る

  • Best Paper Award (1st Prize), International Conference on Industrial Engineering & Other Applications of Applied Intelligent Systems(IEA/AIE 2001)

    2001年6月   International Society of Applied Intelligence (ISAI)  

    中臺一博

     詳細を見る

  • Best Paper Award, International Conference on Information Society (IS-2000)

    2000年10月  

    中臺一博

     詳細を見る

▼全件表示

共同研究・競争的資金等の研究課題

  • スマートドローン聴覚:聴覚コミュニケーション機能を有する災害救助ドローンシステム

    研究課題/領域番号:22KF0141  2023年3月 - 2025年3月

    日本学術振興会  科学研究費助成事業  特別研究員奨励費

    中臺 一博, YEN BENJAMIN

      詳細を見る

    配分額:2200000円 ( 直接経費:2200000円 )

    This research year, we developed and implemented a real-life sound source tracking system using drones equipped with microphone arrays. Previously, such systems were only demonstrated in simulations. Due to strict drone flight regulations in Japan, we designed an indoor system with miniature drones and custom microphones to navigate these restrictions. We also enhanced the system with a drone navigation setup that continuously adjusts drone positions to maximize sound tracking accuracy. Further modifications to the sound tracking algorithms were necessary to address real-life constraints and challenges.
    Additionally, we have advanced drone noise reduction techniques for improved sound source tracking, showing promising results in simulations. Real-life testing, however, unveiled unforeseen challenges not anticipated in the simulation phase, necessitating further simulations and experimental tests to refine our approach and meet these new requirements.
    These developments contribute to our smart drone audition research theme, utilizing multiple drones with autonomous navigation to enhance sound source tracking performance. This system not only aims to improve the accuracy of locating sound sources but also enhances the quality of recorded audio by minimizing drone noise interference. These advancements are expected to significantly benefit applications where audio clarity and quality are critical.

    researchmap

  • 野鳥行動解析のためのマルチモーダル生態環境理解・解析技術の構築

    研究課題/領域番号:20H00475  2020年4月 - 2023年3月

    日本学術振興会  科学研究費助成事業  基盤研究(A)

    中臺 一博, 井手 一郎, 鈴木 麗璽, 森本 元, 松林 志保, 小島 諒介

      詳細を見る

    配分額:45500000円 ( 直接経費:35000000円 、 間接経費:10500000円 )

    本研究課題は,ロボット分野で研究開発されてきた「ロボット聴覚技術」を発展させ,視覚処理技術や機械学習技術と統合,生態学・環境学に適用可能な「マルチモーダル環境理解技術」を確立し,野生動物の観測データを質・量ともに数百倍に引き上げる次世代野生動物観測技術の開発により,生態学・環境学を新たなレベルへ導くことをゴールに,野鳥の鳴き声と画像から複数野鳥同時三次元追跡技術を開発し,群れ中の個体間コミュニケーション行動,夜間行動,配偶行動解析に適用すること,実フィールド背景音解析を通じ,音景解析技術を確立,環境・人による野鳥生態系・世代間伝承への影響評価,いずれも手法構築と実フィールド観測・解析の両面から取り組むことを目標としている.初年度については,コロナ禍,ならびにこれに端を発する半導体不足の影響を大きく受け,屋外観測作業が遂行できず,また予定していた新規観測デバイスの構築が遅れた.このため,1年間の繰り越し処理を行ったが,2021年度も大きな状況の好転は見られず,全体として遅延がみられる.この中にあっても,創意工夫を行い,進められる項目について研究を推進し,以下のような実績を上げることができた.
    技術的な実績:複数マイクアレイによる三次元追跡技術,校正技術の構築, カメラ付き長期収録デバイスの開発と長期定点観測開始,音景解析技術として,低次元埋め込み手法構築
    論文的な実績:雑誌論文7, 国際会議11,国内会議22, 受賞5
    その他の実績:本研究課題の国際的なアピール活動として国際会議IEEE/SICE SII 2021 にてオーガナイズドセッション実施,人工知能学会AIチャレンジ研究会で本研究課題をテーマに2回研究会を開催,アウトリーチ活動としてロボット聴覚ソフトウェアHARK講習会を国内外の学会内 (IJCAI2020,人工知能学会合同研究会) で計2回開催.

    researchmap

  • 鳥類の鳴き声を題材としたロボット聴覚技術のマルチスケール行動生態観測への応用

    研究課題/領域番号:19KK0260  2019年10月 - 2023年3月

    日本学術振興会  科学研究費助成事業  国際共同研究加速基金(国際共同研究強化(B))

    鈴木 麗璽, 松林 志保, 藤田 素子, 小島 諒介, 中臺 一博

      詳細を見る

    配分額:18460000円 ( 直接経費:14200000円 、 間接経費:4260000円 )

    本課題は,マイクアレイを用いて音を聞き分けるロボット聴覚技術を活用して,「個体・集団・音風景」という時間・空間スケールの異なる鳥類生態の観測に革新的な貢献をもたらすことを目的とする.
    本年度は,昨年度から続く新型コロナウイルスの影響により,予定していた米国カリフォルニア州,テキサス州,インドネシアスマトラ島に出向いて行う調査が実施できなかった.カリフォルニアにおいては,一部共同研究者による遠隔での録音サンプルの収録を行いそれに基づく鳴き声分析手法の検討を進めたが,インドネシアに関しては諸々の事情により調査が難しくなった.
    このような状況を踏まえ,継続して調査・観測を続けている国内の調査地での録音等も活用して実験観測分析手法の洗練に注力した.具体的には次のとおりである.屋外長期設置が可能な16チャネルマイクアレイの試用.最新の次元圧縮手法を元にした大量のデータにおいても適用可能な識別・定位,教師なし分類手法を検討した.Webベースの録音分析ツールの試作を行った.多数のマイクアレイによる統合的な個体間相互作用分析手法の検討のため,屋外テント内での複数のキンカチョウの鳴き声相互作用を観測・分析した.音源定位方向を反映した疑似色スペクトログラムによる音風景の可視化や,鳥類とセミに関する鳴き声観測手法の検討等を行った.複数マイクアレイを統合,野鳥種類/雌雄の聞き分けを考慮した複数野鳥の三次元追跡技術の性能向上等や,バイオフォニー・ジオフォニー・アンソロフォニーを考慮できる音景解析手法の構築と実フィールドデータによる有効性の検証を行った.国内の希少種を対象としたマイクアレイによる行動観測を複数実施した.
    また,コロナ禍終息後の各調査地での調査に関して,研究補助期間の延長を含めた将来の計画について検討した.テキサス州での遠隔調査協力や,カナダでの庁舎協力についても検討を進めた.

    researchmap

  • 無人航空機による地上物体認識のための視聴覚統合

    研究課題/領域番号:17K00365  2017年4月 - 2020年3月

    日本学術振興会  科学研究費助成事業  基盤研究(C)

    公文 誠, 中臺 一博

      詳細を見る

    配分額:4550000円 ( 直接経費:3500000円 、 間接経費:1050000円 )

    本課題ではドローンから地上音源を検知する上で、ドローン自身の発する騒音が大きく、また対象音源が遠くにあって、マイクロホンからの信号だけで音源を正確に認識することは難しいことを想定し、カメラとマイクロホンアレイを搭載した無人航空機で安定かつ高精度に対象を認識する技術を目的とした。
    間欠的な音情報と連続的だが音源の外見について不確かな動画情報を相補的に統合し、音源の三次元位置推定、複数移動音源の識別・追跡などを実現した。

    researchmap

  • 対ロボット認知に基づくインタラクションの「間」の実践的意味づけモデル

    研究課題/領域番号:16H02884  2016年4月 - 2020年3月

    日本学術振興会  科学研究費助成事業  基盤研究(B)

    今井 倫太, 小野 哲雄, 中臺 一博

      詳細を見る

    配分額:16250000円 ( 直接経費:12500000円 、 間接経費:3750000円 )

    人とロボットのコミュニケーションにおいて、タイミングや「間」の観点から研究を行い、円滑なコミュニケーションの実現方法の研究を行う。成果の一つ目は、人がロボットとのコミュニケーションに対して感じる飽きを推定する手法を構築した。人の顔の向きから、コミュニケーションの飽きが推定でき、ロボットの会話の質を向上できた。二つ目は、リアルタイムで人の体動を模倣し、「間」を生成する手法を構築した。従来は時間遅延によって体動模倣を人に気がつかれないようにしていたのに対して、本研究では、体動模倣の大きさを変化させる方法を考案した。リアルタイムに気付かれずに体動模倣をし、人とのコミュニケーションを向上できた。

    researchmap

  • 野鳥の歌声解析を対象とした屋外音環境理解

    研究課題/領域番号:16K00294  2016年4月 - 2019年3月

    日本学術振興会  科学研究費助成事業  基盤研究(C)

    中臺 一博, 鈴木 麗璽, 小島 諒介

      詳細を見る

    配分額:4550000円 ( 直接経費:3500000円 、 間接経費:1050000円 )

    複数のマイクロホンアレイで収録した野鳥の歌声音響信号から,何の野鳥がいつ,どこから,どのように歌っているかを歌声イベントとして抽出し,歌声イベント間の関係から野鳥同士の関係性を構造化・可視化するロボット聴覚と機械学習技術の融合した屋外音環境理解技術を開発した.また,専門家でなくても使いやすい野鳥歌声解析用の屋外音環境理解システムを構築し,人手で行われてきた野鳥の歌声解析作業の負担を軽減し,動物行動学・生物音響学分野に貢献した.

    researchmap

  • ロボット聴覚の実環境理解に向けた多面的展開

    研究課題/領域番号:24220006  2012年5月 - 2017年3月

    日本学術振興会  科学研究費助成事業  基盤研究(S)

    奥乃 博, 中臺 一博, 公文 誠, 糸山 克寿, 吉井 和佳, 佐々木 洋子, 昆陽 雅司, 合原 一究, 鈴木 麗璽, 加賀美 聡, 田所 諭

      詳細を見る

    配分額:218140000円 ( 直接経費:167800000円 、 間接経費:50340000円 )

    本研究では,ロボット聴覚ソフトHARKの「聞き分ける技術」を基に,自然環境・災害現場でも通用するように,豊富な機能拡充・高性能化と応用に取り組んだ.HARKはWindows版提供により9万件弱のダウンロードがあった.多人数インタラクション,音楽共演ロボットの可能性を示し, iGSVD-MUSICの開発によるUAV用音源定位の頑健化,索状ロボット用に姿勢推定・音声強調の開発により,レスキューロボットへの音利用の可能性を示し,さらに,カエルの合唱の解明,野鳥の鳴交解析のためのHARKBirdの開発と実地検証により音響生態学への可能性を実証し,ロボット聴覚の多面的展開のための基礎技術が確立できた.

    researchmap

  • 聴覚インタラクションの実現に向けた実環境ロボット聴覚の研究

    研究課題/領域番号:24118702  2012年4月 - 2014年3月

    日本学術振興会  科学研究費助成事業  新学術領域研究(研究領域提案型)

    中臺 一博

      詳細を見る

    配分額:9360000円 ( 直接経費:7200000円 、 間接経費:2160000円 )

    人とロボットが実環境で,より自然にインタラクションを行う「人ロボット共生のための聴覚インタラクション」実現のため,実環境ロボット聴覚技術を開発することを目的とし,当該年度は,個別基礎技術の洗練化とその統合技術に取り組んだ.
    (1) 実環境ロボット聴覚のためのセンサ同期技術については,自己雑音推定技術のロボット実機上での評価にフォーカスをあて研究を行った.非負値行列分解をノンパラメトリックベイズモデルを用いて拡張した自己雑音抑圧は,マイクロホン1本で,動作リファレンスを必要としない手法であるため,①マイクロホン間同期処理,②音―動作間同期処理が不要になるというメリットがある.まず,移動台車付ヒューマノイドロボット Hearboで,従来手法の中で高い性能が報告されているテンプレート法と比較を行ったところ,信号対雑音比,信号対妨害音比において,従来手法を上回る性能を確認できた.また,実際に人ロボット共生学のターゲットロボットの一つであるRovbovie Wを用いて評価を行ったところ,Hearbo とほぼ同等の性能が得られた.Robovie W は関節角情報が得られないため,従来法は適用できないことを考慮すると,提案法は,高性能かつ適用範囲が広いといえる.
    (2)よい聞き手ロボット構築のための実環境ロボット聴覚技術については,これまで研究開発を行ってきた,①音声の聞き分けを行うためのノンパラメトリックベイズモデルに基づく音源同定手法,および,② 音環境理解のためのマイクロホンアレイを用いた定位・分離・認識の統合技術を構築し,オープンソースのロボット聴覚ソフトHARK上で動作可能とした.さらに,③ 可視化技術に関しては,千葉大学大武研究室と共同で,卓上型マイクロホンアレイ「くらげ君」を開発し,上述のHARKを動作させることで,発話の方向やタイミングを,直感的でわかりやすく視覚化するツールを構築した.

    researchmap

  • ロボット聴覚の実環境理解に向けた多面的展開

    研究課題/領域番号:24240035  2012年

    日本学術振興会  科学研究費助成事業  基盤研究(A)

    奥乃 博, 加賀美 聡, 糸山 克寿, 公文 誠, 中臺 一博

      詳細を見る

    配分額:21060000円 ( 直接経費:16200000円 、 間接経費:4860000円 )

    音は画像と比べ拡散性が強いので,ロボット聴覚による音環境理解は,画像だけでは捉えきれない環境でも理解できる一方,広域から得られる情報の活用方法が課題となる.本研究課題では,既開発のロボット聴覚を基に,実環境音環境理解が可能な安全安心のためのロボット聴覚技術の多面的展開を目的とする.
    具体的には,
    WP1:多様なマイクロフォンコンフィグレーションへの展開,HARK-16の性能向上や分散設置された複数のマイクロホンアレイの同期方法,
    WP2:室内から屋外への展開,室内での音響マップ作成から無人飛行機による空中からの音の取得と音源定位,
    WP3:音声から楽音・環境音を含めた音一般への展開,特にノンパラメトリックベイズ信号処理,音光変換による動物音響学,楽器演奏音からの楽器音実時間分離,環境音の擬音語認識,
    に取り組むことになっていた.研究開始から辞退までの2ヶ月間で,実験装置の準備と,無人ヘリコプタの使用の詳細化,無人ヘリコプタ搭載用のマルチチャネルAD装置の設計,特に,非同期分散マイクの処理を高性能化するための時間情報付き音響データ転送方式の設計を行った.また,
    HARK-Binauralの洗練化,移動音源を対象とした音源定位のベイズ手法の開発,ベイズ手法による突発音や反射音を抑制したMUSIC(Multiple Signal Classification)法の開発,音源の活動状況と音源分離とを同時に推定するノンパラメトリックベイズ手法によるIVA法の開発,楽器音の音モデルのゆらぎを許容する多重演奏曲の楽器音分離法の開発,バンドパスフィルタを用いたカエルホタルの高機能化などに取り組んだ.

    researchmap

  • アクティブ視聴覚統合による動的変化環境下での音環境認識

    研究課題/領域番号:22700165  2010年 - 2012年

    日本学術振興会  科学研究費助成事業  若手研究(B)

    中臺 一博

      詳細を見る

    配分額:4030000円 ( 直接経費:3100000円 、 間接経費:930000円 )

    ロボットのカメラ・マイクから得られる視聴覚情報をその認識のしやすさ(情報量レベル)に応じて,適切に統合を行い,ロボットの知覚を向上する枠組みを因果ベイズモデルに基づき,提案・構築した.さらに,ロボットの動作をアクティブに制御し,情報量レベル自体を向上させる「アクティブ視聴覚統合」を提案し,構築した枠組みを拡張した.提案した枠組みの有効性を,実機ロボットを用いた音声認識・発話区間検出タスクを通じて実証した.

    researchmap

  • 音楽を通じた人とロボットの共生

    研究課題/領域番号:22118502  2010年 - 2011年

    日本学術振興会  科学研究費助成事業  新学術領域研究(研究領域提案型)

    中臺 一博

      詳細を見る

    配分額:11960000円 ( 直接経費:9200000円 、 間接経費:2760000円 )

    H23年度については,これまでに構築した音楽処理に関連する個々の機能(楽譜情報を利用した頑健なビートトラッキング技術,自己雑音抑制技術,Kinectを用いた手の動き検出技術,フルート奏者のフルートの動き検出を利用した曲の開始・終了検出技術,振動子を用いた人・ロボット合奏モデル)を統合して,実機ロボットを用いた合奏デモを構築した.具体的には,人型ロボット2台,演奏者(人間)2名の4者によるカルテットを実現し,ロボットが人に,また人がロボットに合わせることにより調和のとれた人ロボット音楽インタラクションを実現した.また,人の楽器演奏に合わせてテルミンを演奏するロボットを構築し,ロボット分野で最高峰の国際会議であるIEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2011)のExhibition Sessionや人工知能学会AI-Challenge研究会において実機デモを行い,その有効性を示した.さらに,より人ロボット共生学領域に貢献すべく,ATRで開発した16チャンネル屋内設置型マイクロホンアレイを用いて,複数名が自発的に行う会話に対して,各話者の位置や発話区間を推定する技術を開発した.また,誤推定を測る指標を提案し,その有効性を明らかにした.計画時に提案した音楽インタラクションにとどまらず,マイクロホンアレイを用いたよい聞き手ロボット実現に向けた基礎技術を開発することもでき,計画以上に研究を進めることができた.

    researchmap

  • 音環境理解に基づくロボット聴覚の構築

    研究課題/領域番号:19100003  2007年 - 2011年

    日本学術振興会  科学研究費助成事業  基盤研究(S)

    奥乃 博, 尾形 哲也, 駒谷 和範, 高橋 徹, 白松 俊, 中臺 一博, 北原 鉄朗, 糸山 克寿, 浅野 太, 浅野 太

      詳細を見る

    配分額:119340000円 ( 直接経費:91800000円 、 間接経費:27540000円 )

    音環境理解の主要機能である混合音の音源定位・分離・認識技術を開発し,ロボット聴覚ソフトウエアHARKとして公開し,国内外で複数の講習会を実施した. HARKを応用し,複数話者同時発話を認識する聖徳太子ロボット,ユーザの割込発話を許容する対話処理などを開発し,その有効性を実証した.さらに,多重奏音楽演奏から書くパート演奏を聞き分ける技術,実時間楽譜追跡機能を開発し,人と共演をする音楽ロボットなどに応用した。

    researchmap

  • ロボットを対象とした視聴覚音声認識の研究

    研究課題/領域番号:19700158  2007年 - 2008年

    日本学術振興会  科学研究費助成事業  若手研究(B)

    中臺 一博

      詳細を見る

    配分額:3480000円 ( 直接経費:3300000円 、 間接経費:180000円 )

    本研究では、実環境でのロボット音声認識を向上させるため、リップリーディングを用いた視聴覚統合、低信頼度の視聴覚情報でも最適な統合を実現するミッシングフィーチャ理論、認識単位を動的に変更するCoarse-to-Fine認識を用いた。この結果、最大50ポイント単語正解率を向上できることを示した。また、研究の過程で得られた課題に対応するため、計画変更を行い、対雑音頑健性および変化への即応性を両立したビートトラッキング手法を開発し、これを用いて歌って踊るロボットを開発した。以上の成果に対して国内外で計4件の賞を受けた。

    researchmap

▼全件表示