2026/03/10 更新

写真a

シノザキ タカヒロ
篠﨑 隆宏
SHINOZAKI TAKAHIRO
所属
工学院 教授
職名
教授
外部リンク

学位

  • 博士(学術) ( 2004年3月 )

研究キーワード

  • 音声認識

  • パターン認識

  • 統計モデル

研究分野

  • 情報通信 / 知能ロボティクス

学歴

  • 東京工業大学   大学院情報理工学研究科   計算工学専攻

    - 2004年

      詳細を見る

    国名: 日本国

    researchmap

経歴

  • 東京科学大学   工学院情報通信系

    2024年7月 - 現在

      詳細を見る

  • 東京工業大学   工学院情報通信系   准教授

    2016年4月 - 2024年6月

      詳細を見る

  • 東京工業大学   大学院総合理工学研究科   准教授

    2013年3月 - 2016年3月

      詳細を見る

  • 千葉大学   大学院融合科学研究科   助教

    2011年4月 - 2013年2月

      詳細を見る

  • 東京工業大学   大学院情報理工学研究科 計算工学専攻   助教

    2008年10月 - 2011年3月

      詳細を見る

  • :東京工業大学   大学院情報理工学研究科   特別研究員

    2007年 - 2008年

      詳細を見る

  • :京都大学   学術情報メディアセンター   特任助手

    2006年 - 2007年

      詳細を見る

  • :ユニバーシティオブワシントン   電気工学科   研究員

    2004年 - 2006年

      詳細を見る

▼全件表示

所属学協会

委員歴

  • 音響学会   音声研究会 主査  

    2025年 - 現在   

      詳細を見る

  • 情報処理学会/電子情報通信学会   音声言語情報処理研究会/音声研究会 主査  

    2024年 - 現在   

      詳細を見る

  • 日本学術会議   計算音響学小委員会  

    2021年2月 - 現在   

      詳細を見る

    団体区分:政府

    researchmap

  • 情報処理学会   JIP編集委員  

    2020年6月 - 現在   

      詳細を見る

    団体区分:学協会

    researchmap

  • 電子情報通信学会   ISS誌編集委員(SP担当)  

    2012年6月 - 現在   

      詳細を見る

    団体区分:学協会

    researchmap

論文

▼全件表示

MISC

  • 超多言語事前学習による低資源音声認識の検討

    Hou Wenxin, Dong Yue, ZHUANG BAIRONG, 楊 龍飛, 篠崎隆宏

    日本音響学会   ( 2-P1-7 )   2020年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • Transformer 音声認識システムの進化的最適化

    日野 健人, 篠崎隆宏

    日本音響学会2020年秋季研究発表会講演論文集   2-P1-6   2020年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 二重相続進化戦略による音声認識システムの最適化

    日野 健人, 木村 友祐, Dong Yue, 篠崎隆宏

    日本音響学会2020年春季研究発表会講演論文集   2-4-5   893 - 894   2020年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • CNNフロントエンドによる高速なEnd-to-End連続DPマッチングの実現

    田中 智宏, 篠崎隆宏

    日本音響学会2020年春季研究発表会講演論文集   2-4-4   891 - 892   2020年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • Robust Multichannel End-to-End Speech Recognition Based on Multi-Output Densenet

    Chonghui Zheng, Takahiro Shinozaki

    2020-SLP-131 ( No. 10 )   1 - 3   2020年2月

     詳細を見る

    記述言語:英語  

    researchmap

  • 二重相続進化戦略によるEnd-to-End音声認識システムの最適化

    木村 友祐, 日野 健人, DongYue, 篠崎 隆宏

    研究報告音声言語情報処理(SLP)   2020-SLP-131 ( No. 11 )   1 - 3   2020年2月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 相乗的複合学習による効率的な音声言語獲得機構

    篠崎隆宏, GAO Shengzhou, ZHANG Mingxin, HOU Wenxin, 田中智宏

    人工知能学会言語・音声理解と対話処理研究会資料   89th   2020年

     詳細を見る

  • CNNフロントエンドによるEnd-to-End連続DPマッチングの高速化

    田中 智宏, 篠崎 隆宏

    研究報告音声言語情報処理(SLP)   Vol. 2019-SLP-130 ( No. 2 )   2019年12月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 入力画像勾配を用いたモデル構造フリーな教師無し音源ローカライゼーション

    田中 智宏, 篠崎隆宏

    日本音響学会2019年秋季研究発表会講演論文集   2-3-3   919 - 920   2019年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 営業電話における大規模 End-to-End 音声認識システムの活用

    平村 健勝, 篠崎隆宏

    日本音響学会2019年秋季研究発表会講演論文集   1-3-3   1183 - 1184   2019年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • Aggregated CMA-ES: An Effective and Stable Strategy for Neuron Model Optimization

    Xu Han, Takahiro Shinozaki, Ryota Kobayashi

    ( No. 9 )   1 - 2   2019年3月

     詳細を見る

    記述言語:英語  

    researchmap

  • 連続単語検出のための 2D-RNN を用いた End-to-EndDPマッチング

    田中智宏, 篠崎隆宏

    日本音響学会2019年春季研究発表会講演論文集   ( 2-P-13 )   979 - 980   2019年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • Analysis of Attention-Based Multimodal Fusion and Maximum Mutual Information Objective for DSTC7 Audio Visual Scene-Aware Dialog Track

    Wenbo Wang, Bairong Zhuang, Takahiro Shinozaki

    ( 2-P-10 )   973 - 974   2019年3月

     詳細を見る

    記述言語:英語  

    researchmap

  • 連続対応検出ネットワークによる音声動画からの教師なし物体セグメンテーションおよび関連学習の検討

    田中智宏, 篠崎隆宏

    日本音響学会2019年春季研究発表会講演論文集   ( 2-P-13 )   979 - 980   2019年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 大規模 End-to-End 音声認識システムの教師なし強化学習の実現に向けた検討

    PengYilong, 篠崎隆宏

    日本音響学会2019年春季研究発表会講演論文集   ( 1-P-9 )   919 - 920   2019年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • I-vector Domain Adaptation Using Cycle-Consistent Adversarial Networks for Speaker Recognition

    Yi Liu, Takahiro Shinozaki

    2019-SLP-126 ( No. 2 )   1 - 3   2019年2月

     詳細を見る

    記述言語:英語  

    researchmap

  • マルチゲートGRUユニットを用いた2D-RNNによるEnd-to-End始終端フリー単語検出

    田中智宏, 篠崎隆宏

    音声言語情報処理研究会   2018年12月

     詳細を見る

    記述言語:日本語  

    researchmap

  • Improving the audio visual scene-aware dialog system in DSTC7 by using attentional multimodal fusion and MMI objective

    Wenbo Wang, Bairong Zhuang, Takahiro Shinozaki

    2018年12月

     詳細を見る

    記述言語:英語  

    researchmap

  • 単語検出性能を目的関数とした単語検出器学習法の提案

    田中智宏, 篠崎隆宏

    2018年秋季研究発表会   2018年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 音声認識システムの教師なし強化学習における報酬と報酬ノイズの影響の検討

    PengYilong, 柴田駿人, 篠崎隆宏

    2018年秋季研究発表会   2018年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 強化学習による報酬のみを用いたend-to-end 認識システム学習

    柴田駿人, PengYilong, 篠崎隆宏

    2018年秋季研究発表会   2018年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • End-to-end音声認識システムの強化学習の検討

    PengYilong, 柴田駿人, 篠崎隆宏

    音声言語情報処理研究会   2018-SLP-123 ( 9 )   1 - 4   2018年7月

     詳細を見る

    記述言語:日本語  

    researchmap

  • Taxi Demand Prediction using Ensemble Model Based on RNNs and XGBOOST 査読

    Takahiro Shinozaki

    9th International Conference of Information and Communication Technology for Embedded Systems   130 - 135   2018年5月

     詳細を見る

    記述言語:英語  

    researchmap

  • 日本人英語学習者を対象とした自動英語音声認識の予備検討

    篠崎 隆宏, 加藤 拓

    CEFR-J 2018 Symposium   2018年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • End-to-Endニューラル対話モデルにおける単語分散表現の比較検討

    鄭 崇輝, 李 知雨, 王 文博, 庄 佰融, 篠崎 隆 宏

    2018年春季研究発表会講演論文集   2018年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 音声認識仮説を用いたベイズ的半教師あり発音辞書学習の検討

    池下裕紀, 篠崎隆宏

    春季研究発表会講演論文集   2018年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 方策勾配法と仮説選択に基づくDNN音声認識システムの強化学習

    加藤拓, 篠崎隆宏

    春季研究発表会講演論文集   2018年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 英語学習者の発声自動評価を目的としたDNN音声認識システムの検討

    加藤 拓, 篠崎 隆宏

    情報処理学会研究報告   Vol. 2017-SLP-119 ( No. 11 )   1 - 4   2017年12月

     詳細を見る

    記述言語:日本語  

    researchmap

  • ベイズ推論を用いた半教師あり学習の日本語適用

    池下裕紀, 篠崎隆宏, 渡部晋治, 持橋大地, Graham Neubig

    情報処理学会研究報告   Vol. 2017-SLP-118 ( No. 3 )   1 - 4   2017年10月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 仮説選択に基づくDNN音声認識システムの強化学習

    加藤 拓, 篠崎 隆宏

    情報処理学会研究報告   Vol. 2017-SLP-118 ( No. 4 )   1 - 5   2017年10月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 進化的戦略を用いたDNNハードウエア音声センサの低消費電力化

    銭 博宇, 王 健, 劉 溢, 朱 凱, 篠崎 隆宏

    2017年秋季研究発表会講演論文集   131 - 132   2017年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • ゼロリソース言語への応用を目的としたABXテストによるDNN特徴量の検討

    柴田駿人, 加藤拓, 篠崎隆宏, 渡部晋治

    秋季研究発表会講演論文集   1 - 2   2017年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 進化的戦略を用いたニューラル機械翻訳システムの自動最適化

    覃 浩, 篠崎 隆宏, Duh Kevin

    2017年秋季研究発表会講演論文集   1397 - 1398   2017年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 読み上げ音声を用いたニューラルネットワークによる任意歌唱者歌声声質変換の検討

    篠崎隆宏, 小池治憲, 能勢隆, 伊藤彰則

    日本音響学会春季研究発表会講演論文集   357 - 358   2017年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • Highwayネットワーク言語モデルを用いた日本語話し言葉音声認識

    田中智大, 篠崎隆宏, 渡部晋治

    日本音響学会春季研究発表会講演論文集   107 - 108   2017年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • ベイズ的教師なし発音辞書学習のWFST実装およびサンプリングアルゴリズムの検討

    篠崎隆宏, 渡部晋治, 持橋大地, Graham Neubig

    日本音響学会春季研究発表会講演論文集   17 - 18   2017年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • Hardware Speech Sensor Based on Deep Neural Network Feature Extractor and Template Matching (音声)

    劉 溢, 銭 博宇, 王 健, 篠崎 隆宏

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   116 ( 477 )   297 - 300   2017年3月

     詳細を見る

    記述言語:英語   出版者・発行元:電子情報通信学会  

    CiNii Books

    researchmap

  • 半教師ありDNN学習を用いた日本語スピーキングテスト音声の認識

    加藤 拓, 篠崎 隆宏

    日本音響学会春季研究発表会講演論文集   93 - 94   2017年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 敵対的学習を利用したニューラルネットワークに基づく任意話者声質変換の検討

    篠崎隆宏, 宮本 颯, 能勢 隆, 伊藤鈴乃介, 小池治憲, 伊藤彰則

    日本音響学会春季研究発表会講演論文集   355 - 356   2017年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • ChimeChallengeタスクにおけるNMFによる雑音除去の検討

    小澤 奈摘, 田中 智大, 篠崎 隆宏

    音声言語情報処理研究会(SLP)   Vol. 2017-SLP-115 ( No. 12 )   2017年2月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 進化戦略に基づいた単語検出ハードウェアのためのDNNメタパラメータ最適化

    王 健, 銭 博宇, 劉溢, 篠崎 隆宏

    音声言語情報処理研究会(SLP)   Vol. 2017-SLP-115 ( No. 6 )   2017年2月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 眼球動作に基づいた対話支援システムのための連続画なぞり入力手法 (音声) -- (第18回音声言語シンポジウム)

    房 福明, 篠崎 隆宏

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   116 ( 378 )   83 - 88   2016年12月

     詳細を見る

    記述言語:日本語   出版者・発行元:電子情報通信学会  

    researchmap

  • 第3回Frederick Jelinek記念サマーワークショップでの教師なし発音辞書学習の取り組み

    篠崎隆宏, 渡部晋治, 持橋大地, Graham Neubig

    音声言語情報処理研究会 (SIG-SLP)   2016年12月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 眼球動作に基づいた対話支援システムのための連続画なぞり入力手法

    房 福明, 篠崎 隆宏

    音声言語情報処理研究会(SLP)   Vol. 2016-SLP-114 ( No. 19 )   2016年12月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 第3回Frederick Jelinek記念サマーワークショップでの教師なし発音辞書学習の取り組み (音声) -- (第18回音声言語シンポジウム)

    篠崎 隆宏, 渡部 晋治, 持橋 大地, Neubig Graham

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   116 ( 378 )   11 - 15   2016年12月

     詳細を見る

    記述言語:日本語   出版者・発行元:電子情報通信学会  

    researchmap

  • 日本語話し言葉音声における半教師ありDNN学習の検討

    加藤 拓, 篠崎 隆宏

    音声言語情報処理研究会 (SIG-SLP)   Vol. 2016-SLP-113 ( No. 1 )   2016年10月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 音声認識とブラックボックス最適化

    篠崎 隆宏, 渡部 晋治

    日本音響学会誌   72 ( 10 )   644 - 652   2016年10月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    CiNii Books

    researchmap

  • 連続音声認識におけるLSTMによる単語履歴を考慮した未知語検出法

    池下裕紀, 篠崎隆宏

    日本音響学会秋季研究発表会   2016年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 差分スペクトルフィルタに基づく声質変換における性能向上の検討

    小池治憲, 能勢 隆, 篠崎隆宏, 伊藤彰則

    日本音響学会秋季研究発表会講演論文集   285 - 286   2016年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 進化的戦略を用いたリカレントニューラルネットワーク言語モデルの最適化

    田中智大, 森谷崇史, 篠崎隆宏, 渡部晋治, 堀貴明, Kevin Duh

    日本音響学会秋季研究発表会講演論文集   31 - 32   2016年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • LSTMによる単語履歴を考慮した未知語検出法

    池下裕紀, 篠崎隆宏

    音声研究会(SP)   116 ( 189 )   33 - 36   2016年8月

     詳細を見る

    記述言語:日本語   出版者・発行元:電子情報通信学会  

    CiNii Books

    researchmap

  • 国際会議ICASSP2016参加報告

    峯松信明, 秋田祐哉, 浅見太一, 伊藤信貴, 落合翼, 郡山知樹, 齋藤大輔, 塩田さやか, 篠崎隆宏, 鈴木雅之, 高木信二, 俵直弘, 橋本佳, 樋口卓哉, 福田隆

    研究報告音声言語情報処理(SLP)   Vol. 2016-SLP-112 ( No. 5 )   1 - 6   2016年7月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 声質変換における学習時の DTW 精度が性能に与える影響

    小池治憲, 能勢隆, 篠崎隆宏, 伊藤彰則

    春季研究発表会講演論文集   313 - 314   2016年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 進化的戦略による高精度大語彙音声認識システムの多目的最適化

    森谷崇史, 田中智大, 篠崎隆宏, 渡部晋治, Duh Kevin

    春季研究発表会講演論文集   45 - 46   2016年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 入力話者非依存ニューラルネットワークに基づく差分スペクトルフィルタを用いた声質変換における学習データ量の影響

    小池治憲, 能勢隆, 篠崎隆宏, 伊藤彰則

    春季研究発表会講演論文集   241 - 242   2016年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • Kaldi 用 CSJ レシピへの RNN 言語モデルの導入と性能評価

    田中智大, 森谷崇史, 篠崎隆宏, 渡部晋治, 堀貴明

    春季研究発表会講演論文集   193 - 194   2016年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • KaldiにおけるCSJレシピの利用法

    篠崎隆宏, 森谷崇史, 田中智大, 渡部晋治

    音声言語情報処理研究会   2016年2月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 粒子フィルタとガウス過程回帰によるシングルチャネル音源分離

    博多屋涼, 篠崎隆宏, 郡山知樹

    研究報告音声言語情報処理(SLP)   Vol. 2016-SLP-110 ( No. 6 )   1 - 6   2016年1月

     詳細を見る

    記述言語:日本語  

    researchmap

  • パレート最適と進化的戦略を用いた高精度大語彙音声認識システム構築の自動化

    篠崎隆宏, 森谷崇史, 田中智大・篠崎隆宏, 渡部晋治, Kevin

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   115 ( 346 )   31 - 36   2015年12月

     詳細を見る

    記述言語:日本語   出版者・発行元:電子情報通信学会  

    CiNii Books

    researchmap

  • DNNを利用したAnimation Unitの変換に基づく顔画像変換の検討 (マルチメディア情報ハイディング・エンリッチメント)

    齋藤 優貴, 能勢 隆, 篠崎 隆宏

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   115 ( 303 )   23 - 28   2015年11月

     詳細を見る

    記述言語:日本語   出版者・発行元:電子情報通信学会  

    researchmap

  • ニューラルネットワークに基づく差分スペクトルフィルタを用いた任意話者声質変換の検討 (音声)

    小池 治憲, 能勢 隆, 篠崎 隆宏

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   115 ( 253 )   13 - 18   2015年10月

     詳細を見る

    記述言語:日本語   出版者・発行元:電子情報通信学会  

    CiNii Books

    researchmap

  • WFSTを用いたスイッチ入力音声コミュニケーション支援システムと低遅延探索アルゴリズム (音声)

    房 福明, 篠崎 隆宏

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   115 ( 253 )   51 - 56   2015年10月

     詳細を見る

    記述言語:日本語   出版者・発行元:電子情報通信学会  

    CiNii Books

    researchmap

  • 高精度日本語話し言葉音声認識のためのKaldiレシピとその評価

    森谷崇史, 篠崎隆宏, 渡部晋治

    秋季研究発表会講演論文集   155 - 156   2015年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • DNN特徴量抽出器に基づく単語検出器のFPGA実装と評価

    朱凱, 李昊霖, 篠崎隆宏, 堀内靖雄, 黒岩眞吾

    秋季研究発表会講演論文集   153 - 154   2015年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 国際会議ICASSP2015参加報告

    岡本拓磨, 小川哲司, 落合翼, 柏木陽佑, 亀岡弘和, 木下慶介, 郡山知樹, 齋藤大輔, 篠崎隆宏, 高木信二, 滝口哲也, 太刀岡勇気, 俵直弘, 橋本佳, 藤本雅清, 松田繁樹, 三村正人, 吉岡拓也, 渡部晋治

    研究報告音声言語情報処理(SLP)   Vol. 2015-SLP-107 ( No. 3 )   1 - 7   2015年7月

     詳細を見る

    記述言語:日本語  

    researchmap

  • ビデオ通話における音声および表情特徴量を用いた話者変換の検討 (マルチメディア情報ハイディング・エンリッチメント)

    齋藤 優貴, 能勢 隆, 篠崎 隆宏

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   115 ( 38 )   45 - 50   2015年5月

     詳細を見る

    記述言語:日本語   出版者・発行元:電子情報通信学会  

    researchmap

  • ビデオ通話における音声および表情特徴量を用いた話者変換の検討

    齋藤優貴, 能勢 隆, 篠崎隆宏, 伊藤彰則

    EMM研究会   2015年5月

     詳細を見る

    記述言語:日本語  

    researchmap

  • ビデオ通話におけるニューラルネットワークを利用した話者変換の検討

    齋藤優貴, 能勢 隆, 篠崎隆宏, 伊藤彰則

    情報処理学会第77回全国大会論文集   2015年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 言語モデルと音響モデルを用いた自動韻律ラベリングの評価

    増子 理菜, 郡山 知樹, 篠崎 隆宏, 小林 隆夫

    春季研究発表会講演論文集   361 - 362   2015年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 進化的アルゴリズムの大規模実行によるDNN構造最適化

    篠崎 隆宏, 渡部 晋治

    春季研究発表会講演論文集   11 - 12   2015年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • DNN特徴量抽出器とDTWによる組み込みシステム向け耐雑音単語検出器の検討

    朱 凱, 篠崎 隆宏

    春季研究発表会講演論文集   155 - 156   2015年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • ニューラルネットワークを用いた話者特徴量抽出に基づく一対多クロスリンガル声質変換

    伊藤 洋二郎, 篠崎 隆宏, 能勢 隆

    春季研究発表会講演論文集   397 - 398   2015年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • ニューラルネットワークに基づくユーザ音声を必要としない多対一声質変換の検討

    能勢 隆, 篠崎 隆宏, 伊藤 洋二郎, 伊藤 彰則

    春季研究発表会講演論文集   271 - 274   2015年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • スピーキングテストシステムにおける発話内容を考慮した自動採点

    小野 豊, 篠崎 隆宏, 堀内 靖雄, 黒岩 眞吾

    電子情報通信学会   2015年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 話者特徴量入力を付加したデノイジングオートエンコーダによるクロスリンガル声質変換 (音声) -- (第16回音声言語シンポジウム)

    伊藤 洋二郎, 篠崎 隆宏, 能勢 隆

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   114 ( 365 )   13 - 18   2014年12月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    数発話程度のごく少量のラベルなし音声を用いて特定話者の任意の発話を任意話者の声質に変換することを目的として,音声特徴量を音声特徴量に変換するデノイジングオートエンコーダに話者特徴量入力を付加した構造を持つニューラルネットを用いた声質変換手法を提案する.多言語音声コーパスを用いた実験により,提案法の有効性を示す.

    CiNii Books

    researchmap

  • 話者特徴量入力を付加したデノイジングオートエンコーダによるクロスリンガル声質変換

    伊藤洋二郎, 篠崎隆宏, 能勢隆

    音声言語情報処理研究会 (SIG-SLP)   2014年12月

     詳細を見る

    記述言語:日本語  

    researchmap

  • GMMに基づく声質変換のためのMDL基準による混合数の自動決定

    小林 友哉, 能勢 隆, 篠崎 隆宏, 小林 隆夫

    秋季講演論文集   341 - 342   2014年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • Denoising Autoencoderによる残響除去の大語彙音声認識における評価

    小宮山 大樹, 篠崎 隆宏, 堀内 靖雄, 黒岩 眞吾

    秋季講演論文集   131 - 132   2014年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • ディープニューラルネットワークを用いた簡素な構造の単一単語検出器の検討

    篠崎 隆宏

    秋季講演論文集   149 - 150   2014年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 眼電位入力音声合成インタフェースのためのコンテキスト依存眼動素を用いた眼電位認識

    房 福明, 篠崎 隆宏, 古井 貞煕, 堀内 靖雄, 黒岩 眞吾

    秋季講演論文集   393 - 394   2014年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 複数ドメインコーパスからの文選択に基づくキャラクター音声合成の検討

    荒生 侑介, 能勢 隆, 篠崎 隆宏, 小林 隆夫

    秋季講演論文集   2014年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • ボルツマンマシンとMCMCサンプリングを用いた音声のシングルチャネル雑音除去

    博多屋 涼, 篠崎隆宏, 小林隆夫

    秋季研究発表会講演論文集   59 - 60   2014年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • スイッチ入力音声コミュニケーション支援システムのための入力プロトコル推薦手法

    房 福明, 篠崎隆宏, 小林隆夫

    秋季研究発表会講演論文集   229 - 230   2014年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • スイッチ入力音声合成システムのための仮名プロトコル推薦手法

    房福明, 篠崎 隆宏, 小林隆夫

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   Vol. 114 ( No. 52 )   355 - 360   2014年5月

     詳細を見る

    記述言語:日本語  

    researchmap

  • スイッチ入力音声合成システムのための仮名プロトコル推薦手法

    房 福明, 篠崎 隆宏, 小林 隆夫

    研究報告音楽情報科学(MUS)   2014 ( 68 )   1 - 6   2014年5月

     詳細を見る

    記述言語:日本語  

    単純なスイッチ操作を入力として素早く音声を合成できるインタフェースが実現すれば,随意運動の障害により意思伝達が困難な者に対する情報保障手段として有用であると期待される.スイッチは適切なインタフェース装置を用いることで,眼球運動など身体の様々な動作をもとに操作できる.一度のスイッチ操作で何通りの状態を区別できるかはケースバイケースであるが,一般にあまり複雑な操作は難しく,通信速度は極めて限定的である.そのため少しでも円滑な音声対話を可能とするためには,各ユーザーの状況に応じた効率的な入力プロトコルを用意することが非常に重要である.また同時に,入力プロトコルは容易に学習可能なものである必要がある.本研究では効率的な入力が可能でかつ学習も容易なプロトコルをユーザーの要望に応じながら自動生成する手法を提案する.提案手法の主なアイデアは,50 音表のような誰もが既に知っている文字表の知識を活用することと,スイッチ入力から発音シンボルへの変換において若干のエラーを許容しそれを N-gram 言語モデルを用いて補うことである.主観評価と客観評価を行い,提案手法により推薦されたプロトコルは従来のものと比べて覚えやすく入力速度も速いことを示す.Switch-to-speech interface can provide a means of interactive speech communication as a support system for people with disabilities with voluntary movements. Any motion of a part of the body such as eye movements can be used for the switch input. The number of possible switch states specified by an operation varies person to person, but the bandwidth is generally quite limited. Therefore, efficient protocols are needed to map the switch operations to pronunciations. Besides, the protocol must be easily learnable so that anyone can use. We propose a protocol recommendation method that can accept individual requirements in switch operations. It suggests a customized protocol that is both speedy to input and easy to remember. Two main ideas in the protocol design are utilizing the knowledge about the alphabet table that everyone already knows, and allowing a small error in the switch to pronunciation conversion that is compensated by an N-gram language model. The performance of the protocols is evaluated by objective and subjective experiments and the advantage of the proposed method is shown.

    CiNii Books

    researchmap

  • ハードウエア音声認識研究のためのプラットフォームFPGA基板

    永谷 悠, 李 昊霖, 篠崎 隆宏, 堀内 靖雄, 黒岩 眞吾

    春季講演論文集   185 - 186   2014年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 腕時計型スマートデバイスにおける音声GUIの有効性の検討

    山本 宗典, 篠崎 隆宏, 堀内 靖雄, 黒岩 眞吾

    春季講演論文集   147 - 148   2014年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • SCMS2.0によるタンパク質ポテンシャルエネルギー最小化の諸条件における評価

    篠崎隆宏, 関嶋政和

    バイオ情報学研究発表会   2014年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 音声合成のための音韻・韻律コンテキストを考慮した文選択アルゴリズムの評価

    荒生侑介, 能勢 隆, 郡山知樹, 篠崎隆宏, 小林隆夫

    日本音響学会2014年春季研究発表会講演論文集   405 - 406   2014年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • HMM音声合成のための音節出現頻度にロバストな音素セットの検討

    舘野英樹, 能勢 隆, 郡山知樹, 篠崎隆宏, 小林隆夫

    日本音響学会2014年春季研究発表会講演論文集   409 - 410   2014年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 音響モデルと言語モデルを利用したアクセント型・アクセント句境界の同時推定

    鈴木啓史, 郡山知樹, 能勢 隆, 篠崎隆宏, 小林隆夫

    日本音響学会2014年春季研究発表会講演論文集   441 - 442   2014年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 「音声認識」は今後こうなる!

    河原達也, 篠田浩一, 堀貴明, 堀智織, 篠崎隆宏

    SIG-SLP第100回記念シンポジウム   2014年1月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 言語モデルと音響モデルを利用したアクセント句境界の自動推定

    鈴木 啓史, 郡山 智樹, 能勢 隆, 篠崎 隆宏, 小林 隆夫

    研究報告音声言語情報処理(SLP)   2013 ( 16 )   1 - 6   2013年12月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    テキスト音声合成システムの構築にはアクセント情報に関する韻律情報ラベルが付与された音声データが必要不可欠であるが,アクセント情報の付与は主に人手で行われており高コストである.そこで本研究では,音声データの自動ラベリングを目的としたアクセント句の境界推定手法を提案する.提案手法では,音声を書き起こしたテキスト情報だけでなく,音声から得られる F0 などの音響特徴量を使用する.アクセント句境界モデルおよびアクセント型モデルといった言語モデルには条件付き確率場 (CRF) を,そして音響モデルに隠れマルコフモデル (HMM) を使用し,それらを組み合わせてアクセント句の境界を推定する.本稿では,読み上げ音声に対するアクセント句境界推定実験を行い,従来法に比べ推定精度が向上することを示した.This paper proposes a technique for automatically estimating accent phrase boundaries for text-to-speech synthesis systems. To construct speech synthesis systems, we need to prepare a database that has annotations of prosodic information including accents. However, manual annotation for this purpose generally requires costly process. In contrast, the proposed method utilizes conditional random field (CRF) for the language models of accent phrase boundary and accent type, and uses hidden markov model (HMM) for the acoustic feature model. In this paper, we confirmed that the proposed method improved the estimation accuracy for reading-style speech data compared with conventional method.

    CiNii Books

    researchmap

  • 言語モデルと音響モデルを利用したアクセント境界の自動推定

    鈴木啓史, 郡山知樹, 能勢 隆, 篠崎隆宏, 小林隆夫

    電子情報通信学会技術研究報告   Vol. 113 ( No. 366 )   97 - 102   2013年12月

     詳細を見る

    記述言語:日本語  

    researchmap

  • S-CATにおける音響特徴量とSVRによるスコア推定

    篠崎 隆宏, 小野 豊

    日本行動計量学会   41   44 - 45   2013年9月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本行動計量学会  

    CiNii Books

    researchmap

  • Denoising Autoencoderを用いた残響下大語彙音声認識の検討

    小宮山 大樹, 石井 敬章, 篠崎 隆宏, 堀内 靖雄, 黒岩 眞吾

    情報処理学会   vol. 2013-SLP-97 ( No. 1 )   1 - 6   2013年7月

     詳細を見る

    記述言語:日本語  

    researchmap

  • ユーザ属性を考慮した字幕付与方法の検討

    白井 洋輔, 柳村 舞衣, 篠崎 隆宏, 堀内 靖雄, 黒岩 眞吾, 遠藤 俊樹, 宇都 宮栄二

    信学技報   vol. 112 ( no. 475 )   245 - 250   2013年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    リアルタイム映像配信における字幕提示において,字幕情報の遅延や欠落は大きな問題である.この問題に対し,音声と字幕の同期と字幕の要約が有効であると考えられるが,一般的な映像での検証はほとんどなされていない.そこで本研究では(1)字幕提示のタイミングを変化させた場合の了解度実験(2)音声に忠実な字幕文(全文字幕)と音声を要約した字幕文(要約字幕)での了解度実験と主観評価実験を行った.結果として字幕提示のタイミングは音声と同期させた場合の了解度が最も高くなった.全文字幕と要約字幕では了解度において有意差は見られなかったが,ろう者に対しては要約字幕の方が了解度が高い傾向が示された.また,主観評価では要約字幕の評価が高くなり,字幕を要約することの有効性が示された.

    CiNii Books

    researchmap

  • Kinectとパーティクルフィルタによる手話認識手法の検討 (マルチメディア・仮想環境基礎)

    古谷 佳大, 今村 大輔, 堀内 靖雄, 川本 一彦, 篠崎 隆宏, 黒岩 眞吾

    電子情報通信学会技術研究報告 : 信学技報   112 ( 474 )   251 - 256   2013年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    本論文ではKinectとパーティクルフィルタを用いた手話認識手法について検討する.我々の先行研究では腕の肌色情報とKinectによる距離情報を統合し、パーティクルフィルタにより、腕を追跡して手話認識を行う手法を提案し、高い認識精度が示された.しかしこの手法では、腕の肌色情報を用いるために腕まくりをしなければならないという制約が存在した.そこで本研究ではKinectの距離情報を利用することにより、腕まくりの制約を課さなくても腕検出を行える手法を提案し、認識実験により先行研究と同程度の認識精度が得られたことを示す.

    researchmap

  • コミュニケーション支援のための眼球動作入力音声合成インタフェースの研究

    房福明, 篠崎隆宏, 堀内靖雄, 黒岩眞吾, 古井貞熙, 武者利光

    電子情報通信学会技術研究報告   112 ( 426 )   29 - 34   2013年2月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    身体的なハンディキャップにより意思疎通が難しい患者,特に筋萎縮性側索硬化症(ALS)の患者に対し代替となる効率的なコミュニケーション手段を提供することを目的として,眼電位を入力とした音声合成インタフェースを提案し研究を行っている.システムは目の周囲に配置した生体電極から眼電位信号を取り込み,音声認識技術を応用した認識器を用いて眼球動作を認識する.そしてその結果をもとに,実時間で音声合成を行う.これまでのシステムでは認識器においてコンテキスト非依存隠れマルコフモデル(HMM)や一部の眼動素のみ直前のコンテキストに依存化させたバイ眼動素モデルを用いていたが,認識性能の点で不十分であった.そこで本研究では,直前および直後のコンテキストに依存化させた状態共有トライ眼動素モデルの利用を検討する.さらに,眼動素の並びをモデル化したN-gramモデルの導入を行う.従来のコンテキスト非依存HMMのみを用いた場合の仮名認識精度が84 3%,バイ眼動素モデルを用いた場合が89 1%であったのに対し,トライ眼動素モデルを用いた場合は96 2%と認識精度が大きく向上した さらに, N-gramモデルとして仮名3-gramモデルを使用することで, 97 3%の高い認識精度が得られた.

    CiNii Books

    researchmap

  • 音声認識システムのパイプライン分解と遅延評価を用いた実装法

    篠崎隆宏, 古井貞熙, 堀内靖雄, 黒岩眞吾

    日本音響学会2012年秋季研究発表会   2012年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 日本語スピーキングテストにおける文章読み上げ問題の自動採点の検討

    山畑 勇人, 大久保 梨思子, 山田 武志, 今井 新悟, 石塚 賢吉, 篠崎 隆宏, 西村 竜一, 牧野 昭二, 北脇 信彦

    秋季講演論文集   399 - 400   2012年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • コミュニケーション支援のための連続眼電位認識の研究

    房福明, 篠崎隆宏, 古井貞熙, 堀内靖雄, 黒岩眞吾

    日本音響学会2012年秋季研究発表会   1513 - 514   2012年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 日本語スピーキングテストシステムS-CAT のためのSVR による自由発話の自動採点

    小野 豊, 大竹 美鈴, 篠崎 隆宏, 西村 竜一, 山田 武志, 石塚 賢吉, 堀内 靖雄, 黒岩 眞吾, 今井 新悟

    秋季講演論文集   335 - 336   2012年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 日本語スピーキングテストにおける文生成問題の自動採点の検討

    大久保 梨思子, 山畑 勇人, 山田 武志, 今井 新悟, 石塚 賢吉, 篠崎 隆宏, 西村 竜一, 牧野 昭二, 北脇 信彦

    秋季講演論文集   395 - 396   2012年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 純粋関数型コンパクトデコーダHusky2 の性能評価

    深津 澪, 篠崎 隆宏, 堀内 靖雄, 黒岩 眞吾

    秋季講演論文集   187 - 188   2012年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 日本語スピーキングテストS-CAT における並列セグメンテーションを用いた自動採点の検討

    西村 竜一, 栗原 理沙, 篠崎 隆宏, 石塚 賢吉, 山田 武志, 今井 新悟, 河原 英紀, 入野 俊夫

    秋季講演論文集   397 - 399   2012年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • クラウド時代の新しい音声研究パラダイム

    秋葉友良, 岩野公司, 緒方淳, 小川哲司, 小野順貴, 篠崎隆宏, 篠田浩一, 南條浩輝, 西崎博光, 西田昌史, 西村竜一, 原直, 堀貴明

    情報処理学会研究報告   Vol. 2012-SLP-92 ( No. 4 )   1 - 7   2012年7月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    個人が複数の携帯情報端末を所有し,そこで得られたあらゆる音声データをクラウドに蓄積することが容易になりつつある.このように音声情報処理の周辺環境・技術が激変していく中で,音声情報処理技術のより一層の高度化が求められている.その期待に応えるためには,クラウド処理を前提とした音声研究プラットフォームの構築と,それを基盤とした新しい音声研究のパラダイムが必要である.本稿では,現在までに培われてきた音声情報処理技術を概観した上で,新しい研究パラダイムの方向性とそこで生じる新たな課題について議論する.

    CiNii Books

    researchmap

  • Slice Chain Max-Sumアルゴリズムによるタンパク質のポテンシャルエネルギー最小化に関する研究

    猪瀬直人, 篠崎隆宏, 杜世橋, 古井貞熙, 関嶋政和

    情報処理学会バイオ情報学研究会   Vol. 2012-BIO-28 ( No. 20 )   1 - 8   2012年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 日本語スピーキングテストにおける文章読み上げ問題の採点に影響を及ぼす要因の検討

    山畑 勇人, 大久保 梨思子, 山田 武志, 今井 新悟, 石塚 賢吉, 篠崎 隆宏, 西村 竜一, 牧野 昭二, 北脇 信彦

    電子情報通信学会総合大会   2012年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 眼電位入力音声合成インタフェースの提案とユーザー適応の検討

    房福明, 篠崎隆宏, 堀内靖雄, 黒岩眞吾, 古井貞熙, 武者利光

    第39回知能システムシンポジウム資料   293 - 298   2012年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 言語モデルの順向き最尤文選択適応への教師なしクロスバリデーション適応法の応用

    篠崎 隆宏, 堀内 靖雄, 黒岩 眞吾

    春季講演論文集   99 - 100   2012年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • AWA長期間収録音声コーパスと時期差の分析

    黒岩 眞吾, 柘植 覚, 張 文彬, 篠崎 隆宏, 堀内 靖雄

    春季講演論文集   83 - 86   2012年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • ストーリー性を考慮した映画あらすじからの類似度計算

    村手宏輔, 黒岩眞吾, 堀内靖雄, 篠崎隆宏

    全国大会講演論文集   2012 ( 1 )   535 - 537   2012年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    情報推薦に用いられるコンテンツベースベース技術に関して、あらすじが書かれた文書などストーリー性のあるコンテンツに対する類似度計算方法を提案する.ストーリーとは映画や小説などに含まれる話の筋のことであり、それらを説明する文書の中では人物の行動の経緯など要素の連続によって表現されていることが多い.しかし、従来の文書間類似度を計算する際に用いられるベクトル空間モデルでは、出現順序によって意味合いが変るストーリーを比較することは難しい.本研究ではストーリー性を考慮した文書の比較を行うことを目標とし、映画のあらすじ文書を対象に要素の並びを利用した類似度計算方法を検討した.

    CiNii Books

    researchmap

  • 軽量な画像特徴量を用いたマルチモーダル音声認識 査読

    吉川正祥, 篠崎隆宏, 岩野公司, 古井貞熙

    電子情報通信学会論文誌   Vol. J95-D ( No. 3 )   618 - 627   2012年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    音声と動画のマルチモーダル音声認識は,音声のみを用いた場合と比較して高い認識性能が期待される手法であり,これまでの研究で雑音環境下での音声認識に有効であることが示されている.また画像特徴量として,様々なものが提案されている.しかしこれまでは認識性能に注意が向けられ,ポータブル機器等において重要な計算量に注目した研究はほとんど存在しない.実際,代表的な画像特徴量であるオプティカルフローや主成分分析に基づいた手法では,音響特徴量の計算と比べ計算量がかなり大きい.そこで本研究では,計算量と認識性能のバランスに優れた特徴量について検討を行った.発話区間検出を目的として提案された低輝度画素数に着目した特徴量を多次元に拡張し,マルチモーダル音声認識に応用する.実験ではビデオカメラで収録したデータとともにiPhone4で収録したデータを用い,提案輝度特徴量が計算量が少なくどの環境においても認識性能の向上に有効であることを示す.

    CiNii Books

    researchmap

  • Kinectとパーティクルフィルタを用いたHMM手話認識手法の検討

    西村 洋介, 今村 大輔, 堀内 靖雄, 川本 一彦, 篠崎 隆宏, 黒岩 眞吾

    信学技報   vol. 111 ( no. 431 )   161 - 166   2012年2月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    本論文ではKinectによる手話認識手法を提案する.Kinectにより得られたRGB画像と距離情報を統合し,パーティクルフィルタにより,3次元空間上での手の位置座標を推定して,HMMにより連続手話認識を行った.その結果,従来手法であるRGB画像のみを用いたものと比較して認識精度を76.2%から86.0%に向上させることができた.また,磁気センサを用いた場合に比べ,認識精度の低下を1%以下に抑えることができた.実用的な応用を考慮した場合,磁気センサは高価で,装着するのも面倒であるが,提案手法は一般のユーザでも容易に入手可能なKinectのみを使用するため,実用的であるということが言える.

    J-GLOBAL

    researchmap

  • 日本語発話能力測定ウェブシステムのための留学生発話分析

    栗原 理沙, 石塚 賢吉, 西村 竜一, 篠崎 隆宏, 山田 武志, 今井 新悟

    信学技報   vol. 111 ( no. 431 )   141 - 142   2012年2月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 隠れマルコフモデルを用いた眼電位認識の研究

    房福明, 篠崎隆宏, 堀内靖雄, 黒岩眞吾, 古井貞熙, 武者利光

    信学技報   111 ( No. SP2011-117 )   97 - 102   2012年2月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    身体的なハンディキャップにより意思疎通が難しい者,特に筋萎縮性側索硬化症(ALS)の患者に対し,代替となる効率的なコミュニケーション手段を提供することを目的として,眼電位を入力とした音声合成インタフェースを提案する.眼電位は眼球が弱い電池であることに起因し,目の周囲に生体電極を配置することで検出できる.提案システムでは,音声認識を応用した認識器を用いて連続した眼球動作を眼電位信号から認識し,その結果をもとに実時間で音声合成を行う.本論文では,このうち認識部について評価を行う.認識器の動作には,予め眼球動作と眼電位の関係を学習した隠れマルコフモデルを用いる.実験では,ユーザ自身から収録したデータを元にモデルを作成することで,平均して95.7%の高い認識精度が得られることを示す.この方法で作成した眼電位のモデルは,基本的にそのユーザ専用となる.しかし実用の観点からは,不特定のユーザに対して動作することが望ましい.そこで,眼電位モデルの個人差による認識性能への影響や,その影響を低減するための適応化手法についても検討を行った.音声認識における話者適応化手法を応用することで,眼電位の認識精度が向上することを示す.

    CiNii Books

    researchmap

  • 日本手話対話と日本語音声対話における話者交替現象の比較分析 (福祉情報工学)

    村瀬 優美, 堀内 靖雄, 篠崎 隆宏, 黒岩 眞吾

    電子情報通信学会技術研究報告 : 信学技報   111 ( 424 )   7 - 12   2012年1月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    本稿では自発的対話における話者交替現象について,Sacksらの話者交替規則に基づいて,日本手話対話と日本語音声対話を比較分析した.日本手話の母語話者6名による3対話と日本語音声母語話者6名による3対話(各対話は約5分)を分析した結果,どちらもSacksらの話者交替規則を指向しているが,オーバーラップの時間長は手話の方が音声よりも長いことが示された.その理由として,(1)オーバーラップが生じた場合,音声は発話の途中で言いやめる場合が多いが,手話では発話の最後まで言い切る現象が多い,(2)日本手話の特徴として,自発話のTRP後に繰り返しや言換えをすることが多く,その場合,相手話者が発話を開始しても最後まで言い換え/繰返しを行うことにより話者重複が生じる,という二つの現象が明らかになった.ただし,(2)のような現象においても,繰返し/言い換えの際には非手指信号(NMS;手動作以外の表現)が消失したり,弱化したりすることにより,発話権の譲渡が明示される現象が多く見られた.これらの分析結果から,視覚言語と聴覚言語の違いが話者交替に与える影響が明らかになった.

    CiNii Books

    researchmap

  • Protein Potential Energy Minimization Using Slice Chain Max-Sum Algorithm

    N. Inose, T. Shinozaki, S. Du, S. Furui, M. Sekijima

    26th Annual Symposium of The Protein Society   2012年

     詳細を見る

    記述言語:英語  

    researchmap

  • Distance based Graph Linearization and Sampled Max-sum Algorithm for Efficient 3D Potential Decoding of Macromolecules 査読

    篠崎隆宏, 岩木聡直, 杜世橋, 関嶋政和, 古井貞熙

    情報処理学会研究会報告   Vol. 4 ( 1 )   34 - 44   2011年12月

     詳細を見る

    記述言語:英語   出版者・発行元:Information and Media Technologies Editorial Board  

    Three-dimensional structure prediction of a molecule can be modeled as a minimum energy search problem in a potential landscape. Popular ab initio structure prediction approaches based on this formalization are the Monte Carlo methods represented by the Metropolis method. However, their prediction performance degrades for larger molecules such as proteins since the search space is exponential to the number of atoms. In order to search the exponential space more efficiently, we propose a new method modeling the potential landscape as a factor graph. The key ideas are slicing the factor graph based on the maximum distance of bonded atoms to convert it to a linear structured graph, and the utilization of the max-sum search algorithm combined with samplings. It is referred to as Slice Chain Max-Sum and it has an advantage that the search is efficient because the graph is linear. Experiments are performed using polypeptides having 50 to 300 amino acid residues. It has been shown that the proposed method is computationally more efficient than the Metropolis method for large molecules.

    DOI: 10.2197/ipsjtbio.4.34

    researchmap

  • 時期差に頑健な話者識別手法

    張 文彬, 陸 昊澤, 篠崎 隆宏, 堀内 靖雄, 黒岩 眞吾

    バイオメトリクスと認識・認証シンポジウム   2011年11月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 構内アナウンス環境下における音声認識のための音声区間検出

    紺野 遼輔, 篠崎 隆宏, 堀内 靖雄, 黒岩 眞吾

    日本音響学会   151 - 152   2011年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • Distance-based Graph Linearization and Sampled Max-sum Algorithm for Efficient 3D Potential Decoding of Macromolecules

    Takahiro Shinozaki, Toshinao Iwaki, Shiqiao Du, Masakazu Sekijima, Sadaoki Furui

    研究報告バイオ情報学(BIO)   2011 ( 5 )   1 - 8   2011年9月

     詳細を見る

    記述言語:英語  

    Three-dimensional structure prediction of a molecule can be modeled as a minimum energy search problem in a potential landscape. Popular ab initio structure prediction approaches based on this formalization are the Monte Carlo methods represented by the Metropolis method. However, their prediction performance degrades for larger molecules such as proteins since the search space is exponential to the number of atoms. In order to search the exponential space more efficiently, we propose a new method modeling the potential landscape as a factor graph. The key ideas are slicing the factor graph based on the maximum distance of bonded atoms to convert it to a linear structured graph, and the utilization of the max-sum search algorithm combined with samplings. It is referred to as Slice Chain Max-Sum and it has an advantage that the search is efficient because the graph is linear. Experiments are performed using polypeptides having 50 to 300 amino acid residues. It has been shown that the proposed method is computationally more efficient than the Metropolis method for large molecules.Three-dimensional structure prediction of a molecule can be modeled as a minimum energy search problem in a potential landscape. Popular ab initio structure prediction approaches based on this formalization are the Monte Carlo methods represented by the Metropolis method. However, their prediction performance degrades for larger molecules such as proteins since the search space is exponential to the number of atoms. In order to search the exponential space more efficiently, we propose a new method modeling the potential landscape as a factor graph. The key ideas are slicing the factor graph based on the maximum distance of bonded atoms to convert it to a linear structured graph, and the utilization of the max-sum search algorithm combined with samplings. It is referred to as Slice Chain Max-Sum and it has an advantage that the search is efficient because the graph is linear. Experiments are performed using polypeptides having 50 to 300 amino acid residues. It has been shown that the proposed method is computationally more efficient than the Metropolis method for large molecules.

    CiNii Books

    researchmap

  • Sampled Max-Sum Algorithm and Application to 3D Structure Prediction of Proteins

    岩木 聡直, 篠崎 隆宏, 古井貞熙

    日本蛋白質科学会年会   2011年6月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 純粋関数型言語を用いた超コンパクトデコーダの開発

    篠崎隆宏, 関嶋政和, 萩原茂樹, 古井貞熙

    情報処理学会   2011年4月

     詳細を見る

    記述言語:日本語  

    researchmap

  • N-gramカウントを用いた言語モデルの効率的な選択学習

    久保田 雄, 篠崎 隆宏, 古井 貞熙, 宇都宮 栄二, 新堂 安孝

    日本音響学会2011年春季講演論文集   ( No. 3-5-2 )   73 - 74   2011年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • クロス言語検索を用いた中国語音声認識による乗換案内システム

    張 ?, 大西 翼, 篠崎 隆宏, 古井 貞熙

    日本音響学会2011年春季講演論文集   ( No. 2-5-7 )   61 - 62   2011年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 眼電位を用いた音声合成インタフェースの研究

    尾崎 賢人, 篠崎 隆宏, 武者 利光, 古井 貞煕

    日本音響学会2011年春季講演論文集   ( No. 3-4-13 )   1621 - 1622   2011年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • ホームビデオからのハイライト検出支援のための音声情報の視覚化

    高木 幸一, 川田 亮一, 篠崎 隆宏, 古井 貞熙

    日本音響学会2010年秋季講演論文集   ( No. 2-9-11 )   69 - 70   2010年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 柔軟でコンパクトな純粋関数型デコーダの検討

    篠崎 隆宏, 関嶋 政和, 萩原 茂樹, 古井 貞熙

    日本音響学会2010年秋季講演論文集   ( No. 1-Q-26 )   181 - 182   2010年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 音声の有無による違いを考慮したHome video簡易編集 (モバイルマルチメディア通信)

    高木 幸一, 川田 亮一, 篠崎 隆宏

    電子情報通信学会技術研究報告   110 ( 128 )   51 - 56   2010年7月

     詳細を見る

    記述言語:日本語   出版者・発行元:電子情報通信学会  

    researchmap

  • 音声の有無による違いを考慮したHome video簡易編集

    高木 幸一, 川田 亮一, 篠崎 隆宏, 古井 貞熙

    研究報告オーディオビジュアル複合情報処理(AVM)   2010 ( 10 )   1 - 6   2010年7月

     詳細を見る

    記述言語:日本語   出版者・発行元:情報処理学会  

    本稿では,音声の有無による違いを考慮した home video 簡易編集方式について報告する.音声情報を含む home video を編集する際に,映像・音声の両方を参照しながら編集する場合と,映像のみの情報を参照して編集する場合で結果が異なる.この違いを主観評価実験から明らかにする.さらに,その結果を利用して,音のみからしか得られない情報,すなわち,音としての本質的な情報のみを視覚化し,一般ユーザが視覚だけを使用して音声を含めたものと同じレベルの編集を行うことができる方式を提案する.主観評価の結果,映像・音声の両方を参照して編集する場合と大差ない結果が得られることを示す.This paper proposes a method for supporting trimming from home video on a mobile terminal without listening to the sound. It has two main contributions. First, we have analyzed the difference of trimming results between with and without listening to the sound, and derived what the necessary audio information not to be obtained from video is. Second, in consideration of the results, only the essential audio data is visualized on a small display of mobile terminal. An experimental result shows that the case of using the above-mentioned visualization data is comparable to that of providing both audio and video.

    CiNii Books

    researchmap

    その他リンク: http://id.nii.ac.jp/1001/00069814/

  • 年齢推定のための音声特徴量および推定器の検討

    和田 俊也, 篠崎 隆宏, 古井 貞熙

    電子情報通信学会 技術研究報告   Vol. SP2010-27   31 - 36   2010年6月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 識別学習モデルと教師なしCV適応を用いたCSJ講演音声認識

    篠崎 隆宏, 久保田 雄, ディクソン・ポール, 古井 貞煕

    日本音響学会2010年春季講演論文集   ( No. 1-6-14 )   37 - 38   2010年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • MLLR変換行列を特徴量として用いた年齢推定

    和田俊也, 篠崎隆宏, 古井貞熙

    日本音響学会2010年春季講演論文集   ( No. 2-6-13 )   83 - 84   2010年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 自然性と個人性に優れた音声合成のための音素継続時間長適応法

    神山歩相名, 篠崎隆宏, 岩野公司, 古井貞熙

    日本音響学会2010年春季講演論文集   ( No. 2-7-1 )   329 - 330   2010年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 日本語話し言葉コーパスを用いた異なるタスクに対する音声認識

    西井 俊介, 篠崎 隆宏, 古井 貞熙

    日本音響学会2010年春季講演論文集   ( No. 1-6-10 )   27 - 28   2010年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • User identification using Time-of-Flight camera image streams

    Felipe Gomez-Caballero, Takahiro Shinozaki, Sadaoki Furui

    ( No. 5X-8 )   2 - 615   2010年3月

     詳細を見る

    記述言語:英語  

    researchmap

  • HMM音声合成における自然性と個人性に優れた韻律モデル適応法の検討

    神山 歩相名, 篠崎 隆宏, 岩野 公司, 古井 貞煕

    情報処理学会研究会報告   Vol. 2010-SLP-80 ( No. 12 )   1 - 6   2010年2月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 教師無しアンサンブル適応法の提案と音響モデル適応への応用

    篠崎 隆宏, 古井 貞煕

    第12回情報論的学習理論ワークショップ   2009年10月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 目的音GMM尤度基準スペクトル補正法の諸評価

    篠崎 隆宏, 古井 貞熙

    日本音響学会2009年秋季講演論文集   ( No. 1-1-10 )   31 - 32   2009年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 自然性と個人性に優れたF0パターン適応法

    神山 歩相名, 篠崎 隆宏, 岩野 公司, 古井 貞熙

    日本音響学会2009年秋季講演論文集   ( No. 1-2-7 )   249 - 250   2009年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 音響モデルのアンサンブル学習

    篠崎 隆宏

    ( No. 11. )   2009年7月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 教師なしクロスバリデーション適応法の諸条件における評価

    久保田 雄, 篠崎 隆宏, 古井 貞熙

    "情報処理学会研究報告, IPSJ SIG Technical Report"   Vol. 2009-SLP-77 ( No. 7 )   2009年7月

     詳細を見る

    記述言語:日本語  

    researchmap

  • F0パターン生成モデルのための数量化?類の平均値置換による話者適応法の検討

    神山 歩相名, 篠崎 隆宏, 岩野 公司, 古井 貞熙

    電子情報通信学会 技術研究報告   87 - 92   2009年6月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 高精度音声認識のための教師なしクロスバリデーション適応法の提案

    篠崎 隆宏, 久保田 雄, 古井貞熙

    日本音響学会2009年春季講演論文集   ( No. 1-5-10 )   27 - 28   2009年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 教師なしクロスバリデーション適応によるタスク適応

    久保田 雄, 篠崎 隆宏, 古井貞熙

    日本音響学会2009年春季講演論文集   ( No. 1-5-11 )   29 - 30   2009年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 音声による3次元直接操作インタフェース 査読

    川崎智久, 大西 翼, 篠崎 隆宏, 古井貞熙

    インタラクション2009   43 - 44   2009年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 高精度音声認識のための教師なしクロスバリデーションおよび集合適応法の提案

    篠崎 隆宏, 久保田 雄, 古井貞熙

    社団法人 情報処理学会 研究報告 (2009-SLP-75)   ( No. 75 )   1 - 6   2009年2月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 携帯端末上でのプロキシ編集

    高木 幸一, 米山 暁夫, 篠崎 隆宏, 古井貞熙

    電子情報通信学会 技術研究報告   ( No. IE2009-02 )   7 - 12   2009年2月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 音声入力によるマウスの直接操作の検討

    川崎 智久, 大西 翼, 岩野 公司, 篠崎 隆宏, 古井貞熙

    日本音響学会2008年秋季講演論文集   ( No. 1-1-23 )   55 - 56   2008年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 目的音GMMを用いたスペクトル補正フィルタの提案

    篠? 隆宏, 古井 貞煕

    日本音響学会2008年秋季講演論文集   ( No. 1-1-1 )   1 - 2   2008年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 効率的なクロスバリデーションに基づく混合ガウス分布の最適化とその拡張

    篠? 隆宏, 古井 貞煕, 河原 達也

    社団法人 情報処理学会 研究報告   2008-SLP-72   69 - 74   2008年7月

     詳細を見る

    記述言語:日本語  

    researchmap

  • クロスバリデーション尤度によるHMMの混合数の最適化

    篠崎 隆宏, 河原 達也

    春季講演論文集   41 - 42   2008年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • Aggregated cross-validation尤度を用いた混合ガウス分布最適化アルゴリズムの提案

    篠崎 隆宏, 古井 貞熙, 河原 達也

    日本音響学会2008年春季講演論文集   ( No. 2-10-1 )   67 - 68   2008年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • Initial Evaluation of the Drivers' Japanese Speech Corpus in a Car Environment

    Kousuke Hiraki, Takahiro Shinozaki, Koji Iwano, Agnieszka Betkowska, Betkowska Agnieszka, Koichi Shinoda, SADAOKI FURUI

    Vol. SP2007-202   93 - 98   2008年3月

     詳細を見る

    記述言語:英語  

    researchmap

  • 頑健なパラメタ推定のためのAggregated EM 法の提案と評価

    篠崎 隆宏, Mari Ostendorf, 河原 達也

    電子情報通信学会 技術研究報告   223 - 228   2007年12月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 頑健なパラメタ推定のためのAggregated EMアルゴリズムの提案

    篠崎 隆宏, Mari Ostendorf, 河原 達也

    秋季講演論文集   131 - 134   2007年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 効率的なクロスバリデーション尤度評価に基づく混合ガウス分布の最適化

    篠崎 隆宏, 河原 達也

    情報処理学会   81 - 86   2007年7月

     詳細を見る

    記述言語:日本語  

    researchmap

  • ICASSP2007報告

    戸田 智基, 篠崎 隆宏, 秋田 祐哉

    情報処理学会   45 - 48   2007年7月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 超並列計算機を用いた話し言葉音声認識の研究

    篠崎 隆宏, 河原 達也

    京都大学学術情報メディアセンター全国共同利用版[公報]   Vol. 6 ( No. 1 )   31 - 37   2007年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 頑健なパラメタ推定のためのクロスバリデーション EM 法の提案

    篠崎 隆宏, Mari OSTENDORF

    情報処理学会研究報告音声言語情報処理(SLP)   2006 ( 136 )   191 - 196   2006年12月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    EM アルゴリズムの欠点である過学習の問題を補うため、従来の自己尤度に代えてクロスバリデーション尤度を用いる新しい最尤学習アルゴリズムの提案を行う。並列化 EM学習と同様に学習セットを区画化し、各区画ごとに求めたモデルの十分統計量を用いることで、提案手法は従来の EM 学習と同程度の計算量で実行可能である。人工的なデータを用いた分析実験により、提案法が従来の EM アルゴリズムと比較して過学習に対して頑健であることを示す。中国語放送音声を用いた大語彙連続音声認識実験により、提案手法が EM 学習と比較してより多くのパラメタを有効に活用し、単語誤り率の削減に有効であることを示す。A new maximum likelihood training algorithm is proposed that compensates for weaknesses of the EM algorithm by using cross-validation likelihood in the expectation step to avoid overtraining. By using a set of sufficient statistics associated with a partitioning of the training data, as in parallel EM, the algorithm has the same order of computational requirements as the original EM algorithm. Analyses using a GMM with artificial data show the proposed algorithm is more robust for overtraining than the conventional EM algorithm. Large vocabulary recognition experiments on Mandarin broadcast news data show that the method makes better use of more parameters and gives lower recognition error rates than EM training.

    CiNii Books

    researchmap

    その他リンク: http://id.nii.ac.jp/1001/00056862/

  • 頑健なパラメタ推定のためのクロスバリデーションEM法の提案

    篠崎 隆宏, Mari Ostendorf

    電子情報通信学会 技術研究報告   13 - 18   2006年12月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 音声情報処理技術の最先端:2.統計的手法を用いた音声モデリングの高度化とその音声認識への応用

    篠田 浩一, 篠崎 隆宏

    情報処理   45 ( 10 )   1012 - 1019   2004年10月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    従来、音声認識においては隠れマルコフモデル(HMM)による音声のモデル化が一般的であるHMMを用いた音声認識は丁寧な読み上げ発声に対しては90%以上の高い認識性能を持つ.しかしながら,日常会話などの通常の話し言葉音声に対してはその性能はまだ十分でない.また,認識性能の著しく低い話者が存在する,周囲雑音の影響を受け性能が劣化する,など多くの課題が残されている.これらの課題の解決のためには,HMMを内包した,より柔軟な統計的モデリング手法が必要とされている.この目的のために多様な手法が活発に研究されているが,ここでは,その中で特に3つのトピック,情報量基準を用いたモデル選択,構造的事後確率最大化による話者適応化,ダイナミックベイジアンネットを用いた音声モデリング,について解説し,今後の展望を述べる.

    CiNii Books

    researchmap

    その他リンク: http://id.nii.ac.jp/1001/00065158/

  • Dynamic Bayesian Network-Based Acoustic Models Incorporating Speaking Rate Effects

    SHINOZAKI Takahiro, FURUI Sadaoki

    IEICE transactions on information and systems   87 ( 10 )   2339 - 2347   2004年10月

     詳細を見る

    記述言語:英語   出版者・発行元:一般社団法人電子情報通信学会  

    One of the most important issues in spontaneous speech recognition is how to cope with the degradation of recognition accuracy due to speaking rate fluctuation within an utterance. This paper proposes an acoustic model for adjusting mixture weights and transition probabilities of the HMM for each frame according to the local speaking rate. The proposed model is implemented along with variants and conventional models using the Bayesian network framework. The proposed model has a hidden variable representing variation of the "mode" of the speaking rate, and its value controls the parameters of the underlying HMM. Model training and maximum probability assignment of the variables are conducted using the EM/GEM and inference algorithms for the Bayesian networks. Utterances from meetings and lectures are used for evaluation where the Bayesian network-based acoustic models are used to rescore the likelihood of the N-best lists. In the experiments, the proposed model indicated consistently higher performance than conventional HMMs and regression HMMs using the same speaking rate information.

    CiNii Books

    researchmap

  • 周波数帯域ごとの重みつき尤度を用いた音声認識の検討

    西村 義隆, 篠崎 隆宏, 岩野 公司, 古井 貞煕

    日本音響学会 2004年春季講演論文集   1 ( No. 2-11-9 )   117 - 118   2004年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    researchmap

  • 超並列デコーダを用いた話し言葉音声認識

    篠崎 隆宏, 古井 貞熙

    日本音響学会 2004年春季講演論文集   ( No. 2-11-6 )   111 - 112   2004年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 超並列デコーダによる話し言葉音声認識

    篠崎 隆宏, 古井 貞熙

    第3回話し言葉の科学と工学ワークショップ 講演予稿集   67 - 72   2004年2月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 話し言葉音声認識へのベイジアンネットの適用

    篠崎 隆宏, 古井 貞熙

    国立国語研究所公開研究発表会 「話し言葉のデータベース ?『日本語話し言葉コーパス』?」 講演予稿集   47 - 48   2003年12月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 周波数帯域ごとの重みつき尤度を用いた雑音に頑健な音声認識

    西村 義隆, 篠崎 隆宏, 岩野 公司, 古井 貞熙

    電子情報通信学会 技術研究報告   ( No. SP2003-116 )   19 - 24   2003年12月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 隠れモードベイズ分類器を用いた音響モデルの適応学習

    篠崎 隆宏, 古井 貞熙

    日本音響学会 2003年秋季講演論文集   ( No. 2-6-2 )   63 - 64   2003年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 重みつきスペクトル特徴量を用いた雑音に頑健な音声認識

    西村 義隆, 篠崎 隆宏, 岩野 公司, 古井 貞熙

    日本音響学会 2003年秋季講演論文集   ( No. 1-6-3 )   5 - 6   2003年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 発話速度変動を考慮した隠れモードHMMによる音声のモデル化 : 音声認識におけるベイジアンネットの応用

    篠崎 隆宏, 古井 貞煕

    聴覚研究会資料 = Proceedings of the auditory research meeting   33 ( 4 )   245 - 250   2003年6月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    CiNii Books

    researchmap

  • 発話速度変動を考慮した隠れモードHMMによる音声のモデル化

    篠崎隆宏, 古井 貞熙

    電子情報通信学会 技術研究報告   ( No. SP2003-41 )   37 - 42   2003年6月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 大語彙連続音声認識のための言語的音響的属性に基づく単語単位の最適化

    篠崎隆宏, 古井貞熙

    日本音響学会 2003年春季講演論文集   ( No. 3-4-4 )   135 - 136   2003年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 言語モデルの教師なしバッチ型話題適応

    横山忠介, 篠崎隆宏, 岩野公司, 古井 貞熙

    日本音響学会 2003年春季講演論文集   ( No. 3-4-1 )   129 - 130   2003年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 隠れモードHMMによる発話速度変動を考慮した音声のモデル化

    篠崎 隆宏, 古井 貞熙

    日本音響学会 2003年秋季講演論文集   ( No. 2-6-1 )   61 - 62   2003年

     詳細を見る

    記述言語:日本語  

    researchmap

  • 言語モデルのバッチ型教師なし適応化法

    横山 忠介, 篠崎 隆宏, 岩野 公司, 古井 貞煕

    情報処理学会研究報告音声言語情報処理(SLP)   2002 ( 121 )   183 - 188   2002年12月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    本稿では話し言葉音声認識の性能向上を目的とした、クラスモデルを用いた言語モデルのバッチ型教師なし適応化法を提案する。対象としているタスクは日本語講演音声認識である。提案手法では、複数の講演から構築される話題非依存の単語n-gramを用いて一つの講演音声を全て認識し、その認識仮説から講演ごとの話題依存クラスとに言語も出る適応を行い、その適応モデルを用いて講演音声を再認識する。提案する手法を用いた評価実験を行った結果、評価セット中の全ての講演について適応による単語正解精度の向上を確認した。適応化における最適なクラス数は100程度であり、そのときの単語正解精度の改善は絶対値で2.3%であった。さらに、音響モデルの教師なし適応を併用した場合についても言語モデルの適応化の効果を評価する実験を行ったところ、同様の認識性能の改善が得られ、最終的な講演音声認識性能は、単語正解精度で焼く71.8%に達した。This paper proposes an unsupervised, batch-type, class-based language model adaptation method for spontaneous speech recognition. The word classes are automatically determined by maximizeing the bigram likelihood using a training set. A class-based language model is built based on recognition hypotheses obtained using a general word-based language model, and linearly interpolated with the general language model. All the input utterances are re-recognized using the adapted language model. The proposed method was applied to the recognition of spontaneous presentations and was found to be effective in improving the recognition accuracy for all the presentations. The best condition was found to be using 100 word classes, and in this condition 2.3% of the absolute value improvement in the word accuracy averaged over all the speakers was achieved, using speaker independent acoustic models. It was also found that effectiveness of the proposed method is additive to that of the acoustic model adaptation. Consequently, 71.8% word recognition accuracy was achieved for spontaneous presentations after adapting both acoustic and language models.

    CiNii Books

    researchmap

    その他リンク: http://id.nii.ac.jp/1001/00057297/

  • 言語モデルのバッチ型教師なし適応化法

    横山忠介, 篠崎隆宏, 岩野公司, 古井貞熙

    電子情報通信学会 技術研究報告   Vol. NLC2002-74 ( No. SP2002-151 )   19 - 24   2002年12月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 講演音声認識を対象とした言語モデルの話者適応化

    横山 忠介, 篠崎 隆宏, 古井 貞熙

    日本音響学会 2002年秋季講演論文集   ( No. 3-9-6 )   141 - 142   2002年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 話し言葉音声中の単語認識における人を基準としたデコーダの性能評価

    篠崎 隆宏, 古井 貞熙

    日本音響学会 2002年秋季講演論文集   ( No. 2-9-13 )   87 - 88   2002年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 話し言葉音声認識における認識率の変動要因の分析と認識単位の設計

    篠崎 隆宏, 古井 貞熙

    第2回 話し言葉の科学と工学ワークショップ講演予稿集   59 - 64   2002年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 話し言葉音声認識における認識性能の個人差の解析

    篠崎 隆宏, 古井 貞熙

    日本音響学会 2002年春季講演論文集   ( No. 1-5-9 )   17 - 18   2002年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • Presentation Transcription Using a Japanese Spontaneous Speech Corpus

    Takahiro Shinozaki, Sadaoki Furui

    43 ( 7 )   2098 - 2107   2002年

     詳細を見る

  • 話し言葉音声認識における話者間の認識率変動要因の解析

    篠崎 隆宏, 古井 貞煕

    情報処理学会研究報告音声言語情報処理(SLP)   2001 ( 123 )   111 - 116   2001年12月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    話し言葉認識の認識性能は十分ではなく、また話し言葉の音声認識における単語正解精度低下の要因はあまり分かっていない。そこで、日本語話し言葉のコーパスの多数の話者を対象に音声認識実験を行い、話者間での単語正解精度変動の分布の解析を行った。個人差の主たる要因が発話速度、未知語率および言い直し頻度である事を明らかにした。また、教師無し話者適応化は単語正解精度の向上に効率的に働くが、適応化を行った後も発話速度の影響は減少しないことを示した。This paper reports results of various investigations on recognizing spontaneous presentation speech. Individual differences in the speech recognition preformance are analyzed. A restricted set of the speaker attributes comprising the speaking rate, the out of vocablary rate and the repair rate is found to be most significant to yield individual differences in the word accuracy. It is shown that unsupervised MLLR speaker adaptation works well form improving the word accuracy but does not compensate for the effect of the speaking rate.

    CiNii Books

    researchmap

    その他リンク: http://id.nii.ac.jp/1001/00057386/

  • 話し言葉音声認識における話者間の認識率変動要因の解析

    篠崎 隆宏, 古井 貞熙

    電子情報通信学会 技術研究報告   Vol. SP2001-102 ( No. NLC2001-67 )   1 - 6   2001年12月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 話し言葉認識における決定木を用いた誤り要因の分析

    篠崎 隆宏, 古井 貞熙

    日本音響学会 2001年秋季講演論文集   2001 ( No. 1-1-9 )   17 - 18   2001年10月

     詳細を見る

    記述言語:日本語  

    CiNii Books

    researchmap

  • 話し言葉コーパスを用いた音声認識の検討

    篠崎隆宏, 細川貴生, 古井貞熙

    日本音響学会2001年春季講演論文集   2001 ( No. 1-3-14 )   31 - 32   2001年3月

     詳細を見る

    記述言語:日本語  

    CiNii Books

    researchmap

  • 話し言葉音声認識のための音響・言語モデル

    篠崎隆宏, 堀智織, 古井貞熙

    話し言葉の科学と工学ワークショップ予稿集   101 - 108   2001年3月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 話し言葉音声の認識を目指して

    篠崎 隆宏, 斎藤洋平, 堀 智織, 古井 貞煕

    情報処理学会研究報告音声言語情報処理(SLP)   2000 ( 119 )   125 - 130   2000年12月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    話し言葉音声の認識を目指して平成11年度に開始したプロジェクトに関連して、講演音声、対談音声、討論音声などを対象として進めている種々の検討状況を報告する。実際の話し言葉コーパスから作成した音素モデルや言語モデル、話題の分野に対応した過去のニュースや教科書を用いた未知語の登録、対談のクロストークの区間における音響back-offなどが有用であることが確認された。認識性能に個人差が大きく、発話速度、フィラー数、言い直し数などに関連していることなどが確認された。会議などの議事録を、音声認識システムとユーザとが対話を行いながら効率的に作成する方法についても検討した。話し言葉の音声認識性能はまだ低く、認識対象としての文単位の抽出法、発音辞書、コーパス作成における書き起こし法など、今後解決しなければならない研究課題が多い。This paper reports various investigations on recognizing spontaneous speech such as lectures, interviews and discussions conducted in relation with our national project started in 1999. Usefulness of acoustic and linguistic modeling based on actual spontaneous speech corpora, registration of new words using past broadcast news or a textbook related to the areas of topics, and an acoustic backing-off method for the periods of cross talk in interviews have been confirmed. Recognition accuracy has a wide speaker-to-speaker variability according to the speaking rate, number of fillers, number of repairs, etc. This paper also reports a method for efficiently making minutes of meetings based on interaction between a speech recognition system and a user. The recognition accuracy for spontaneous speech is still very low, and there exist a large number of research issues including how to extract pseudo-sentence unit speech for recognition, how to build pronunciation dictionaries, and how to transcribe spontaneous speech in corpora.

    CiNii Books

    researchmap

    その他リンク: http://id.nii.ac.jp/1001/00057471/

  • 話し言葉音声の認識を目指して

    篠崎隆宏, 斎藤洋平, 堀智織, 古井貞熙

    電子情報通信学会 技術研究報告   ( No. SP2000-96 )   7 - 12   2000年12月

     詳細を見る

    記述言語:日本語  

    researchmap

  • k-制限最小値独立置換族のサイズ均等性

    篠崎 隆宏, 武井 由智, 伊東 利哉

    平成12年度信越支部大会   2000年10月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 最適な最小値独立置換族の構成

    武井 由智, 伊東 利哉, 篠崎 隆宏

    電子情報通信学会技術研究報告. COMP, コンピュテーション   98 ( 432 )   89 - 98   1999年11月

     詳細を見る

    記述言語:英語   出版者・発行元:一般社団法人電子情報通信学会  

    最小値独立置換族は, インターネット上に存在する多数の類似した文書の特定に有用であることが知られている.整数n>0に対し, 集合{1, 2, ..., n}上の置換族Cが最小値独立であるとは, 任意の(空でない)部分集合X⊆{1, 2, ..., n}と任意のx∈Xに対し, π∈Cを一様且つ無作為に選んだ場合, Pr{min{π(X)}=π(x)}=∥X∥^<-1>が成り立つことを言う.ただし, ∥A∥は有限集合Aの要素数を表すものとする.これまでに, 集合{1, 2, ..., n}上の最小値独立置換族に関して, 以下の結果-(1)任意の最小値独立置換族Cに対して, ∥C∥>1cm(n, n-1, ..., 2, 1)=e^<n-o(n)>;(2)∥C∥<4^nとなるような最小値独立置換族Cが存在する-が知られているが, ∥C∥=1cm(n, n-1, ..., 2, 1)を満たす最小値独立置換族Cの存在さらにその構成法は未解決であった.本論文では, 全ての整数n>0に対し, ∥F_n∥=1cm(n, n-1, ..., 2, 1)を満たす極小な最小値独立置換族F_nの構成法を与え, その詳細な解析を行なう.

    CiNii Books

    researchmap

  • A Polynomial Time Sampling Algorithm for an Optimal Family of Min-Wise Independent Permutations (Models of Computation and Algorithms)

    篠崎 隆宏, 伊東 利哉

    数理解析研究所講究録   1093   74 - 80   1999年4月

     詳細を見る

    記述言語:英語   出版者・発行元:京都大学  

    CiNii Books

    researchmap

▼全件表示

受賞

  • 情報・システムソサイエティ活動功労賞

    2018年   電子情報通信学会  

     詳細を見る

  • 情報処理学会山下記念研究賞

    2009年  

     詳細を見る

    受賞国:日本国

    researchmap

  • 日本音響学会 粟屋 潔学術奨励賞

    2008年  

     詳細を見る

    受賞国:日本国

    researchmap

  • カナガワビエンナーレ 日本国際連合協会会長賞

    1987年   神奈川県  

     詳細を見る

共同研究・競争的資金等の研究課題

  • ミクロな地震間作用の統計解析による地震発生システムの物理的多様性解明

    研究課題/領域番号:22K03753  2022年4月 - 2026年3月

    日本学術振興会  科学研究費助成事業  基盤研究(C)

    麻生 尚文, 篠崎 隆宏

      詳細を見る

    配分額:4290000円 ( 直接経費:3300000円 、 間接経費:990000円 )

    researchmap

  • 抑揚のある自然発話を実現する音声言語獲得エージェント

    研究課題/領域番号:22K12069  2022年4月 - 2025年3月

    日本学術振興会  科学研究費助成事業  基盤研究(C)

    篠崎 隆宏, 岡本 拓磨

      詳細を見る

    配分額:4160000円 ( 直接経費:3200000円 、 間接経費:960000円 )

    researchmap

  • CEFR-Jに基づくCAN-DOタスク中心の教授と評価に関する総合的研究

    研究課題/領域番号:20H00095  2020年4月 - 2025年3月

    日本学術振興会  科学研究費助成事業 基盤研究(A)  基盤研究(A)

    根岸 雅史, 投野 由紀夫, 奥村 学, 高田 智子, 片桐 徳昭, 中谷 安男, 能登原 祥之, 石井 康毅, 長沼 君主, 篠崎 隆宏, 工藤 洋路, 内田 諭, 村越 亮治, 大橋 由紀子, 和泉 絵美, 周 育佳

      詳細を見る

    配分額:44720000円 ( 直接経費:34400000円 、 間接経費:10320000円 )

    2020年度前半は研究チームの編成・計画の具体化と研究協力校の募集と依頼を行った。小中高と検討したが、最も可能性が高い京都府との連携を最初に模索し、CAN-DOリストを用いた CEFR-Jを基盤とする教育実践と評価を、高校レベルでは京都府立東舞鶴高等学校に研究協力校として受諾してもらい、詳細データ(短期・長期)を収集することになった。
    一方、具体的な授業への介入を行う以外に、全般的な CAN-DO 評価を CEFR-J CAN-DO テストを用いて実施する計画も立てられた。これに関しても、CEFR-J のメーリングリスト等で呼びかけて大規模に実施する予定であったが、2020年度後半からのコロナ感染拡大により、当初の予定通り学校募集等ができなくなった。
    またライティングのように大規模にデータ収集を不特定多数の学校で実施できる可能性も検討し、これに関してはさいたま市を対象に検討を進めていったが、こちらもコロナによる学校側の感染対策がさまざまな障害となり、十分に研究協力に時間を割くことが学校側としてできない状況があった。
    2020年度後半は予定を変更し、研究協力校に負担にならないように京都府の全体研修などの機会を利用して担当の教員と連絡を取り合い、こちら側の研究目的や教育支援体制を説明し、連携できる体制を整えることに時間を費やした。2020年度終盤に、次年度の予定を話し合い、まずは試験的に授業観察を行って授業データを録画・分析して、そこから課題を見いだして二学期に授業を焦点化して改善点を探ることとした。

    researchmap

  • 全ベイズモデルに基づく音声認識システム学習のデータ無制約化

    研究課題/領域番号:17K20001  2017年6月 - 2020年3月

    日本学術振興会  科学研究費助成事業 挑戦的研究(萌芽)  挑戦的研究(萌芽)

    篠崎 隆宏, 持橋 大地

      詳細を見る

    配分額:6240000円 ( 直接経費:4800000円 、 間接経費:1440000円 )

    音声認識を様々なタスクにおいて実用的なものとするためには、認識システムの学習において教師あり学習への依存度を減らし、システムをより自律的なものへとする必要がある。本研究では、ノンパラメトリックベイズ法と重み付き有限トランスデューサ技術を応用し、対応の無い音素データとテキストデータから、自動的に発音辞書を拡張する手法を提案した。また、書き起こしテキストを用いずにEncoder-Decoder型の音声認識システム全体を方策関数として、認識結果のスカラー評価値をもとにシステムを強化学習する方法について検討および実験を進めた。これは、クラウド上に構築された音声認識サーバーが多数のユーザーに認識サービスを提供する際に、ユーザーからのわずかなフィードバックを大量に集めることで、書き起こしを用いることなくシステム性能を向上させる応用を想定したものである。学習と共に期待報酬が増加することは理論的には保障されているものの、実際に有限のリソースのもとに学習を進めることは容易ではない。例えば、教師あり学習を行うシステムにおいて一般的なアテンション機構の利用は、学習の初期において強化学習を困難にすることが判明した。これは、アライメントの学習がうまくいかないためである。そこで、従来のアテンション機構を代替するものとしてスポーク状の構造を提案し、有効性を示した。人間にとって視覚と聴覚はそれぞれが重要であることに加えて、それらの相関の利用は学習を行う上で役立っていると考えられる。ビデオカメラに代表されるように画像と音声を同時に収録することは一般的に行われており、人手によるラベルを用いない学習において音声と画像の相関を有効利用できれば有用であると考えられる。このような目的の元、音声を手掛かりに画像中の音源を教師なしで特定する手法を提案し、有効性を示した。

    researchmap

  • 英語到達度指標CEFR-J準拠のCAN-DO指導タスクおよびテスト開発と公開

    研究課題/領域番号:16H01935  2016年4月 - 2020年3月

    日本学術振興会  科学研究費助成事業 基盤研究(A)  基盤研究(A)

    根岸 雅史, 投野 由紀夫, 酒井 英樹, 長沼 君主, 高田 智子, 内田 諭, 金子 恵美子, 村越 亮治, 奥村 学, 工藤 洋路, 能登原 祥之, 小泉 利恵, 石井 康毅, 篠崎 隆宏, 和泉 絵美, 印南 洋, 中谷 安男

      詳細を見る

    配分額:37960000円 ( 直接経費:29200000円 、 間接経費:8760000円 )

    まず、指導タスクとテスト・タスクのうち、CEFR-Jの各CAN-DOディスクリプタに基づくテスト・タスクの開発およびその困難度の検証を優先することを決定した。
    各CAN-DOディスクリプタに基づく評価タスクの開発としては、2017年度はPre-A1からA2.2を作成したが、2018年度はB1.1からB2.2までのテスト項目の開発と検証を行った。リーディングにおいては、リーディングのテキスト・タイプ、テキスト困難度、タスクについて検討し、修正をした後、テスト・セットを作成した。リスニングにおいては、リーディングと同様、リスニングのテキスト・タイプ、テキスト困難度、タスクについて検討し、修正をしたが、音声の収録およびテストの実施には至らなかった。ススピーキング(発表)・スピーキング(やりとり)・ライティングにおいては、タスクと採点方法について検討し、修正をした後、テスト・セットを作成した。これらのテストをそれぞれ実施し、採点・統計的な分析・解釈を行った。
    言語処理班では、リーディングやリスニングのテキスト分析の結果に基づき、テキストのCEFR-Jレベルの判定を可能にするプログラムの開発を行い、公開した。さらに、文法のレベル別基準特性を判定を可能にするCEFR-J Grammar Profileを開発・公開した。音声認識では、スピーキング・テスト解答データを追加することで、音声認識プログラムの精度を向上した。
    2019年3月23日に「CEFR-J 2019シンポジウム in 京都」を開催し、170名余りの参加者があった。このシンポジウムでは、3年間の研究成果の発表をするとともに、CEFR-Jのリソースの活用ワークショップも行った。さらに、CEFR-Jの利用企業や協力校の発表機会を提供した。これらの活動により、CEFR-Jが広く認知され、日本の英語教育の改善に大きく資することができた。

    researchmap

  • 音声認識生成システムの自己組織化学習

    研究課題/領域番号:26280055  2014年4月 - 2018年3月

    日本学術振興会  科学研究費助成事業 基盤研究(B)  基盤研究(B)

    篠崎 隆宏, 能勢 隆, Duh Kevin, 荒井 隆行, 渡部 晋治

      詳細を見る

    配分額:15730000円 ( 直接経費:12100000円 、 間接経費:3630000円 )

    少量のラベル付き音声データと大量のラベル無し音声データから音声言語を学習したり、人手に頼ることなく自動的にシステム構造や学習条件を最適化しシステム性能を最大化したりすることのできる、自律的な音声言語情報処理システムの仕組みを実現することを目的に研究を行った。進化戦略を用いた大規模なニューラルネットワークシステムの自動最適化手法や、音声をモデル化する各種の統計モデルの教師なし学習法、強化学習法の提案を行い、実験により有効性を示した。研究成果発表の一環として公開したフリーな高性能日本語音声認識システムは、国内外で幅広く用いられている。

    researchmap

  • コンピュータ自動採点日本語スピーキングテストの実用化と妥当性の検証

    研究課題/領域番号:26244026  2014年4月 - 2017年3月

    日本学術振興会  科学研究費助成事業 基盤研究(A)  基盤研究(A)

    今井 新悟, 西村 竜一, 山田 武志, 赤木 彌生, 中園 博美, 伊東 祐郎, 菊地 賢一, 中村 洋一, 本田 明子, 篠崎 隆宏, 家根橋 伸子, 石塚 賢吉

      詳細を見る

    配分額:37700000円 ( 直接経費:29000000円 、 間接経費:8700000円 )

    日本語学習者の日本語スピーキング能力の測定を自動で行う適応型テストシステムSJ-CAT (Speaking Japanese Computerized Adaptive Test) を開発し、インターネット上で公開した。SJ-CATは、文読み上げ問題、選択肢読み上げ問題、文生成問題、自由発話問題の4種類2セクションで構成され、音声の特徴量(韻律、音響尤度、スピーキングレートなど)やキーワードなどで評価する。項目応答理論の段階反応モデルで日本語スピーキング能力を点数化する。訓練された人間が評定を行うスピーキングテストとSJ-CATを比較し、実用化に十分な相関を得た。

    researchmap

  • Deep Generative Model とその因子分解による音声情報処理基盤

    研究課題/領域番号:25280058  2013年4月 - 2016年3月

    日本学術振興会  科学研究費助成事業 基盤研究(B)  基盤研究(B)

    篠田 浩一, 岩野 公司, 篠崎 隆宏

      詳細を見る

    配分額:16900000円 ( 直接経費:13000000円 、 間接経費:3900000円 )

    多数話者の発声した大量の音声データから、Deep Neural Network (DNN)を構築し、それを音韻と話者の要因毎に分解することで高性能な音声認識モデルを獲得する枠組みの研究開発を行った。2つのDNNの一部を共有させた構造をもつDeep Siamese Networkを用いた話者認識、音韻構造を階層的な出力層で表現したDNNを用いた話者適応化、Soft Targetを教師としたStudent-Teacher学習の枠組みを用いた話者正規化学習、の3つの手法を提案し、それぞれで話者認識性能、音声認識性能の顕著な向上を得た。それ以外にもDNNの実装、ネットワーク構造設計の研究を行った。

    researchmap

  • グラフィカルモデルを用いた高分子ポテンシャルデコーダの開発

    研究課題/領域番号:23650068  2011年 - 2013年

    日本学術振興会  科学研究費助成事業 挑戦的萌芽研究  挑戦的萌芽研究

    篠崎 隆宏, 篠田 浩一, 関嶋 政和, 関嶋 政和

      詳細を見る

    配分額:3250000円 ( 直接経費:2500000円 、 間接経費:750000円 )

    タンパク質の立体構造はその機能と深く関わるため、アミノ酸配列から立体構造を予測することは重要である。本プロジェクトでは効率的な立体構造予測の実現のため、分子のポテンシャルエネルギーにより定まるギブス分布の表現に因子グラフと呼ばれるグラフ構造を導入した上で、マルコフ連鎖モンテカルロ(MCMC) 法による局所的な探索とグローバルなグラフ探索手法であるmax-sumアルゴリズムを組み合わせたSCMS手法の提案と改良を行った。計算機実験により提案法が従来のMCMC 法や、MCMCに準ニュートン法を組み合わせた方法と比較して、少ない計算量でより低いエネルギーの分子形状を探索できることを示した。

    researchmap

  • 音声認識技術を応用したコンピュータ自動採点日本語スピーキングテストの開発

    研究課題/領域番号:22242014  2010年 - 2012年

    日本学術振興会  科学研究費助成事業 基盤研究(A)  基盤研究(A)

    今井 新悟, 伊東 祐郎, 中村 洋一, 酒井 たか子, 赤木 彌生, 菊地 賢一, 本田 明子, 中園 博美, 西村 竜一, 篠崎 隆宏, 山田 武志, 家根橋 伸子, 石塚 賢吉, ファム ターンソン

      詳細を見る

    配分額:46670000円 ( 直接経費:35900000円 、 間接経費:10770000円 )

    日本語学習者のための日本語スピーキング能力をコンピュータ上で自動採点するテストシステムを開発した。インターネットを介して受験でき、時間と場所の制約を受けずに受験が可能である。音声認識技術を使い、受験者の発話から特徴量を抽出することにより、自動採点を実現している。項目応答理論を用い、受験者の能力に適合した難しさの問題を出題するアダプティブテストとなっており、少ない問題数で能力の判定ができる。

    researchmap

  • 遅延評価手法を用いた大規模統計システム構築法の確立

    2010年

      詳細を見る

    資金種別:競争的資金

    researchmap

  • 長期間収録音声コーパスに基づく話者内音声変動に頑健な話者認識手法の研究

    研究課題/領域番号:21300060  2009年4月 - 2014年3月

    日本学術振興会  科学研究費助成事業 基盤研究(B)  基盤研究(B)

    黒岩 眞吾, 柘植 覚, 長内 隆, 篠崎 隆宏, 堀内 靖雄, 西田 昌史, 篠崎 隆宏

      詳細を見る

    配分額:17940000円 ( 直接経費:13800000円 、 間接経費:4140000円 )

    本研究では、音声が長期間及び短期間にどのように変化するかを調査するための音声コーパスを構築すると共に、民生利用及び法科学の分野での利用を視野に、話者内音声変動に頑健で信頼性の高い話者認識手法の検討を行った。具体的には、10年間に渡り、毎週1回朝・昼・夕に同一話者が防音室で音素バランス文等を発声した音声データを国立情報学研究所・音声資源コンソーシアムを通じ『AWA長期間収録音声コーパス』として公開した。また、同コーパスを利用して話者内音声変動に頑健な話者認識手法を提案すると共に、法科学分野における話者認識で有用な特徴量、機械と人の話者認識特性の比較、話者モデル構築手法、照合手法を提案した。

    researchmap

  • 多層モデルの階層間密統合に基づく音声理解フレームワークの研究

    研究課題/領域番号:21300066  2009年4月 - 2014年3月

    日本学術振興会  科学研究費助成事業 基盤研究(B)  基盤研究(B)

    李 晃伸, 駒谷 和範, 南條 浩輝, 西村 竜一, 西田 昌史, 篠崎 隆弘, 秋田 祐哉

      詳細を見る

    配分額:17550000円 ( 直接経費:13500000円 、 間接経費:4050000円 )

    本研究では,音声認識における信号処理から言語理解までの各層における制約について,低次から高次までの制約を互いに相互作用させる枠組みの研究を行った.階層ごとの統計モデルの研究では,言語・音響・対話の各層における高精度な統計モデルの研究を行い,各層からの制約統合について検討を行った.制約の統合手法の研究では,ベイズリスク最小化探索および対話制御における音声情報の統合等について研究を行った.これらの成果は音声対話システムを構築するための基盤システムとして,オープンソースツールキットMMDAgentおよび音声認識エンジンJuliusの一部として公開されている.

    researchmap

  • WFSTによる音声認識の高度化

    研究課題/領域番号:21300062  2009年 - 2011年

    日本学術振興会  科学研究費助成事業 基盤研究(B)  基盤研究(B)

    古井 貞煕, 篠田 浩一, 篠崎 隆宏

      詳細を見る

    配分額:18070000円 ( 直接経費:13900000円 、 間接経費:4170000円 )

    重みつき有限状態トランスデューサ(WFST)による音声認識の高度化と、WFSTデコーダの新たな応用展開を目指して研究を行い、以下の種々の成果を上げることができた。WFSTデコーダのon-the-fly合成アルゴリズムの改良を行い、世界最高性能の音声認識デコーダ(T^3デコーダ)を開発した。これにさらに音声・非音声情報を組み込み、雑音下での認識性能を向上させた。開発したデコーダを、大規模コーパスを持たない音声や、複数言語が混在して用いられる音声の認識、transliterationなどに適用し、効果的なアルゴリズムを提案した。さらに、デコーダ技術の新たな展開となるアイディアを創出した。開発したT^3デコーダを、国内外に公開した。

    researchmap

  • 目的音モデル尤度を用いた高速な耐雑音音声認識フロントエンドの研究

    2009年 - 2011年

      詳細を見る

    資金種別:競争的資金

    researchmap

  • 目的音モデル尤度を用いた高速な耐雑音音声認識フロントエンドの研究

    研究課題/領域番号:21700188  2009年 - 2010年

    日本学術振興会  科学研究費助成事業 若手研究(B)  若手研究(B)

    篠崎 隆宏

      詳細を見る

    配分額:4290000円 ( 直接経費:3300000円 、 間接経費:990000円 )

    雑音の補償操作を雑音の定式化に最も適した短時間スペクトル領域で行い、補償のためのパラメタ推定に音声の性質を表すのに最も適した音声特徴量に対する最尤基準を用いる目的音GMMスペクトル補正法(TGSC法)の提案を行った。構成のバリエーションやパラメタの推定法等について最適な条件の探索を行い、音声認識実験により効果を示した。また実時間動作が可能であることを確認した。

    researchmap

  • CV 学習法を用いた最尤及び識別学習基準による準教師あり学習法の研究

    2009年 - 2010年

      詳細を見る

    資金種別:競争的資金

    researchmap

  • Lightly supervised training based on CV framework using ML and discriminative criteria

    2009年 - 2010年

      詳細を見る

    資金種別:競争的資金

    researchmap

  • Statistical pattern classifier training based on cross-validation likelihood

    2007年 - 2009年

      詳細を見る

    資金種別:競争的資金

    researchmap

  • クロスバリデーション尤度を用いた統計的パターン分類器学習アルゴリズムの研究

    2007年 - 2009年

      詳細を見る

    資金種別:競争的資金

    researchmap

  • クロスバリデーション尤度を用いた統計的パターン分類器学習アルゴリズムの研究

    研究課題/領域番号:19700167  2007年 - 2008年

    日本学術振興会  科学研究費助成事業 若手研究(B)  若手研究(B)

    篠崎 隆宏

      詳細を見る

    配分額:3780000円 ( 直接経費:3300000円 、 間接経費:480000円 )

    モデル選択手法として用いられているクロスバリデーション的手法を繰り返し最尤パラメタ推定法の内部に効果的に組み込むことで、少ないデータから精密かつ一般性の高い統計モデルを学習するための手法を提案した。具体的には期待値最大化学習法にクロスバリデーションを組み込んだ手法の提案を行い、さらに教師なし適応への応用も行った。提案手法を音声認識で用いる統計モデルの学習に応用し、認識性能の向上に非常に効果的であることを示した。

    researchmap

▼全件表示