2026/03/11 更新

写真a

エンドウ トシオ
遠藤 敏夫
ENDO TOSHIO
所属
総合研究院 スーパーコンピューティング研究センター 教授
職名
教授
外部リンク

学位

  • 博士(理学) ( 東京大学 )

研究キーワード

  • メモリ階層

  • 高性能計算

  • GPGPU

  • スーパーコンピュータ

研究分野

  • 情報通信 / 高性能計算

学歴

  • 東京大学   理学系研究科   情報科学専攻

    1996年4月 - 2001年9月

      詳細を見る

    国名: 日本国

    備考: 修士課程・博士課程

    researchmap

  • 東京大学   理学部   情報科学科

    1992年4月 - 1996年3月

      詳細を見る

    国名: 日本国

    researchmap

経歴

  • 東京科学大学   総合研究院スーパーコンピューティング研究センター   教授

    2024年10月 - 現在

      詳細を見る

    国名:日本国

    researchmap

  • 東京工業大学   学術国際情報センター   教授

    2018年4月 - 2024年9月

      詳細を見る

  • 東京工業大学   学術国際情報センター   准教授

    2012年6月 - 2018年3月

      詳細を見る

所属学協会

論文

  • FRUGAL: Pushing GPU Applications beyond Memory Limits

    Lingqi Zhang, Tengfei Wang, Jiajun Huang, Chen Zhuang, Ivan R. Ivanov, Peng Chen, Toshio Endo, Mohamed Wahib

    2026 IEEE/ACM International Symposium on Code Generation and Optimization (CGO)   188 - 201   2026年1月

     詳細を見る

    掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.1109/cgo68049.2026.11395210

    researchmap

  • Scaling Large-scale GNN Training to Thousands of Processors on CPU-based Supercomputers

    Chen Zhuang, Lingqi Zhang, Du Wu, Peng Chen, Jiajun Huang, Xin Liu, Rio Yokota, Nikoli Dryden, Toshio Endo, Satoshi Matsuoka, Mohamed Wahib

    Proceedings of the 39th ACM International Conference on Supercomputing   57 - 72   2025年6月

     詳細を見る

    掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ACM  

    DOI: 10.1145/3721145.3730422

    researchmap

  • An Optimization Technique for Hiding Communication Costs in 3D Parallel Training of Deep Learning 査読 国際共著 国際誌

    Ryubu Hosoki, Kento Sato, Toshio Endo, Julien Bigot, Edouard Audit

    2025 IEEE 25th International Symposium on Cluster, Cloud and Internet Computing (CCGrid)   1 - 10   2025年5月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.1109/ccgrid64434.2025.00044

    researchmap

  • A General and Scalable GCN Training Framework on CPU Supercomputers.

    Chen Zhuang, Peng Chen 0035, Xin Liu 0020, Rio Yokota, Nikoli Dryden, Lingqi Zhang 0001, Toshio Endo, Satoshi Matsuoka, Mohamed Wahib

    PPoPP   566 - 568   2025年

     詳細を見る

    掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1145/3710848.3710860

    researchmap

    その他リンク: https://dblp.uni-trier.de/db/conf/ppopp/ppopp2025.html#ZhuangCLYD0EMW25

  • Challenges in Computing Resource Sharing Towards Next-Gen Interactive Accelerated HPC 査読 国際誌

    Toshio Endo, Shohei Minami, Akihiro Nomura, Hiroki Ohtsuji, Jun Kato, Masahiro Miwa, Eiji Yoshida, Tomoya Yuki, Ryuichi Sakamoto

    Interactive and Urgent High-Performance Computing (CIW-IUS), in conjunction with ISC24, LNCS 15058   231 - 242   2024年12月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:Springer Nature Switzerland  

    DOI: 10.1007/978-3-031-73716-9_16

    researchmap

  • TSUBAME4.0の処理量担保のための計算ノード分割

    野村 哲弘, 遠藤 敏夫

    2024年度大学ICT推進協議会(AXIES)年次大会, 10AM2C-5   2024年12月

     詳細を見る

    担当区分:最終著者   記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    researchmap

  • TSUBAME4.0: HPC-AI時代に向けた東京科学大学のもっとみんなのスパコン

    安良岡由規, 遠藤敏夫, 野村哲弘, 渡邊 寿雄, 鶴見 慶

    2024年度大学ICT推進協議会(AXIES)年次大会, 10AM1C-1   2024年12月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    researchmap

  • SuperGCN: General and Scalable Framework for GCN Training on CPU-powered Supercomputers 国際共著 国際誌

    Chen Zhuang, Lingqi Zhang, Du Wu, Peng Chen, Jiajun Huang, Xin Liu, Rio Yokota, Nikoli Dryden, Toshio Endo, Satoshi Matsuoka, Mohamed Wahib

    arXiv:2411.16025 [cs.DC]   2024年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

    researchmap

  • HPC-AI時代に向けたもっとみんなのスパコンTSUBAME4.0

    遠藤 敏夫, 野村 哲弘, 渡邊 寿雄, 安良岡 由規, 鶴見 慶

    並列/分散/協調処理に関するサマーワークショップ(SWoPP2024), 情報処理学会研究報告   2024-HPC-195 ( 8 )   2024年8月

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    researchmap

  • Leveraging GPUDirect Storage for Efficient Image Reconstruction

    Du Wu, Peng Chen, Toshio Endo, Satoshi Matsuoka, Mohamed Wahib

    Summer United Workshops on Parallel, Distributed and Cooperative Processing (SWoPP 2024), IPSJ SIG Technical Report   2024-HPC-195 ( 5 )   2024年8月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    researchmap

  • High-performance Graph Convolutional Networks Training on Fugaku and ABCI Supercomputers 国際共著

    Chen Zhuang, Peng Chen, Xin Liu, Rio Yokota, Toshio Endo, Satoshi Matsuoka, Mohamed Wahib

    Summer United Workshops on Parallel, Distributed and Cooperative Processing (SWoPP 2024), IPSJ SIG Technical Report   2024-HPC-195 ( 14 )   2024年8月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    researchmap

  • FRUGAL: Reducing GPU Memory Requirement of HPC Applications

    Tengfei Wang, Lingqi Chang, Ivan Ivanov, Peng Chen, Toshio Endo, Mohamed Wahib

    Summer United Workshops on Parallel, Distributed and Cooperative Processing (SWoPP 2024), IPSJ SIG Technical Report   2024-HPC-195 ( 27 )   2024年8月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    researchmap

  • タンパク質構造予測プログラムOmegaFoldのマルチGPUを用いた高速化 査読

    大沢 泰生, 遠藤 敏夫, 細木 隆豊

    Cross-disciplinary Workshop on Computing Systems, Infrastructures, and Programming (xSIG 2024)   2024年8月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(その他学術会議資料等)  

    researchmap

  • スパコンTSUBAMEシリーズにおけるリソース分割戦略

    野村 哲弘, 遠藤 敏夫

    並列/分散/協調処理に関するサマーワークショップ(SWoPP2024), 情報処理学会研究報告   2024-HPC-195 ( 7 )   2024年8月

     詳細を見る

    担当区分:最終著者   記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    researchmap

  • Real-time High-resolution X-Ray Computed Tomography 査読 国際共著 国際誌

    Du Wu, Peng Chen, Xiao Wang, Issac Lyngaas, Takaaki Miyajima, Toshio Endo, Satoshi Matsuoka, Mohamed Wahib

    Proceedings of the 38th ACM International Conference on Supercomputing   110 - 123   2024年5月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ACM  

    DOI: 10.1145/3650200.3656634

    researchmap

    その他リンク: https://dl.acm.org/doi/pdf/10.1145/3650200.3656634

  • ステンシル計算の時間ブロッキングフレームワークの実装と評価

    瓜生 侑, 遠藤 敏夫

    情報処理学会研究報告   2024-HPC-194 ( 3 )   2024年5月

     詳細を見る

    担当区分:最終著者   記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    researchmap

  • An optimization pass for training speed-up and strategy search in 3D parallelism 国際共著

    Ryubu Hosoki, Kento Sato, Toshio Endo, Julien Bigot, Edouard Audit

    IPSJ SIG Technical Report   2024-HPC-194 ( 7 )   2024年5月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    researchmap

  • Accelerating Stencil Computations on a GPU by Combining Using Tensor Cores and Temporal Blocking 査読

    Futa Kambe, Toshio Endo

    16th Workshop on General Purpose Processing Using GPU   1 - 6   2024年3月

     詳細を見る

    担当区分:最終著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ACM  

    DOI: 10.1145/3649411.3649412

    researchmap

    その他リンク: https://dl.acm.org/doi/pdf/10.1145/3649411.3649412

  • Retargeting and Respecializing GPU Workloads for Performance Portability 査読

    Ivan R. Ivanov, Oleksandr Zinenko, Jens Domke, Toshio Endo, William S. Moses

    2024 IEEE/ACM International Symposium on Code Generation and Optimization (CGO)   119 - 132   2024年3月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.1109/cgo57630.2024.10444828

    researchmap

  • Automatic Parallelization and OpenMP Offloading of Fortran Array Notation 査読

    Ivan R. Ivanov, Jens Domke, Toshio Endo, Johannes Doerfert

    proceedings of 20th International Workshop on OpenMP (IWOMP 2024), LNCS 15195   197 - 209   2024年3月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1007/978-3-031-72567-8_13

    researchmap

  • High Throughput 3D Image Reconstruction with GPUDirect and Tensor Core

    Du Wu, Peng Chen, Takaaki Miyajima, Toshio Endo, Satoshi Matsuoka, Mohamed Wahib

    IPSJ SIG Technical Report   2024-HPC-193 ( 25 )   2024年3月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    researchmap

  • AshPipe: Asynchronous Hybrid Pipeline Parallel for DNN Training 査読

    Ryubu Hosoki, Toshio Endo, Takahiro Hirofuchi, Tsutomu Ikegami

    Proceedings of the International Conference on High Performance Computing in Asia-Pacific Region   117 - 126   2024年1月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ACM  

    DOI: 10.1145/3635035.3635045

    researchmap

    その他リンク: https://dl.acm.org/doi/pdf/10.1145/3635035.3635045

  • Communication Optimization for Distributed GCN Training on ABCI Supercomputer.

    Chen Zhuang, Peng Chen 0035, Xin Liu 0020, Toshio Endo, Satoshi Matsuoka, Mohamed Wahib

    IEEE International Conference on Cluster Computing   160 - 161   2024年

     詳細を見る

    掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.1109/CLUSTERWorkshops61563.2024.00038

    researchmap

    その他リンク: https://dblp.uni-trier.de/db/conf/cluster/clusterw2024.html#Zhuang0LEMW24

  • Investigating Nvidia GPU Architecture Trends via Microbenchmarks.

    Lingqi Zhang 0001, Ryan Barton, Peng Chen 0035, Xiao Wang 0004, Toshio Endo, Satoshi Matsuoka, Mohamed Wahib

    IEEE International Conference on Cluster Computing   174 - 175   2024年

     詳細を見る

    掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.1109/CLUSTERWorkshops61563.2024.00045

    researchmap

    その他リンク: https://dblp.uni-trier.de/db/conf/cluster/clusterw2024.html#ZhangBCWEMW24

  • Asynchronous I/O Optimization for X-Ray Imaging via GPUDirect Storage.

    Du Wu, Peng Chen 0035, Yiyu Tan, Yusuke Tanimura, Toshio Endo, Satoshi Matsuoka, Mohamed Wahib

    IEEE International Conference on Cluster Computing   196 - 197   2024年

     詳細を見る

    掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.1109/CLUSTERWorkshops61563.2024.00056

    researchmap

    その他リンク: https://dblp.uni-trier.de/db/conf/cluster/clusterw2024.html#WuCTTEMW24

  • Pyramid Swin Transformer for Multi-task: Expanding to More Computer Vision Tasks 査読

    Chenyu Wang, Toshio Endo, Takahiro Hirofuchi, Tsutomu Ikegami

    Proceedings of Conference on Advanced Concepts for Intelligent Vision Systems (ACIVS 2023), Springer, LNCS Vol. 14124   53 - 65   2023年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:Springer Nature Switzerland  

    DOI: 10.1007/978-3-031-45382-3_5

    researchmap

  • The Aggressive Oversubscribing Scheduling for Interactive Jobs on a Supercomputing System 査読

    Shohei Minami, Toshio Endo, Akihiro Nomura

    2023 IEEE High Performance Extreme Computing Conference (HPEC)   1 - 7   2023年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.1109/hpec58863.2023.10363580

    researchmap

  • Scalable Training of Graph Convolutional Networks on Supercomputers

    Chen Zhuang, Peng Chen, Xin Liu, Satoshi Matsuoka, Toshio Endo, Mohamed Wahib

    Summer United Workshops on Parallel, Distributed and Cooperative Processing (SWoPP 2023), IPSJ SIG Technical Report   2023-HPC-190 ( 19 )   2023年8月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    researchmap

  • High-performance Temporal Blocking Stencils at Low GPU Occupancy

    Lingqi Zhang, Mohamed Wahib, Peng Chen, Yusuke Tanimura, Toshio Endo, Satoshi Matsuoka

    Summer United Workshops on Parallel, Distributed and Cooperative Processing (SWoPP 2023), IPSJ SIG Technical Report   2023-HPC-190 ( 26 )   2023年8月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    researchmap

  • 動的スケジューリングライブラリを用いたPythonにおける分散コレスキー分解の実装と評価

    岡本 洸琉, 遠藤 敏夫

    並列/分散/協調処理に関するサマーワークショップ(SWoPP2023), 情報処理学会研究報告   2023-HPC-190 ( 15 )   2023年8月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    researchmap

  • GPU上のTensor coreを使ったステンシル計算の時間ブロッキングによる高速化

    神戸 風太, 遠藤 敏夫

    並列/分散/協調処理に関するサマーワークショップ(SWoPP2023), 情報処理学会研究報告   2023-HPC-190 ( 29 )   2023年8月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    researchmap

  • Enhancing the Performance of AlphaFold Through Modified Storage Method and Optimization of HHblits on TSUBAME3.0 Supercomputer

    Hayato Fujita, Akihiro Nomura, Toshio Endo, Masakazu Sekijima

    2023 Congress in Computer Science, Computer Engineering, & Applied Computing (CSCE)   2023年7月

     詳細を見る

    掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.1109/csce60160.2023.00351

    researchmap

  • PERKS: a Locality-Optimized Execution Model for Iterative Memory-bound GPU Applications 招待 査読

    Lingqi Zhang, Mohamed Wahib, Peng Chen, Jintao Meng, Xiao Wang, Toshio Endo, Satoshi Matsuoka

    In proceedings of ACM International Conference on Supercomputing (ICS 2023), Orlando, June 2023.   2023年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1145/3577193.3593705

    researchmap

  • Revisiting Temporal Blocking Stencil Optimizations 招待 査読

    Lingqi Zhang, Mohamed Wahib, Peng Chen, Jintao Meng, Xiao Wang, Toshio Endo, Satoshi Matsuoka

    In proceedings of ACM International Conference on Supercomputing (ICS 2023), Orlando, June 2023.   2023年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1145/3577193.3593716

    researchmap

  • 次世代高性能メモリシステムにおけるステンシル計算の局所性向上技術の評価

    幸 朋矢, 遠藤 敏夫

    情報処理学会研究報告   2023-HPC-188 ( 31 )   2023年3月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    researchmap

  • Effectiveness of the Oversubscribing Scheduling on Supercomputer Systems 査読

    Shohei Minami, Toshio Endo, Akihiro Nomura

    Proceedings of the International Conference on High Performance Computing in Asia-Pacific Region   18 - 28   2023年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ACM  

    DOI: 10.1145/3578178.3578221

    researchmap

    その他リンク: https://dl.acm.org/doi/pdf/10.1145/3578178.3578221

  • Exploiting Scratchpad Memory for Deep Temporal Blocking 査読

    Lingqi Zhang, Mohamed Wahib, Peng Chen, Jintao Meng, Xiao Wang, Toshio Endo, Satoshi Matsuoka

    Proceedings of the 15th Workshop on General Purpose Processing Using GPU   34 - 35   2023年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1145/3589236.3589242

    researchmap

  • High-Performance GPU-to-CPU Transpilation and Optimization via High-Level Parallel Constructs

    William S. Moses, Ivan R. Ivanov, Jens Domke, Toshio Endo, Johannes Doerfert, Oleksandr Zinenko

    Proceedings of the 28th ACM SIGPLAN Annual Symposium on Principles and Practice of Parallel Programming   119 - 134   2023年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ACM  

    DOI: 10.1145/3572848.3577475

    researchmap

    その他リンク: https://dl.acm.org/doi/pdf/10.1145/3572848.3577475

  • Pyramid Swin Transformer: Different-Size Windows Swin Transformer for Image Classification and Object Detection

    583 - 590   2023年

     詳細を見る

    掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.5220/0011675800003417

    researchmap

  • 機械学習を用いた音声処理に向けたデータ拡張手法の研究

    丸山 翼, 池上 努, 遠藤 敏夫, 広渕 崇宏

    電子情報通信学会 応用音響研究会 技術研究報告   2022年12月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    researchmap

  • Efficient Stencil Computation with Temporal Blocking by Halide DSL 査読

    Hiroki Aikawa, Toshio Endo, Tomoya Yuki, Takahiro Hirofuchi, Tsutomu Ikegami

    2022 IEEE Intl Conf on Parallel & Distributed Processing with Applications, Big Data & Cloud Computing, Sustainable Computing & Communications, Social Computing & Networking (ISPA/BDCloud/SocialCom/SustainCom)   870 - 877   2022年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.1109/ispa-bdcloud-socialcom-sustaincom57177.2022.00116

    researchmap

  • Breaking the Memory Bottleneck for Iterative Memory-bound Applications Via Persistent Kernels

    Lingqi Zhang, Mohamed Wahib, Peng Chen, Jintao Meng, Xiao Wang, Toshio Endo, Satoshi Matsuoka

    IPSJ SIG Technical Report   2022-HPC-187 ( 18 )   2022年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    researchmap

  • Speed-Up Single Shot Detector on GPU with CUDA 査読

    Chenyu Wang, Toshio Endo, Takahiro Hirofuchi, Tsutomu Ikegami

    Proceedings of SNPD2022-summer, Studies in Computational Intelligence   1074   89 - 106   2022年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:Springer International Publishing  

    DOI: 10.1007/978-3-031-19604-1_7

    researchmap

  • 3D Stacked SRAMを活用したHPC向けメモリアーキテクチャの検討

    萩原 汐, 吉川 隆英, 幸 朋矢, 遠藤 敏夫

    デザインガイア2022, 情報処理学会研究報告   2022-SLDM-200 ( 31 )   2022年11月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    researchmap

  • ラムダ式を用いる移植性の高い並列プログラムの実装とCPU・GPU上の評価

    瓜生 侑, 遠藤 敏夫

    並列/分散/協調処理に関するサマーワークショップ(SWoPP2022), 情報処理学会研究報告   2022-HPC-185 ( 20 )   2022年7月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    researchmap

  • High-Performance GPU-to-CPU Transpilation and Optimization via High-Level Parallel Constructs

    William S. Moses, Ivan R. Ivanov, Jens Domke, Toshio Endo, Johannes Doerfer, Oleksandr Zinenko

    arXiv:2207.00257 [cs.PL]   2022年7月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

    researchmap

  • 負荷分散を改善したハイブリッドパイプライン並列深層学習手法

    細木 隆豊, 遠藤 敏夫, 広渕 崇宏, 池上 努

    並列/分散/協調処理に関するサマーワークショップ(SWoPP2022), 情報処理学会研究報告   2022-HPC-185 ( 17 )   2022年7月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    researchmap

  • タンパク質構造解析システムAlphafoldの実行時ファイルステージングを用いた高速化

    大沢 泰生, 遠藤 敏夫, 野村 哲弘

    並列/分散/協調処理に関するサマーワークショップ(SWoPP2022), 情報処理学会研究報告   2022-HPC-185 ( 24 )   2022年7月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    researchmap

  • mdx: A Cloud Platform for Supporting Data Science and Cross-Disciplinary Research Collaborations

    Toyotaro Suzumura, Akiyoshi Sugiki, Hiroyuki Takizawa, Akira Imakura, Hiroshi Nakamura, Kenjiro Taura, Tomohiro Kudoh, Toshihiro Hanawa, Yuji Sekiya, Hiroki Kobayashi, Shin Matsushima, Yohei Kuga, Ryo Nakamura, Renhe Jiang, Junya Kawase, Masatoshi Hanai, Hiroshi Miyazaki, Tsutomu Ishizaki, Daisuke Shimotoku, Daisuke Miyamoto, Kento Aida, Atsuko Takefusa, Takashi Kurimoto, Koji Sasayama, Naoya Kitagawa, Ikki Fujiwara, Yusuke Tanimura, Takayuki Aoki, Toshio Endo, Satoshi Ohshima, Keiichiro Fukazawa, Susumu Date, Toshihiro Uchibayashi

    arXiv:2203.14188 [cs.LG]   2022年3月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

    researchmap

  • Measurement and Modeling of Performance of HPC Applications Towards Overcommitting Scheduling Systems 査読

    Shohei Minami, Toshio Endo, Akihiro Nomura

    proceedings of 24th Workshop on Job Scheduling Strategies for Parallel Processing (JSSPP 2021), LNCS   12985   59 - 79   2021年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:Springer International Publishing  

    DOI: 10.1007/978-3-030-88224-2_4

    researchmap

  • Performance Modeling of HPC Applications on Overcommitted Systems.

    Shohei Minami, Toshio Endo, Akihiro Nomura 0002

    HPC Asia 2021: The International Conference on High Performance Computing in Asia-Pacific Region   129 - 132   2021年

     詳細を見る

    掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ACM  

    DOI: 10.1145/3432261.3439866

    researchmap

    その他リンク: https://dblp.uni-trier.de/db/conf/hpcasia/hpcasia2021.html#MinamiE021

  • Integrating Cache Oblivious Approach with Modern Processor Architecture 査読

    Toshio Endo

    Proceedings of the International Conference on High Performance Computing in Asia-Pacific Region   123 - 130   2020年1月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ACM  

    DOI: 10.1145/3368474.3368477

    researchmap

    その他リンク: https://dl.acm.org/doi/pdf/10.1145/3368474.3368477

  • AN5D: automated stencil framework for high-degree temporal blocking on GPUs. 査読

    Kazuaki Matsumura, Hamid Reza Zohouri, Mohamed Wahib, Toshio Endo, Satoshi Matsuoka

    CGO '20: 18th ACM/IEEE International Symposium on Code Generation and Optimization(CGO)   199 - 211   2020年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ACM  

    Stencil computation is one of the most widely-used compute patterns in high
    performance computing applications. Spatial and temporal blocking have been
    proposed to overcome the memory-bound nature of this type of computation by
    moving memory pressure from external memory to on-chip memory on GPUs. However,
    correctly implementing those optimizations while considering the complexity of
    the architecture and memory hierarchy of GPUs to achieve high performance is
    difficult. We propose AN5D, an automated stencil framework which is capable of
    automatically transforming and optimizing stencil patterns in a given C source
    code, and generating corresponding CUDA code. Parameter tuning in our framework
    is guided by our performance model. Our novel optimization strategy reduces
    shared memory and register pressure in comparison to existing implementations,
    allowing performance scaling up to a temporal blocking degree of 10. We achieve
    the highest performance reported so far for all evaluated stencil benchmarks on
    the state-of-the-art Tesla V100 GPU.

    DOI: 10.1145/3368826.3377904

    arXiv

    researchmap

    その他リンク: https://dblp.uni-trier.de/db/conf/cgo/cgo2020.html#MatsumuraZWEM20

  • AN5D: Automated Stencil Framework for High-Degree Temporal Blocking on GPUs.

    Kazuaki Matsumura, Hamid Reza Zohouri, Mohamed Wahib, Toshio Endo, Satoshi Matsuoka

    CoRR   abs/2001.01473   2020年

     詳細を見る

    掲載種別:研究論文(学術雑誌)  

    researchmap

    その他リンク: https://dblp.uni-trier.de/db/journals/corr/corr2001.html#abs-2001-01473

  • Profiling based Out-of-core Hybrid Method for Large Neural Networks

    Yuki Ito, Haruki Imai, Tung Le Duc, Yasushi Negishi, Kiyokuni Kawachiya, Ryo Matsumiya, Toshio Endo

    arXiv:1907.05013 [cs.LG]   2019年7月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

    researchmap

  • An Autotuning Framework for Scalable Execution of Tiled Code via Iterative Polyhedral Compilation 査読

    Yukinori Sato, Tomoya Yuki, Toshio Endo

    ACM Transactions on Architecture and Code Optimization   15 ( 4 )   1 - 23   2018年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)   出版者・発行元:Association for Computing Machinery (ACM)  

    On modern many-core CPUs, performance tuning against complex memory subsystems and scalability for parallelism is mandatory to achieve their potential. In this article, we focus on loop tiling, which plays an important role in performance tuning, and develop a novel framework that analytically models the load balance and empirically autotunes unpredictable cache behaviors through iterative polyhedral compilation using LLVM/Polly. From an evaluation on many-core CPUs, we demonstrate that our autotuner achieves a performance superior to those that use conventional static approaches and well-known autotuning heuristics. Moreover, our autotuner achieves almost the same performance as a brute-force search-based approach.

    DOI: 10.1145/3293449

    researchmap

    その他リンク: https://dl.acm.org/doi/pdf/10.1145/3293449

  • Scalable RMA-based Communication Library Featuring Node-local NVMs 査読

    Ryo Matsumiya, Toshio Endo

    2018 IEEE High Performance extreme Computing Conference (HPEC)   1 - 7   2018年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.1109/hpec.2018.8547546

    researchmap

  • Applying Recursive Temporal Blocking for Stencil Computations to Deeper Memory Hierarchy 査読

    Toshio Endo

    2018 IEEE 7th Non-Volatile Memory Systems and Applications Symposium (NVMSA)   19 - 24   2018年8月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.1109/nvmsa.2018.00016

    researchmap

  • Exhaustive evaluation of memory-latency sensitivity on manycore processors with large cache 査読

    Noboru Tanabe, Toshio Endo

    Proceedings of the 2nd International Conference on High Performance Compilation, Computing and Communications   27 - 34   2018年3月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ACM  

    DOI: 10.1145/3195612.3195616

    researchmap

    その他リンク: https://dl.acm.org/doi/pdf/10.1145/3195612.3195616

  • Characterizing Memory-Latency Sensitivity of Sparse Matrix Kernels 査読

    Noboru Tanabe, Toshio Endo

    2018 26th Euromicro International Conference on Parallel, Distributed and Network-based Processing (PDP)   249 - 254   2018年3月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.1109/pdp2018.2018.00042

    researchmap

  • ooc_cuDNN: Accommodating convolutional neural networks over GPU memory capacity 査読

    Yuki Ito, Ryo Matsumiya, Toshio Endo

    2017 IEEE International Conference on Big Data (Big Data)   2017年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.1109/bigdata.2017.8257926

    researchmap

  • HPCとビッグデータ・AIを融合するグリーン・クラウドスパコンTSUBAME3.0の概要

    松岡聡, 遠藤敏夫, 額田彰, 三浦信一, 野村哲弘, 佐藤仁, 實本英之, DROZD Aleksandr

    Tsubame e-Science Journal   16   02‐08 (JA),20‐27 (EN) - 9   2017年11月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(大学,研究機関等紀要)  

    J-GLOBAL

    researchmap

  • Applying Temporal Blocking with a Directive-based Approach 査読

    Shota Kuroda, Toshio Endo, Satoshi Matsuoka

    Proceedings of the Fourth Workshop on the LLVM Compiler Infrastructure in HPC   1 - 11   2017年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ACM  

    DOI: 10.1145/3148173.3148190

    researchmap

    その他リンク: https://dl.acm.org/doi/pdf/10.1145/3148173.3148190

  • GPUメモリを超える大規模計算の実現に向けたステンシル計算のためのフレームワークの開発 査読

    下川辺 隆史, 遠藤 敏夫, 小野寺 直幸, 青木 尊之

    Proceedings of 2017 IEEE International Conference on Cluster Computing (IEEE Cluster 2017) (Internet)   525 - 529   2017年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    ステンシルに基づくCFDコードは、規則的なメモリアクセスを持つため、GPUで高い性能を得ることができる。しかしながら、GPUはCPUと比較して、メモリ容量が小さいため、CPUと同様の大きさの問題を解くことができない。そこで、本研究では、CPUのホストメモリとCPUのデバイスメモリの局所性を向上させることが可能な、テンポラルブロッキング法を用いることで、GPUのメモリ容量を超える大きさの計算を可能とした。本研究で開発したフレームワークでは、複雑なコーディングは必要とせずに、テンポラルブロッキング法を含む並列計算用のコードを生成できる。フレームワークを用いて開発した気流解析コードでは、TSUBAME2.5において、GPUのメモリ容量の2倍の計算規模においても、通常のメモリ容量の計算の80\%程度の実効性能を達成した。

    DOI: 10.1109/cluster.2017.97

    researchmap

  • An Accurate Simulator of Cache-Line Conflicts to Exploit the Underlying Cache Performance 査読

    Yukinori Sato, Toshio Endo

    Proceedings of 23rd International European Conference on Parallel and Distributed Computing (Euro-par 2017)   119 - 133   2017年8月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:Springer International Publishing  

    DOI: 10.1007/978-3-319-64203-1_9

    researchmap

  • HPCとビッグデータ・AIを融合するグリーン・クラウドスパコンTSUBAME3.0の概要

    松岡聡, 遠藤敏夫, 額田彰, 三浦信一, 野村哲弘, 佐藤仁, 實本英之, DROZD Aleksandr

    情報処理学会研究報告(Web)   2017 ( HPC-160 )   Vol.2017‐HPC‐160,No.29,1‐6 (WEB ONLY)   2017年7月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    J-GLOBAL

    researchmap

  • ExanaDBT: A Dynamic Compilation System for Transparent Polyhedral Optimizations at Runtime 査読

    Yukinori Sato, Tomoya Yuki, Toshio Endo

    Proceedings of the Computing Frontiers Conference   191 - 200   2017年5月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ACM  

    DOI: 10.1145/3075564.3077627

    researchmap

    その他リンク: https://dl.acm.org/doi/pdf/10.1145/3075564.3077627

  • Evaluating the impacts of code-level performance tunings on power efficiency 査読

    Satoshi Imamura, Keitaro Oka, Yuichiro Yasui, Yuichi Inadomi, Katsuki Fujisawa, Toshio Endo, Koji Ueno, Keiichiro Fukazawa, Nozomi Hata, Yuta Kakibuka, Koji Inoue, Takatsugu Ono

    2016 IEEE International Conference on Big Data (Big Data)   362 - 369   2016年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.1109/bigdata.2016.7840624

    researchmap

  • PGAS Communication Runtime for Extreme Large Data Computation 査読

    Ryo Matsumiya, Toshio Endo

    2016 Second International Workshop on Extreme Scale Programming Models and Middlewar (ESPM2)   10 - 16   2016年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.1109/espm2.2016.007

    researchmap

  • Realizing Out-of-Core Stencil Computations Using Multi-tier Memory Hierarchy on GPGPU Clusters 査読

    Toshio Endo

    2016 IEEE International Conference on Cluster Computing (CLUSTER)   21 - 29   2016年9月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.1109/cluster.2016.61

    researchmap

  • From FLOPS to BYTES: Disruptive change in high-performance computing towards the post-moore era 査読

    Satoshi Matsuoka, Hideharu Amano, Kengo Nakajima, Koji Inoue, Tomohiro Kudoh, Naoya Maruyama, Kenjiro Taura, Takeshi Iwashita, Takahiro Katagiri, Toshihiro Hanawa, Toshio Endo

    2016 ACM International Conference on Computing Frontiers - Proceedings   274 - 281   2016年5月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:Association for Computing Machinery, Inc  

    DOI: 10.1145/2903150.2906830

    Scopus

    researchmap

    その他リンク: http://dblp.uni-trier.de/db/conf/cd/cf2016.html#conf/cd/MatsuokaANIKMTI16

  • Advanced Computing and Optimization Infrastructure for Extremely Large-Scale Graphs on Post Peta-Scale Supercomputers. 査読

    Katsuki Fujisawa, Toshio Endo, Yuichiro Yasui

    Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)   9725   265 - 274   2016年3月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1007/978-3-319-42432-3_33

    Web of Science

    Scopus

    researchmap

    その他リンク: https://dblp.uni-trier.de/db/conf/icms/icms2016.html#FujisawaEY16

  • Dynamic Compilation for Transparent Data Locality Analysis and Memory Subsystem Tuning 査読

    Yukinori Sato, Toshio Endo

    The International Workshop on Architectural and Micro-Architectural Support for Dynamic Optimization (AMAS-DO)   2016年3月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    researchmap

  • A Cache-aware Temporal Blocking Method for 3D Stencil Computation 査読

    Shimpei Sato, Yukinori Sato, Toshio Endo

    3rd International Workshop on High-Performance Stencil Computations (HiStencils 2016), In conjunction with HiPEAC 2016   2016年1月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    researchmap

  • The scalable petascale data-driven approach for the Cholesky factorization with multiple GPUs. 査読

    Yuki Tsujita, Toshio Endo, Katsuki Fujisawa

    Proceedings of ESPM2 2015: 1st International Workshop on Extreme Scale Programming Models and Middleware - Held in conjunction with SC 2015: The International Conference for High Performance Computing, Networking, Storage and Analysis   38 - 45   2015年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ACM  

    DOI: 10.1145/2832241.2832245

    Scopus

    researchmap

    その他リンク: https://dblp.uni-trier.de/db/conf/sc/espm2015.html#TsujitaEF15

  • Exana: an execution-driven application analysis tool for assisting productive performance tuning 査読

    Yukinori Sato, Shimpei Sato, Toshio Endo

    Proceedings of the 2nd International Workshop on Software Engineering for Parallel Systems   1 - 10   2015年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ACM  

    DOI: 10.1145/2837476.2837477

    researchmap

    その他リンク: https://dl.acm.org/doi/pdf/10.1145/2837476.2837477

  • Investigating potential performance benefits of memory layout optimization based on roofline model 査読

    Shimpei Sato, Yukinori Sato, Toshio Endo

    Proceedings of the 2nd International Workshop on Software Engineering for Parallel Systems   50 - 56   2015年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ACM  

    DOI: 10.1145/2837476.2837483

    researchmap

    その他リンク: https://dl.acm.org/doi/pdf/10.1145/2837476.2837483

  • Advanced Computing and Optimization Infrastructure for Extremely Large-Scale Graphs on Post Peta-Scale Supercomputers 査読

    Katsuki Fujisawa, Toyotaro Suzumura, Hitoshi Sato, Koji Ueno, Yuichiro Yasui, Keita Iwabuchi, Toshio Endo

    Optimization in the Real World - Toward Solving Real-World Optimization Problems -, Series of Mathematics for Industry   1 - 13   2015年9月

     詳細を見る

    記述言語:英語   掲載種別:論文集(書籍)内論文   出版者・発行元:Springer Japan  

    DOI: 10.1007/978-4-431-55420-2_1

    researchmap

  • TSUBAME2におけるスケジュール効率化への取り組みとユーザ動向の見える化

    野村哲弘, 野村哲弘, 佐々木淳, 三浦信一, 三浦信一, 遠藤敏夫, 遠藤敏夫, 松岡聡, 松岡聡

    情報処理学会研究報告(Web)   2015 ( HPC-150 )   VOL.2015-HPC-150,NO.2 (WEB ONLY)   2015年7月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    J-GLOBAL

    researchmap

  • Power Capping of CPU-GPU Heterogeneous Systems using Power and Performance Models 査読

    226 - 233   2015年5月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.5220/0005445102260233

    researchmap

  • Data Driven Scheduling Approach for the Multi-node Multi-GPU Cholesky Decomposition 査読

    Yuki Tsujita, Toshio Endo

    Proceedings of Workshop on Job Scheduling Strategies for Parallel Processing (JSSPP)   2015年5月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    researchmap

  • Realizing Extremely Large-Scale Stencil Applications on GPU Supercomputers 査読

    Toshio Endo, Yuki Takasaki, Satoshi Matsuoka

    2015 IEEE 21ST INTERNATIONAL CONFERENCE ON PARALLEL AND DISTRIBUTED SYSTEMS (ICPADS)   625 - 632   2015年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1109/ICPADS.2015.84

    Web of Science

    researchmap

  • Exploration of Lossy Compression for Application-level Checkpoint/Restart 査読

    Naoto Sasaki, Kento Sato, Toshio Endo, Satoshi Matsuoka

    2015 IEEE 29TH INTERNATIONAL PARALLEL AND DISTRIBUTED PROCESSING SYMPOSIUM (IPDPS)   914 - 922   2015年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1109/IPDPS.2015.67

    Web of Science

    researchmap

  • Efficient utilization of memory hierarchy to enable the computation on bigger domains for stencil computation in CPU-GPU based systems 査読

    Guanghao Jin, James Lin, Toshio Endo

    2014 International Conference on High Performance Computing and Applications (ICHPCA)   1 - 6   2014年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.1109/ichpca.2014.7045354

    researchmap

  • Software technologies coping with memory hierarchy of GPGPU clusters for stencil computations 査読

    Toshio Endo, Guanghao Jin

    2014 IEEE International Conference on Cluster Computing (CLUSTER)   132 - 139   2014年9月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.1109/cluster.2014.6968747

    researchmap

  • 実アプリケーションを用いた計算機評価ベンチマークと性能リポジトリの開発

    野村哲弘, 三浦信一, 遠藤敏夫, 松岡聡

    研究報告ハイパフォーマンスコンピューティング(HPC)   2014 ( 29 )   1 - 7   2014年7月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)   出版者・発行元:一般社団法人情報処理学会  

    次世代スーパーコンピュータのアーキテクチャ開発における課題として,提案アーキテクチャのもとで実行したい実アプリケーションが十分な性能で動作するかを見積もることが挙げられる.そのためには対象となるアプリケーションの汎用的な性能モデルを構築する必要があるが,そのための基礎データとなるアーキテクチャを横断した実アプリケーション性能データベースというものは作られておらず,個別のアプリケーションについてアプリケーション開発者とアーキテクチャ開発者が個別に性能を予測している現状がある.本稿ではアプリケーションおよびアーキテクチャによらず一般的に性能モデルを構築する変数となる性能計測項目を定義し,その一般的な計測方法と保存形式を定義することにより,アプリケーション開発者が独力で各自のプログラムの性能モデルを構築して比較検討ができる環境を整えた経過を報告すると同時に,計測結果を格納して第三者が客観的にアプリケーションとアーキテクチャの組み合わせの適否を判断するためのリポジトリを構築することを提案する.

    J-GLOBAL

    researchmap

  • An evaluation of the potential of flash SSD as large and slow memory for stencil computations 査読

    Hiroko Midorikawa, Hideyuki Tan, Toshio Endo

    2014 International Conference on High Performance Computing & Simulation (HPCS)   268 - 277   2014年7月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.1109/hpcsim.2014.6903695

    researchmap

  • Petascale general solver for semidefinite programming problems with over two million constraints 査読

    Katsuki Fujisawa, Toshio Endo, Yuichiro Yasui, Hitoshi Sato, Naoki Matsuzawa, Satoshi Matsuoka, Hayato Waki

    Proceedings of the International Parallel and Distributed Processing Symposium, IPDPS   1171 - 1180   2014年5月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1109/IPDPS.2014.121

    Web of Science

    Scopus

    researchmap

  • TSUBAME-KFC: a Modern Liquid Submersion Cooling Prototype towards Exascale Becoming the Greenest Supercomputer in the World 査読

    Toshio Endo, Akira Nukada, Satoshi Matsuoka

    2014 20TH IEEE INTERNATIONAL CONFERENCE ON PARALLEL AND DISTRIBUTED SYSTEMS (ICPADS)   360 - 367   2014年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1109/padsw.2014.7097829

    Web of Science

    researchmap

  • Accelerating Quantum Chemistry Calculations with Graphical Processing Units - Toward in High-Density (HD) Silico Drug Discovery 査読

    Yohsuke Hagiwara, Kazuki Ohno, Masaya Orita, Ryota Koga, Toshio Endo, Yutaka Akiyama, Masakazu Sekijima

    CURRENT COMPUTER-AIDED DRUG DESIGN   9 ( 3 )   396 - 401   2013年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.2174/15734099113099990031

    Web of Science

    PubMed

    researchmap

  • システム評価のためのアプリケーション性能リポジトリの構築と性能モデルの評価

    野村哲弘, 三浦信一, 遠藤敏夫, 松岡聡, 鈴木惣一朗, 丸山直也

    研究報告ハイパフォーマンスコンピューティング(HPC)   2013 ( 4 )   1 - 6   2013年7月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)   出版者・発行元:一般社団法人情報処理学会  

    次世代スーパーコンピュータの開発に向けて実アプリケーション本位でのシステムデザインを行うためには,アーキテクチャと実アプリケーション実行性能を結びつける標準ベンチマークやパフォーマンスモデルが必要となるが,そのようなものはいまだ実現されていない.本報告では,将来 HPCI システムのあり方の調査研究 「アプリケーション分野」 におけるシステム評価用ベンチマークと性能モデルの作成について紹介する.本研究では,実アプリケーションコードの提供を受けてコードを単純化した 「ミニアプリ」 を作成し,ベンチマーク・性能モデルの基礎とする.また,複数の HPCI システム上で動作する性能評価ツールを用いてベンチマーク結果を収集し,性能モデルを構築するための基礎データとするとともに,性能モデルの構築方法・表現形式について考察する.

    J-GLOBAL

    researchmap

  • A Multi-Level Optimization Method for Stencil Computation on the Domain that is Bigger than Memory Capacity of GPU 査読

    Guanghao Jin, Toshio Endo, Satoshi Matsuoka

    2013 IEEE International Symposium on Parallel & Distributed Processing, Workshops and Phd Forum   1080 - 1087   2013年5月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.1109/ipdpsw.2013.58

    researchmap

  • Tsubame2.0: The first petascale supercomputer in japan and the greatest production in the world

    Satoshi Matsuoka, Takayuki Aoki, Toshio Endo, Hitoshi Sato, Shin'Ichiro Takizawa, Akihiko Nomura, Kento Sato

    Contemporary High Performance Computing: From Petascale toward Exascale   525 - 555   2013年1月

     詳細を見る

    掲載種別:論文集(書籍)内論文  

    Scopus

    researchmap

  • A Parallel Optimization Method for Stencil Computation on the Domain that is Bigger than Memory Capacity of GPUs 査読

    Guanghao Jin, Toshio Endo, Satoshi Matsuoka

    2013 IEEE INTERNATIONAL CONFERENCE ON CLUSTER COMPUTING (CLUSTER)   1 - 8   2013年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1109/cluster.2013.6702633

    Web of Science

    researchmap

  • TSUBAME2.0におけるMulti-rail InfiniBandネットワークの性能評価

    野村 哲弘, Nomura Akihiro, 遠藤 敏夫, Endo Toshio, 松岡 聡, MATSUOKA SATOSHI

    情報処理学会研究報告   ( 2012 )   2012年12月

     詳細を見る

    記述言語:日本語   出版者・発行元:情報処理学会  

    researchmap

  • High-performance general solver for extremely large-scale semidefinite programming problems 査読

    Katsuki Fujisawa, Hitoshi Sato, Satoshi Matsuoka, Toshio Endo, Makoto Yamashita, Maho Nakata

    International Conference for High Performance Computing, Networking, Storage and Analysis, SC   93 - 93   2012年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1109/SC.2012.67

    Web of Science

    Scopus

    researchmap

    その他リンク: http://dl.acm.org/citation.cfm?id=2389122

  • Petaflop biofluidics simulations on a two million-core system 査読

    Massimo Bernaschi, Mauro Bisson, Toshio Endo, Satoshi Matsuoka, Massimiliano Fatica, Simone Melchionna

    Proceedings of 2011 International Conference for High Performance Computing, Networking, Storage and Analysis   1 - 12   2011年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ACM  

    DOI: 10.1145/2063384.2063389

    researchmap

    その他リンク: https://dl.acm.org/doi/pdf/10.1145/2063384.2063389

  • Molecular Dynamics Simulation of a Biomolecule with High Speed, Low Power and Accuracy Using GPU-Accelerated TSUBAME2.0 Supercomputer 査読

    Shiqiao Du, Takuro Udagawa, Toshio Endo, Masakazu Sekijima

    Proceedings of Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2011)   2011年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    researchmap

  • Peta-scale phase-field simulation for dendritic solidification on the TSUBAME 2.0 supercomputer 査読

    Takashi Shimokawabe, Takayuki Aoki, Tomohiro Takaki, Akinori Yamanaka, Akira Nukada, Toshio Endo, Naoya Maruyama, Satoshi Matsuoka

    Proceedings of 2011 SC - International Conference for High Performance Computing, Networking, Storage and Analysis   1 - 11   2011年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ACM  

    DOI: 10.1145/2063384.2063388

    Scopus

    researchmap

    その他リンク: https://dl.acm.org/doi/pdf/10.1145/2063384.2063388

  • An 80-fold speedup, 15.0 TFlops GPU acceleration of non-hydrostatic weather model ASUCA production code 査読

    Takashi Shimokawabe, Takayuki Aoki, Chiashi Muroi, Junichi Ishida, Kohei Kawano, Toshio Endo, Akira Nukada, Naoya Maruyama, Satoshi Matsuoka

    2010 ACM/IEEE International Conference for High Performance Computing, Networking, Storage and Analysis, SC 2010   2010年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1109/SC.2010.9

    Scopus

    researchmap

  • 異種アクセラレータを持つTSUBAMEスーパーコンピュータのLinpack評価(<特集>GPGPUコンピューティングの数理)

    遠藤 敏夫, 額田 彰, 松岡 聡

    応用数理   20 ( 2 )   117 - 124   2010年

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 日本応用数理学会  

    グラフィックプロセッサ(GPU)とSIMD型ClearSpeedアクセラレータを備えたハイブリッド型スパコンである東工大TSUBAMEにおけるLinpackベンチマークの実行について報告する.TSUBAMEの約10000のOpteronコア,640のXeonコア,648基のClearSpeedアクセラレータ,624基のNVIDIA Tesla GPUを全て用いたLinpack実行において,87 TFlopsを達成した.この性能の実現のために必要であった,アクセラレータの特性を考慮したアルゴリズム設計やチューニングについて報告する.ハイブリッド型スパコンとしてはRoadRunnerが挙げられるが,その上のLinpack実装方針と我々のものでは大きく変える必要があった.その点についてもシステムアーキテクチャの観点から議論する.

    DOI: 10.11540/bjsiam.20.2_117

    CiNii Books

    researchmap

  • 増分データとErasure Codingを利用した高速なチェックポイント手法

    實本 英之, 中村 俊介, 遠藤 敏夫, 松岡 聡

    研究報告ハイパフォーマンスコンピューティング(HPC)   2009 ( 9 )   1 - 6   2009年10月

     詳細を見る

    記述言語:日本語   出版者・発行元:情報処理学会  

    チェックポイント/リスタート手法は多くの大規模 HPC システムで利用されている耐故障機能である。しかし、近年の大規模 HPC システムのメモリサイズの急速な増大に比べ、並列ファイルシステムの I/O 帯域の増大は相対的に低いため、チェックポイント時間が増加してしまう問題がある。本研究では、チェックポイントのオーバヘッドを低く抑えつつ多重故障に対応することを目的とし、Erasure Coding を採用する。処理のボトルネックを避けるために Erasure Coding の符号演算処理を並列化し、かつ並列ファイルシステムの代わりにノードのローカルストレージにプロセスイメージを格納する。さらにプロセスイメージの大きさを削減するために、Incremental Checkpoint 手法を採用する。この手法はチェックポイント時に前回のプロセスイメージとの差分部分を記憶するものである。並列環境において行列積演算および NPB LU ベンチマークを用いた実験の結果、Incremental Checkpoint を用いたときに 28-84% の性能向上を確認した。Checkpointing/restarting is a well-known method as a fault tolerance mechanism in large scale HPC systems. However, overhead of this method tends to get larger, since memory size of recent systems is increasing rapidly, while the improvement of I/O bandwidth of file systems is relatively mild. The purpose of this work is to achieve checkpointing that supports multiple faults with low overhead by utilizing erasure coding. To eliminate the bottleneck, we parallelize encoding and store process images into node-local storage instead of shared file systems. Furthermore, to reduce sizes of process images, we adopt incremental checkpointing, which stores only parts of the process image that are modified since the previous checkpointing. Through parallel experiments using matrix multiply computation and NPB LU benchmark, we have observed 28 to 84% performance improvement by introducing incremental checkpointing.

    researchmap

  • 次世代光インターコネクトでのMPI通信に関する研究

    滝澤 真一朗, 遠藤 敏夫, 松岡 聡

    コンピュータソフトウェア   26 ( 3 )   5 - 19   2009年7月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本ソフトウェア科学会  

    DOI: 10.11309/jssst.26.3_5

    CiNii Books

    researchmap

  • Power-Aware Dynamic Task Scheduling for Heterogeneous Accelerated Clusters

    Tomoaki Hamano, Toshio Endo, Satoshi Matsuoka

    2009 IEEE INTERNATIONAL SYMPOSIUM ON PARALLEL & DISTRIBUTED PROCESSING, VOLS 1-5   1912 - 1919   2009年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Web of Science

    researchmap

  • File Clustering Based Replication Algorithm in a Grid Environment 査読

    Hitoshi Sato, Satoshi Matsuoka, Toshio Endo

    CCGRID: 2009 9TH IEEE INTERNATIONAL SYMPOSIUM ON CLUSTER COMPUTING AND THE GRID   204 - 211   2009年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1109/CCGRID.2009.73

    Web of Science

    researchmap

  • Bandwidth intensive 3-D FFT kernel for GPUs using CUDA 査読

    A. Nukada, Y. Ogata, T. Endo, S. Matsuoka

    2008 SC - International Conference for High Performance Computing, Networking, Storage and Analysis   1 - 11   2008年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1109/sc.2008.5213210

    Web of Science

    researchmap

  • Massive supercomputing coping with heterogeneity of modern accelerators 査読

    Toshio Endo, Satoshi Matsuoka

    2008 IEEE INTERNATIONAL SYMPOSIUM ON PARALLEL & DISTRIBUTED PROCESSING, VOLS 1-8   1179 - 1188   2008年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Web of Science

    researchmap

  • Locality aware MPI communication on a commodity opto-electronic hybrid network 査読

    Shin'ichiro Takizawa, Toshio Endo, Satoshi Matsuoka

    2008 IEEE INTERNATIONAL SYMPOSIUM ON PARALLEL & DISTRIBUTED PROCESSING, VOLS 1-8   2158 - +   2008年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Web of Science

    researchmap

  • An efficient, model-based CPU-GPU heterogeneous FFT library 査読

    Yasuhito Ogata, Toshio Endo, Naoya Maruyama, Satoshi Matsuoka

    2008 IEEE INTERNATIONAL SYMPOSIUM ON PARALLEL & DISTRIBUTED PROCESSING, VOLS 1-8   380 - +   2008年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Web of Science

    researchmap

  • Access-Pattern and Bandwidth Aware File Replication Algorithm in a Grid Environment 査読

    Hitoshi Sato, Satoshi Matsuoka, Toshio Endo, Naoya Maruyama

    2008 9TH IEEE/ACM INTERNATIONAL CONFERENCE ON GRID COMPUTING   250 - 257   2008年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Web of Science

    researchmap

  • Performance evaluation of parallel applications on next generation memory architecture with power-aware paging method 査読

    Yuto Hosogaya, Toshio Endo, Satoshi Matsuoka

    2008 IEEE INTERNATIONAL SYMPOSIUM ON PARALLEL & DISTRIBUTED PROCESSING, VOLS 1-8   862 - 869   2008年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Web of Science

    researchmap

  • 性能モデルに基づくCPU及びGPUを併用する効率的なFFTライブラリ

    尾形泰彦, 遠藤敏夫, 丸山直也, 松岡聡

    情報処理学会論文誌コンピューティングシステム   1 ( 1 )   40 - 50   2008年

     詳細を見る

  • ABARIS: An Adaptable Fault Detection/Recovery Component Framework for MPIs. 査読

    Hideyuki Jitsumoto, Toshio Endo, Satoshi Matsuoka

    21th International Parallel and Distributed Processing Symposium (IPDPS 2007), Proceedings, 26-30 March 2007, Long Beach, California, USA   1 - 8   2007年

     詳細を見る

    出版者・発行元:IEEE  

    DOI: 10.1109/IPDPS.2007.370603

    researchmap

  • High-performance MPI broadcast algorithm for grid environments utilizing multi-lane NICs 査読

    Tatsuhiro Chiba, Toshio Endo, Satoshi Matsuoka

    CCGRID 2007: SEVENTH IEEE INTERNATIONAL SYMPOSIUM ON CLUSTER COMPUTING AND THE GRID   487 - +   2007年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Web of Science

    researchmap

▼全件表示

書籍等出版物

MISC

  • スーパーコンピュータTSUBAME3.0におけるAlphaFoldのデータベースの保存方法の変更とHHblitsの最適化による性能向上

    藤田隼斗, 野村哲弘, 遠藤敏夫, 遠藤敏夫, 関嶋政和

    情報処理学会研究報告(Web)   2023 ( MPS-144 )   2023年

     詳細を見る

  • センサー情報を意識したジョブスケジューリング実現のための標準ジョブ履歴スキーマの提案

    野村, 哲弘, Nomura, Akihiro, 遠藤, 敏夫, Endo, Toshio

    情報処理学会研究報告   HPC-178 ( No. 14 )   1 - 8   2021年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 情報処理学会  

    identifier:oai:t2r2.star.titech.ac.jp:50567350

    CiNii Research

    researchmap

  • TSUBAME2におけるジョブスケジューリング効率化への取り組みと検証

    野村, 哲弘, Nomura, Akihiro, 佐々木, 淳, Sasaki, Atsushi, 三浦, 信一, Miura, Shinichi, 遠藤, 敏夫, Endo, Toshio, 松岡, 聡, MATSUOKA, SATOSHI

    大学ICT推進協議会 2015年度年次大会 企画セッション HPCテクノロジー   2015年12月

     詳細を見る

    記述言語:日本語  

    identifier:oai:t2r2.star.titech.ac.jp:50307764

    CiNii Research

    researchmap

  • 計算科学と計算機科学のコデザインのためのミニアプリ(ミニアプリ集FIBERの紹介/アプリケーションのEmpiricalな性能モデル構築のためのプロファイル情報の収集/FIBERミニアプリの性能およびそのモデル化)

    丸山, 直也, 鈴木, 惣一朗, 三上, 和徳, 小村, 幸浩, 滝澤, 真一朗, 松田, 元彦, 野村, 哲弘, 三浦, 信一, 遠藤, 敏夫, 松岡, 聡

    ハイパフォーマンスコンピューティングと計算科学シンポジウム論文集   2015   107 - 108   2015年5月

     詳細を見る

    記述言語:日本語   出版者・発行元:情報処理学会  

    我々は計算科学アプリケーションを簡略したプログラムであるミニアプリの開発および整備を進めている.ミニアプリは元のフルセットのアプリケーションから評価に本質的に不要な部分を省いた簡略化したものであり,計算機科学研究開発における評価を迅速に進めることを目的としたツールとして開発・整備を進めている.HPC における計算機科学研究では実際のアプリケーションを用いた評価を行うことが望まれるが,往々にして実際のアプリケーションは広く入手可能なものとは限らず,評価に用いるためにはハードルが高い.我々のミニアプリ集である FIBER は原則としてソースコードが自由に入手可能であり,利用のための制限を設けていない点が特徴である (http://fiber-miniapp.github.io/).本セッションではまず我々のミニアプリを紹介し,続いてその性能評価およびモデル化に関する取り組みを紹介する.本セッションによってミニアプリを計算機科学研究における今後の評価に役立つツールとして広く普及することを狙う.また計算科学研究者には今後のミニアプリ集の拡充に協力を呼びかける場となることを狙う.

    CiNii Research

    researchmap

    その他リンク: http://id.nii.ac.jp/1001/00141717/

講演・口頭発表等

  • An Optimization Technique for Hiding Communication Costs in 3D Parallel Training of Deep Learning 国際共著 国際会議

    Ryubu Hosoki, Kento Sato, Toshio Endo, Julien Bigot, Edouard Audit

    2025 IEEE 25th International Symposium on Cluster, Cloud and Internet Computing (CCGrid)  2025年5月  IEEE

     詳細を見る

    開催年月日: 2025年5月

    記述言語:英語   会議種別:口頭発表(一般)  

    researchmap

  • Polyhedral Rescheduling of GPU Kernels To Exploit Async Memory Movement 国際共著 国際会議

    Ivan R. Ivanov, William Moses, Emil Vatai, Toshio Endo, Jens Domke, Oleksandr Zinenko

    Ninth LLVM Performance Workshop at CGO  2025年3月 

     詳細を見る

    開催年月日: 2025年3月

    記述言語:英語   会議種別:口頭発表(一般)  

    researchmap

  • Challenges in Computing Resource Sharing Towards Next-Gen Interactive Accelerated HPC 国際会議

    Toshio Endo, Shohei Minami, Akihiro Nomura, Hiroki Ohtsuji, Jun Kato, Masahiro Miwa, Eiji Yoshida, Tomoya Yuki, Ryuichi Sakamoto

    Interactive and Urgent High-Performance Computing (CIW-IUS), in conjunction with ISC24, LNCS 15058  2024年12月  Springer Nature Switzerland

     詳細を見る

    開催年月日: 2024年12月

    記述言語:英語   会議種別:口頭発表(一般)  

    researchmap

  • TSUBAME4.0の処理量担保のための計算ノード分割

    野村 哲弘, 遠藤 敏夫

    2024年度大学ICT推進協議会(AXIES)年次大会, 10AM2C-5  2024年12月 

     詳細を見る

    開催年月日: 2024年12月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • TSUBAME4.0: HPC-AI時代に向けた東京科学大学のもっとみんなのスパコン

    安良岡由規, 遠藤敏夫, 野村哲弘, 渡邊 寿雄, 鶴見 慶

    2024年度大学ICT推進協議会(AXIES)年次大会, 10AM1C-1  2024年12月 

     詳細を見る

    開催年月日: 2024年12月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • System Research on TSUBAME Supercomputer Series in Tokyo Tech and Science Tokyo 招待 国際会議

    Toshio Endo

    Co-Creation Monthly Seminar, Fujitsu-Co-Creation Research Lab at the University of Toronto  2024年11月 

     詳細を見る

    開催年月日: 2024年11月

    記述言語:英語   会議種別:公開講演,セミナー,チュートリアル,講習,講義等  

    researchmap

  • Asynchronous I/O Optimization for X-ray Imaging via GPUDirect Storage 国際共著 国際会議

    Du Wu, Peng Chen, Yiyu Tan, Yusuke Tanimura, Toshio Endo, Satoshi Matsuoka, Mohamed Wahib

    2024 IEEE International Conference on Cluster Computing (CLUSTER 2024)  2024年9月 

     詳細を見る

    開催年月日: 2024年9月

    記述言語:英語   会議種別:ポスター発表  

    researchmap

  • Investigating Nvidia GPU Architecture Trends via Microbenchmarks 国際共著 国際会議

    Lingqi Zhang, Ryan Barton, Peng Chen, Xiao Wang, Toshio Endo, Satoshi Matsuoka, Mohamed Wahib

    2024 IEEE International Conference on Cluster Computing (CLUSTER 2024)  2024年9月 

     詳細を見る

    開催年月日: 2024年9月

    記述言語:英語   会議種別:ポスター発表  

    researchmap

  • An optimization pass for training speed-up and strategy search in 3D parallelism 国際共著 国際会議

    Ryubu Hosoki, Kento Sato, Toshio Endo, Julien Bigot, Edouard Audit

    2024 IEEE International Conference on Cluster Computing (CLUSTER 2024)  2024年9月 

     詳細を見る

    開催年月日: 2024年9月

    記述言語:英語   会議種別:ポスター発表  

    researchmap

  • Communication Optimization for Distributed GCN Training on ABCI Supercomputer . 2024 IEEE International Conference on Cluster Computing (CLUSTER 2024) poster session, Kobe, Sep 24-27, 2024. 国際共著 国際会議

    Chen Zhuang, Peng Chen, Xin Liu, Toshio Endo, Satoshi Matsuoka, Mohamed Wahib

    2024 IEEE International Conference on Cluster Computing (CLUSTER 2024)  2024年9月 

     詳細を見る

    開催年月日: 2024年9月

    記述言語:英語   会議種別:ポスター発表  

    researchmap

  • HPC-AI時代に向けたもっとみんなのスパコンTSUBAME4.0

    遠藤 敏夫, 野村 哲弘, 渡邊 寿雄, 安良岡 由規, 鶴見 慶

    並列/分散/協調処理に関するサマーワークショップ(SWoPP2024), 情報処理学会研究報告  2024年8月 

     詳細を見る

    開催年月日: 2024年8月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • Leveraging GPUDirect Storage for Efficient Image Reconstruction

    Du Wu, Peng Chen, Toshio Endo, Satoshi Matsuoka, Mohamed Wahib

    Summer United Workshops on Parallel, Distributed and Cooperative Processing (SWoPP 2024), IPSJ SIG Technical Report  2024年8月 

     詳細を見る

    開催年月日: 2024年8月

    記述言語:英語   会議種別:口頭発表(一般)  

    researchmap

  • High-performance Graph Convolutional Networks Training on Fugaku and ABCI Supercomputers 国際共著

    Chen Zhuang, Peng Chen, Xin Liu, Rio Yokota, Toshio Endo, Satoshi Matsuoka, Mohamed Wahib

    Summer United Workshops on Parallel, Distributed and Cooperative Processing (SWoPP 2024), IPSJ SIG Technical Report  2024年8月 

     詳細を見る

    開催年月日: 2024年8月

    記述言語:英語   会議種別:口頭発表(一般)  

    researchmap

  • FRUGAL: Reducing GPU Memory Requirement of HPC Applications

    Tengfei Wang, Lingqi Chang, Ivan Ivanov, Peng Chen, Toshio Endo, Mohamed Wahib

    Summer United Workshops on Parallel, Distributed and Cooperative Processing (SWoPP 2024), IPSJ SIG Technical Report  2024年8月 

     詳細を見る

    開催年月日: 2024年8月

    記述言語:英語   会議種別:口頭発表(一般)  

    researchmap

  • タンパク質構造予測プログラムOmegaFoldのマルチGPUを用いた高速化

    大沢 泰生, 遠藤 敏夫, 細木 隆豊

    Cross-disciplinary Workshop on Computing Systems, Infrastructures, and Programming (xSIG 2024)  2024年8月 

     詳細を見る

    開催年月日: 2024年8月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • スパコンTSUBAMEシリーズにおけるリソース分割戦略

    野村 哲弘, 遠藤 敏夫

    並列/分散/協調処理に関するサマーワークショップ(SWoPP2024), 情報処理学会研究報告  2024年8月 

     詳細を見る

    開催年月日: 2024年8月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • Experiences with making a power measurement and submission for TSUBAME4.0, Level 3 国際会議

    Toshio Endo, Akihiro Nomura

    EE HPC WG Workshop 2024  2024年6月 

     詳細を見る

    開催年月日: 2024年6月

    記述言語:英語   会議種別:口頭発表(一般)  

    researchmap

  • Real-time High-resolution X-Ray Computed Tomography 国際共著 国際会議

    Du Wu, Peng Chen, Xiao Wang, Issac Lyngaas, Takaaki Miyajima, Toshio Endo, Satoshi Matsuoka, Mohamed Wahib

    Proceedings of the 38th ACM International Conference on Supercomputing  2024年5月  ACM

     詳細を見る

    開催年月日: 2024年5月

    記述言語:英語   会議種別:口頭発表(一般)  

    researchmap

    その他リンク: https://dl.acm.org/doi/pdf/10.1145/3650200.3656634

  • ステンシル計算の時間ブロッキングフレームワークの実装と評価

    瓜生 侑, 遠藤 敏夫

    情報処理学会研究報告  2024年5月 

     詳細を見る

    開催年月日: 2024年5月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • An optimization pass for training speed-up and strategy search in 3D parallelism 国際共著

    Ryubu Hosoki, Kento Sato, Toshio Endo, Julien Bigot, Edouard Audit

    IPSJ SIG Technical Report  2024年5月 

     詳細を見る

    開催年月日: 2024年5月

    記述言語:英語   会議種別:口頭発表(一般)  

    researchmap

  • General and Scalable Framework for GCN Training on CPU-powered Supercomputers

    Chen Zhuang, Peng Chen, Xin Liu, Toshio Endo, Mohamed Wahib

    The 6th R-CCS International Symposium, poster session  2024年1月 

     詳細を見る

    開催年月日: 2024年1月

    記述言語:英語   会議種別:ポスター発表  

    researchmap

  • Optimizing Matrix Multiplication on Arm Architectures

    Du Wu, Peng Chen, Toshio Endo, Satoshi Matsuoka, Mohamed Wahib

    The 6th R-CCS International Symposium  2024年1月 

     詳細を見る

    開催年月日: 2024年1月

    記述言語:英語   会議種別:ポスター発表  

    researchmap

  • The Aggressive Oversubscribing Scheduling for Interactive Jobs on a Supercomputing System

    Shohei Minami, Toshio Endo, Akihiro Nomura

    The cross-disciplinary Workshop on Computing Systems, Infrastructures, and Programming (xSIG 2023)  2023年8月 

     詳細を見る

    開催年月日: 2023年8月

    記述言語:英語   会議種別:ポスター発表  

    researchmap

  • TSUBAMEスパコンシリーズのデータセンターとしての側面 招待

    遠藤 敏夫

    電子情報通信学会集積回路研究専門委員会 LSIとシステムのワークショップ2023  2023年5月 

     詳細を見る

    開催年月日: 2023年5月

    記述言語:日本語   会議種別:公開講演,セミナー,チュートリアル,講習,講義等  

    researchmap

  • Environmental-Aware Optimization of MPI Checkpointing Intervals

    Hideyuki Jitsumoto, Toshio Endo, Satoshi Matsuoka

    2008 IEEE INTERNATIONAL CONFERENCE ON CLUSTER COMPUTING  2008年9月 

     詳細を見る

    開催年月日: 2008年9月

    記述言語:英語   会議種別:ポスター発表  

    researchmap

▼全件表示

受賞

  • 平成24年度科学技術分野の文部科学大臣表彰(開発部門)

    2012年4月   文部科学省  

     詳細を見る

    「運用世界一グリーンペタスパコンの開発」について、松岡聡教授、青木尊之教授と共同受賞

    researchmap

  • 2011年度情報処理学会山下記念研究賞

    2012年3月   情報処理学会  

     詳細を見る

    受賞区分:国内学会・会議・シンポジウム等の賞 

    HOKKE-18発表論文「ヘテロ型スーパーコンピュータTSUBAME 2.0のLinpackによる性能評価」に対して授与

    researchmap

  • 2011 ACM Gordon Bell Prize Special Achievements in Scalability and Time-to-Solution

    2011年11月   ACM  

     詳細を見る

    受賞区分:国際学会・会議・シンポジウム等の賞 

    "Peta-scale Phase-Field Simulation for Dendritic Solidification on the TSUBAME 2.0 Supercomputer" (8 authors are awarded)

    researchmap

共同研究・競争的資金等の研究課題

  • スケーラブルな機械学習基盤ソフトウェア技術の省計算資源化への展開

    研究課題/領域番号:23K28059  2023年4月 - 2027年3月

    日本学術振興会  科学研究費助成事業  基盤研究(B)

    遠藤 敏夫, 坂本 龍一

      詳細を見る

    配分額:18460000円 ( 直接経費:14200000円 、 間接経費:4260000円 )

    researchmap

  • 異種アーキテクチャ並列環境におけるスケーラブルな機械学習基盤ソフトウェア技術

    研究課題/領域番号:20H04165  2020年4月 - 2023年3月

    日本学術振興会  科学研究費助成事業  基盤研究(B)

    遠藤 敏夫

      詳細を見る

    配分額:17550000円 ( 直接経費:13500000円 、 間接経費:4050000円 )

    以下の研究項目について研究を推進した。
    (a) 演算カーネルレベルのマルチコア/SIMD並列性の活用:本項目ではまず、ドメイン特化型言語(DSL)Halideにより、反復をまたぐブロッキング技術を含めたステンシルカーネルを対象とし、開発コストの低減とCPU/GPU上の高性能の両立が可能であることを示した。そしてハンドコーディングしたカーネルとの性能比較を行った。その中途成果について情報処理学会SWoPPで発表した。並行して、映像検出タスクの一種であるSingle Shot Detector (SSD)を対象とし、必要なカーネルを洗い出し、cuDNNなどの既存ライブラリのみでは不足であると判断した。そのため、SSDに必要なカーネルをCUDAで実装(現在はハンドコーディング)し、先行研究による実装よりも高速な実装を実現した。この内容について国際会議に投稿した。
    (b) 水平・垂直方向の演算・データスケジューリング:マルチGPU環境において、モデル並列とデータ並列を併用するハイブリッド並列を行うフレームワークのプロトタイプを完成させた。負荷バランスとAll-reduce対象プロセス数の低減が見込める一方、プロセス間の通信パターンが複雑になるために通信処理の順序やスレッド数が性能に大きく影響することを示した。それらの課題の改良を行い、情報処理学会SWoPPで発表した。引き続き、ニューラルネットワーク構造およびハードウェア構造を考慮したマッピングの改良の研究を進めている。並行して、音声認識手法であるAugment Adversarial Training (AAT)を主対象として、マルチGPUにおけるハイブリッド並列アルゴリズムを検討し、プロトタイプ実装を行った。
    以上の一部の研究は産総研・東工大 実社会ビッグデータ活用 オープンイノベーションラボラトリとの協働で行った。

    researchmap

  • ExaPath: Hierarchical Routing for Next-Gen Supercomputers and Beyond

    研究課題/領域番号:19H04119  2019年4月 - 2024年3月

    日本学術振興会  科学研究費助成事業  基盤研究(B)

    ドンケ イェンス, 遠藤 敏夫

      詳細を見る

    配分額:17160000円 ( 直接経費:13200000円 、 間接経費:3960000円 )

    In FY2020, the second year of the ExaPath project, we conducted two distinct studies for routing in HPC interconnects.
    The first published paper of this FY is a survey of data center and supercomputer networks, which investigates various aspects related to how multi-pathing is implemented in those systems, what type of routing they deploy, and how effectively utilize them for extensive communication loads. The survey with the title "High-Performance Routing with Multipathing and Path Diversity in Supercomputers and Data Centers" was published in the IEEE Transactions on Parallel and Distributed Systems journal.
    The second published work, a peer-reviewed poster, is based on a Bachelor's thesis of our intern from Tokyotech which was presented at the 3rd R-CCS International Symposium. This thesis and poster tackled the fault resiliency of lossless interconnects and how to perform rerouting of the network while preserving certain properties, such as deadlock-freedom.
    Furthermore, we collaborated with researchers of ETH Zurich to develop a real Slimfly testbed and deploy the routing we developed in the previous FY. Simultaneously, we supervised with a colleague from ETH a second Bachelor's thesis with the topic of routing low-diameter topologies.
    Lastly, we disseminated our research findings through invited talks at the ISC High Performance conference (ISC'20) in a focus session on 'Photonics & Interconnects' and discussed our work and related routing and network topics with colleagues from academia and industry at various meetings and conference.

    researchmap

  • 機械学習を用いた自律型スマートHPCデータセンター

    研究課題/領域番号:19H04121  2019年4月 - 2022年3月

    日本学術振興会  科学研究費助成事業  基盤研究(B)

    松葉 浩也, 高野 了成, 野村 哲弘, 三浦 信一, 遠藤 敏夫, 滝澤 真一朗

      詳細を見る

    配分額:17290000円 ( 直接経費:13300000円 、 間接経費:3990000円 )

    データセンターの運用の自動化のため、データセンターからのデータを取得して仮想空間上に再現する方法と、その仮想空間上で運用ポリシーを最適化する方法を研究した。
    前者のデータ取得については、機器によるデータフォーマットの違いやデータの用途に依存することなく、様々な運用に役立つ汎用的なデータを多くのデータセンターから収集できる一般的なデータフォーマットと保存形式を定義することに成功した。後者の運用最適化については、制御方法を自動的に学習する強化学習を用いてジョブスケジューリングを最適化することに成功すると共に、その学習の場としてスケジューリングや冷却設備のシミュレータを実装した。

    researchmap

  • ものづくりHPCアプリケーションのエクサスケールへの進化

    研究課題/領域番号:26220002  2014年5月 - 2019年3月

    日本学術振興会  科学研究費助成事業  基盤研究(S)

    青木 尊之, 森口 周二, 下川辺 隆史, 高木 知弘, 滝沢 研二, 小野寺 直幸, 額田 彰, 遠藤 敏夫

      詳細を見る

    配分額:188370000円 ( 直接経費:144900000円 、 間接経費:43470000円 )

    演算性能に対してメモリ帯域やノード間通信の性能が低いエクサスケールのスパコンにおいて、最もTime-to-Solutionが短くなるような数値計算手法の変更、計算高速化アルゴリズムの導入を行い、ものづくり系アプリケーションをエクサスケールで十分な実行性能が得られるように大きく進化させた。流体系アプリケーション、材料系アプリケーション、粒子系アプリケーションに陽解法および適合細分化格子法と動的負荷分散を導入し、Time-to-Solutionと計算規模を飛躍的に向上させ、エクサスケールのものづくりシミュレーションを実行することに対して十分な見通しを得た。

    researchmap

  • 10億並列・エクサスケールスーパーコンピュータの耐故障性基盤

    研究課題/領域番号:23220003  2011年4月 - 2016年3月

    日本学術振興会  科学研究費助成事業  基盤研究(S)

    松岡 聡, 實本 英之, 遠藤 敏夫, 佐藤 仁, 丸山 直也, 滝澤 真一朗, 佐藤 賢斗

      詳細を見る

    配分額:213720000円 ( 直接経費:164400000円 、 間接経費:49320000円 )

    エクサ(10の18乗)フロップス・10億並列のエクサスケール・スーパーコンピュータ実現には、規模の増大による故障率の増加に対応する必要がある。このための耐故障性基盤を確立することを目的として耐故障にかかわる複数の要素を対象とした複合的数理モデルの提案とそれを用いた軽量かつ高度な耐故障化手法を提案・評価した。また、開発したシステムの一部についてはオープンソースでの公開を行っている。

    researchmap

  • 情報爆発に対応する高度にスケーラブルなソフトウェア構成基盤

    研究課題/領域番号:18049015  2006年 - 2010年

    日本学術振興会  科学研究費助成事業  特定領域研究

    近山 隆, 湯淺 太一, 上田 和紀, 田浦 健次朗, 遠藤 敏夫, 横山 大作, 馬谷 誠二, 田浦 健次朗, 遠藤 敏夫, 横山 大作

      詳細を見る

    配分額:64600000円 ( 直接経費:64600000円 )

    爆発的に増加する大量の情報を効率的に扱うソフトウェアの構成には、広域に分散配置した高度な並列性を持つ情報システムを柔軟に記述できるソフトウェアの枠組が基本技術として必要となる。このためのプログラミング言語やミドルウェアのシステムと、複雑なソフトウェアの正当性を検証するためのシステムを対象に研究を進め、具体的なシステムを提案、設計、実装し、その性能を検証した。代表的成果ソフトウェアは公開している。

    researchmap

  • 広域分散環境における高性能で記述の容易な並列ブログラミングシステムに関する研究

    研究課題/領域番号:17700050  2005年 - 2006年

    日本学術振興会  科学研究費助成事業  若手研究(B)

    遠藤 敏夫

      詳細を見る

    配分額:3400000円 ( 直接経費:3400000円 )

    本研究の目的は,動的・ヘテロ・大遅延の特徴を持つ大規模分散環境向けの並列プログラミングシステムの設計・評価である.タスク間の複雑な依存関係が存在する計算に対応し,大規模環境の特性を考慮したプログラミング環境を対象とし,応用分散アルゴリズムも対象とした.本年度は,近年の高性能アーキテクチャの動向を踏まえ,マルチコア・マルチCPUやアクセラレータ,GPUによるヘテロ型アーキテクチャへ対応する技術の提案・評価を行った.具体的には,ヘテロなノード間において並列プロセス数の調整を行い,かつそれぞれはCPUもしくはアクセラレータにおいてカーネル部分の計算を行うことにより異種計算機資源を効率的に利用するものである.提案プログラミング手法の実装・評価を東京工業大学の大規模計算機であるTSUBAME上において行った.ノードは汎用CPUとClearSpeed SIMDアクセラレータという異種計算機資源を持つため,双方を効率的に利用するようにプロセス数の調整を,現状では手動で,行った.並列Linpackを用いた評価により,本手法が十分に大きな問題サイズを持つときにスケーラビリティが高い(weakly scalable)ことを示した.結果については電子情報通信学会研究会(招待講演として)や情報処理学会シンポジウムHPCS2007で発表を行い,また情報処理学会論文誌に採択された.本年度購入した物品のうち,小額備品のノート型パソコンについては,システムの実装や実験のために利用した.また備品のXeonサーバは,合計8CPUコアを備えるサーバであり,マルチコアアーキテクチャの性能評価のために利用した.

    researchmap

  • 移動コードを基本としたセキュアなプログラミング言語処理系

    研究課題/領域番号:12133203  2000年 - 2003年

    日本学術振興会  科学研究費助成事業  特定領域研究

    米澤 明憲, 大山 恵弘, 増原 英彦, 田浦 健次朗, 住井 英二郎, 遠藤 敏夫

      詳細を見る

    配分額:37800000円 ( 直接経費:37800000円 )

    移動コードを基本としたセキュアなプログラミング言語処理系について研究を行った。本研究では、プログラミング言語およびシステムソフトウェアの安全性にかかわる諸問題について、理論と実用の両面から研究を行った。まず、ソフトウェアの開発においてもっとも重要な要素であるプログラミング言語の様々な問題について、場当たり的な対症療法ではなく、堅固な理論にもとづく系統的な解決策を与えた。さらに、コンピュータ上でプログラムを実行する際に安全性を保証する基盤となるシステムソフトウェアに関しても、対象となるシステムへの深い理解にもとづく体系的な解決策によって問題を解決した。具体的には、C言語の安全な処理系Fail-Safe C、 Fail-Safe Cのためのインタフェース記述言語、型システムを利用して安全性を保証するOS Kernel Mode Linux、分散DoS攻撃からネットワークを守るシステムMoving Firewall、暗号ラムダ計算、文字列処理のための正規表現型、自己修復型リファレンスモニタ、プログラム部品間のアクセスをきめ細かく制御する機構、移動コードの記述を支援する言語処理系JavaGoおよびJavaGoX、Javaにおけるオブジェクト使用解析、動的型付き言語Schemeのためのリージョンベースのメモリ管理、分散計算におけるアクセス制御のための型システムなど、国内外から極めて高い評価を得ている研究実績を残した。本研究は、3つのソフトウェアの公開と30本近い査読つき論文の発表などを通じ、学術的・社会的に大きなインパクトを与え、日本ソフトウェア科学会や日経BP社から論文賞などの4つの賞を受賞した。

    researchmap

  • 高性能広域分散計算のための適応的な基盤ソフトウェア

    研究課題/領域番号:12308012  2000年 - 2002年

    日本学術振興会  科学研究費助成事業  基盤研究(A)

    米澤 明憲, 増原 英彦, 住井 英二郎, 田浦 健次朗, 小林 直樹, 遠藤 敏夫, 山本 泰宇, 大山 恵弘

      詳細を見る

    配分額:41120000円 ( 直接経費:36200000円 、 間接経費:4920000円 )

    本研究では、高性能なプログラム実行時処理系、とくに、実行時に判明する資源(CPU、メモリ、ネットワーク)の状況に適応して、常に良好な性能を発揮する処理系を構築することを目指した。主な成果は以下のとおりである。(1)並列言語で必要となる、共有データに対するアクセスの調停方法を、アプリケーションが持つ並列度に適応して選択し、常に良好なアクセスを行う方式を確立した(ACM PaCTに採択)。(2)分散計算において、ノードやネットワークの状況に応じて計算に参加するノードを変更できるフレームワークの設計と実装について提案を行った(ACM PPoPP, ACM/IEEE CCGridに採択)。(3)アプリケーションが必要とする計算・通信比と、与えられた資源とから、適切な(性能を最適にする)資源を選び出す問題について、アプリケーション・資源ともに性質が時間不変という仮定の下でモデル化を行い、アルゴリズムの提案とシミュレーションによる実験を行った。(4)動的なメモリ管理システムにおいて、割り当てられるメモリの局所性とメモリ使用量を自在にバランスさせることのできるメモリ管理システム方式を確立した。(5)これまで難しいとされてきた、保守的GCにおいて実時間性を確保する方式を達成した(ACM ISMMに採択)。

    researchmap

  • 自動メモリ管理方式を中心とした並列言語処理系の最適化に関する研究

    研究課題/領域番号:00J08839  2000年 - 2001年

    日本学術振興会  科学研究費助成事業  特別研究員奨励費

    遠藤 敏夫

      詳細を見る

    配分額:2000000円 ( 直接経費:2000000円 )

    researchmap

▼全件表示