研究者詳細 - 松岡　聡

2026/03/10 更新

写真a

マツオカ　サトシ

松岡　聡

MATSUOKA SATOSHI

所属

情報理工学院特定教授

外部リンク

News & Topics

スーパーコンピュータ「京」がGraph500において9期連続で世界第1位を獲得ビッグデータの処理で重要となるグラフ解析で最高レベルの評価

2019/06/21

掲載言語：日本語

　詳細を見る

理化学研究所（理研）、九州大学、東京工業大学、バルセロナ・スーパーコンピューティング・センター、富士通株式会社、株式会社フィックスターズによる国際共同研究グループは、ビッグデータ処理（大規模グラフ解析）に関するスーパーコンピュータの国際的な性能ランキングであるGraph500において、スーパーコンピュータ｢京（けい）｣[補足1]による解析結果で、2018年11月に続き9期連続（通算10期）で第1位を獲得しました。
スーパーコンピュータ「京」がGraph500において8期連続で世界第1位を獲得ビッグデータの処理で重要となるグラフ解析で最高レベルの評価

2018/11/14

掲載言語：日本語

　詳細を見る

理化学研究所（理研）、九州大学、東京工業大学、バルセロナ・スーパーコンピューティング・センター、富士通株式会社、株式会社フィックスターズによる国際共同研究グループは、ビッグデータ処理（大規模グラフ解析）に関するスーパーコンピュータの国際的な性能ランキングであるGraph500において、スーパーコンピュータ｢京（けい）｣[用語1]による解析結果で、2018年6月に続き8期連続（通算9期）で第1位を獲得しました。
スーパーコンピュータ「京」がGraph500において7期連続で世界第1位を獲得ビッグデータの処理で重要となるグラフ解析で最高レベルの評価

2018/06/29

掲載言語：日本語

　詳細を見る

理化学研究所（理研）、九州大学、東京工業大学、バルセロナ・スーパーコンピューティング・センター、富士通株式会社、株式会社フィックスターズによる国際共同研究グループは、ビッグデータ処理（大規模グラフ解析）に関するスーパーコンピュータの国際的な性能ランキングであるGraph500において、スーパーコンピュータ｢京（けい）｣[用語1]による解析結果で、2017年11月に続き7期連続（通算8期）で第1位を獲得しました。
スーパーコンピュータ「京」がGraph500において5期連続で世界1位を獲得

2017/06/26

掲載言語：日本語

　詳細を見る

九州大学と東京工業大学、理化学研究所、スペインのバルセロナ・スーパーコンピューティング・センター、富士通株式会社による国際共同研究グループは、2017年6月21日（水）（米国ソルトレイクシティ現地時間）に公開された最新のビッグデータ処理（大規模グラフ解析）に関するスーパーコンピュータの国際的な性能ランキングであるGraph500において、スーパーコンピュータ「京（けい）」[用語1]による解析結果で、2016年11月に続き5期連続（通算6期）で第1位を獲得しました。
スーパーコンピュータ「京」がGraph500において4期連続で世界1位を獲得

2016/11/24

掲載言語：日本語

　詳細を見る

概要九州大学と東京工業大学、理化学研究所、スペインのバルセロナ・スーパーコンピューティング・センター、富士通株式会社による国際共同研究グループは、2016年11月15日（火）（米国ソルトレイクシティ現地時間）に公開された最新のビッグデータ処理（大規模グラフ解析）に関するスーパーコンピュータの国際的な性能ランキングであるGraph500において、スーパーコンピュータ「京（けい）」[用語1]による解析結果で、2016年6月に続き4期連続（通算5期）で第1位を獲得しました。
スーパーコンピュータ「京」がGraph500で世界第1位を獲得―ビッグデータの処理で重要となるグラフ解析で最高の評価―

2016/07/13

掲載言語：日本語

　詳細を見る

九州大学と東京工業大学、理化学研究所、スペインのバルセロナ・スーパーコンピューティング・センター、富士通株式会社による国際共同研究グループは、2016年6月に公開された最新のビッグデータ処理（大規模グラフ解析）に関するスーパーコンピュータの国際的な性能ランキングであるGraph500において、スーパーコンピュータ「京（けい）」による解析結果で、2015年11月に続き3期連続（通算4期）で第1位を獲得しました。
2期連続でスーパーコンピュータ「京」がGraph500で世界第1位を獲得

2015/11/24

掲載言語：日本語
K computer takes first place in Graph 500 supercomputer ranking for second consecutive time

2015/11/24

掲載言語：英語
K computer takes first place in Graph 500 supercomputer ranking

2015/07/31

掲載言語：英語
スーパーコンピュータ「京」がGraph500で世界第1位を奪還

2015/07/27

掲載言語：日本語
Supercharging a supercomputer

2009/07/31

掲載言語：英語

▼全件表示

学位

理学修士（東京大学理学系研究科情報科学専攻）
理学博士（東京大学理学系研究科情報科学専攻）

研究分野

情報通信 / 高性能計算 / スーパーコンピュータ、高性能AI、省電力、ビッグデータHPC、異機種高性能計算

学歴

東京大学大学院理学系研究科情報科学

- 1989年

　詳細を見る

国名：日本国

researchmap
東京大学理学部情報科学

- 1986年

　詳細を見る

国名：日本国

researchmap

経歴

東京科学大学情報理工学院特定教授

2024年10月 - 現在

　詳細を見る

researchmap
東京工業大学情報理工学院特定教授

2023年4月 - 2024年9月

　詳細を見る

researchmap
特定国立研究開発法人理化学研究所計算科学研究センター (R-CCS) センター長

2018年4月 - 現在

　詳細を見る

国名：日本国

researchmap
東京工業大学情報理工学院特任教授

2018年4月 - 2023年3月

　詳細を見る

researchmap
東京工業大学学術国際情報センター教授

2001年 - 2018年3月

　詳細を見る

国名：日本国

researchmap
東京工業大学助教授

1996年

　詳細を見る

researchmap
東京大学講師

1993年

　詳細を見る

researchmap
東京大学助手

1989年

　詳細を見る

researchmap

▼全件表示

所属学協会

IEEE Supercomputing

　詳細を見る

researchmap
HPC Asia 2004

　詳細を見る

researchmap
ACM Object-Oriented Programming: Languages, Systems and Applications (OOPSLA 2002)

　詳細を見る

researchmap
IEEE Computing Clusters and the Grid (CCGrid 2003)

　詳細を見る

researchmap

委員歴

IEEE Supercomputing Area Chair

2004年

　詳細を見る

団体区分：学協会

researchmap
HPC Asia 2004 Program Co-chair

2004年

　詳細を見る

団体区分：学協会

researchmap
IEEE Supercomputing Area Chair

2004年

　詳細を見る

団体区分：学協会

researchmap
HPC Asia 2004 Program Co-chair

2004年

　詳細を見る

団体区分：学協会

HPC Asia 2004

researchmap
IEEE Computing Clusters and the Grid (CCGrid 2003) Program Chair

2003年

　詳細を見る

団体区分：学協会

researchmap
IEEE Computing Clusters and the Grid (CCGrid 2003) Program Chair

2003年

　詳細を見る

団体区分：学協会

researchmap
ACM Object-Oriented Programming: Languages, Systems and Applications (OOPSLA 2002) Program Chair

2002年

　詳細を見る

団体区分：学協会

researchmap
ACM Object-Oriented Programming: Languages, Systems and Applications (OOPSLA 2002) Program Chair

2002年

　詳細を見る

団体区分：学協会

researchmap

▼全件表示

論文

Scaling Large-scale GNN Training to Thousands of Processors on CPU-based Supercomputers

Chen Zhuang, Lingqi Zhang, Du Wu, Peng Chen, Jiajun Huang, Xin Liu, Rio Yokota, Nikoli Dryden, Toshio Endo, Satoshi Matsuoka, Mohamed Wahib

Proceedings of the 39th ACM International Conference on Supercomputing 57 - 72 2025年6月

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ACM

DOI： 10.1145/3721145.3730422

researchmap
A General and Scalable GCN Training Framework on CPU Supercomputers.

Chen Zhuang, Peng Chen 0035, Xin Liu 0020, Rio Yokota, Nikoli Dryden, Lingqi Zhang 0001, Toshio Endo, Satoshi Matsuoka, Mohamed Wahib

PPoPP 566 - 568 2025年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1145/3710848.3710860

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/ppopp/ppopp2025.html#ZhuangCLYD0EMW25
Real-time High-resolution X-Ray Computed Tomography 招待査読

Du Wu, Peng Chen, Xiao Wang, Issac Lyngaas, Takaaki Miyajima, Toshio Endo, Satoshi Matsuoka, Mohamed Wahib

In proceedings of ACM International Conference on Supercomputing (ICS 2024), Kyoto, June 2023. 2024年6月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1145/3650200.3656634

researchmap
Asynchronous I/O Optimization for X-Ray Imaging via GPUDirect Storage.

Du Wu, Peng Chen 0035, Yiyu Tan, Yusuke Tanimura, Toshio Endo, Satoshi Matsuoka, Mohamed Wahib

IEEE International Conference on Cluster Computing 196 - 197 2024年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/CLUSTERWorkshops61563.2024.00056

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/cluster/clusterw2024.html#WuCTTEMW24
Communication Optimization for Distributed GCN Training on ABCI Supercomputer.

Chen Zhuang, Peng Chen 0035, Xin Liu 0020, Toshio Endo, Satoshi Matsuoka, Mohamed Wahib

IEEE International Conference on Cluster Computing 160 - 161 2024年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/CLUSTERWorkshops61563.2024.00038

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/cluster/clusterw2024.html#Zhuang0LEMW24
Investigating Nvidia GPU Architecture Trends via Microbenchmarks.

Lingqi Zhang 0001, Ryan Barton, Peng Chen 0035, Xiao Wang 0004, Toshio Endo, Satoshi Matsuoka, Mohamed Wahib

IEEE International Conference on Cluster Computing 174 - 175 2024年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/CLUSTERWorkshops61563.2024.00045

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/cluster/clusterw2024.html#ZhangBCWEMW24
At the Locus of Performance: Quantifying the Effects of Copious 3D-Stacked Cache on HPC Workloads.

Jens Domke, Emil Vatai, Balazs Gerofi, Yuetsu Kodama, Mohamed Wahib, Artur Podobas, Sparsh Mittal, Miquel Pericàs, Lingqi Zhang 0001, Peng Chen 0035, Aleksandr Drozd, Satoshi Matsuoka

ACM Transactions on Architecture and Code Optimization 20 ( 4 ) 57 - 26 2023年12月

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.1145/3629520

researchmap

その他リンク： https://dblp.uni-trier.de/db/journals/taco/taco20.html#DomkeVGKWPMPZCDM23
Myths and legends in high-performance computing.

Satoshi Matsuoka, Jens Domke, Mohamed Wahib, Aleksandr Drozd, Torsten Hoefler

International Journal of High Performance Computing Applications 37 ( 3-4 ) 245 - 259 2023年7月

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.1177/10943420231166608

researchmap
PERKS: a Locality-Optimized Execution Model for Iterative Memory-bound GPU Applications 招待査読

Lingqi Zhang, Mohamed Wahib, Peng Chen, Jintao Meng, Xiao Wang, Toshio Endo, Satoshi Matsuoka

In proceedings of ACM International Conference on Supercomputing (ICS 2023), Orlando, June 2023. 2023年6月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1145/3577193.3593705

researchmap
Revisiting Temporal Blocking Stencil Optimizations 招待査読

Lingqi Zhang, Mohamed Wahib, Peng Chen, Jintao Meng, Xiao Wang, Toshio Endo, Satoshi Matsuoka

In proceedings of ACM International Conference on Supercomputing (ICS 2023), Orlando, June 2023. 2023年6月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1145/3577193.3593716

researchmap
Exploiting Scratchpad Memory for Deep Temporal Blocking

Lingqi Zhang, Mohamed Wahib, Peng Chen, Jintao Meng, Xiao Wang, Toshio Endo, Satoshi Matsuoka

Proceedings of the 15th Workshop on General Purpose Processing Using GPU 2023年2月

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ACM

DOI： 10.1145/3589236.3589242

researchmap
Simeuro: A Hybrid CPU-GPU Parallel Simulator for Neuromorphic Computing Chips

Huaipeng Zhang, Nhut-Minh Ho, Yigit Polat Dogukan, Peng Chen, Mohamed Wahib, Truong Thao Nguyen, Jintao Meng, Rick Siow Mong Goh, Satoshi Matsuoka, Tao Luo, Weng-Fai Wong

IEEE Transactions on Parallel and Distributed Systems 1 - 16 2023年

　詳細を見る

掲載種別：研究論文（学術雑誌）出版者・発行元：Institute of Electrical and Electronics Engineers (IEEE)

DOI： 10.1109/tpds.2023.3291795

researchmap
Scalable FBP decomposition for cone-beam CT reconstruction

Peng Chen, Mohamed Wahib, Xiao Wang, Takahiro Hirofuchi, Hirotaka Ogawa, Ander Biguri, Richard Boardman, Thomas Blumensath, Satoshi Matsuoka

International Conference for High Performance Computing, Networking, Storage and Analysis, SC 2021年11月

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1145/3458817.3476139

Scopus

researchmap
Performance portable back-projection algorithms on CPUs

Peng Chen, Mohamed Wahib, Xiao Wang, Shinichiro Takizawa, Takahiro Hirofuchi, Hirotaka Ogawa, Satoshi Matsuoka

Proceedings of the ACM International Conference on Supercomputing 2021年6月

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ACM

DOI： 10.1145/3447818.3460353

researchmap
MLPerf HPC: A Holistic Benchmark Suite for Scientific Machine Learning on HPC Systems.

Steven Farrell, Murali Emani, Jacob Balma, Lukas Drescher, Aleksandr Drozd, Andreas Fink, Geoffrey C. Fox, David Kanter, Thorsten Kurth, Peter Mattson, Dawei Mu, Amit Ruhela, Kento Sato, Koichi Shirahata, Tsuguchika Tabaru, Aristeidis Tsaris, Jan Balewski, Ben Cumming, Takumi Danjo, Jens Domke, Takaaki Fukai, Naoto Fukumoto, Tatsuya Fukushi, Balazs Gerofi, Takumi Honda, Toshiyuki Imamura, Akihiko Kasagi, Kentaro Kawakami, Shuhei Kudo, Akiyoshi Kuroda, Maxime Martinasso, Satoshi Matsuoka, Henrique Mendonça, Kazuki Minami, Prabhat Ram, Takashi Sawada, Mallikarjun Shankar, Tom St. John, Akihiro Tabuchi, Venkatram Vishwanath, Mohamed Wahib, Masafumi Yamazaki, Junqi Yin

CoRR abs/2110.11466 2021年

　詳細を見る

掲載種別：研究論文（学術雑誌）

researchmap

その他リンク： https://dblp.uni-trier.de/db/journals/corr/corr2110.html#abs-2110-11466
Scalable FBP decomposition for cone-beam CT reconstruction.

Peng Chen, Mohamed Wahib, Xiao Wang 0004, Takahiro Hirofuchi, Hirotaka Ogawa, Ander Biguri, Richard P. Boardman, Thomas Blumensath, Satoshi Matsuoka

SC '21: The International Conference for High Performance Computing, Networking, Storage and Analysis(SC) 9 - 9 2021年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ACM

DOI： 10.1145/3458817.3476139

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/sc/sc2021.html#ChenWWHOBBBM21
Matrix Engines for High Performance Computing: A Paragon of Performance or Grasping at Straws?

Jens Domke, Emil Vatai, Aleksandr Drozd, Peng Chen, Yosuke Oyama, Lingqi Zhang 0001, Shweta Salaria, Daichi Mukunoki, Artur Podobas, Mohamed Wahib, Satoshi Matsuoka

1056 - 1065 2021年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/IPDPS49936.2021.00114

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/ipps/ipdps2021.html#DomkeVDCO0SMPWM21
A Study of Single and Multi-device Synchronization Methods in Nvidia GPUs.

Lingqi Zhang 0001, Mohamed Wahib, Haoyu Zhang, Satoshi Matsuoka

2020 IEEE International Parallel and Distributed Processing Symposium (IPDPS)(IPDPS) 483 - 493 2020年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

GPUs are playing an increasingly important role in general-purpose computing.
Many algorithms require synchronizations at different levels of granularity in
a single GPU. Additionally, the emergence of dense GPU nodes also calls for
multi-GPU synchronization. Nvidia's latest CUDA provides a variety of
synchronization methods. Until now, there is no full understanding of the
characteristics of those synchronization methods. This work explores important
undocumented features and provides an in-depth analysis of the performance
considerations and pitfalls of the state-of-art synchronization methods for
Nvidia GPUs. The provided analysis would be useful when making design choices
for applications, libraries, and frameworks running on single and/or multi-GPU
environments. We provide a case study of the commonly used reduction operator
to illustrate how the knowledge gained in our analysis can be useful. We also
describe our micro-benchmarks and measurement methods.

DOI： 10.1109/IPDPS47924.2020.00057

arXiv

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/ipps/ipdps2020.html#ZhangWZM20
The Case for Strong Scaling in Deep Learning: Training Large 3D CNNs with Hybrid Parallelism.

Yosuke Oyama, Naoya Maruyama, Nikoli Dryden, Erin McCarthy, Peter Harrington, Jan Balewski, Satoshi Matsuoka, Peter Nugent, Brian Van Essen

CoRR abs/2007.12856 2020年

　詳細を見る

掲載種別：研究論文（学術雑誌）

We present scalable hybrid-parallel algorithms for training large-scale 3D
convolutional neural networks. Deep learning-based emerging scientific
workflows often require model training with large, high-dimensional samples,
which can make training much more costly and even infeasible due to excessive
memory usage. We solve these challenges by extensively applying hybrid
parallelism throughout the end-to-end training pipeline, including both
computations and I/O. Our hybrid-parallel algorithm extends the standard data
parallelism with spatial parallelism, which partitions a single sample in the
spatial domain, realizing strong scaling beyond the mini-batch dimension with a
larger aggregated memory capacity. We evaluate our proposed training algorithms
with two challenging 3D CNNs, CosmoFlow and 3D U-Net. Our comprehensive
performance studies show that good weak and strong scaling can be achieved for
both networks using up 2K GPUs. More importantly, we enable training of
CosmoFlow with much larger samples than previously possible, realizing an
order-of-magnitude improvement in prediction accuracy.

arXiv

researchmap

その他リンク： https://dblp.uni-trier.de/db/journals/corr/corr2007.html#abs-2007-12856
AN5D: automated stencil framework for high-degree temporal blocking on GPUs.

Kazuaki Matsumura, Hamid Reza Zohouri, Mohamed Wahib, Toshio Endo, Satoshi Matsuoka

CGO '20: 18th ACM/IEEE International Symposium on Code Generation and Optimization(CGO) 199 - 211 2020年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ACM

Stencil computation is one of the most widely-used compute patterns in high
performance computing applications. Spatial and temporal blocking have been
proposed to overcome the memory-bound nature of this type of computation by
moving memory pressure from external memory to on-chip memory on GPUs. However,
correctly implementing those optimizations while considering the complexity of
the architecture and memory hierarchy of GPUs to achieve high performance is
difficult. We propose AN5D, an automated stencil framework which is capable of
automatically transforming and optimizing stencil patterns in a given C source
code, and generating corresponding CUDA code. Parameter tuning in our framework
is guided by our performance model. Our novel optimization strategy reduces
shared memory and register pressure in comparison to existing implementations,
allowing performance scaling up to a temporal blocking degree of 10. We achieve
the highest performance reported so far for all evaluated stencil benchmarks on
the state-of-the-art Tesla V100 GPU.

DOI： 10.1145/3368826.3377904

arXiv

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/cgo/cgo2020.html#MatsumuraZWEM20
A Survey on Coarse-Grained Reconfigurable Architectures from a Performance Perspective.

Artur Podobas, Kentaro Sano, Satoshi Matsuoka

CoRR abs/2004.04509 2020年

　詳細を見る

掲載種別：研究論文（学術雑誌）

researchmap

その他リンク： https://dblp.uni-trier.de/db/journals/corr/corr2004.html#abs-2004-04509
A Template-based Framework for Exploring Coarse-Grained Reconfigurable Architectures.

Artur Podobas, Kentaro Sano, Satoshi Matsuoka

31st IEEE International Conference on Application-specific Systems, Architectures and Processors (ASAP) 1 - 8 2020年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/ASAP49362.2020.00010

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/asap/asap2020.html#PodobasSM20
AN5D: Automated Stencil Framework for High-Degree Temporal Blocking on GPUs.

Kazuaki Matsumura, Hamid Reza Zohouri, Mohamed Wahib, Toshio Endo, Satoshi Matsuoka

CoRR abs/2001.01473 2020年

　詳細を見る

掲載種別：研究論文（学術雑誌）

researchmap

その他リンク： https://dblp.uni-trier.de/db/journals/corr/corr2001.html#abs-2001-01473
A Study of Single and Multi-device Synchronization Methods in Nvidia GPUs.

Lingqi Zhang 0001, Mohamed Wahib, Haoyu Zhang, Satoshi Matsuoka

CoRR abs/2004.05371 2020年

　詳細を見る

掲載種別：研究論文（学術雑誌）

researchmap

その他リンク： https://dblp.uni-trier.de/db/journals/corr/corr2004.html#abs-2004-05371
Scaling distributed deep learning workloads beyond the memory capacity with KARMA.

Mohamed Wahib, Haoyu Zhang, Truong Thao Nguyen, Aleksandr Drozd, Jens Domke, Lingqi Zhang 0001, Ryousei Takano, Satoshi Matsuoka

19 - 19 2020年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/SC41405.2020.00023

researchmap

その他リンク： https://dblp.uni-trier.de/conf/sc/2020
Performance optimization, modeling and analysis of sparse matrix-matrix products on multi-core and many-core processors

Yusuke Nagasaka, Satoshi Matsuoka, Ariful Azad, Aydin Buluc

PARALLEL COMPUTING 90 2019年12月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1016/j.parco.2019.102545

Web of Science

researchmap
iFDK

Peng Chen, Mohamed Wahib, Shinichiro Takizawa, Ryousei Takano, Satoshi Matsuoka

Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis 2019年11月

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ACM

DOI： 10.1145/3295500.3356163

researchmap
Scaling Word2Vec on Big Corpus.

Bofang Li, Aleksandr Drozd, Yuhe Guo, Tao Liu 0001, Satoshi Matsuoka, Xiaoyong Du 0001

Data Sci. Eng. 4 ( 2 ) 157 - 175 2019年

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.1007/s41019-019-0096-6

researchmap
How File-access Patterns Influence the Degree of I/O Interference between Cluster Applications.

Aamer Shah, Chih-Song Kuo, Akihiro Nomura 0002, Satoshi Matsuoka, Felix Wolf 0001

Supercomput. Front. Innov. 6 ( 2 ) 29 - 55 2019年

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.14529/jsfi190203

researchmap
A Versatile Software Systolic Execution Model for GPU Memory-Bound Kernels

Peng Chen, Mohamed Wahib, Shinichiro Takizawa, Ryousei Takano, Satoshi Matsuoka

PROCEEDINGS OF SC19: THE INTERNATIONAL CONFERENCE FOR HIGH PERFORMANCE COMPUTING, NETWORKING, STORAGE AND ANALYSIS 2019年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1145/3295500.3356162

Web of Science

arXiv

researchmap

その他リンク： http://arxiv.org/pdf/1907.06154v2
iFDK: A Scalable Framework for Instant High-resolution Image Reconstruction

Peng Chen, Mohamed Wahib, Shinichiro Takizawa, Ryousei Takano, Satoshi Matsuoka

PROCEEDINGS OF SC19: THE INTERNATIONAL CONFERENCE FOR HIGH PERFORMANCE COMPUTING, NETWORKING, STORAGE AND ANALYSIS 2019年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1145/3295500.3356163

Web of Science

arXiv

researchmap

その他リンク： http://arxiv.org/pdf/1909.02724v1
Learning Neural Representations for Predicting GPU Performance

Shweta Salaria, Aleksandr Drozd, Artur Podobas, Satoshi Matsuoka

HIGH PERFORMANCE COMPUTING, ISC HIGH PERFORMANCE 2019 11501 40 - 58 2019年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1007/978-3-030-20656-7_3

Web of Science

researchmap
MH-QEMU: Memory-State-Aware Fault Injection Platform

Hideyuki Jitsumoto, Yuya Kobayashi, Akihiro Nomura, Satoshi Matsuoka

SUPERCOMPUTING FRONTIERS, SCFA 2019 11416 71 - 85 2019年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1007/978-3-030-18645-6_5

Web of Science

researchmap
The First Supercomputer with HyperX Topology: A Viable Alternative to Fat-Trees?

Jens Domke, Satoshi Matsuoka, Ivan Radanov, Yuki Tsushima, Tomoya Yuki, Akihiro Nomura 0002, Shin'ichi Miura, Nic McDonald, Dennis Lee Floyd, Nicolas Dubé

2019 IEEE Symposium on High-Performance Interconnects 1 - 4 2019年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/HOTI.2019.00013

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/hoti/hoti2019.html#DomkeMRTY0MMFD19
Performance Optimizations and Analysis of Distributed Deep Learning with Approximated Second-Order Optimization Method

Yohei Tsuji, Kazuki Osawa, Yuichiro Ueno, Akira Naruse, Rio Yokota, Satoshi Matsuoka

PROCEEDINGS OF THE 48TH INTERNATIONAL CONFERENCE ON PARALLEL PROCESSING WORKSHOPS (ICPP 2019) 21 - 8 2019年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1145/3339186.3339202

Web of Science

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/icppw/icppw2019.html#TsujiOUNYM19
Second-order Optimization Method for Large Mini-batch: Training ResNet-50 on ImageNet in 35

Kazuki Oosawa, Youhei Tsuji, Yuichiro Ueno, Akira Naruse, Rio Yokota, Satoshi Matsuoka

2019年

　詳細を見る

researchmap
HyperX Topology: First At-Scale Implementation and Comparison to the Fat-Tree

Jens Domke, Satoshi Matsuoka, Ivan R. Ivanov, Yuki Tsushima, Tomoya Yuki, Akihiro Nomura, Shin'ichi Miura, Nic McDonald, Dennis L. Floyd, Nicolas Dube

PROCEEDINGS OF SC19: THE INTERNATIONAL CONFERENCE FOR HIGH PERFORMANCE COMPUTING, NETWORKING, STORAGE AND ANALYSIS 2019年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1145/3295500.3356140

Web of Science

researchmap
Large-Scale Distributed Second-Order Optimization Using Kronecker-Factored Approximate Curvature for Deep Convolutional Neural Networks

Kazuki Osawa, Yohei Tsuji, Yuichiro Ueno, Akira Naruse, Rio Yokota, Satoshi Matsuoka

2019 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR 2019) 12351 - 12359 2019年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/CVPR.2019.01264

Web of Science

arXiv

researchmap

その他リンク： https://dblp.uni-trier.de/conf/cvpr/2019
Batched Sparse Matrix Multiplication for Accelerating Graph Convolutional Networks

Yusuke Nagasaka, Akira Nukada, Ryosuke Kojima, Satoshi Matsuoka

2019 19TH IEEE/ACM INTERNATIONAL SYMPOSIUM ON CLUSTER, CLOUD AND GRID COMPUTING (CCGRID) 231 - 240 2019年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/CCGRID.2019.00037

Web of Science

arXiv

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/ccgrid/ccgrid2019.html#NagasakaNKM19
Evaluating the SW26010 many-core processor with a micro-benchmark suite for performance optimizations

James Lin, Zhigeng Xu, Linjin Cai, Akira Nukada, Satoshi Matsuoka

PARALLEL COMPUTING 77 128 - 143 2018年9月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1016/j.parco.2018.06.001

Web of Science

researchmap
Interference between I/O and MPI Traffic on Fat-tree Networks

Kevin A. Brown, Nikhil Jain, Satoshi Matsuoka, Martin Schulz, Abhinav Bhatele

Proceedings of the 47th International Conference on Parallel Processing 2018年8月

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ACM

DOI： 10.1145/3225058.3225144

researchmap
MRG8 - Random Number Generation for the Exascale Era

Yusuke Nagasaka, Akira Nukada, Satoshi Matsuoka, Kenichi Miura, John Shalf

Proceedings of the Platform for Advanced Scientific Computing Conference 2018年7月

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ACM

DOI： 10.1145/3218176.3218230

researchmap
世界最大規模のオープンAIインフラストラクチャAI橋渡しクラウド(ABCI)の概要

小川宏高, 松岡聡, 松岡聡, 佐藤仁, 高野了成, 滝澤真一朗, 谷村勇輔, 三浦信一, 三浦信一, 関口智嗣

情報処理学会研究報告(Web) 2018 ( HPC-165 ) Vol.2018‐HPC‐165,No.19,1‐7 (WEB ONLY) 2018年7月

　詳細を見る

記述言語：日本語掲載種別：研究論文（研究会，シンポジウム資料等）

J-GLOBAL

researchmap
0.55AI‐EFLOPSの計算インフラストラクチャを支える超グリーンAIデータセンタ

高野了成, 三浦信一, 三浦信一, 杉田正, 小川宏高, 松岡聡, 松岡聡

情報処理学会研究報告(Web) 2018 ( HPC-165 ) Vol.2018‐HPC‐165,No.20,1‐7 (WEB ONLY) 2018年7月

　詳細を見る

記述言語：日本語掲載種別：研究論文（研究会，シンポジウム資料等）

J-GLOBAL

researchmap
High-performance sparse matrix-matrix products on Intel KNL and multicore architectures

Yusuke Nagasaka, Satoshi Matsuoka, Ariful Azad, Aydın Buluç

2018年4月

　詳細を見る

Sparse matrix-matrix multiplication (SpGEMM) is a computational primitive
that is widely used in areas ranging from traditional numerical applications to
recent big data analysis and machine learning. Although many SpGEMM algorithms
have been proposed, hardware specific optimizations for multi- and many-core
processors are lacking and a detailed analysis of their performance under
various use cases and matrices is not available. We firstly identify and
mitigate multiple bottlenecks with memory management and thread scheduling on
Intel Xeon Phi (Knights Landing or KNL). Specifically targeting multi- and
many-core processors, we develop a hash-table-based algorithm and optimize a
heap-based shared-memory SpGEMM algorithm. We examine their performance
together with other publicly available codes. Different from the literature,
our evaluation also includes use cases that are representative of real graph
algorithms, such as multi-source breadth-first search or triangle counting. Our
hash-table and heap-based algorithms are showing significant speedups from
libraries in the majority of the cases while different algorithms dominate the
other scenarios with different matrix size, sparsity, compression factor and
operation type. We wrap up in-depth evaluation results and make a recipe to
give the best SpGEMM algorithm for target scenario. A critical finding is that
hash-table-based SpGEMM gets a significant performance boost if the nonzeros
are not required to be sorted within each row of the output matrix.

arXiv

researchmap

その他リンク： http://arxiv.org/pdf/1804.01698v2
Combined Spatial and Temporal Blocking for High-Performance Stencil Computation on FPGAs Using OpenCL

Hamid Reza Zohouri, Artur Podobas, Satoshi Matsuoka

2018年2月

　詳細を見る

Recent developments in High Level Synthesis tools have attracted software
programmers to accelerate their high-performance computing applications on
FPGAs. Even though it has been shown that FPGAs can compete with GPUs in terms
of performance for stencil computation, most previous work achieve this by
avoiding spatial blocking and restricting input dimensions relative to FPGA
on-chip memory. In this work we create a stencil accelerator using Intel FPGA
SDK for OpenCL that achieves high performance without having such restrictions.
We combine spatial and temporal blocking to avoid input size restrictions, and
employ multiple FPGA-specific optimizations to tackle issues arisen from the
added design complexity. Accelerator parameter tuning is guided by our
performance model, which we also use to project performance for the upcoming
Intel Stratix 10 devices. On an Arria 10 GX 1150 device, our accelerator can
reach up to 760 and 375 GFLOP/s of compute performance, for 2D and 3D stencils,
respectively, which rivals the performance of a highly-optimized GPU
implementation. Furthermore, we estimate that the upcoming Stratix 10 devices
can achieve a performance of up to 3.5 TFLOP/s and 1.6 TFLOP/s for 2D and 3D
stencil computation, respectively.

DOI： 10.1145/3174243.3174248

arXiv

researchmap

その他リンク： http://arxiv.org/pdf/1802.00438v1
Lock Contention Management in Multithreaded MPI

Abdelhalim Amer, Huiwei Lu, Pavan Balaji, Milind Chabbi, Yanjie Wei, Jeff Hammond, Satoshi Matsuoka

ACM TRANSACTIONS ON PARALLEL COMPUTING 5 ( 3 ) 2018年1月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1145/3275443

Web of Science

researchmap
Machine Learning Predictions for Underestimation of Job Runtime on HPC System

Jian Guo, Akihiro Nomura, Ryan Barton, Haoyu Zhang, Satoshi Matsuoka

Supercomputing Frontiers 179 - 198 2018年

　詳細を見る

出版者・発行元：Springer International Publishing

DOI： 10.1007/978-3-319-69953-0\_11

DOI： 10.1007/978-3-319-69953-0_11

researchmap
Machine Learning Predictions for Underestimation of Job Runtime on HPC System

Jian Guo, Akihiro Nomura, Ryan Barton, Haoyu Zhang, Satoshi Matsuoka

SUPERCOMPUTING FRONTIERS, SCFA 2018 10776 179 - 198 2018年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1007/978-3-319-69953-0_11

Web of Science

researchmap
Efficient Solving of Scan Primitive on Multi-GPU Systems

Adrian P. Dieguez, Margarita Amor, Ramon Doallo, Akira Nukada, Satoshi Matsuoka

2018 32ND IEEE INTERNATIONAL PARALLEL AND DISTRIBUTED PROCESSING SYMPOSIUM (IPDPS) 794 - 803 2018年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/IPDPS.2018.00089

Web of Science

researchmap
Predicting Performance Using Collaborative Filtering

Shweta Salaria, Aleksandr Drozd, Artur Podobas, Satoshi Matsuoka

2018 IEEE INTERNATIONAL CONFERENCE ON CLUSTER COMPUTING (CLUSTER) 504 - 514 2018年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/CLUSTER.2018.00066

Web of Science

researchmap
Hardware Implementation of POSITs and Their Application in FPGAs

Artur Podobas, Satoshi Matsuoka

2018 IEEE INTERNATIONAL PARALLEL AND DISTRIBUTED PROCESSING SYMPOSIUM WORKSHOPS (IPDPSW 2018) 138 - 145 2018年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/IPDPSW.2018.00029

Web of Science

researchmap
Adaptive Pattern Matching with Reinforcement Learning for Dynamic Graphs

Hiroki Kanezashi, Toyotaro Suzumura, Dario Garcia-Gasulla, Min-hwan Oh, Satoshi Matsuoka

2018 IEEE 25TH INTERNATIONAL CONFERENCE ON HIGH PERFORMANCE COMPUTING (HIPC) 92 - 101 2018年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/HiPC.2018.00019

Web of Science

arXiv

researchmap

その他リンク： http://arxiv.org/pdf/1812.10321v1
Explorations of Data Swapping on Burst Buffer

Tianqi Xu, Kento Sato, Satoshi Matsuoka

2018 IEEE 24TH INTERNATIONAL CONFERENCE ON PARALLEL AND DISTRIBUTED SYSTEMS (ICPADS 2018) 517 - 526 2018年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/ICPADS.2018.00074

Web of Science

researchmap
DRAGON: Breaking GPU Memory Capacity Limits with Direct NVM Access

Pak Markthub, Mehmet E. Belviranli, Seyong Lee, Jeffrey S. Vetter, Satoshi Matsuoka

PROCEEDINGS OF THE INTERNATIONAL CONFERENCE FOR HIGH PERFORMANCE COMPUTING, NETWORKING, STORAGE, AND ANALYSIS (SC'18) 2018年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Optimizing Preconditioned Conjugate Gradient on TaihuLight for OpenFOAM

James Lin, Minhua Wen, Delong Meng, Xin Liu, Akira Nukada, Satoshi Matsuoka

2018 18TH IEEE/ACM INTERNATIONAL SYMPOSIUM ON CLUSTER, CLOUD AND GRID COMPUTING (CCGRID) 273 - 282 2018年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/CCGRID.2018.00042

Web of Science

researchmap
Accelerating Deep Learning Frameworks with Micro-batches

Yosuke Oyama, Tal Ben-Nun, Torsten Hoefler, Satoshi Matsuoka

2018 IEEE INTERNATIONAL CONFERENCE ON CLUSTER COMPUTING (CLUSTER) 402 - 412 2018年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/CLUSTER.2018.00058

Web of Science

researchmap
Cambrian Explosion of Computing and Big Data in the Post-Moore Era

Satoshi Matsuoka

HPDC '18: PROCEEDINGS OF THE 27TH INTERNATIONAL SYMPOSIUM ON HIGH-PERFORMANCE PARALLEL AND DISTRIBUTED COMPUTING 105 - 105 2018年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1145/3208040.3225055

Web of Science

researchmap
Efficient Algorithms for the Summed Area Tables Primitive on GPUs

Peng Chen, Mohamed Wahib, Shinichiro Takizawa, Ryousei Takano, Satoshi Matsuoka

2018 IEEE INTERNATIONAL CONFERENCE ON CLUSTER COMPUTING (CLUSTER) 482 - 493 2018年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/CLUSTER.2018.00064

Web of Science

researchmap
High-Performance High-Order Stencil Computation on FPGAs Using OpenCL

Hamid Reza Zohouri, Artur Podobas, Satoshi Matsuoka

2018 IEEE INTERNATIONAL PARALLEL AND DISTRIBUTED PROCESSING SYMPOSIUM WORKSHOPS (IPDPSW 2018) abs/2002.05983 123 - 130 2018年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/IPDPSW.2018.00027

Web of Science

arXiv

researchmap

その他リンク： https://dblp.uni-trier.de/db/journals/corr/corr2002.html#abs-2002-05983
MACC: An OpenACC Transpiler for Automatic Multi-GPU Use 査読

Kazuaki Matsumura, Mitsuhisa Sato, Taisuke Boku, Artur Podobas, Satoshi Matsuoka

SUPERCOMPUTING FRONTIERS, SCFA 2018 10776 109 - 127 2018年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1007/978-3-319-69953-0_7

Web of Science

Scopus

researchmap
HPCとビッグデータ・AIを融合するグリーン・クラウドスパコンTSUBAME3.0の概要

松岡聡, 遠藤敏夫, 額田彰, 三浦信一, 野村哲弘, 佐藤仁, 實本英之, DROZD Aleksandr

Tsubame e-Science Journal 16 02‐08 (JA),20‐27 (EN) - 8 2017年11月

　詳細を見る

記述言語：日本語出版者・発行元：東京工業大学学術国際情報センター

CiNii Books

J-GLOBAL

researchmap
Applying Temporal Blocking with a Directive-based Approach

Shota Kuroda, Toshio Endo, Satoshi Matsuoka

Proceedings of the Fourth Workshop on the LLVM Compiler Infrastructure in HPC 2017年11月

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ACM

DOI： 10.1145/3148173.3148190

researchmap
AI橋渡しクラウド―AI Bridging Cloud Infrastructure(ABCI)―の構想

小川宏高, 松岡聡, 松岡聡, 佐藤仁, 高野了成, 滝澤真一朗, 谷村勇輔, 三浦信一, 関口智嗣

情報処理学会研究報告(Web) 2017 ( HPC-160 ) Vol.2017‐HPC‐160,No.28,1‐7 (WEB ONLY) 2017年7月

　詳細を見る

記述言語：日本語掲載種別：研究論文（研究会，シンポジウム資料等）

J-GLOBAL

researchmap
HPCとビッグデータ・AIを融合するグリーン・クラウドスパコンTSUBAME3.0の概要

松岡聡, 遠藤敏夫, 額田彰, 三浦信一, 野村哲弘, 佐藤仁, 實本英之, DROZD Aleksandr

情報処理学会研究報告(Web) 2017 ( HPC-160 ) Vol.2017‐HPC‐160,No.29,1‐6 (WEB ONLY) 2017年7月

　詳細を見る

記述言語：日本語掲載種別：研究論文（研究会，シンポジウム資料等）

J-GLOBAL

researchmap
Accelerating Big Data Infrastructure and Applications (Ongoing Collaboration)

Kevin Brown, Tianqi Xu, Keita Iwabuchi, Kento Sato, Adam Moody, Kathryn Mohror, Nikhil Jain, Abhinav Bhatele, Martin Schulz, Roger Pearce, Maya Gokhale, Satoshi Matsuoka

2017 IEEE 37th International Conference on Distributed Computing Systems Workshops (ICDCSW) 343 - 347 2017年6月

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/icdcsw.2017.74

researchmap
Efficient Breadth-First Search on Massively Parallel and Distributed-Memory Machines

Koji Ueno, Toyotaro Suzumura, Naoya Maruyama, Katsuki Fujisawa, Satoshi Matsuoka

Data Science and Engineering 2 ( 1 ) 22 - 35 2017年3月

　詳細を見る

掲載種別：研究論文（学術雑誌）出版者・発行元：Springer Science and Business Media LLC

DOI： 10.1007/s41019-016-0024-y

researchmap

その他リンク： http://link.springer.com/article/10.1007/s41019-016-0024-y/fulltext.html
Fast Recognition of Bird Sounds Using Extreme Learning Machines

Kun Qian, Jian Guo, Ken Ishida, Satoshi Matsuoka

IEEJ TRANSACTIONS ON ELECTRICAL AND ELECTRONIC ENGINEERING 12 ( 2 ) 294 - 296 2017年3月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1002/tee.22378

Web of Science

researchmap
Co-locating Graph Analytics and HPC Applications

Kevin Brown, Satoshi Matsuoka

2017 IEEE INTERNATIONAL CONFERENCE ON CLUSTER COMPUTING (CLUSTER) 659 - 660 2017年

　詳細を見る

記述言語：英語

DOI： 10.1109/CLUSTER.2017.111

Web of Science

researchmap
Optimizations of Two Compute-bound Scientific Kernels on the SW26010 Many-core Processor

James Lin, Zhigeng Xu, Akira Nukada, Naoya Maruyama, Satoshi Matsuoka

2017 46TH INTERNATIONAL CONFERENCE ON PARALLEL PROCESSING (ICPP) 432 - 441 2017年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/ICPP.2017.52

Web of Science

researchmap
GPU-based Training of Autoencoders for Bird Sound Data Processing

Jian Guo, Kun Qian, Bjorn Schuller, Satoshi Matsuoka

2017 IEEE INTERNATIONAL CONFERENCE ON CONSUMER ELECTRONICS - TAIWAN (ICCE-TW) 2017年

　詳細を見る

記述言語：英語

DOI： 10.1109/icce-china.2017.7991037

Web of Science

researchmap
High-performance and Memory-saving Sparse General Matrix-Matrix Multiplication for NVIDIA Pascal GPU

Yusuke Nagasaka, Akira Nukada, Satoshi Matsuoka

2017 46TH INTERNATIONAL CONFERENCE ON PARALLEL PROCESSING (ICPP) 101 - 110 2017年

　詳細を見る

記述言語：英語

DOI： 10.1109/ICPP.2017.19

Web of Science

researchmap
Being "BYTES-oriented" in HPC leads to an Open Big Data/AI Ecosystem and Further Advances into the Post-Moore Era

Satoshi Matsuoka

2017 IEEE INTERNATIONAL CONFERENCE ON BIG DATA (BIG DATA) 5 - 5 2017年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Benchmarking SW26010 Many-core Processor

Zhigeng Xu, James Lin, Satoshi Matsuoka

2017 IEEE INTERNATIONAL PARALLEL AND DISTRIBUTED PROCESSING SYMPOSIUM WORKSHOPS (IPDPSW) 743 - 752 2017年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/IPDPSW.2017.9

Web of Science

researchmap
Asynchronous, Data-Parallel Deep Convolutional Neural Network Training with Linear Prediction Model for Parameter Transition

Ikuro Sato, Ryo Fujisaki, Yosuke Oyama, Akihiro Nomura, Satoshi Matsuoka

NEURAL INFORMATION PROCESSING (ICONIP 2017), PT II 10635 305 - 314 2017年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1007/978-3-319-70096-0_32

Web of Science

researchmap
Evaluating High-Level Design Strategies on FPGAs for High-Performance Computing

Artur Podobas, Hamid Reza Zohouri, Naoya Maruyama, Satoshi Matsuoka

2017 27TH INTERNATIONAL CONFERENCE ON FIELD PROGRAMMABLE LOGIC AND APPLICATIONS (FPL) 2017年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Designing and Accelerating Spiking Neural Networks using OpenCL for FPGAs

Artur Podobas, Satoshi Matsuoka

2017 INTERNATIONAL CONFERENCE ON FIELD PROGRAMMABLE TECHNOLOGY (ICFPT) 255 - 258 2017年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Evaluation of HPC-Big Data Applications Using Cloud Platforms

Shweta Salaria, Kevin Brown, Hideyuki Jitsumoto, Satoshi Matsuoka

2017 17TH IEEE/ACM INTERNATIONAL SYMPOSIUM ON CLUSTER, CLOUD AND GRID COMPUTING (CCGRID) 1053 - 1061 2017年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/CCGRID.2017.143

Web of Science

researchmap
Evaluating High-Level Design Strategies on FPGAs for High-Performance Computing

Artur Podobas, Hamid Reza Zohouri, Naoya Maruyama, Satoshi Matsuoka

2017 27TH INTERNATIONAL CONFERENCE ON FIELD PROGRAMMABLE LOGIC AND APPLICATIONS (FPL) 2017年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Migrating Legacy Fortran to Python While Retaining Fortran-Level Performance through Transpilation and Type Hints

Mateusz Bysiek, Aleksandr Drozd, Satoshi Matsuoka

2016 6th Workshop on Python for High-Performance and Scientific Computing (PyHPC) 2016年11月

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/pyhpc.2016.006

researchmap
Special Issue on Cluster Computing

Michela Taufer, Pavan Balaji, Satoshi Matsuoka

PARALLEL COMPUTING 58 25 - 26 2016年10月

　詳細を見る

記述言語：英語

DOI： 10.1016/j.parco.2016.09.001

Web of Science

researchmap
Critical mass in the emergence of collective intelligence: a parallelized simulation of swarms in noisy environments

Aleksandr Drozd, Olaf Witkowski, Satoshi Matsuoka, Takashi Ikegami

Artificial Life and Robotics 21 ( 3 ) 317 - 323 2016年9月

　詳細を見る

掲載種別：研究論文（学術雑誌）出版者・発行元：Springer Science and Business Media LLC

DOI： 10.1007/s10015-016-0303-8

researchmap

その他リンク： http://link.springer.com/article/10.1007/s10015-016-0303-8/fulltext.html
仮想マシンエミュレータを用いた特定故障パターン発生時におけるアプリケーションの誤差の評価

小林佑矢, 實本英之, 野村哲弘, 松岡聡

情報処理学会研究報告(Web) 2016 ( HPC-155 ) Vol.2016‐HPC‐155,No.10,1‐7 (WEB ONLY) - 7 2016年8月

　詳細を見る

記述言語：日本語

高性能計算機の規模は年々大きくなっている．大規模化に伴う故障率の増加により，Silent Data Corruption (SDC) と呼ばれる問題が深刻になると予想されている．SDC はアプリケーションが異常な結果を出力するが，停止には至らないため計算結果の誤りを検知できない障害である．SDC に対処するため多くの研究が行われたが，計算機の変化とともに故障の種類や発生傾向も変化しており，新たな耐故障手法が求められている．本研究は連続したメモリデータの破壊または複数のビットエラーが DRAM 上に発生した際に，NAS Parallel Benchmark の CG カーネルに現れる SDC の調査を目的とする．またそのために，DRAM に特定の故障パターンを注入する故障発生器を，仮想マシンエミュレータである QEMU を拡張して作成した．これにより，SDC が発生しうること，アプリケーションの特性により SDC の発生割合が約 5%減少することを確認した．また連続したデータ破壊が発生したとき，アプリケーションは約 80%の割合で正常な結果を返すが，同じビット数のビットエラーを注入した際には約 90%の割合で異常終了することを確認した．

J-GLOBAL

researchmap
Routing on the Dependency Graph

Jens Domke, Torsten Hoefler, Satoshi Matsuoka

Proceedings of the 25th ACM International Symposium on High-Performance Parallel and Distributed Computing 2016年5月

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ACM

DOI： 10.1145/2907294.2907313

researchmap
From FLOPS to BYTES: Disruptive change in high-performance computing towards the post-moore era 査読

Satoshi Matsuoka, Hideharu Amano, Kengo Nakajima, Koji Inoue, Tomohiro Kudoh, Naoya Maruyama, Kenjiro Taura, Takeshi Iwashita, Takahiro Katagiri, Toshihiro Hanawa, Toshio Endo

2016 ACM International Conference on Computing Frontiers - Proceedings 274 - 281 2016年5月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：Association for Computing Machinery, Inc

DOI： 10.1145/2903150.2906830

Scopus

researchmap
From FLOPS to BYTES

Satoshi Matsuoka, Hideharu Amano, Kengo Nakajima, Koji Inoue, Tomohiro Kudoh, Naoya Maruyama, Kenjiro Taura, Takeshi Iwashita, Takahiro Katagiri, Toshihiro Hanawa, Toshio Endo

Proceedings of the ACM International Conference on Computing Frontiers 274 - 281 2016年5月

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ACM

DOI： 10.1145/2903150.2906830

researchmap
Serving More GPU Jobs, with Low Penalty, using Remote GPU Execution and Migration

Pak Markthub, Akihiro Nomura, Satoshi Matsuoka

2016 IEEE INTERNATIONAL CONFERENCE ON CLUSTER COMPUTING (CLUSTER) 485 - 488 2016年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/CLUSTER.2016.36

Web of Science

researchmap
Scaling FMM with Data-Driven OpenMP Tasks on Multicore Architectures

Abdelhalim Amer, Satoshi Matsuoka, Miquel Pericas, Naoya Maruyama, Kenjiro Taura, Rio Yokota, Pavan Balaji

OPENMP: MEMORY, DEVICES, AND TASKS 9903 156 - 170 2016年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1007/978-3-319-45550-1_12

Web of Science

researchmap
GPU-Based Fast Signal Processing for Large Amounts of Snore Sound Data

Jian Guo, Kun Qian, Huijie Xu, Christoph Janott, Bjoern Schuller, Satoshi Matsuoka

2016 IEEE 5TH GLOBAL CONFERENCE ON CONSUMER ELECTRONICS 2016年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Tapas: An Implicitly Parallel Programming Framework For Hierarchical N-body Algorithms

Keisuke Fukuda, Motohiko Matsuda, Naoya Maruyama, Rio Yokota, Kenjiro Taura, Satoshi Matsuoka

2016 IEEE 22ND INTERNATIONAL CONFERENCE ON PARALLEL AND DISTRIBUTED SYSTEMS (ICPADS) 1100 - 1109 2016年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/ICPADS.2016.143

Web of Science

researchmap
アプリケーションからみた将来の HPCI システムへの要件の抽出のためのベンチマーク

野村哲弘, 鈴木惣一朗, 三上和徳, 丸山直也, 松岡聡

2016年

　詳細を見る

researchmap
Analogy-based detection of morphological and semantic relations with word embeddings: what works and what doesn't.

Anna Gladkova, Aleksandr Drozd, Satoshi Matsuoka

Proceedings of the NAACL Student Research Workshop 2016年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：Association for Computational Linguistics

DOI： 10.18653/v1/n16-2002

researchmap
Word embeddings, analogies, and machine learning: beyond king - man + woman = queen

Aleksandr Drozd, Anna Gladkova, Satoshi Matsuoka

Proceedings of COLING 2016, the 26th International Conference on Computational Linguistics: Technical Papers 2016年

　詳細を見る

出版者・発行元：The COLING 2016 Organizing Committee

researchmap
Evaluating and Optimizing OpenCL Kernels for High Performance Computing with FPGAs

Hamid Reza Zohouri, Naoya Maruyama, Aaron Smith, Motohiko Matsuda, Satoshi Matsuoka

SC '16: PROCEEDINGS OF THE INTERNATIONAL CONFERENCE FOR HIGH PERFORMANCE COMPUTING, NETWORKING, STORAGE AND ANALYSIS 409 - 420 2016年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
CloudBB: Scalable I/O Accelerator for Shared Cloud Storage

Tianqi Xu, Kento Sato, Satoshi Matsuoka

2016 IEEE 22ND INTERNATIONAL CONFERENCE ON PARALLEL AND DISTRIBUTED SYSTEMS (ICPADS) 509 - 518 2016年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/ICPADS.2016.72

Web of Science

researchmap
I/O Chunking and Latency Hiding Approach for Out-of-core Sorting Acceleration using GPU and Flash NVM 査読

Hitoshi Sato, Ryo Mizote, Satoshi Matsuoka, Hirotaka Ogawa

2016 IEEE INTERNATIONAL CONFERENCE ON BIG DATA (BIG DATA) 398 - 403 2016年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Predicting Statistics of Asynchronous SGD Parameters for a Large-Scale Distributed Deep Learning System on GPU Supercomputers

Yosuke Oyama, Akihiro Nomura, Ikuro Sato, Hiroki Nishimura, Yukimasa Tamatsu, Satoshi Matsuoka

2016 IEEE INTERNATIONAL CONFERENCE ON BIG DATA (BIG DATA) 66 - 75 2016年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Adaptive Multi-level Blocking Optimization for Sparse Matrix Vector Multiplication on GPU

Yusuke Nagasaka, Akira Nukada, Satoshi Matsuoka

INTERNATIONAL CONFERENCE ON COMPUTATIONAL SCIENCE 2016 (ICCS 2016) 80 131 - 142 2016年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1016/j.procs.2016.05.304

Web of Science

researchmap
Extreme Scale Breadth-First Search on Supercomputers

Koji Ueno, Toyotaro Suzumura, Naova Maruyama, Katsuki Fujisawa, Satoshi Matsuoka

2016 IEEE INTERNATIONAL CONFERENCE ON BIG DATA (BIG DATA) 1040 - 1047 2016年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Towards a Distributed Large-Scale Dynamic Graph Data Store

Keita Iwabuchi, Scott Sallinen, Roger Pearce, Brian Van Essen, Maya Gokhale, Satoshi Matsuoka

2016 IEEE 30TH INTERNATIONAL PARALLEL AND DISTRIBUTED PROCESSING SYMPOSIUM WORKSHOPS (IPDPSW) 892 - 901 2016年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/IPDPSW.2016.189

Web of Science

researchmap
A Directive-based Data Layout Abstraction for Performance Portability of OpenACC Applications

Tetsuya Hoshino, Naoya Maruyama, Satoshi Matsuoka

PROCEEDINGS OF 2016 IEEE 18TH INTERNATIONAL CONFERENCE ON HIGH PERFORMANCE COMPUTING AND COMMUNICATIONS; IEEE 14TH INTERNATIONAL CONFERENCE ON SMART CITY; IEEE 2ND INTERNATIONAL CONFERENCE ON DATA SCIENCE AND SYSTEMS (HPCC/SMARTCITY/DSS) 1147 - 1154 2016年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/HPCC-SmartCity-DSS.2016.34

Web of Science

researchmap
Towards Convergence of Extreme Computing and Big Data Centers

Satoshi Matsuoka

DIDC'16: PROCEEDINGS OF THE ACM INTERNATIONAL WORKSHOP ON DATA-INTENSIVE DISTRIBUTED COMPUTING 1 - 1 2016年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1145/2912152.2912159

Web of Science

researchmap
Discovering Aspectual Classes of Russian Verbs in Untagged Large Corpora

Aleksandr Drozd, Anna Gladkova, Satoshi Matsuoka

2015 IEEE International Conference on Data Science and Data Intensive Systems 2015年12月

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/dsdis.2015.30

researchmap
MPI plus Threads: Runtime Contention and Remedies

Abdelhalim Amer, Huiwei Lu, Yanjie Wei, Pavan Balaji, Satoshi Matsuoka

ACM SIGPLAN NOTICES 50 ( 8 ) 239 - 248 2015年8月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1145/2688500.2688522

Web of Science

researchmap
TSUBAME2におけるスケジュール効率化への取り組みとユーザ動向の見える化

野村哲弘, 野村哲弘, 佐々木淳, 三浦信一, 三浦信一, 遠藤敏夫, 遠藤敏夫, 松岡聡, 松岡聡

情報処理学会研究報告(Web) 2015 ( HPC-150 ) VOL.2015-HPC-150,NO.2 (WEB ONLY) 2015年7月

　詳細を見る

記述言語：日本語掲載種別：研究論文（研究会，シンポジウム資料等）

J-GLOBAL

researchmap
Realizing Extremely Large-Scale Stencil Applications on GPU Supercomputers

Toshio Endo, Yuki Takasaki, Satoshi Matsuoka

2015 IEEE 21ST INTERNATIONAL CONFERENCE ON PARALLEL AND DISTRIBUTED SYSTEMS (ICPADS) 625 - 632 2015年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/ICPADS.2015.84

Web of Science

researchmap
Evaluating AVX2 Vgather Instruction with Stencils

James Lin, Qiang Qin, Shuo Li, Minhua Wen, Satoshi Matsuoka

2015年

　詳細を見る

researchmap
GPUクラスタにおける大規模都市気流シミュレーションの最適化と性能モデル

高嵜祐樹, 遠藤敏夫, 松岡聡

2015年

　詳細を見る

researchmap
Python, performance, and natural language processing

Aleksandr Drozd, Anna Gladkova, Satoshi Matsuoka

Proceedings of the 5th Workshop on Python for High-Performance and Scientific Computing - PyHPC '15 2015年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ACM Press

DOI： 10.1145/2835857.2835858

researchmap
Design of a NVRAM Specialized Degree Aware Dynamic Graph Data Structure

Keita Iwabuchi, Roger Pearce, Brian Van Essen, Maya Gokhale, Satoshi Matsuoka

2015年

　詳細を見る

researchmap
Performance Analysis of MapReduce Implementations for High Performance Homology Search

Chaojie Zhang, Koichi Shirahata, Shuji Suzuki, Yutaka Akiyama, Satoshi Matsuoka

2015年

　詳細を見る

researchmap
Porting and Optimizing GTC-P on Sunway TaihuLight Supercomputer with Sunway OpenACC

Yichao Wang, James Lin, Linjin Cai, William Tang, Stephane Ethier, Bei Wang, Simon See, Satoshi

2015年

　詳細を見る

researchmap
Pregelグラフ処理系におけるメッセージ配送最適化

上野晃司, 鈴村豊太郎, 松岡聡

2015年

　詳細を見る

researchmap
Signal-Driven Swarming: A Parallel Implementation of Evolved Autonomous Agents to Perform A Foraging Task

Aleksandr Drozd, Olaf Witkowski, Satoshi Matsuoka, Takashi Ikegami

2015年

　詳細を見る

researchmap
法定計量および計量標準におけるソフトウェア認証

松岡聡

計測と制御 54 ( 10 ) 766 - 769 2015年

　詳細を見る

記述言語：日本語出版者・発行元：The Society of Instrument and Control Engineers

DOI： 10.11499/sicejl.54.766

CiNii Books

researchmap

その他リンク： https://jlc.jst.go.jp/DN/JLC/20016439007?from=CiNii
Exploration of Lossy Compression for Application-level Checkpoint/Restart 査読

Naoto Sasaki, Kento Sato, Toshio Endo, Satoshi Matsuoka

2015 IEEE 29TH INTERNATIONAL PARALLEL AND DISTRIBUTED PROCESSING SYMPOSIUM (IPDPS) 914 - 922 2015年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/IPDPS.2015.67

Web of Science

researchmap
Efficient Execution of Multiple CUDA Applications Using Transparent Suspend, Resume and Migration

Taichiro Suzuki, Akira Nukada, Satoshi Matsuoka

EURO-PAR 2015: PARALLEL PROCESSING 9233 687 - 699 2015年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1007/978-3-662-48096-0_53

Web of Science

researchmap
Understanding Performance Portability of OpenACC for Supercomputers

Suttinee Sawadsitang, James Lin, Simon See, Francois Bodin, Satoshi Matsuoka

2015 IEEE 29TH INTERNATIONAL PARALLEL AND DISTRIBUTED PROCESSING SYMPOSIUM WORKSHOPS 699 - 707 2015年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/IPDPSW.2015.60

Web of Science

researchmap
Hardware-Centric Analysis of Network Performance for MPI Applications

Kevin A. Brown, Jens Domke, Satoshi Matsuoka

2015 IEEE 21ST INTERNATIONAL CONFERENCE ON PARALLEL AND DISTRIBUTED SYSTEMS (ICPADS) 692 - 699 2015年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/ICPADS.2015.92

Web of Science

researchmap
Characterizing MPI and Hybrid MPI plus Threads Applications at Scale: Case Study with BFS

Abdelhalim Amer, Huiwei Lu, Pavan Balaji, Satoshi Matsuoka

2015 15TH IEEE/ACM INTERNATIONAL SYMPOSIUM ON CLUSTER, CLOUD AND GRID COMPUTING 1075 - 1083 2015年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/CCGrid.2015.93

Web of Science

researchmap
Modeling Gather and Scatter with Hardware Performance Counters for Xeon Phi

James Lin, Akira Nukada, Satoshi Matsuoka

2015 15TH IEEE/ACM INTERNATIONAL SYMPOSIUM ON CLUSTER, CLOUD AND GRID COMPUTING 713 - 716 2015年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/CCGrid.2015.59

Web of Science

researchmap
An OpenACC Extension for Data Layout Transformation

Tetsuya Hoshino, Naoya Maruyama, Satoshi Matsuoka

2014 First Workshop on Accelerator Programming using Directives 12 - 18 2014年11月

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/waccpd.2014.12

researchmap
Tracing data movements within MPI collectives

Kevin A. Brown, Jens Domke, Satoshi Matsuoka

ACM International Conference Proceeding Series 09-12-September-2014 117 - 118 2014年9月

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1145/2642769.2642789

Scopus

researchmap
実アプリケーションを用いた計算機評価ベンチマークと性能リポジトリの開発

野村哲弘, 三浦信一, 遠藤敏夫, 松岡聡

研究報告ハイパフォーマンスコンピューティング（HPC） 2014 ( 29 ) 1 - 7 2014年7月

　詳細を見る

記述言語：日本語掲載種別：研究論文（研究会，シンポジウム資料等）出版者・発行元：一般社団法人情報処理学会

次世代スーパーコンピュータのアーキテクチャ開発における課題として，提案アーキテクチャのもとで実行したい実アプリケーションが十分な性能で動作するかを見積もることが挙げられる．そのためには対象となるアプリケーションの汎用的な性能モデルを構築する必要があるが，そのための基礎データとなるアーキテクチャを横断した実アプリケーション性能データベースというものは作られておらず，個別のアプリケーションについてアプリケーション開発者とアーキテクチャ開発者が個別に性能を予測している現状がある．本稿ではアプリケーションおよびアーキテクチャによらず一般的に性能モデルを構築する変数となる性能計測項目を定義し，その一般的な計測方法と保存形式を定義することにより，アプリケーション開発者が独力で各自のプログラムの性能モデルを構築して比較検討ができる環境を整えた経過を報告すると同時に，計測結果を格納して第三者が客観的にアプリケーションとアーキテクチャの組み合わせの適否を判断するためのリポジトリを構築することを提案する．

CiNii Books

J-GLOBAL

researchmap
HPCI先端ソフトウェア運用基盤の構築と運用

三浦信一, 滝澤真一朗, 松岡聡, 棟朝雅晴, 實本英之, 小林泰三

研究報告ハイパフォーマンスコンピューティング（HPC） 2014 ( 30 ) 1 - 6 2014年2月

　詳細を見る

記述言語：日本語掲載種別：研究論文（研究会，シンポジウム資料等）出版者・発行元：一般社団法人情報処理学会

平成 24 年度より運用が開始されている HPCI では，スーパコンピュータ「京」や基盤センター群が保有するスーパコンピュータ間の認証基盤統一，データ共有を実現している．しかしながら，既存のスーパコンピュータシステムはバッチキューでジョブ管理されていることや，計算ノードでの管理者権限がないため，OS や分散システムの研究開発を行う CS 系ユーザの利用環境条件を満たさない．また，インターネット上より各種データを取得し，それを用いた計算を行う場合や，得られた成果を外部に公開するには，スーパコンピュータの利用は不向きである．そこで我々は，利用者に対してシステムへの管理者権限を付与する広域分散システムのホスティング機能を提供する，先端ソフトウェア運用基盤を HPCI の枠組みの中で構築し，平成 26 年 4 月より本格運用を開始する．本稿では先端ソフトウェア運用基盤の設計，構築及び運用について紹介する．

CiNii Books

J-GLOBAL

researchmap
Cache-aware Sparse Matrix Formats for Kepler GPU

Yusuke Nagasaka, Akira Nukada, Satoshi Matsuoka

2014 20TH IEEE INTERNATIONAL CONFERENCE ON PARALLEL AND DISTRIBUTED SYSTEMS (ICPADS) 281 - 288 2014年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Special issue: SC13-The International Conference for High Performance Computing, Networking, Storage and Analysis

William Gropp, Satoshi Matsuoka

SCIENTIFIC PROGRAMMING 22 ( 2 ) 57 - 58 2014年

　詳細を見る

記述言語：英語

DOI： 10.1155/2014/915921

Web of Science

researchmap
Petascale General Solver for Semidefinite Programming Problems with over Two Million Constraints

Katsuki Fujisawa, Toshio Endo, Yuichiro Yasui, Hitoshi Sato, Naoki Matsuzawa, Satoshi Matsuoka, Hayato Waki

2014 IEEE 28TH INTERNATIONAL PARALLEL AND DISTRIBUTED PROCESSING SYMPOSIUM 2014年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/IPDPS.2014.121

Web of Science

researchmap
NVM-based Hybrid BFS with Memory Efficient Data Structure

Keita Iwabuchi, Hitoshi Sato, Yuichiro Yasui, Katsuki Fujisawa, Satoshi Matsuoka

2014 IEEE INTERNATIONAL CONFERENCE ON BIG DATA (BIG DATA) 529 - 538 2014年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Hybrid BFS Approach Using Semi-External Memory

Keita Iwabuchi, Hitoshi Sato, Ryo Mizote, Yuichiro Yasui, Katsuki Fujisawa, Satoshi Matsuoka

PROCEEDINGS OF 2014 IEEE INTERNATIONAL PARALLEL & DISTRIBUTED PROCESSING SYMPOSIUM WORKSHOPS (IPDPSW) 1698 - 1707 2014年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/IPDPSW.2014.189

Web of Science

researchmap
Fail-in-Place Network Design: Interaction between Topology, Routing Algorithm and Failures

Jens Domke, Torsten Hoefler, Satoshi Matsuoka

SC14: INTERNATIONAL CONFERENCE FOR HIGH PERFORMANCE COMPUTING, NETWORKING, STORAGE AND ANALYSIS 597 - 608 2014年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/SC.2014.54

Web of Science

researchmap
TSUBAME-KFC: a Modern Liquid Submersion Cooling Prototype towards Exascale Becoming the Greenest Supercomputer in the World

Toshio Endo, Akira Nukada, Satoshi Matsuoka

2014 20TH IEEE INTERNATIONAL CONFERENCE ON PARALLEL AND DISTRIBUTED SYSTEMS (ICPADS) 360 - 367 2014年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Efficient String Sorting on Multi- and Many-Core Architectures

Aleksandr Drozd, Miquel Pericas, Satoshi Matsuoka

2014 IEEE INTERNATIONAL CONGRESS ON BIG DATA (BIGDATA CONGRESS) 637 - 644 2014年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/BigData.Congress.2014.97

Web of Science

researchmap
Extreme Big Data (EBD): Next Generation Big Data Infrastructure Technologies Towards Yottabyte/Year.

Satoshi Matsuoka, Hitoshi Sato, Osamu Tatebe, Michihiro Koibuchi, Ikki Fujiwara, Shuji Suzuki, Masanori Kakuta, Takashi Ishida, Yutaka Akiyama, Toyotaro Suzumura, Koji Ueno, Hiroki Kanezashi, Takemasa Miyoshi

Supercomput. Front. Innov. 1 ( 2 ) 89 - 107 2014年

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.14529/jsfi140206

researchmap
Tracing Data Movements within MPI Collectives.

Kevin A. Brown, Jens Domke, Satoshi Matsuoka

117 - 117 2014年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1145/2642769.2642789

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/pvm/eurompi2014.html#BrownDM14
Latent Fault Detection With Unbalanced Workloads

Moshe Gabel, Kento Sato, Daniel Keren, Satoshi Matsuoka, Assaf Schuster

2014年

　詳細を見る

researchmap
Node-level Memory Access Optimization on Intel Knights Corner

James Lin, Shuo Li, Jiaming Zhao, Satoshi Matsuoka

2014年

　詳細を見る

researchmap
Out-of-core GPU Memory Management for MapReduce-based Large-scale Graph Processing

Koichi Shirahata, Hitoshi Sato, Satoshi Matsuoka

2014 IEEE INTERNATIONAL CONFERENCE ON CLUSTER COMPUTING (CLUSTER) 221 - 229 2014年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Large-scale Distributed Sorting for GPU-based Heterogeneous Supercomputers

Hideyuki Shamoto, Koichi Shirahata, Aleksandr Drozd, Hitoshi Sato, Satoshi Matsuoka

2014 IEEE INTERNATIONAL CONFERENCE ON BIG DATA (BIG DATA) 510 - 518 2014年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Scalable Analysis of Multicore Data Reuse and Sharing

Miquel Pericas, Kenjiro Taura, Satoshi Matsuoka

PROCEEDINGS OF THE 28TH ACM INTERNATIONAL CONFERENCE ON SUPERCOMPUTING, (ICS'14) 353 - 362 2014年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1145/2597652.2597674

Web of Science

researchmap
Analysis of Data Reuse in Task-Parallel Runtimes

Miquel Pericas, Abdelhalim Amer, Kenjiro Taura, Satoshi Matsuoka

HIGH PERFORMANCE COMPUTING SYSTEMS: PERFORMANCE MODELING, BENCHMARKING AND SIMULATION 8551 73 - 87 2014年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1007/978-3-319-10214-6_4

Web of Science

researchmap
FMI: Fault Tolerant Messaging Interface for Fast and Transparent Recovery

Kento Sato, Adam Moody, Kathryn Mohror, Todd Gamblin, Bronis R. de Supinski, Naoya Maruyama, Satoshi Matsuoka

2014 IEEE 28TH INTERNATIONAL PARALLEL AND DISTRIBUTED PROCESSING SYMPOSIUM 2014年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/IPDPS.2014.126

Web of Science

researchmap
A User-level InfiniBand-based File System and Checkpoint Strategy for Burst Buffers

Kento Sato, Kathryn Mohror, Adam Moody, Todd Gamblin, Bronis R. de Supinski, Naoya Maruyama, Satoshi Matsuoka

2014 14TH IEEE/ACM INTERNATIONAL SYMPOSIUM ON CLUSTER, CLOUD AND GRID COMPUTING (CCGRID) 21 - 30 2014年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/CCGrid.2014.24

Web of Science

researchmap
Using rCUDA to Reduce GPU Resource-assignment Fragmentation caused by Job Scheduler

Pak Markthub, Akihiro Nomura, Satoshi Matsuoka

2014 15TH INTERNATIONAL CONFERENCE ON PARALLEL AND DISTRIBUTED COMPUTING, APPLICATIONS AND TECHNOLOGIES (PDCAT 2014) 105 - 112 2014年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/PDCAT.2014.26

Web of Science

researchmap
How File Access Patterns Influence Interference Among Cluster Applications

Chih-Song Kuo, Aamer Shah, Akihiro Nomura, Satoshi Matsuoka, Felix Wolf

2014 IEEE INTERNATIONAL CONFERENCE ON CLUSTER COMPUTING (CLUSTER) 185 - 193 2014年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
システム評価のためのアプリケーション性能リポジトリの構築と性能モデルの評価

野村哲弘, 三浦信一, 遠藤敏夫, 松岡聡, 鈴木惣一朗, 丸山直也

情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 2013 ( 4 ) 1 - 6 2013年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

次世代スーパーコンピュータの開発に向けて実アプリケーション本位でのシステムデザインを行うためには,アーキテクチャと実アプリケーション実行性能を結びつける標準ベンチマークやパフォーマンスモデルが必要となるが,そのようなものはいまだ実現されていない.本報告では,将来 HPCI システムのあり方の調査研究「アプリケーション分野」におけるシステム評価用ベンチマークと性能モデルの作成について紹介する.本研究では,実アプリケーションコードの提供を受けてコードを単純化した「ミニアプリ」を作成し,ベンチマーク・性能モデルの基礎とする.また,複数の HPCI システム上で動作する性能評価ツールを用いてベンチマーク結果を収集し,性能モデルを構築するための基礎データとするとともに,性能モデルの構築方法・表現形式について考察する.

CiNii Books

J-GLOBAL

researchmap
Guest Editors' Introduction: Special Issue on Applications for the Heterogeneous Computing Era

Pavan Balaji, Satoshi Matsuoka

INTERNATIONAL JOURNAL OF HIGH PERFORMANCE COMPUTING APPLICATIONS 27 ( 2 ) 87 - 88 2013年5月

　詳細を見る

記述言語：英語

DOI： 10.1177/1094342013481158

Web of Science

researchmap
Tsubame2.0: The first petascale supercomputer in japan and the greatest production in the world

Satoshi Matsuoka, Takayuki Aoki, Toshio Endo, Hitoshi Sato, Shin'Ichiro Takizawa, Akihiko Nomura, Kento Sato

Contemporary High Performance Computing: From Petascale toward Exascale 525 - 555 2013年1月

　詳細を見る

掲載種別：論文集(書籍)内論文

Scopus

researchmap
Scalable Implementation of a MapReduce-based Graph Processing Algorithm for Large-scale Heterogeneous Supercomputers

Koichi Shirahata, Hitoshi Sato, Toyotaro Suzumura, Satoshi Matsuoka

PROCEEDINGS OF THE 2013 13TH IEEE/ACM INTERNATIONAL SYMPOSIUM ON CLUSTER, CLOUD AND GRID COMPUTING (CCGRID 2013) 277 - 284 2013年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/CCGrid.2013.85

Web of Science

researchmap
Energy-aware I/O optimization for checkpoint and restart on a NAND flash memory system

Takafumi Saito, Kento Sato, Hitoshi Sato, Satoshi Matsuoka

FTXS 2013 - Proceedings of the 3rd ACM Workshop on Fault-Tolerance for HPC at eXtreme Scale 41 - 47 2013年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1145/2465813.2465822

Scopus

researchmap
Proceedings of SC13 The International Conference for High Performance Computing, Networking, Storage and Analysis Denver, Colorado 17-22 November 2013

William Gropp, Satoshi Matsuoka

2013 INTERNATIONAL CONFERENCE FOR HIGH PERFORMANCE COMPUTING, NETWORKING, STORAGE AND ANALYSIS (SC) 2013年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
A Multi GPU Read Alignment Algorithm with Model-Based Performance Optimization

Aleksandr Drozd, Naoya Maruyama, Satoshi Matsuoka

HIGH PERFORMANCE COMPUTING FOR COMPUTATIONAL SCIENCE - VECPAR 2012 7851 270 - 277 2013年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
A Parallel Optimization Method for Stencil Computation on the Domain that is Bigger than Memory Capacity of GPUs

Guanghao Jin, Toshio Endo, Satoshi Matsuoka

2013 IEEE INTERNATIONAL CONFERENCE ON CLUSTER COMPUTING (CLUSTER) 2013年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
CUDA vs OpenACC: Performance Case Studies with Kernel Benchmarks and a Memory-Bound CFD Application11

Tetsuya Hoshino, Naoya Maruyama, Satoshi Matsuoka, Ryoji Takaki

PROCEEDINGS OF THE 2013 13TH IEEE/ACM INTERNATIONAL SYMPOSIUM ON CLUSTER, CLOUD AND GRID COMPUTING (CCGRID 2013) 136 - 143 2013年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/CCGrid.2013.12

Web of Science

researchmap
Fork-Join and Data-Driven Execution Models on Multi-core Architectures: Case Study of the FMM

Abdelhalim Amer, Naoya Maruyama, Miquel Pericas, Kenjiro Taura, Rio Yokota, Satoshi Matsuoka

SUPERCOMPUTING (ISC 2013) 7905 255 - 266 2013年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Energy-aware I/O optimization for checkpoint and restart on a NAND flash memory system.

Takafumi Saito, Kento Sato, Hitoshi Sato, Satoshi Matsuoka

41 - 48 2013年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1145/2465813.2465822

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/hpdc/ftxs2013.html#SaitoSSM13
Multi-GPU Implementation of the NICAM Atmospheric Model

Irina Demeshko, Naoya Maruyama, Hirofumi Tomita, Satoshi Matsuoka

EURO-PAR 2012: PARALLEL PROCESSING WORKSHOPS 7640 175 - 184 2013年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Improving the computing efficiency of HPC systems using a combination of proactive and preventive checkpointing

Mohamed Slim Bouguerra, Ana Gainaru, Leonardo Bautista Gomez, Franck Cappello, Satoshi Matsuoka, Naoya Maruyama

IEEE 27TH INTERNATIONAL PARALLEL AND DISTRIBUTED PROCESSING SYMPOSIUM (IPDPS 2013) 501 - 512 2013年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/IPDPS.2013.74

Web of Science

researchmap
Towards Exascale with the ANR-JST Japanese-French Project FP3C 査読

G. Antoniu, T. Boku, A. Buttari, C. Calvin, P. Codognet, M. Dayde, N. Emad, Y. Ishikawa, G. Joslin, S. Matsuoka, K. Nakajima, H. Nakashima, R. Namyst, S. Petiton, T. Sakurai, M. Sato

2013 COMPUTER SCIENCE AND INFORMATION TECHNOLOGIES (CSIT) 2013年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/CSITechnol.2013.6710357

Web of Science

researchmap
Scalable Reed-Solomon-Based Reliable Local Storage for HPC Applications on IaaS Clouds

Leonardo Bautista Gomez, Bogdan Nicolae, Naoya Maruyama, Franck Cappello, Satoshi Matsuoka

EURO-PAR 2012 PARALLEL PROCESSING 7484 313 - 324 2012年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Hierarchical Clustering Strategies for Fault Tolerance in Large Scale HPC Systems

Leonardo Bautista-Gomez, Thomas Ropars, Naoya Maruyama, Franck Cappello, Satoshi Matsuoka

2012 IEEE INTERNATIONAL CONFERENCE ON CLUSTER COMPUTING (CLUSTER) 355 - 363 2012年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/CLUSTER.2012.71

Web of Science

researchmap
Using Bittorrent and SVC for Efficient Video Sharing and Streaming

Amer Abdelhalim, Toufik Ahmed, Hidouci Walid-Khaled, Satoshi Matsuoka

2012 IEEE SYMPOSIUM ON COMPUTERS AND COMMUNICATIONS (ISCC) 537 - 543 2012年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Design and Modeling of a Non-blocking Checkpointing System

Kento Sato, Kathryn Mohror, Adam Moody, Todd Gamblin, Bronis R. de Supinski, Naoya Maruyama, Satoshi Matsuoka

2012 INTERNATIONAL CONFERENCE FOR HIGH PERFORMANCE COMPUTING, NETWORKING, STORAGE AND ANALYSIS (SC) 2012年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Topic 16: GPU and Accelerators Computing

Alex Ramirez, Dimitrios S. Nikolopoulos, David Kaeli, Satoshi Matsuoka

EURO-PAR 2012 PARALLEL PROCESSING 7484 857 - 858 2012年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Design and Implementation of Portable and Efficient Non-blocking Collective Communication. 査読

Akihiro Nomura 0002, Yutaka Ishikawa, Naoya Maruyama, Satoshi Matsuoka

12th IEEE/ACM International Symposium on Cluster, Cloud and Grid Computing(CCGRID) 1 - 8 2012年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE Computer Society

DOI： 10.1109/CCGrid.2012.96

researchmap
High-Performance General Solver for Extremely Large-Scale Semidefinite Programming Problems

Katsuki Fujisawa, Toshio Endo, Hitoshi Sato, Makoto Yamashita, Satoshi Matsuoka, Maho Nakata

2012 INTERNATIONAL CONFERENCE FOR HIGH PERFORMANCE COMPUTING, NETWORKING, STORAGE AND ANALYSIS (SC) 2012年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Sequence Alignment on Massively Parallel Heterogeneous Systems

Aleksandr Drozd, Naoya Maruyama, Satoshi Matsuoka

2012 IEEE 26TH INTERNATIONAL PARALLEL AND DISTRIBUTED PROCESSING SYMPOSIUM WORKSHOPS & PHD FORUM (IPDPSW) 2498 - 2501 2012年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/IPDPSW.2012.311

Web of Science

researchmap
Scalable Multi-GPU 3-D FFT for TSUBAME 2.0 Supercomputer

Akira Nukada, Kento Sato, Satoshi Matsuoka

2012 INTERNATIONAL CONFERENCE FOR HIGH PERFORMANCE COMPUTING, NETWORKING, STORAGE AND ANALYSIS (SC) 2012年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
The International Exascale Software Project roadmap 査読

Jack Dongarra, Pete Beckman, Terry Moore, Patrick Aerts, Giovanni Aloisio, Jean-Claude Andre, David Barkai, Jean-Yves Berthou, Taisuke Boku, Bertrand Braunschweig, Franck Cappello, Barbara Chapman, Xuebin Chi, Alok Choudhary, Sudip Dosanjh, Thom Dunning, Sandro Fiore, Al Geist, Bill Gropp, Robert Harrison, Mark Hereld, Michael Heroux, Adolfy Hoisie, Koh Hotta, Zhong Jin, Yutaka Ishikawa, Fred Johnson, Sanjay Kale, Richard Kenway, David Keyes, Bill Kramer, Jesus Labarta, Alain Lichnewsky, Thomas Lippert, Bob Lucas, Barney Maccabe, Satoshi Matsuoka, Paul Messina, Peter Michielse, Bernd Mohr, Matthias S. Mueller, Wolfgang E. Nagel, Hiroshi Nakashima, Michael E. Papka, Dan Reed, Mitsuhisa Sato, Ed Seidel, John Shalf, David Skinner, Marc Snir, Thomas Sterling, Rick Stevens, Fred Streitz, Bob Sugar, Shinji Sumimoto, William Tang, John Taylor, Rajeev Thakur, Anne Trefethen, Mateo Valero, Aad van der Steen, Jeffrey Vetter, Peg Williams, Robert Wisniewski, Kathy Yelick

INTERNATIONAL JOURNAL OF HIGH PERFORMANCE COMPUTING APPLICATIONS 25 ( 1 ) 3 - 60 2011年2月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1177/1094342010391989

Web of Science

researchmap
Physis: an implicitly parallel programming model for stencil computations on large-scale GPU-accelerated supercomputers.

Naoya Maruyama, Tatsuo Nomura, Kento Sato, Satoshi Matsuoka

11 - 12 2011年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1145/2063384.2063398

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/sc/sc2011.html#MaruyamaNSM11
Physis: An implicitly parallel programming model for stencil computations on large-scale gpu-accelerated supercomputers

Naoya Maruyama, Tatsuo Nomura, Kento Sato, Satoshi Matsuoka

Proceedings of 2011 SC - International Conference for High Performance Computing, Networking, Storage and Analysis 2011年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1145/2063384.2063398

Scopus

researchmap
Performance Characteristics of Graph500 on Large-Scale Distributed Environment

Toyotaro Suzumura, Koji Ueno, Hitoshi Sato, Katsuki Fujisawa, Satoshi Matsuoka

2011 IEEE INTERNATIONAL SYMPOSIUM ON WORKLOAD CHARACTERIZATION (IISWC) 149 - 158 2011年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Model-based Fault Localization: Finding Behavioral Outliers in Large-scale Computing Systems

Naoya Maruyama, Satoshi Matsuoka

NEW GENERATION COMPUTING 28 ( 3 ) 237 - 255 2010年7月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1007/s00354-009-0088-6

Web of Science

researchmap
THE INTERNATIONAL EXASCALE SOFTWARE PROJECT: A CALL TO COOPERATIVE ACTION BY THE GLOBAL HIGH-PERFORMANCE COMMUNITY

Jack Dongarra, Pete Beckman, Patrick Aerts, Frank Cappello, Thomas Lippert, Satoshi Matsuoka, Paul Messina, Terry Moore, Rick Stevens, Anne Trefethen, Mateo Valero

INTERNATIONAL JOURNAL OF HIGH PERFORMANCE COMPUTING APPLICATIONS 23 ( 4 ) 309 - 322 2009年11月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1177/1094342009347714

Web of Science

researchmap
四種プロセッサからなるヘテロ型スーパーコンピュータにおける Linpack チューニング

遠藤敏夫, 額田彰, 松岡聡, 丸山直也, 實本英之

情報処理学会研究報告. 計算機アーキテクチャ研究会報告 182 ( 14 ) 13 - 18 2009年2月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

汎用プロセッサ二種とSIMD型アクセラレータ二種を備えたヘテロ型スパコンであるTSUBAMEにおけるLinpackベンチマークの実行について報告する.アクセラレータ型アーキテクチャは電力・設置面積を抑えつつ計算機システムの性能向上のために重要であるが,大規模並列計算を行った報告は筆者らの報告を除き依然少ない.TSUBAMEの約10000のOpteronコア,約500のXeonコア,約640基のClearSpeedアクセラレータ,約620基のNVIDIA Tesla GPUを全て用いたLinpack実行において,77TFlopsを達成した.この結果を得るためには,アクセラレータの性能を保持するためのプログラムの改変やチューニングが必要不可欠であった.なお今回の結果は最新Top500スパコンランキングに29位にランクされ,ヘテロ型システムとしては世界二位である.

CiNii Books

researchmap
Speculative Checkpointing: Exploiting Temporal Affinity of Memory Operations 査読

Satoshi Matsuoka, Ikuhei Yamagata, Hideyuki Jitsumoto

Conference on High Performance Computing (HPC Asia 2009) 2009年

　詳細を見る

researchmap
Adaptive Resource Indexing Technique for Unstructured Peer-to-Peer Networks

Sumeth Lerthirunwong, Naoya Maruyama, Satoshi Matsuoka

CCGRID: 2009 9TH IEEE INTERNATIONAL SYMPOSIUM ON CLUSTER COMPUTING AND THE GRID 172 - 179 2009年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/CCGRID.2009.41

Web of Science

researchmap
Power-Aware Dynamic Task Scheduling for Heterogeneous Accelerated Clusters

Tomoaki Hamano, Toshio Endo, Satoshi Matsuoka

2009 IEEE INTERNATIONAL SYMPOSIUM ON PARALLEL & DISTRIBUTED PROCESSING, VOLS 1-5 1912 - 1919 2009年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Auto-Tuning 3-D FFT Library for CUDA GPUs

Akira Nukada, Satoshi Matsuoka

PROCEEDINGS OF THE CONFERENCE ON HIGH PERFORMANCE COMPUTING NETWORKING, STORAGE AND ANALYSIS 2009年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Fast Conjugate Gradients with Multiple GPUs

Ali Cevahir, Akira Nukada, Satoshi Matsuoka

COMPUTATIONAL SCIENCE - ICCS 2009, PART I 5544 893 - 903 2009年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
A Model-Based Algorithm for Optimizing I/O Intensive Applications in Clouds using VM-Based Migration

Kento Sato, Hitoshi Sato, Satoshi Matsuoka

CCGRID: 2009 9TH IEEE INTERNATIONAL SYMPOSIUM ON CLUSTER COMPUTING AND THE GRID 466 - + 2009年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/CCGRID.2009.24

Web of Science

researchmap
File Clustering Based Replication Algorithm in a Grid Environment 査読

Hitoshi Sato, Satoshi Matsuoka, Toshio Endo

CCGRID: 2009 9TH IEEE INTERNATIONAL SYMPOSIUM ON CLUSTER COMPUTING AND THE GRID 204 - 211 2009年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/CCGRID.2009.73

Web of Science

researchmap
Aspects of GPU for General Purpose High Performance Computing

Reiji Suda, Takayuki Aoki, Shoichi Hirasawa, Akira Nukada, Hiroki Honda, Satoshi Matsuoka

PROCEEDINGS OF THE ASP-DAC 2009: ASIA AND SOUTH PACIFIC DESIGN AUTOMATION CONFERENCE 2009 216 - + 2009年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Coupled-Simulation e-Science Support in the NAREGI Grid 査読

Satoshi Matsuoka, Kazushige Saga, Mutsumi Aoyagi

COMPUTER 41 ( 11 ) 42 - + 2008年11月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1109/MC.2008.449

Web of Science

researchmap
GridARS: An Advance Reservation-based Grid Co-allocation Framework for Distributed Computing and Network Resources 査読

Atsuko Takefusa, Hidemoto Nakada, Tomohiro Kudoh, Yoshio Tanaka, Satoshi Sekiguchi

Proc. 13th Workshop on Job Scheduling Strategies for Parallel Processing (LNCS 4942) 152 - 168 2008年4月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

For high performance parallel computing on actual Grids, one of the<br /> important issues is to co-allocate the distributed resources that are<br /> managed by <br /> various local schedulers with advance reservation.<br /> To address the issue, we proposed and developed the GridARS resource<br /> co-allocation framework, and a general advance reservation protocol<br /> that uses WSRF/GSI and a two-phased commit (2PC) protocol to<br /> enable a generic and secure advance reservation process based on distributed<br /> transactions, and provides the interface module for various existing<br /> resource schedulers.<br /> To confirm the effectiveness of GridARS, we describe the performance of <br /> a simultaneous reservation process and a case study of GridARS grid<br /> co-allocation over transpacific computing and network resources.<br /> Our experiments showed that: <br /> 1) the GridARS simultaneous 2PC reservation process is scalable and<br /> practical and<br /> 2) GridARS can co-allocate distributed<br /> resources managed by various local schedulers stably.

DOI： 10.1007/978-3-540-78699-3_9

researchmap
An efficient, model-based CPU-GPU heterogeneous FFT library 査読

Yasuhito Ogata, Toshio Endo, Naoya Maruyama, Satoshi Matsuoka

2008 IEEE INTERNATIONAL SYMPOSIUM ON PARALLEL & DISTRIBUTED PROCESSING, VOLS 1-8 380 - + 2008年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Model-Based Optimization for Data-Intensive Application on Virtual Cluster

Kento Sato, Hitoshi Sato, Satoshi Matsuoka

2008 9TH IEEE/ACM INTERNATIONAL CONFERENCE ON GRID COMPUTING 367 - 368 2008年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Bandwidth Intensive 3-D FFT kernel for GPUs using CUDA

Akira Nukada, Yasuhiko Ogata, Toshio Endo, Satoshi Matsuoka

INTERNATIONAL CONFERENCE FOR HIGH PERFORMANCE COMPUTING, NETWORKING, STORAGE AND ANALYSIS 273 - 283 2008年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Index Distribution Technique for Efficient Search on Unstructured Peer-to-Peer Networks

Sumeth Lerthirunwong, Naoya Maruyama, Satoshi Matsuoka

ECTI-CON 2008: PROCEEDINGS OF THE 2008 5TH INTERNATIONAL CONFERENCE ON ELECTRICAL ENGINEERING/ELECTRONICS, COMPUTER, TELECOMMUNICATIONS AND INFORMATION TECHNOLOGY, VOLS 1 AND 2 97 - + 2008年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
The Rise of the Commodity Vectors

Satoshi Matsuoka

HIGH PERFORMANCE COMPUTING FOR COMPUTATIONAL SCIENCE - VECPAR 2008 5336 53 - 62 2008年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Model-based fault localization in large-scale computing systems

Naoya Maruyama, Satoshi Matsuoka

2008 IEEE INTERNATIONAL SYMPOSIUM ON PARALLEL & DISTRIBUTED PROCESSING, VOLS 1-8 1841 - 1852 2008年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
The road to TSUBAME and beyond

Satoshi Matsuoka

HIGH PERFORMANCE COMPUTING ON VECTOR SYSTEMS 2007 265 - 267 2008年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1007/978-3-540-74384-2_19

Web of Science

researchmap
Connecting Text Mining and Pathways using the PathText Resource 査読

Kemper Oda Okazaki Saetre, Matsuoka, Kikuchi, Kitano, Ananiadou Tsujii Tsuruoka

SIXTH INTERNATIONAL CONFERENCE ON LANGUAGE RESOURCES AND EVALUATION, LREC 2008 1736 - 1740 2008年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Access-Pattern and Bandwidth Aware File Replication Algorithm in a Grid Environment 査読

Hitoshi Sato, Satoshi Matsuoka, Toshio Endo, Naoya Maruyama

2008 9TH IEEE/ACM INTERNATIONAL CONFERENCE ON GRID COMPUTING 250 - 257 2008年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Performance evaluation of parallel applications on next generation memory architecture with power-aware paging method 査読

Yuto Hosogaya, Toshio Endo, Satoshi Matsuoka

2008 IEEE INTERNATIONAL SYMPOSIUM ON PARALLEL & DISTRIBUTED PROCESSING, VOLS 1-8 862 - 869 2008年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Massive supercomputing coping with heterogeneity of modern accelerators 査読

Toshio Endo, Satoshi Matsuoka

2008 IEEE INTERNATIONAL SYMPOSIUM ON PARALLEL & DISTRIBUTED PROCESSING, VOLS 1-8 1179 - 1188 2008年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Locality aware MPI communication on a commodity opto-electronic hybrid network 査読

Shin'ichiro Takizawa, Toshio Endo, Satoshi Matsuoka

2008 IEEE INTERNATIONAL SYMPOSIUM ON PARALLEL & DISTRIBUTED PROCESSING, VOLS 1-8 2158 - + 2008年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
An Advance Reservation-based Computation Resource Manager for Global Scheduling 査読

Hidemoto Nakada, Atsuko Takefusa, Katsuhiko Ookubo, Tomohiro Kudoh, Yoshio Tanaka, Satoshi Sekiguchi

Proc. of GCA 2007 3 - 14 2007年6月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Advance Reservation is one possible way to enable resource co-allocation on the Grid. This method requires all the resources to have advance reservation capability as well as coordination protocol support. We employed 2-phased commit protocol as a coordination protocol, which is common in the distributed transaction area, and implemented an Advance Reservation Manager called {\bf PluS}. PluS works with existing local queuing managers, such as TORQUE or Grid Engine, and provides users advance reservation capability. To provide the capability, there are two implementation methods; 1) completely replaces the scheduling module of the queuing manger, 2) represents reservation as a queue and controls the queues using external interface. We designed and implemented a reservation manager with both way, and evaluated them. We found that the former has smaller overhead and allows arbitrary scheduling policy, while the latter is much easier to implement withacceptable response time.

DOI： 10.1142/9789812708823_0001

researchmap
情報爆発時代における安全・安心ITシステム基盤(<特集>情報爆発時代に向けた新しいIT基盤技術の研究)

松岡聡, 柴山悦哉, 近山隆, 中島達夫, 田浦健次朗

人工知能 22 ( 2 ) 222 - 228 2007年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人人工知能学会

DOI： 10.11517/jjsai.22.2_222

CiNii Books

CiNii Research

researchmap

その他リンク： http://id.nii.ac.jp/1004/00006713/
A decentralized, scalable, and autonomous grid monitoring system 査読

Laurent Baduel, Satoshi Matsuoka

PRINCIPLES OF DISTRIBUTED SYSTEMS, PROCEEDINGS 4878 1 - 15 2007年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
情報爆発時代における安全・安心ITシステム基盤査読

松岡聡, 柴山悦哉, 近山隆, 田浦健次朗

人工知能学会誌 22 222 - 228 2007年

　詳細を見る

掲載種別：研究論文（学術雑誌）

CiNii Research

researchmap

その他リンク： https://kaken.nii.ac.jp/grant/KAKENHI-PLANNED-18049073/
Grid'BnB: A parallel branch and bound framework for grids

Denis Caromel, Alexandre di Costanzo, Laurent Baduel, Satoshi Matsuoka

HIGH PERFORMANCE COMPUTING - HIPC 2007, PROCEEDINGS 4873 566 - 579 2007年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Teddy: a sketching interface for 3D freeform design.

Takeo Igarashi, Satoshi Matsuoka, Hidehiko Tanaka

21 - 21 2007年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1145/1281500.1281532

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/siggraph/siggraph2007courses.html#IgarashiMT07
ABARIS: An Adaptable Fault Detection/Recovery Component Framework for MPIs. 査読

Hideyuki Jitsumoto, Toshio Endo, Satoshi Matsuoka

21th International Parallel and Distributed Processing Symposium (IPDPS 2007), Proceedings, 26-30 March 2007, Long Beach, California, USA 1 - 8 2007年

　詳細を見る

出版者・発行元：IEEE

DOI： 10.1109/IPDPS.2007.370603

researchmap
A peer-to-peer infrastructure for autonomous grid monitoring 査読

Laurent Baduel, Satoshi Matsuoka

Proceedings - 21st International Parallel and Distributed Processing Symposium, IPDPS 2007; Abstracts and CD-ROM 2007年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/IPDPS.2007.370653

Scopus

researchmap
Virtual clusters on the fly - Fast, scalable, and flexible installation

Hideo Nishimura, Naoya Maruyama, Satoshi Matsuoka

CCGRID 2007: SEVENTH IEEE INTERNATIONAL SYMPOSIUM ON CLUSTER COMPUTING AND THE GRID 549 - + 2007年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
High-performance MPI broadcast algorithm for grid environments utilizing multi-lane NICs 査読

Tatsuhiro Chiba, Toshio Endo, Satoshi Matsuoka

CCGRID 2007: SEVENTH IEEE INTERNATIONAL SYMPOSIUM ON CLUSTER COMPUTING AND THE GRID 487 - + 2007年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Design and Implementation of a Local Scheduling System with Advance Reservation for Co-allocation on the Grid 査読

Hidemoto Nakada, Atsuko Takefusa, Katsuhiko Ookubo, Makoto Kishimoto, Tomohiro Kudoh, Yoshio Tanaka, Satoshi Sekiguchi

Proceedings of CIT2006 2006年9月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

While advance reservation is an essential capability for co-allocating several resources on Grid environments, it is not obvious how it can co-exist with priority-based First Come First Served scheduling, that is widely used as local scheduling policy today. To investigate this problem, we 1) developed a scheduling API in Java for TORQUE, a variant of OpenPBS, that enables users to implement their own schedulers and replace the original scheduling module with them, 2) implemented a prototype scheduler module that has advance reservation capability with the API. We also provide an external interface for the reservation capability based on WSRF to enable co-allocation of resources over the Grid. Using this interface with the job submission module from Globus toolkit 4, users can make reservation for resources and submit jobs over the Grid.

DOI： 10.1109/CIT.2006.71

researchmap
Interactive beautification: A technique for rapid geometric design 査読

Takeo Igarashi, Satoshi Matsuoka, Sachiko Kawachiya, Hidehiko Tanaka

SIGGRAPH 2006 - ACM SIGGRAPH 2006 Courses 2006年7月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：Association for Computing Machinery, Inc

DOI： 10.1145/1185657.1185769

Scopus

researchmap
G-lambda: Coordination of a Grid Scheduler and Lambda Path Service over GMPLS 査読

Atsuko Takefusa, Michiaki Hayashi, Naohide Nagatsu, Hidemoto Nakada, Tomohiro Kudoh, Takahiro Miyamoto, Tomohiro Otani, Hideaki Tanaka, Masatoshi Suzuki, Yasunori Samejima, Wataru Imajuku, Masahiko Jinno, Yoshihiro Takigawa, Shuichi Okamoto, Yoshio Tanaka, Satoshi Sekiguchi

Future Generation Computer Systems-The International Journal of Grid Computing Theory Methods and Applications 22 ( 2006 ) 868 - 875 2006年6月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1016/j.future.2006.03.005

Scopus

researchmap
MegaProto/E: Power-Aware High-Performance Cluster with Commodity Technology 査読

Taisuke, Boku, Mitsuhisa, Sato, Daisuke, Takahashi, Hiroshi, Nakashima, Hiroshi, Nakamura, Satoshi, Matsuoka, Yoshihiko, Hotta

Proc. 20th IEEE International Parallel and Distributed Processing Symposium (IPDPS 2006), The Second Workshop on High-Performance, Power-Aware Computing (HP-PAC 2006) 2006年4月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE Computer Society

researchmap
PCクラスタにおける電力実行プロファイル情報を用いたDVS制御による電力性能の最適化 (「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006)) 査読

堀田義彦, 佐藤三久, 木村英明, 松岡聡, 朴泰祐, 高橋大介

情報処理学会研究報告 2006 ( 20 ) 139 - 144 2006年2月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

本論文では,高性能PCクラスタにおけるプロファイル情報を用いたDVSスケジューリングによる電力性能最適化手法を提案する.近年,従来低消費電力向けプロセッサに実装されていた,消費電力を削減するためにプロセッサの動作周波数・電圧を動的に変更するDVS(Dynamic Voltage Scaling)が高性能プロセッサにも実装されている.性能低下を最小限にし,消費電力を削減するために通信やメモリアクセスの際に適切な周波数スケジューリングを行う必要がある.電力性能を最適化するために,プログラムをいくつかの領域に分割し,領域ごとに適切な周波数を選択する.DVSによる周波数変更は,オーバーヘッドを発生するため,これを加味した周波数選択アルゴリズムを提案する.システムの詳細な電力消費特性を測定するため,電力測定環境を構築した.このシステムにより,異なるプロセッサを使用する2つのクラスタで提案するアルゴリズムの有効性能の評価を行った.その結果,標準の周波数で動作するときと比べ,最大40%のをEDP(ED積)を5%以下の性能低下でできることがわかった.

CiNii Books

researchmap
Making wide-area, multi-site MPI feasible using Xen VM

Masaki Tatezono, Naoya Maruyama, Satoshi Matsuoka

FRONTIERS OF HIGH PERFORMANCE COMPUTING AND NETWORKING - ISPA 2006 WORKSHOPS, PROCEEDINGS 4331 387 - + 2006年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Teddy: a sketching interface for 3D freeform design.

Takeo Igarashi, Satoshi Matsuoka, Hidehiko Tanaka

11 - 11 2006年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1145/1185657.1185772

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/siggraph/siggraph2006courses.html#IgarashiMT06
Multi-Replication with Intelligent Staging in Data-Intensive Grid Applications 査読

Yuya Machida, Shin'ichiro Takizawa, Hidemoto Nakada, Satoshi Matsuoka

2006 7TH IEEE/ACM INTERNATIONAL CONFERENCE ON GRID COMPUTING 88 - + 2006年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/ICGRID.2006.311002

Web of Science

researchmap
高性能計算のための低電力・高密度クラスタMegaProto 査読

中島浩, 中村宏, 佐藤三久, 朴泰祐, 松岡聡, 高橋大介, 堀田義彦

情報処理学会論文誌コンピューティングシステム（ACS） 46 ( 12 ) 46 - 61 2005年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

現在進行中の研究プロジェクト「低電力とモデリング技術によるメガスケールコンピューティング」において，我々は百万プロセッサ規模の並列システムは低電力コモディティプロセッサの高密度実装によってのみ実現可能であると主張し，それを実証するためのプロトタイプMegaProto を開発している．また同時にMegaProto は，プロジェクトで開発中の低電力化コンパイル技術，高信頼・高性能ネットワーク技術，高信頼クラスタ構築技術，多重並列プログラミング技術などを実証するためのプラットフォームとしても機能する．MegaProto は19 インチラックに搭載可能な1U サイズのクラスタユニットを単位として構成され，1 つのユニットには16 個の低電力プロセッサと，それらを結合するプロセッサあたり2Gbps の高バンド幅ネットワークが搭載される．ユニットあたりのピーク性能は第1 バージョンで14.4GFlops，第2 バージョンで32.0GFlops であり，ユニット内およびユニット間のネットワークバンド幅はそれぞれ32Gbps，16Gbps である．また，消費電力は待機時で150W，最大計算負荷を課した条件でも300～320W と小さく，従来型の1U サーバ，たとえばハイエンドのデュアルプロセッササーバと同等以下である．一方NPB による性能評価の結果，第1バージョンにおいても4 つのベンチマークでデュアルプロセッササーバを大きく凌駕し，最大2.8 倍の高い性能を発揮することが明らかになっており，コモディティ技術により高密度・低消費電力・高性能が同時に達成できることが実証された．MegaProto is a proof-of-concept prototype for our project "Mega-Scale Computing Based on Low-Power Technology and Workload Modeling", implementing our key idea that a millionscale parallel system should be built with densely mounted low-power commodity processors. It also serves as a platform to implement and evaluate our new technologies such as power conscious compilation, highly reliable and high performance networking, highly dependable cluster management, and multi-level scalable parallel programming. The building block of the MegaProto is a 1U-high 19 inch-rack mountable motherboard unit on which 16 low-power, one-dollar note-sized, commodity PC-architecture daughterboards are mounted with a high bandwidth, 2Gbps per processor network based on Gigabit Ethernet. The peak performance of each unit is 14.4GFlops for the first version and will improve to 32.0GFlops in the second version through a processor/daughterboard upgrade. The intra- and inter-unit network bandwidths are 32Gbps and 16Gbps respectively. As for power consumption, the entire unit idles at less than 150W and consumes 300-320W maximum under extreme computational stress; this is comparable to or better than conventional 1U servers comprised of dual high-performance, power hungry processors, while benchmarks exhibit up to 279% superior performance for some NPB programs. This demonstrates that higher performance can be achieved with low-power, densely populated architectures with commodity components.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00018370/
MegaProto: A Low-Level and Compact Cluster for High-Performance Computing 査読

H., Nakashima, H., Nakamura, M., Sato, T., Boku, S., Matsuoka, D., Takahashi, Y., Hotta

Proc. of HP-PAC05 (in IPDPS2005), Denver CDROM 2005年1月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

researchmap
A scalable multi-replication framework for data grid 査読

S Takizawa, Y Takamiya, H Nakada, S Matsuoka

2005 SYMPOSIUM ON APPLICATIONS AND THE INTERNET WORKSHOPS, PROCEEDINGS 2005 310 - 315 2005年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

Scopus

researchmap

その他リンク： http://orcid.org/0000-0002-8901-2504
Parallelization of phylogenetic tree inference using grid technologies

Yo Yamamoto, Hidemoto Nakada, Hidetoshi Shimodaira, Satoshi Matsuoka

Lecture Notes in Bioinformatics (Subseries of Lecture Notes in Computer Science) 3370 103 - 116 2005年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1007/978-3-540-32251-1_10

Scopus

researchmap
The second trans-pacific grid datafarm testbed and experiments for SC2003 査読

O Tatebe, H Ogawa, Y Kodama, T Kudoh, S Sekiguchi, S Matsuoka, K Aida, T Boku, M Sato, Y Morita, Y Kitatsuji, J Williams, J Hicks

2004 INTERNATIONAL SYMPOSIUM ON APPLICATIONS AND THE INTERNET WORKSHOPS, PROCEEDINGS 602 - 607 2004年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Parallelization of Phylogenetic Tree Inference Using Grid Technologies.

Yo Yamamoto, Hidemoto Nakada, Hidetoshi Shimodaira, Satoshi Matsuoka

103 - 116 2004年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1007/978-3-540-32251-1_10

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/lsgrid/lsgrid2004.html#YamamotoNSM04
A Java-based programming environment for hierarchical Grid: Jojo 査読

H Nakada, S Matsuoka, S Sekiguchi

2004 IEEE INTERNATIONAL SYMPOSIUM ON CLUSTER COMPUTING AND THE GRID - CCGRID 2004 51 - 58 2004年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

Scopus

researchmap

その他リンク： http://orcid.org/0000-0002-8901-2504
GridSpeed: A Web-based grid portal generation server 査読

Toyotaro Suzumura, Satoshi Matsuoka, Hidemoto Nakada, Henri Casanova

Proceedings - Seventh International Conference on High Performance Computing and Grid in Asia Pacific Region, HPCAsia 2004 26 - 33 2004年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/HPCASIA.2004.1324013

Scopus

researchmap
The design and implementation of a fault-tolerant RFC system: Ninf-C 査読

Hidemoto Nakada, Satoshi Matsuoka, Yoshio Tanaka, Satoshi Sekiguchi

Proceedings - Seventh International Conference on High Performance Computing and Grid in Asia Pacific Region, HPCAsia 2004 9 - 18 2004年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/HPCASIA.2004.1324011

Scopus

researchmap
Autonomous configuration of grid monitoring systems 査読

K Shirose, S Matsuoka, H Nakada, H Ogawa

2004 INTERNATIONAL SYMPOSIUM ON APPLICATIONS AND THE INTERNET WORKSHOPS, PROCEEDINGS 651 - 657 2004年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

Scopus

researchmap

その他リンク： http://orcid.org/0000-0002-8901-2504
グリッド計算環境でのデッドラインを考慮したスケジューリング手法の性能査読

竹房あつ子, 松岡聡

電子情報通信学会論文誌. D-I, 情報・システム, I-情報処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-I 86 ( 9 ) 661 - 670 2003年9月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

広域ネットワークに接続された計算資源を共通の目的をもつコミュニティで効率的に活用するグリッドが注目されている.グリッドシステムとして,ネットワーク上で計算資源とともにサービスの提供を可能にするNetwork-enabled Server (NES)が複数提案されている.NESは一般的にクライアント・サーバ型アーキテクチャであり,分散したグリッド計算資源上にサーバを用意する.一方,複数サーバ,複数のクライアントを想定したグリッドのスケジューリングに関する議論が十分に行われていない.また,将来のNESシステム運用での課金に伴い,ユーザはジョブ実行時間を最短にすることから最小コストの資源群を利用して規定時間内に処理を終了させることを要求するようになる.本論文ではデッドラインスケジューリングに着目し,その性能特性をグリッドの評価用シミュレータBricksで調査した.まず,複数サーバ,複数クライアントを想定した,デッドラインスケジューリングアルゴリズムを紹介するとともに,その性能を高めるメカニズム,Load CorrectionとFallbackを提案する.次に,Bricksを用いた評価より,グリッド上でのNESシステムのデッドラインスケジューリングの有効性を示す.

CiNii Books

researchmap
Grid Datafarmにおけるスケジューリング・複製手法の性能評価査読

竹房あつ子, 建部修見, 松岡聡, 森田洋平

情報処理学会論文誌コンピューティングシステム（ACS） 44 ( 11 ) 57 - 67 2003年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

グリッド技術を基盤にした大容量データに対する遍在するアクセスを可能にする技術をデータグリッドと呼び，複数のシステムの設計・実装が行われている．しかしながら，それらは実験段階にあり，データグリッドアーキテクチャの設計方針の妥当性や性能に関する議論は不十分である．本稿では，Bricksグリッドシミュレータにデータグリッドシステムに対する拡張を行い，Grid Datafarmアーキテクチャに基づくデータグリッドモデルにおける高エネルギー物理アプリケーションジョブの性能について比較・調査した．データグリッドモデルでは，CentralモデルとTierモデルを比較し，Tierモデルでは様々なスケジューリングと複製手法を適用し，2007年に開始されるCERNの高エネルギー物理実験を想定してその性能を評価した．評価では，Centralで効率良く処理できること，Tierではバックグラウンドに複製を作る手法を用いると効率良く処理でき，1サイトの性能がCentralより低い構成でも，Centralより良い性能を示すことが分かった．Data Grid is a Grid environment for ubiquitous access and analysis of large-scale data. Due to its early research status, the performance of petabyte-scale Data Grid models in a realistic data processing setting have not been well investigated. By enhancing our Bricks Grid simulator to be able to simulate Data Grid scenarios, we investigate and compare the performance of different Data Grid models in the Grid Datafarm architecture, mainly categorized into the central and the tier models but with varying scheduling and replication strategies, under realistic assumptions of job processing for the CERN LHC experiments. Our results show the central model is efficient but the tier model with greater amount of resources and speculative class of background replication policies is quite effective and achieves higher performance while each tier being smaller than the central model.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00018532/
Worldwide Fast File Replication on Grid Datafarm 査読

Osamu Tatebe, Satoshi Sekiguchi, Youhei Morita, Satoshi Matsuoka, Noriyuki Soda

CoRR cs.PF/0306090 2003年6月

　詳細を見る

The Grid Datafarm architecture is designed for global petascale
data-intensive computing. It provides a global parallel filesystem with online
petascale storage, scalable I/O bandwidth, and scalable parallel processing,
and it can exploit local I/O in a grid of clusters with tens of thousands of
nodes. One of features is that it manages file replicas in filesystem metadata
for fault tolerance and load balancing.
This paper discusses and evaluates several techniques to support
long-distance fast file replication. The Grid Datafarm manages a ranked group
of files as a Gfarm file, each file, called a Gfarm file fragment, being stored
on a filesystem node, or replicated on several filesystem nodes. Each Gfarm
file fragment is replicated independently and in parallel using rate-controlled
HighSpeed TCP with network striping. On a US-Japan testbed with 10,000 km
distance, we achieve 419 Mbps using 2 nodes on each side, and 741 Mbps using 4
nodes out of 893 Mbps with two transpacific networks.

arXiv

researchmap

その他リンク： http://arxiv.org/pdf/cs/0306090v1
Performance Analysis of Scheduling and Replication Algorithms on Grid Datafarm Architecture for High Energy Physics Applications 査読

Atsuko Takefusa, Osamu Tatebe, Satoshi Matsuoka, Youhei Morita

Proc. 12th IEEE International Symposium on High Performance Distributed Computing (HPDC-12) 34 - 43 2003年6月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/HPDC.2003.1210014

researchmap
Grid Datafarmにおけるスケジューリング・複製手法の性能評価査読

竹房あつ子, 建部修見, 松岡聡, 森田洋平

情報処理学会・電気通信処理学会 SACSIS2003シンポジウム論文集 121 - 128 2003年5月

　詳細を見る

記述言語：日本語

researchmap
Building A High Performance Parallel File System Using Grid Datafarm and ROOT I/O 査読

Youhei Morita, Hiroyuki Sato, Yoshiyuki Watase, Osamu Tatebe, Satoshi Sekiguchi, Satoshi Matsuoka, Noriyuki Soda, A. Dell'Acqua

CoRR cs.DC/0306092 2003年

　詳細を見る

researchmap
Ninf-G: A Reference Implementation of RPC-based Programming Middleware for Grid Computing. 査読

Yoshio Tanaka, Hidemoto Nakada, Satoshi Sekiguchi, Toyotaro Suzumura, Satoshi Matsuoka

J. Grid Comput. 1 ( 1 ) 41 - 51 2003年

　詳細を見る

DOI： 10.1023/A:1024083511032

researchmap
Performance Evaluation Model for Scheduling in Global Computing Systems 査読

Kento Aida, Atsuko Takefusa, Satoshi Matsuoka, Hidemoto Nakada, Umpei Nagashima

International Journal of High-Performance Computing Applications 14 ( 3 ) 268 - 279 2000年10月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1177/109434200001400308

researchmap
OMPC++ - A portable high-performance implementation of DSM using OpenC plus plus reflection 査読

Y Sohda, H Ogawa, S Matsuoka

PARALLEL AND DISTRIBUTED COMPUTING FOR SYMBOLIC AND IRREGULAR APPLICATIONS 316 - 320 2000年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Design Issues of Network Enabled Server Systems for the Grid. 査読

Satoshi Matsuoka, Mitsuhisa Sato, Hidemoto Nakada, Satoshi Sekiguchi

Grid Computing - GRID 2000, First IEEE/ACM International Workshop, Bangalore, India, December 17, 2000, Proceedings 4 - 17 2000年

　詳細を見る

出版者・発行元：Springer

DOI： 10.1007/3-540-44444-0_2

researchmap
Overview of a Performance Evaluation System for Global Computing Scheduling Algorithms 査読

Atsuko Takefusa, Satoshi Matsuoka, Hidemoto Nakada, Kento Aida, Umpei Nagashima

Proc. 8th IEEE International Symposium on High Performance Distributed Computing (HPDC-8) 97 - 104 1999年8月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/HPDC.1999.805287

researchmap
グローバルコンピューティングのためのスケジューリングフレームワーク査読

中田秀基, 竹房あつ子, 松岡聡, 佐藤三久, 関口智嗣

情報処理学会・電気通信処理学会並列処理シンポジウム JSPP'99 論文集 277 - 284 1999年6月

　詳細を見る

記述言語：日本語

researchmap
階層連立1次方程式のための制約解消系パッケージHiRiseの改良と移植

松岡聡, 細部博史

平成10年度委託研究成果報告会 2 - 7 1999年3月

　詳細を見る

記述言語：日本語出版者・発行元：日本情報処理開発協会先端情報技術研究所

researchmap
HiRise : GUI構築のためのインクリメンタルな制約解消系査読

細部博史, 松岡聡, 米澤明憲

コンピュータソフトウェア 16 ( 6 ) 6_549 - 6_561 1999年

　詳細を見る

記述言語：日本語出版者・発行元：日本ソフトウェア科学会

<p></p>

DOI： 10.11309/jssst.16.6_549

CiNii Books

researchmap
HiRise: GUI構築のためのインクリメンタルな制約解消系査読

細部博史, 松岡聡, 米澤明憲

安村通晃(編), インタラクティブシステムとソフトウェアVI?日本ソフトウェア科学会WISS'98, レクチャーノート/ソフトウェア学 21 73 - 82 1998年12月

　詳細を見る

記述言語：日本語掲載種別：研究論文（研究会，シンポジウム資料等）出版者・発行元：近代科学社

researchmap
広域計算システムのシミュレーションによる評価 - Ninfシステムの広域分散環境でのジョブスケジューリング実現に向けて - 査読

竹房あつ子, 合田憲人, 小川宏高, 中田秀基, 松岡聡, 佐藤三久, 関口智嗣, 長嶋雲兵

情報処理学会・電気通信処理学会並列処理シンポジウム JSPP'98 論文集 127 - 134 1998年6月

　詳細を見る

記述言語：日本語

researchmap
階層連立1次方程式のための効率的解消系の開発

松岡聡, 細部博史

平成9年度知的ソフトウェア研究討論会 4 - 9 1998年3月

　詳細を見る

記述言語：日本語出版者・発行元：日本情報処理開発協会先端情報技術研究所

researchmap
認知的負荷の少ないインタラクティブ描画方式の提案

河内谷幸子, 五十嵐健夫, 松岡聡, 田中英彦

コンピュータソフトウェア 15 ( 4 ) 4_296 - 4_306 1998年

　詳細を見る

記述言語：日本語出版者・発行元：日本ソフトウェア科学会

<p></p>

DOI： 10.11309/jssst.15.4_296

CiNii Books

researchmap
Ninflet: a migratable parallel objects framework using Java. 査読

Hiromitsu Takagi, Satoshi Matsuoka, Hidemoto Nakada, Satoshi Sekiguchi, Mitsuhisa Sato, Umpei Nagashima

Concurrency - Practice and Experience 10 ( 11-13 ) 1063 - 1078 1998年

　詳細を見る

DOI： 10.1002/(SICI)1096-9128(199809/11)10:11/13<1063::AID-CPE414>3.0.CO;2-1

researchmap
階層線形系を用いた効率的な制約階層解消法(ショート論文) 査読

細部博史, 松岡聡, 米澤明憲

尾内理紀夫(編), インタラクティブシステムとソフトウェアV?日本ソフトウェア科学会WISS'97, レクチャーノート/ソフトウェア学 18 129 - 134 1997年12月

　詳細を見る

記述言語：日本語掲載種別：研究論文（研究会，シンポジウム資料等）出版者・発行元：近代科学社

researchmap
Preliminary Evaluation of Scheduling in Ninf: a Global Computing System 査読

Satoshi Matsuoka, Hirotaka Ogawa, Atsuko Takefusa, Hidemoto Nakada, Kento Aida, Umpei Nagashima, Mitsuhisa Sato, Satoshi Sekiguchi

Proc. International Workshop on Innovative Architectures '97 1 - 7 1997年10月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

researchmap
In Search for an Ideal Computer-Assisted Drawing System 査読

104 - 111 1997年7月

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/interact/interact1997.html#IgarashiKMT97
マルチクライアントによるネットワーク数値情報システム Ninfの性能査読

竹房あつ子, 小川宏高, 松岡聡, 中田秀基, 佐藤三久, 関口智嗣, 長嶋雲兵

情報処理学会・電気通信処理学会並列処理シンポジウム JSPP'97 論文集 273 - 280 1997年5月

　詳細を見る

記述言語：日本語

researchmap
Towards a Parallel C++ Programming Language Based on Commodity Object-Oriented Technologies.

Satoshi Matsuoka, A. Nikami, Hirotaka Ogawa, Yutaka Ishikawa

Scientific Computing in Object-Oriented Parallel Environments(ISCOPE) 81 - 88 1997年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：Springer

DOI： 10.1007/3-540-63827-X_47

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/iscope/iscope1997.html#MatsuokaNOI97
Ninf: A Network Based Information Library for Global World-Wide Computing Infrastructure. 査読

Mitsuhisa Sato, Hidemoto Nakada, Satoshi Sekiguchi, Satoshi Matsuoka, Umpei Nagashima, Hiromitsu Takagi

High-Performance Computing and Networking, International Conference and Exhibition, HPCN Europe 1997, Vienna, Austria, April 28-30, 1997, Proceedings 491 - 502 1997年

　詳細を見る

出版者・発行元：Springer

DOI： 10.1007/BFb0031622

researchmap
Generalized Local Propagation: A Framework for Solving Constraint Hierarchies 査読

Hiroshi Hosobe, Satoshi Matsuoka, Akinori Yonezawa

Eugene C. Freuder (Ed.), Principles and Practice of Constraint Programming--CP'96, Lecture Notes in Computer Science 1118 237 - 251 1996年8月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：Springer-Verlag

researchmap
GIGA:A Pen-Based Constraint Drawing System 査読

314 - 315 1996年

　詳細を見る

researchmap
不等式を含む制約階層の効率的解消法査読

細部博史, 松岡聡, 米澤明憲

田中二郎(編), インタラクティブシステムとソフトウェアIII?日本ソフトウェア科学会WISS'95, レクチャーノート/ソフトウェア学 12 123 - 132 1995年12月

　詳細を見る

記述言語：日本語掲載種別：研究論文（研究会，シンポジウム資料等）出版者・発行元：近代科学社

researchmap
ユーザによるレイアウトの適応的認識査読

五十嵐健夫, 松岡聡, 田中英彦, 増井俊之

全国大会講演論文集 51 ( 0 ) 265 - 266 1995年9月

　詳細を見る

記述言語：日本語

情報の整理やコミュニケーションの手段として様々なカード操作エディタが提案されている。これらのエディタ上のカードには、テキストや図などの情報を書き込むことができ、その空間的な位置関係によって各情報の間の意味的な関係が表現される。さて、このようなカードのレイアウトには情報の意味的な構造に対応した空間的構造を認めることができる。たとえば、図1aと図1bはそれぞれ全体が3つのグループにわかれていることを表現している。こういった空間的配置から得られる構造をシステムが理解することによって、その構造に基づいた操作(あるグループの要素全体の移動や内容変更など)を支援し、カードエディタの操作性を向上することが可能である。しかし、この様な構造は、ある一定のルールによって記述されるような明示的なものであるというよりも、むしろユーザの個人的な知覚に依存する潜在的なものであり、単純な生成規則による構文解析のアルゴリズムで解析することが困難である。まず第一に、空間的なレイアウトは基本的に曖昧で複数の解釈が可能なものである。例えば図1cでは灰色の箱は左のクラスタに属するのか右のリストに属するのかといったような問題が生じる。第二に、レイアウトからの構造の知覚は個人差が大きく、同じレイアウトでも人によって違う解釈をすることがありうる、といった問題がある。著者らは以上のような問題を克服しユーザにとって自然な構造を取り出す手法を提案し、それらに基づいたビジュアル・パーザのプロトタイプを作成した。

CiNii Books

researchmap
A Constraint-Based Approach for Visualization and Animation 査読

Shin Takahashi, Satoshi Matsuoka, Ken Miyashita, Hiroshi Hosobe, Akinori Yonezawa, Tomihisa Kamada

Proceedings of the International Workshop on Constraints for Graphics and Visualization 103 - 117 1995年9月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

researchmap
Stackthreads: An abstract machine for scheduling fine-grain threads on stock CPUs 査読

Kenjiro Taura, Satoshi Matsuoka, Akinori Yonezawa

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 907 121 - 136 1995年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：Springer Verlag

DOI： 10.1007/BFb0026567

Scopus

researchmap
Locally Simultaneous Constraint Satisfaction 査読

Hiroshi Hosobe, Ken Miyashita, Shin Takahashi, Satoshi Matsuoka, Akinori Yonezawa

Alan Borning (Ed.), Principles and Practice of Constraint Programming--PPCP'94, Lecture Notes in Computer Science 874 51 - 62 1994年10月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：Springer-Verlag

researchmap
局所的な連立に基づく制約解消法査読

細部博史, 宮下健, 高橋伸, 松岡聡, 米澤明憲

竹内彰一(編), インタラクティブシステムとソフトウェアI?日本ソフトウェア科学会WISS'93, レクチャーノート/ソフトウェア学 7 49 - 56 1994年9月

　詳細を見る

記述言語：日本語掲載種別：研究論文（研究会，シンポジウム資料等）出版者・発行元：近代科学社

researchmap
Highly efficient and encapsulated re-use of synchronization code in concurrent object-oriented languages 査読

Satoshi Matsuoka, Kenjiro Taura, Akinori Yonezawa

Proceedings of the Conference on Object-Oriented Programming Systems, Languages, and Applications, OOPSLA 129674 109 - 126 1993年10月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：Association for Computing Machinery

DOI： 10.1145/165854.165874

Scopus

researchmap
ユーザインターフェースで実時間のインタラクションを実現する制約解消法

細部博史, 宮下健, 高橋伸, 松岡聡, 米澤明憲, 鎌田富久

日本ソフトウェア科学会第10回大会論文集 77 - 80 1993年6月

　詳細を見る

記述言語：日本語掲載種別：研究論文（研究会，シンポジウム資料等）

researchmap
Implementing Concurrent Object-Oriented Languages on Multicomputers

Akinori Yonezawa, Satoshi Matsuoka, Masahiro Yasugi, Kenjiro Taura

IEEE Parallel and Distributed Technology 1 ( 2 ) 49 - 61 1993年5月

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.1109/88.218175

Scopus

researchmap
An Efficient Implementation Scheme of Concurrent Object-Oriented Languages on Stock Multicomputers

Kenjiro Taura, Satoshi Matsuoka, Akinori Yonezawa

ACM SIGPLAN Notices 28 ( 7 ) 218 - 228 1993年1月

　詳細を見る

掲載種別：研究論文（学術雑誌）

DOI： 10.1145/173284.155355

Scopus

researchmap
An efficient implementation scheme of concurrent object-oriented languages on stock multicomputers

Kenjiro Taura, Satoshi Matsuoka, Akinori Yonezawa

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 748 LNCS 402 - 403 1993年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1007/bfb0018667

Scopus

researchmap
OBJECT-ORIENTED CONCURRENT REFLECTIVE LANGUAGES CAN BE IMPLEMENTED EFFICIENTLY

H MASUHARA, S MATSUOKA, T WATANABE, A YONEZAWA

SIGPLAN NOTICES 27 ( 10 ) 127 - 144 1992年10月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： 10.1145/141937.141948

Web of Science

researchmap
OBJECT-ORIENTED CONCURRENT REFLECTIVE LANGUAGES CAN BE IMPLEMENTED EFFICIENTLY 査読

H MASUHARA, S MATSUOKA, T WATANABE, A YONEZAWA

OOPSLA '92 CONFERENCE PROCEEDINGS: CONFERENCE ON OBJECT-ORIENTED PROGRAMMING SYSTEMS, LANGUAGES, AND APPLICATIONS 127 - 144 1992年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Web of Science

researchmap
Object-oriented concurrent reflective architectures

Satoshi Matsuoka, Takuo Watanabe, Yuuji Ichisugi, Akinori Yonezawa

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 612 LNCS 211 - 226 1992年

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1007/3-540-55613-3_11

Scopus

researchmap

▼全件表示

書籍等出版物

スパコン富岳の挑戦 GAFAなき日本の戦い方

（担当：単著）

文藝春秋 2022年10月（ ISBN:9784166613663 ）

　詳細を見る

researchmap
スーパーコンピュータ

小柳, 義夫, 中村, 宏, 佐藤, 三久, 松岡, 聡

岩波書店 2012年3月（ ISBN:9784000113076 ）

　詳細を見る

総ページ数：x, 204p 記述言語：日本語

CiNii Books

researchmap
The road to TSUBAME and beyond

Chapman & Hall Crc Computational Science Series 2007年（ ISBN:9781584889090 ）

　詳細を見る

researchmap
The road to TSUBAME and beyond

Chapman & Hall Crc Computational Science Series 2007年（ ISBN:9781584889090 ）

　詳細を見る

researchmap
ネットワークアプリケーション

砂原, 秀樹, 知念, 賢一, 中田, 秀基, 松岡, 聡, 後藤, 滋樹

岩波書店 2003年3月（ ISBN:9784000110549 ）

　詳細を見る

総ページ数：xviii, 196p 記述言語：日本語

CiNii Books

researchmap
<4> ネットワークアプリケーション岩波講座インターネット

岩波書店 2003年

　詳細を見る

researchmap
Metalevel architectures and separation of crosscutting concerns : Third International Conference, REFLECTION 2001, Kyoto, Japan, September 25-28, 2001 : proceedings

Reflection, 米沢, 明憲, 松岡, 聡

Springer 2001年（ ISBN:3540426183 ）

　詳細を見る

総ページ数：xi, 281 p. 記述言語：英語

CiNii Books

researchmap
Computing in object-oriented parallel environments : third International Symposium, ISCOPE 99, San Francisco, CA, USA, December 8-10, 1999 : proceedings

ISCOPE (Conference), 松岡, 聡, Oldehoeft, Rodney R., Tholburn, Marydell

Springer 1999年（ ISBN:3540668187 ）

　詳細を見る

総ページ数：viii, 203 p. 記述言語：英語

CiNii Books

researchmap
認知的負荷の少ないインタラクティブ描画方式の提案

コンピュータソフトウェア15-4 1998年

　詳細を見る

researchmap
ECOOP'97 - object-oriented programming : 11th European Conference, Jyväskylä, Finland, June 9-13, 1997 : proceedings

European Conference on Object-Oriented Programming, Akşit, Mehmet, 松岡, 聡

Springer-Verlag 1997年（ ISBN:3540630899 ）

　詳細を見る

総ページ数：xi, 529 p. 記述言語：英語

CiNii Books

researchmap
Compiling Concurrent Objects for MPPs In Parallel Language and Compiler Research in Japan, Bic, Nicolau and Sato (eds.)

Kluwer Academic Press 1996年

　詳細を見る

researchmap
Object technologies for advanced software : Second JSSST International Symposium, ISOTAS ʾ96, Kanazawa, Japan, March 11-15, 1996 : proceedings

International Symposium on Object Technologies for Advanced Software, 二木, 厚吉, 松岡, 聡, 日本ソフトウェア科学会

Springer-Verlag 1996年（ ISBN:3540609547 ）

　詳細を見る

総ページ数：x, 307 p. 記述言語：英語

CiNii Books

researchmap
Compiling Concurrent Objects for MPPs In Parallel Language and Compiler Research in Japan, Bic, Nicolau and Sato (eds.)

Kluwer Academic Press 1996年

　詳細を見る

researchmap
並列オブジェクト指向言語処理系の汎用MIMD型並列計算機上での高効率な実現

米沢, 明憲, 松岡, 聡, 小林, 直樹

米澤明憲 1996年

　詳細を見る

総ページ数：259p 記述言語：英語

CiNii Books

researchmap
オブジェクト指向コンピューティング

田中, 克己, 西尾, 章治郎, 米沢, 明憲, 松岡, 聡, 尾内, 理紀夫

近代科学社 1993年（ ISBN:4764902133 ）

　詳細を見る

総ページ数：3冊記述言語：日本語

CiNii Books

researchmap
並列オブジェクト指向計算におけるReflectionとその応用

米沢, 明憲, 松岡, 聡, 渡部, 卓雄, 一杉, 裕志

米澤明憲 1992年

　詳細を見る

総ページ数：vii,152p 記述言語：英語

CiNii Books

researchmap

▼全件表示

MISC

Efficient FDK Algorithms on SIMD-accelerated Processors

Peng Chen, Mohamed Wahib, shinichiro takizawa, Takahiro Hirofuchi, Ogawa Hirotaka, Satoshi Matsuoka

研究報告ハイパフォーマンスコンピューティング（HPC） 2020-HPC-175 ( 6 ) 1 - 11 2020年7月

　詳細を見る

Computed Tomography (CT) is a widely used 3D imaging technology that requires compute-intense algorithms to generate volume data (or images). We propose a collection of novel back-projection algorithms that reduce the arithmetic computation and improve data locality. We also implement novel algorithms as efficient back-projection kernels that are performance portable over a wide range of CPUs. Unlike the conventional approaches that use OpenMP and target-specific SIMD intrinsics, we employ a high-level OpenCL implementation to generate the vectorized code and use the OpenCL local memory to prefetch the pixels at sub-pixel precision in a regular memory access fashion. Performance evaluation using a variety of Intel CPUs generations demonstrates that our back-projection implementation runs up to 10 times faster than the multi-threading optimized implementation.

researchmap
A Study of Synchronization Methods in Modern GPUs

Lingqi Zhang, Wahib Mohamed, Haoyu Zhang, Satoshi Matsuoka

IEEE International Parallel & Distributed Processing Symposium 2020 2020年4月

　詳細を見る

記述言語：英語

GPUs are playing an increasingly important role in general-purpose computing. Many algorithms require synchronizations at different levels of granularity in a single GPU. Additionally, the emergence of dense GPU nodes also calls for multi-GPU synchronization. Nvidia's latest CUDA provides a variety of synchronization methods. Until now, there is no full understanding of the characteristics of those synchronization methods. This work explores important undocumented features and provides an in-depth analysis of the performance considerations and pitfalls of the state-of-art synchronization methods for Nvidia GPUs. The provided analysis would be useful when making design choices for applications, libraries, and frameworks running on single and/or multi-GPU environments. We provide a case study of the commonly used reduction operator to illustrate how the knowledge gained in our analysis can be useful. We also describe our micro-benchmarks and measurement methods.

researchmap
High resolution Image Reconstruction on Super computers

Chen Peng,Wahib, Mohamed, Takizawa Shinichiro, Matsuoka Satoshi

2020年3月

　詳細を見る

researchmap
A Software Systolic Array on GPUs

Chen Peng,Wahib, Mohamed, Takizawa Shinichiro, Matsuoka Satoshi

2020年3月

　詳細を見る

researchmap
A Survey on Coarse-Grained Reconfigurable Architectures From a Performance Perspective

Artur Podobas, Kentaro Sano, Satoshi Matsuoka

IEEE ACCESS 8 146719 - 146743 2020年

　詳細を見る

記述言語：英語

DOI： 10.1109/ACCESS.2020.3012084

Web of Science

arXiv

researchmap
Scaling Distributed Deep Learning Workloads beyond the Memory Capacity with KARMA.

Mohamed Wahib, Haoyu Zhang, Truong Thao Nguyen, Aleksandr Drozd, Jens Domke, Lingqi Zhang 0001, Ryousei Takano, Satoshi Matsuoka

CoRR abs/2008.11421 2020年

　詳細を見る

The dedicated memory of hardware accelerators can be insufficient to store
all weights and/or intermediate states of large deep learning models. Although
model parallelism is a viable approach to reduce the memory pressure issue,
significant modification of the source code and considerations for algorithms
are required. An alternative solution is to use out-of-core methods instead of,
or in addition to, data parallelism. We propose a performance model based on
the concurrency analysis of out-of-core training behavior, and derive a
strategy that combines layer swapping and redundant recomputing. We achieve an
average of 1.52x speedup in six different models over the state-of-the-art
out-of-core methods. We also introduce the first method to solve the
challenging problem of out-of-core multi-node training by carefully pipelining
gradient exchanges and performing the parameter updates on the host. Our data
parallel out-of-core solution can outperform complex hybrid model parallelism
in training large models, e.g. Megatron-LM and Turning-NLG.

arXiv

researchmap

その他リンク： https://dblp.uni-trier.de/db/journals/corr/corr2008.html#abs-2008-11421
Matrix Engines for High Performance Computing: A Paragon of Performance or Grasping at Straws?

Jens Domke, Emil Vatai, Aleksandr Drozd, Peng Chen, Yosuke Oyama, Lingqi Zhang 0001, Shweta Salaria, Daichi Mukunoki, Artur Podobas, Mohamed Wahib, Satoshi Matsuoka

CoRR abs/2010.14373 2020年

　詳細を見る

Matrix engines or units, in different forms and affinities, are becoming a
reality in modern processors; CPUs and otherwise. The current and dominant
algorithmic approach to Deep Learning merits the commercial investments in
these units, and deduced from the No. 1 benchmark in supercomputing, namely
High Performance Linpack, one would expect an awakened enthusiasm by the HPC
community, too. Hence, our goal is to identify the practical added benefits for
HPC and machine learning applications by having access to matrix engines. For
this purpose, we perform an in-depth survey of software stacks, proxy
applications and benchmarks, and historical batch job records. We provide a
cost-benefit analysis of matrix engines, both asymptotically and in conjunction
with state-of-the-art processors. While our empirical data will temper the
enthusiasm, we also outline opportunities to "misuse" these dense
matrix-multiplication engines if they come for free.

arXiv

researchmap

その他リンク： https://dblp.uni-trier.de/db/journals/corr/corr2010.html#abs-2010-14373
早期終了タイミングを予測する：深層学習における確率勾配の分布の変化点検出

八島慶汰, 石川康太, 佐藤育郎, 野村哲弘, 横田理央, 松岡聡

第22回情報論的学習理論ワークショップ (IBIS 2019) 2019年9月

　詳細を見る

researchmap
Understanding the Overheads of Launching CUDA Kernels

Lingqi Zhang, Wahib Mohamed, Satoshi Matsuoka

2019年8月

　詳細を見る

researchmap
Towards Performance Portability and Modernization of FLASH via Transpilation with High-Level Intermediate Representation

研究報告ハイパフォーマンスコンピューティング（HPC） 2019-HPC-170 ( 30 ) 1 - 9 2019年7月

　詳細を見る

researchmap
メモリアクセスデータを用いた機械学習によるアプリケーションの類型化

土川稔生, 遠藤敏夫, 野村哲弘, 近藤正章, 大山洋介, 松岡聡

研究報告ハイパフォーマンスコンピューティング（HPC） 2019-HPC-170 ( 12 ) 1 - 7 2019年7月

　詳細を見る

記述言語：日本語

researchmap
Breaking the Limitation of GPU memory for Deep Learning

研究報告ハイパフォーマンスコンピューティング（HPC） 2019-HPC-170 ( 10 ) 1 - 7 2019年7月

　詳細を見る

researchmap
DNNの汎化の解明に向けた学習過程における勾配データの解析

八島慶汰, 石川康太, 佐藤育郎, 松岡聡

研究報告ハイパフォーマンスコンピューティング（HPC） 2019-HPC-170 ( 7 ) 1 - 5 2019年7月

　詳細を見る

近年，Deep Neural Network (DNN) を用いた深層学習は画像認識や自然言語等の多くの分野において優れた結果を残している．その中でも SGD を用いた学習メカニズムと未知データに対する汎化性能との関連性については未解明な部分が多く存在している．私達は学習過程において学習データから得られる Fisher 情報行列の固有値や勾配データの解析を行うことで，これまでに汎化の指標であると考えられてきた Fisher 情報量行列の固有値の値は不安定であるということを実験的に示した．また，その実験から勾配の外れ値や分布と汎化性能が関連しているのではないのかという仮説をもとに，学習モデルから全訓練データから得られる勾配量の時系列的解析を行った．

researchmap
Toward Training a Large 3D Cosmological CNN with Hybrid Parallelization

Yosuke Oyama, Naoya Maruyama, Nikoli Dryden, Peter Harrington, Jan Balewski, Satoshi Matsuoka, Marc Snir, Peter Nugent, Brian Van Essen

2019年6月

　詳細を見る

記述言語：英語

researchmap
Boosting GCN Application with Batched Sparse Matrix Multiplication

Yusuke Nagasaka, Akira Nukada, Ryosuke Kojima, Satoshi Matsuoka

2019年3月

　詳細を見る

researchmap
Double-precision FPUs in High-Performance Computing: an Embarrassment of Riches?

Jens Domke, Kazuaki Matsumura, Mohamed Wahib, Haoyu Zhang, Keita Yashima, Toshiki Tsuchikawa, Yohei Tsuji, Artur Podobas, Satoshi Matsuoka

2019 IEEE 33RD INTERNATIONAL PARALLEL AND DISTRIBUTED PROCESSING SYMPOSIUM (IPDPS 2019) 78 - 88 2019年

　詳細を見る

記述言語：英語

DOI： 10.1109/IPDPS.2019.00019

Web of Science

arXiv

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/ipps/ipdps2019.html#DomkeMWZYTTPM19
The Memory Controller Wall: Benchmarking the Intel FPGA SDK for OpenCL Memory Interface

Hamid Reza Zohouri, Satoshi Matsuoka

PROCEEDINGS OF H2RC 2019: 2019 FIFTH IEEE/ACM INTERNATIONAL WORKSHOP ON HETEROGENEOUS HIGH-PERFORMANCE RECONFIGURABLE COMPUTING (H2RC) 11 - 18 2019年

　詳細を見る

記述言語：英語

DOI： 10.1109/H2RC49586.2019.00007

Web of Science

arXiv

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/sc/h2rc2019.html#ZohouriM19
Cloud-based Burst Buffers for I/O Acceleration

研究報告ハイパフォーマンスコンピューティング（HPC） 2018年7月

　詳細を見る

researchmap
μ-cuDNN: Accelerating Deep Learning Frameworks with Micro-Batching

Yosuke Oyama, Tal Ben-Nun, Torsten Hoefler, Satoshi Matsuoka

2018年4月

　詳細を見る

NVIDIA cuDNN is a low-level library that provides GPU kernels frequently used
in deep learning. Specifically, cuDNN implements several equivalent convolution
algorithms, whose performance and memory footprint may vary considerably,
depending on the layer dimensions. When an algorithm is automatically selected
by cuDNN, the decision is performed on a per-layer basis, and thus it often
resorts to slower algorithms that fit the workspace size constraints. We
present {\mu}-cuDNN, a transparent wrapper library for cuDNN, which divides
layers' mini-batch computation into several micro-batches. Based on Dynamic
Programming and Integer Linear Programming, {\mu}-cuDNN enables faster
algorithms by decreasing the workspace requirements. At the same time,
{\mu}-cuDNN keeps the computational semantics unchanged, so that it decouples
statistical efficiency from the hardware efficiency safely. We demonstrate the
effectiveness of {\mu}-cuDNN over two frameworks, Caffe and TensorFlow,
achieving speedups of 1.63x for AlexNet and 1.21x for ResNet-18 on P100-SXM2
GPU. These results indicate that using micro-batches can seamlessly increase
the performance of deep learning, while maintaining the same memory footprint.

arXiv

researchmap

その他リンク： http://arxiv.org/pdf/1804.04806v1
HuronFS : Hierarchical, User-level and On-demand Burst Buffer File System

Tianqi Xu, Kento Sato, Satoshi Matsuoka

ISC2018 2018年4月

　詳細を見る

researchmap
Pushing the Limits for 2D Convolution Computation On CUDA-enabled GPUs

研究報告ハイパフォーマンスコンピューティング（HPC） 2018-HPC-163 ( 22 ) 1 - 9 2018年2月

　詳細を見る

researchmap
Efficiently Enlarging GPU Memory Capacity with NVM

Pak Markthub, Mehmet E. Belviranli, Seyong Lee, Jeffrey S. Vetter, Satoshi Matsuoka

2018年1月

　詳細を見る

researchmap
機械学習による計算機トレースの自動生成

土川稔生, 大山洋介, 野村哲弘, 松岡聡, 松岡聡

情報処理学会研究報告(Web) 2018 ( HPC-165 ) 2018年

　詳細を見る

J-GLOBAL

researchmap
大規模データセンター運用最適化フレームワーク構築に向けて

滝澤真一朗, 高野了成, 松岡聡

2017年12月

　詳細を見る

researchmap
Less is More: Accelerating Deep Neural Networks with Micro-Batching

研究報告ハイパフォーマンスコンピューティング（HPC） 2017-HPC-162 ( 22 ) 1 - 9 2017年12月

　詳細を見る

researchmap
OpenCL-Based High-Performance 3D Stencil Computation on FPGAs

Hamid Reza Zohouri, Artur Podobas, Naoya Maruyama, Satoshi Matsuoka

2017年11月

　詳細を見る

researchmap
A Simulation-Based Analysis on the Configuration of the Burst Buffer

Tianqi Xu, Kento Sato, Satoshi Matsuoka

2017年11月

　詳細を見る

researchmap
Deep Q-Networkを用いての計算機の制御による電力最適化

寺西賢人, 野村哲弘, 松岡聡

情報処理学会研究報告 017-HPC-158 ( 3 ) 2017年8月

　詳細を見る

近年のスーパーコンピュータは大量に電力を消費するようになり，実用的なスーパーコンピュータの性能の向上には電力効率が課題となっている．省電力手法としてはCPUの周波数や電圧などの制御による電力の最適化があり，その制御に適した値をパフォーマンスカウンタなどのデータを用いて算出する研究が多く進められている．しかし，既存の研究では各データを詳細に解析する手法を取っており，扱うデータ数の制限や環境の変化による再解析を必要としている．そこで我々は，近年研究が盛んに行われている深層学習を用いて解析をする汎用性が高い制御方法を提案する．特にゲーミングや囲碁のAIなどで使用されているDeep Q-Networkという深層強化学習手法によって計算機を直接制御する装置を実装し，評価する．

researchmap
動的なプロセス数操作による分散深層学習の耐故障性と性能評価

辻陽平, 野村哲弘, 實本英之, 佐藤育郎, 松岡聡

情報処理学会研究報告(Web) (IPSJ Technical Report (Web)) 2017 ( HPC-160 ) 2017年7月

　詳細を見る

深層学習はその認識精度の高さから研究開発が盛んに行われており,実社会においても深層学習を取り入れた応用技術を目にすることができる。深層学習では十分な認識精度を得るまでに,大量のデータとGPUなどを用いた長時間の計算が必要となる。そのためHPCクラスタなどの高性能計算機での分散処理が利用される。分散システムでは故障発生間隔が短くなる傾向があり,アプリケーションの計算を正しく継続させるために耐故障性の手法が必要になる。本研究では大規模システム上の深層学習において重要になる耐故障性に対して,既存のcheckpoint/restartでない新たな手法detect/respawnを提案し,これをULFM-MPIによって実装した。SPRINTと呼ばれる分散深層学習アプリケーションを用いてTSUBAME-KFCの16ノード(128GPU)上で提案手法と既存手法を比較したところ,10時間の学習において提案手法が2.5%低いエラー率となり,より高い認識精度を達成することができた。(著者抄録)

researchmap
Accelerating Spiking Neural Networks on FPGAs using OpenCL

研究報告システム・アーキテクチャ（ARC） 2017-ARC-227 ( 23 ) 1 - 7 2017年7月

　詳細を見る

researchmap
人工知能処理向け大規模・省電力クラウド基盤 AI Bridging Cloud Infrastructure (ABCI)の構想

小川宏高, 松岡聡, 佐藤仁, 高野了成, 滝澤真一朗, 谷村勇輔, 三浦信一, 関口智嗣

情報処理学会研究報告 2017-HPC-160 2017年7月

　詳細を見る

researchmap
メタゲノム解析アプリケーションGHOSTZ-GPUの性能モデリングおよび改善

山川智史, 野村哲弘, 松岡聡

情報処理学会研究報告 2017-HPC-160 2017年7月

　詳細を見る

researchmap
Prototype Modular Framework for Deep Learning Performance Testing

2017年4月

　詳細を見る

researchmap
ディープラーニングのデータ並列学習における少精度浮動小数点数を用いた通信量の削減

大山洋介, 野村哲弘, 佐藤育郎, 松岡聡

研究報告ハイパフォーマンスコンピューティング（HPC） 2017-HPC-158 ( 30 ) 1 - 10 2017年3月

　詳細を見る

Deep Neural Network を用いた学習手法であるディープラーニングは他の機械学習手法と比較して高い認識精度を発揮することから近年非常に重要視されている．一方でディープラーニングはネットワークの計算量や学習に使用するデータ量が膨大であることから GPU クラスタを用いた場合でも学習に非常に長い時間を要する．また，特にパラメータ数が多いネットワークを一定のミニバッチサイズで学習する場合は勾配の GPU 間・ノード間通信がスケーラビリティのボトルネックとなり，現存する GPU スパコンで利用可能な並列数よりもはるかに小さな規模でしか学習できないことが指摘されている．本論文では単精度よりも更に bit 数の少ない浮動小数点数型を用いた通信量の削減手法を提案する．提案手法では通信するデータを半精度浮動小数点数の上位 8bit により表現し，レイヤーごとに動的に表現範囲を調整することにより高速かつ単精度と比較して学習後の認識精度を大きく損なわない通信を実現する．提案手法は TSUBAME-KFC / DL の 2 ノード (16 GPU) を用いた CaffeNet と GoogLeNet の学習において，既存の単精度浮動小数点型を用いる場合と比較して認識精度を損なわずにそれぞれ 2.71 倍，2.19 倍の高速化を達成した．

researchmap
Evolutionary Power Modeling for Energy Efficiency in CPU-GPU based systems

研究報告ハイパフォーマンスコンピューティング（HPC） 2017-HPC-158 ( 2 ) 1 - 7 2017年3月

　詳細を見る

researchmap
低ランク近似行列によるCNNにおける畳み込み演算の最適化

本山義史, 遠藤敏夫, 松岡聡, 横田理央, 福田圭祐, 佐藤育郎

研究報告ハイパフォーマンスコンピューティング（HPC） 2017-HPC-158 ( 25 ) 1 - 7 2017年3月

　詳細を見る

機械学習による画像認識の分野において，Convolutional Neural Network (CNN) を用いた優れた認識結果が報告されている．データセットが巨大であるため，学習には非常に大きな時間がかかり，また，必要となるメモリ量は大きくなる．そこで我々は，DL の計算におけるメモリ量の削減を図るため，畳み込みの演算の約 7 割を占める行列積計算に対し，低ランク近似行列を用いることを提案する．CNN アプリケーション中の行列に対し，SVD と階層型行列を適用し，評価した．特に，SVD を用いた時，圧縮率と精度とのトレードオフにおいて，認識精度をほとんど落とさず，サイズが特に大きい image 行列で最大約 9 割程のメモリ量削減に成功した．

researchmap
Assessing the Interference Between Inter-node Communication and Network I/O Traffic

研究報告ハイパフォーマンスコンピューティング（HPC） 2017-HPC-158 ( 11 ) 1 - 6 2017年3月

　詳細を見る

researchmap
Predicting Probabilistic Parameters of a Large-Scale Asynchronous SGD Deep Learning System

Yosuke Oyama, Akihiro Nomura, Ikuro Sato, Hiroki Nishimura, Yukimasa Tamatsu, Satoshi Matsuoka

2017年2月

　詳細を見る

researchmap
Towards Making Legacy HPC Codes Maintainable: Two-Way Fortran-Python Transpilation with Python Type Hints (Unrefereed Workshop Manuscript)

Mateusz Bysiek, Aleksandr Drozd, 松岡聡

研究報告ハイパフォーマンスコンピューティング（HPC） 2016-HPC-157 ( 9 ) 1 - 10 2016年12月

　詳細を見る

researchmap
ディレクティブによる時空間ブロッキングの自動適用

黒田勝汰, 遠藤敏夫, 松岡聡

情報処理学会研究報告(Web) (IPSJ Technical Report (Web)) 2016 ( HPC-157 ) 2016年12月

　詳細を見る

ステンシル計算向けのループ最適化である時空間ブロッキングは非常に高い効果があるが,ループの制御が複雑になるためプログラミングコストが大きく,汎用的な最適化ではない。そのためループ変換ツールやステンシル向けDSLコンパイラの機能として実装されてきた。しかし,これらはパラメータ設定の柔軟性や対象プログラムの大幅な書き換えが必要という点で問題を抱えている。そこで,我々はディレクティブによる時空間ブロッキングの適用を提案する。いくつかの条件を満たすループにディレクティブにより指定されたパラメータで時空間ブロッキングを適用するツールを実装した。ステンシルベンチマークを用いて提案システムの性能改善効果とプログラミングコストを評価する。(著者抄録)

researchmap
Fast Sparse General Matrix-Matrix Multiplication on GPU with Low Memory Usage

Yusuke Nagasaka, Akira Nukada, Satoshi Matsuoka

2016年11月

　詳細を見る

Sparse general matrix-matrix multiplication (SpGEMM) is one of the key kernel of preconditioner such as algebraic multigrid method or graph algorithms. The performance of SpGEMM is quite low because of its random memory access to both input and output matrices. Moreover, the pattern of non-zero elements of resulting matrix is not known beforehand, which makes it hard to manage the memory usage. There are several GPU implementations of fast SpGEMM computation while consuming large temporal memory. We devise new SpGEMM algorithm requiring small amount of memory so that we can compute larger matrices using limited device memory of GPU. Accesses to input matrices are optimized for coalesced memory access. We devise efficient hash table on shared memory to calculate output matrix with appropriate case analysis for better load-balancing. Our algorithm achieves speedups of up to x4.0 in single precision and x3.3 in double precision compared to existing fast SpGEMM libraries.

researchmap
I/O分割による遅延隠蔽を取り入れたOut-of-coreなGPU Set Intersectionの性能評価

佐藤仁, 溝手竜, 松岡聡, 小山宏高

2016年8月

　詳細を見る

researchmap
メモリ使用量を抑えた疎行列疎行列積計算のGPU高速化

長坂侑亮, 額田彰, 松岡聡

研究報告ハイパフォーマンスコンピューティング（HPC） 2016-HPC-156 ( 15 ) 1 - 9 2016年8月

　詳細を見る

AMG 法など反復解法の前処理において用いられる疎行列疎行列積計算は，ランダムなメモリアクセスによって性能向上が困難であることに加え，出力される行列の非ゼロ要素配置が計算開始時には不明であるという特徴を持つ．GPU での高速化を目的とした既存のアルゴリズムでは，実際に出力行列に必要となるメモリ使用量と比べて多大なメモリを要するため，適用可能な行列が制限されている．適切な場合分けとシェアードメモリの活用によってメモリの使用量を抑えることで広範な行列に対して適用可能であり，かつ更なる高性能化を実現する GPU での疎行列疎行列積計算手法を提案する．様々な特性を持つ 12 個の行列に対して Maxwell 世代 GPU にて性能評価を行い，既存の疎行列計算ライブラリから単精度で最大 4.77倍，倍精度で最大 3.84 倍の性能向上を達成した．

researchmap
Towards Understanding HPC-Big Data Convergence Using Cloud Platforms

研究報告ハイパフォーマンスコンピューティング（HPC） 2016-HPC-155 ( 2 ) 1 - 5 2016年8月

　詳細を見る

researchmap
データレイアウト最適化指示文によるOpenACCアプリケーションの高速化

情報処理学会研究報告 2016-HPC-155 ( 9 ) 2016年8月

　詳細を見る

researchmap
学習条件を考慮した大規模非同期ディープラーニングシステムの性能モデリング

大山洋介, 野村哲弘, 佐藤育郎, 西村裕紀, 玉津幸政, 松岡聡

研究報告ハイパフォーマンスコンピューティング（HPC） 2016-HPC-155 ( 5 ) 1 - 9 2016年8月

　詳細を見る

機械学習による画像認識において Convolutional Neural Network (CNN) と大規模なデータセットを用いた高い認識結果が報告されている．CNN の学習にはミニバッチ Stochastic Gradient Descent (SGD) と呼ばれる最適化手法が広く用いられるが，不適切なミニバッチサイズ下では認識性能が悪化することが知られている．SGD を高速化するために GPU での CNN の計算とパラメータの更新を非同期に行う非同期 SGD が提案されているが，ミニバッチサイズが動的に定まることからノード数等の学習条件の最適値は明らかではない．本論文では非同期 SGD で CNN の学習を行うシステム SPRINT の性能モデルを提案する．この性能モデルは CNN の構造とマシン性能・構成を入力とし，データセット全体を学習に使用する時間と平均ミニバッチサイズを予測する．TSUBAME-KFC/DL の 1～16 ノードを用いた評価では複数の CNN 構造について学習時間と平均ミニバッチサイズの平均予測誤差は 8%以下だった．また，2 つの異なるマシン上である平均ミニバッチサイズの範囲内で学習時間が最短となる学習条件を探索したところ，モデルが予測した順位は実測での順位と一致した．

researchmap
ポストムーア時代におけるFLOPSからBYTESへの変革

松岡聡, 天野英晴, 中島研吾, 井上弘士, 工藤知宏, 丸山直也, 田浦健次, 岩下武史, 片桐孝弘, 塙敏博, 遠藤敏夫

情報処理学会研究報告HPC-155-2016 2016年8月

　詳細を見る

researchmap
Evaluating tolerance of applications against realistic DRAM faults

Yuya Kobayashi, Hideyuki Jitsumoto, Akihiro Nomura, Satoshi Matsuoka

2016年6月

　詳細を見る

researchmap
Training Condition Conscious Performance Modeling of an Asynchronous Data-Parallel Deep Learning System

Yosuke Oyama, Akihiro Nomura, Ikuro Sato, Hiroki Nishimura, Yukimasa Tamatsu, Satoshi Matsuoka

2016年6月

　詳細を見る

researchmap
大規模グラフ処理ライブラリScaleGraphのout-of-coreメモリ拡張

岩渕圭太, 佐藤仁, 松岡聡

ハイパフォーマンスコンピューティングと計算科学シンポジウム論文集 2016 56 - 56 2016年5月

　詳細を見る

researchmap
Reducing Remote GPU Execution’s Overhead with mrCUDA

2016年4月

　詳細を見る

researchmap
GPUアクセラレータと不揮発性メモリを考慮した大規模分散ソート

社本秀之, 佐藤仁, 松岡聡

情報処理学会研究報告 2015-HPC-154 2015-HPC-154 2016年4月

　詳細を見る

researchmap
Towards Understanding the Performance of FPGAs using OpenCL Benchmarks

Hamid Reza, Zohouri Naoya Maruyama Aaron, Smith Motohiko Matsuda, Satoshi Matsuoka

HiPEAC Workshop on Reconfigurable Computing 2016年3月

　詳細を見る

We evaluate the performance of a subset of the benchmarks available in the Rodinia Suite, using Altera’s OpenCL SDK and the Terasic DE5-Net FPGA board, equipped with an Altera Stratix V GXA7 FPGA, and present timing and power estimation results and comparison with a modern CPU and GPU. The results are presented for multiple versions of each benchmark, each with a varying degree of optimization for FPGAs, ranging from direct ports from the initial OpenCL implementation to loop-pipelined kernels specifically optimized for FPGAs. Our results show that, while it is possible to use a common programming language available for other more-widely used accelerators in HPC, the implementation method optimal for FPGAs is significantly different from those for other accelerators such as GPUs. Specifically, we find that multithreaded kernels typically used for GPUs do not perform as efficiently as those optimized with FPGA-specific optimizations such as sliding windows. However, by exploiting the FPGA-specific optimizations, FPGA with OpenCL shows promising performance. Our results using the Altera Stratix V 5SGXA7 FPGA indicate that, with FPGA-specific optimizations, it is possible to achieve up to 3.9x better power efficiency in comparison to an Nvidia K20C GPU.

researchmap
GPU-Accelerated Large-scale Distributed Sorting Coping with Device Memory Capacity

Hideyuki Shamoto, Koichi Shirahata, Aleksandr Drozd, Hitoshi Sato, Satoshi Matsuoka

IEEE Transactions on Big Data Volume 1 ( Issue 1 ) 57 - 69 2016年3月

　詳細を見る

出版者・発行元：IEEE

Splitter-based parallel sorting algorithms are known to be highly efficient for distributed sorting due to their low communication complexity. Although using GPU accelerators could help to reduce the computation cost in general, their effectiveness in distributed sorting algorithms remains unclear. We investigate applicability of using GPU devices to the splitter-based algorithms and extend HykSort, an existing splitter-based algorithm by offloading costly computation phases to GPUs. To cope with the volumes of data exceeding the GPU memory capacity, out-of-core local sort is used with small overhead about 7.5 percent when the data size is tripled. We evaluate the performance of our implementation on the TSUBAME2.5 supercomputer that comprises over 4,000 NVIDIA K20x GPUs. Weak scaling analysis shows 389 times speedup with 0.25 TB/s throughput when sorting 4 TB of 64 bit integer values on 1,024 nodes compared to running on one node; this is 1.40 times faster than the reference CPU implementation. Detailed analysis however reveals that the performance is mostly bottlenecked by the CPU-GPU host-to-device bandwidth. With orders of magnitude improvements announced for next generation GPUs, the performance boost will be tremendous in accordance with other successful GPU accelerations.

researchmap
Linguistic Regularities from Multiple Samples

Drozd Aleksandr, Matsuoka Satoshi

Research Reports on Mathematical and Computing Sciences. Ser. C, Computer Science ( 283 ) 1 - 6 2016年2月

　詳細を見る

記述言語：英語出版者・発行元：Dept. of Mathematical and Computing Sciences, Tokyo Institute of Technology

researchmap
I/O分割による遅延隠蔽を用いたOut-of-coreなGPU Set Intersectionの性能評価(Unrefereed Workshop Manuscript)

佐藤仁, 佐藤仁, 佐藤仁, 溝手竜, 溝手竜, 松岡聡, 松岡聡, 松岡聡, 小川宏高

情報処理学会研究報告(Web) 2016 ( HPC-155 ) 2016年

　詳細を見る

J-GLOBAL

researchmap
大規模画像データセットの機械学習のための分散コンピューティング

佐藤育郎, 渡邉隆太郎, 西村裕紀, 野村哲弘, 松岡聡

Tsubame e-Science Journal 14 2016年

　詳細を見る

J-GLOBAL

researchmap
Optimizing the Rodinia Benchmark for FPGAs

Hamid Reza Zohouri, Naoya Maruyama, Aaron Smith, Motohiko Matsuda, Satoshi Matsuoka

IPSJ SIG Technical Report 2015-HPC-152 No.16 2015年12月

　詳細を見る

researchmap
Design and Modelling of Cloud-based Burst Buffers

Tianqi Xu, Kento Sato, Satoshi Matsuoka

2015年11月

　詳細を見る

researchmap
多段階ブロッキングによるメモリアクセス量削減を図ったGPU向け疎行列ベクトル積計算手法の性能評価

長坂侑亮, 額田彰, 松岡聡

2015年9月

　詳細を見る

researchmap
mrCUDA: Low-Overhead Middleware for Live Migrating Remote GPU Execution to Local GPU Execution

Pak Markthub, Akihiro Nomura, Satoshi Matsuoka

2015年9月

　詳細を見る

researchmap
疎行列ベクトル積計算を対象としたGPU向けメモリアクセス削減手法

長坂侑亮, 額田彰, 松岡聡

研究報告ハイパフォーマンスコンピューティング（HPC） 2015-HPC-151 ( 8 ) 1 - 7 2015年9月

　詳細を見る

科学技術計算において巨大で疎な問題行列を持つ連立一次方程式を解く際，疎行列ベクトル積計算が実行時間の大部分を占めている．疎行列ベクトル積計算の GPU 向けの高速化も数多く行われてきているものの，疎行列ベクトル積計算がメモリバウンドなカーネルであることや入力ベクトルへのランダムアクセスによって発生する局所性低下等が要因となって性能向上が妨げられている．我々は GPU での疎行列ベクトル積計算時のメモリアクセス量とアクセス頻度を効果的に削減する疎行列フォーマットである AMB（Adaptive Multi-level Blocking）フォーマットを提案する．16bit integer の利用と種々のブロッキング手法によって，列インデックスの圧縮を行い，メモリアクセス量の削減を図っている．Florida 大学の疎行列データセットから選出した 40 個の行列に対して，既存手法との比較を行い，cuSparse と比較して最大で 2.81 倍，平均で 1.77 倍の性能向上を果たし，また，近年提案された高速な疎行列ベクトル積ライブラリである yaSpMV と比較して最大で 1.38 倍，平均で 1.13 倍の性能向上を果たした．

researchmap
ノード内同時実行ジョブにおけるパフォーマンスカウンタによるプロセス毎消費電力のモデル化

寺西賢人, 野村哲弘, 遠藤敏夫, 松岡聡

情報処理学会研究報告 2015年8月

　詳細を見る

近年のスーパーコンピュータは大量に電力を消費するようになり，実用的なスーパーコンピュータの性能の向上には電力効率が課題となっている．消費電力の効率の良い制御のためにはより詳しい消費電力の計測を行う必要がある．しかし現状ノード毎の消費電力を計測することは可能だが，プロセス毎の消費電力の計測をすることはできない．本論文ではプロセス毎に計測可能なパフォーマンスカウンタを用いて消費電力をモデリングし，同一ノード内で同時にジョブを実行した場合のプロセス毎の消費電力の推定を提案する．作成したモデル式を用いた電力の推定実験を1プロセス時と2プロセス同時実行時についてそれぞれ行い，1プロセス時は最大で誤差5.16%，2プロセス時は計測した組み合わせのうちの84.8%が誤差4%以内となった

researchmap
mrCUDA: A middleware for migrating rCUDA virtual GPUs to native GPUs

情報処理学会研究報告 2015-HPC-150 2015年8月

　詳細を見る

researchmap
GPUアクセラレータと不揮発性メモリを考慮した外部ソート

佐藤仁, 溝手竜, 松岡聡

研究報告ハイパフォーマンスコンピューティング（HPC） 2015-HPC-150 ( 24 ) 1 - 7 2015年7月

　詳細を見る

GPU アクセラレータと不揮発性メモリを考慮した外部ソートアルゴリズム xtr2sort (extreme external sort) を提案する．GPU の高い演算性能とメモリバンド幅を活かし，不揮発性メモリ，ホストメモリ，デバイスメモリ間のデータ移動に伴う遅延を隠蔽するために，不揮発性メモリ上のソートの対象となるレコードをデバイスメモリの収まるサイズへチャンクに分割し，チャンク毎にパイプラインで不揮発性メモリへの I/O 操作， CPU-GPU 間のメモリ転送，GPU 上でのソート処理を非同期に行うことで，デバイスメモリやホストメモリの容量を超えたサイズのレコードに対しても高速なソートを行う．提案手法を 2-way の Intel Xeon E5-2699 v3 2.30GHz (18コア), NVIDIA Tesla K40 を搭載した 1 台のサーバで評価した結果，Linux Asynchronous I/O(libaio) を用いたノンブロッキング I/O による提案手法の実装において，CPU 上で実行可能なレコード数の 4 倍，GPU 上で実行可能なレコード数の 64 倍となる 25:6 × 109 の int64 t 型の整数値からなるレコードに対し，78,121,548 records/sec で動作し，2 ソケット 72 スレッドで動作させた CPU 版のノンブロッキング I/O による out-of-core ソートと比較して 2.16 倍の性能を示すことを確認した．これらから，GPU アクセラレータを用いた Out-of-core な処理に向けて，不揮発性メモリを組み合わせ I/O のチャンク化と遅延隠蔽を行うことが良好な手法であることが伺える．

researchmap
メモリアクセスパターン依存故障の注入のためのQEMUベース故障注入器

小林佑矢, 實本英之, 野村哲弘, 松岡聡

情報処理学会研究報告(Web) (IPSJ Technical Report (Web)) 2017 ( HPC-160 ) 2015年7月

　詳細を見る

並列計算機の大規模化で,Silent Data Corruption(SDC)による信頼性低下が懸念されている。SDCは検出が困難な障害で,対応にはコストがかかる。適切な方法を構築・選択するには,故障注入によるオーバーヘッドや耐故障性の評価が重要になる。しかし,これまでの故障注入器はランダムなビットフリップを行うものが多く,ハードウェア特有の故障パターンを再現できない。本研究では実故障の注入を目的として,仮想マシンエミュレータQEMUを拡張し,故障注入器MH-QEMUを作成した。MH-QEMUでは,メモリ状態の変更のみならず,仮想マシンのメモリへのアクセスを検知・処理できるメモリアクセスハンドラ機能を実現した。これによりメモリアクセスパターン依存故障や永続的故障を注入できる。これらの機能のオーバーヘッドは仮想マシン上のワークロードごとに異なり,NAS Parallel Benchmarks(NPB)を用いた場合には,もっともよい場合で実行時間が約20倍で抑えられることを確認した。さらに,NPBのCGカーネルに対し,シングルビットフリップの注入では約100%の割合で計算が正常終了したが,Row-Hammerの注入では,約40%の割合で異常終了が起き,3%の割合でSDCが発生することを確認した。(著者抄録)

researchmap
TSUBAME2におけるジョブスケジューリング効率化への取り組みと検証

野村哲弘, 佐々木淳, 三浦信一, 遠藤敏夫, 松岡聡

情報処理学会研究報告(Web) (IPSJ Technical Report (Web)) 2015 ( HPC-150 ) 2015年7月

　詳細を見る

スーパーコンピュータの資源利用の効率化のためには,投入されるジョブの情報を正確に把握し,ジョブのスケジューリングを最適化することが重要である。東京工業大学学術国際情報センターのTSUBAME2においても,各種のログ情報・センサー情報を蓄積していたが,蓄積したデータの分析は十分なものではなかった。本報告では,TSUBAMEにおいて行われているユーザの資源指定を正確なものにするための取り組みと,その成果を確認するための各種ログ情報・センサー情報の解析について報告する。(著者抄録)

researchmap
Performance Optimization of Large-Scale Traffic Simulation on Parallel and Distributed Systems

Hiroki Kanezashi, Toyotaro Suzumura, Satoshi Matsuoka

2015年7月

　詳細を見る

researchmap
計算科学と計算機科学のコデザインのためのミニアプリ（ミニアプリ集FIBERの紹介／アプリケーションのEmpiricalな性能モデル構築のためのプロファイル情報の収集／FIBERミニアプリの性能およびそのモデル化）

丸山直也, 鈴木惣一朗, 三上和徳, 小村幸浩, 滝澤真一朗, 松田元彦, 野村哲弘, 三浦信一, 遠藤敏夫, 松岡聡

ハイパフォーマンスコンピューティングと計算科学シンポジウム論文集 ( 2015 ) 107 - 108 2015年5月

　詳細を見る

記述言語：日本語

researchmap
GPU搭載システムにおける都市気流シミュレーションの大規模化と性能モデル

高嵜祐樹, 遠藤敏夫, 松岡聡

情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 2015 ( 13 ) 1 - 8 2015年2月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

GPU 向けステンシル計算の規模は,通常 GPU のメモリ容量に制限されるが,テンポラル・ブロッキングと呼ばれる手法により性能劣化なく大規模化を実現可能である.本研究では,10,000 行を超えるコード規模を持つ GPU クラスタ向けアプリケーションである都市気流シミュレーションの大規模化・高性能維持を実現する手法として,HHRT をテンポラルブロッキングを組み合わせた手法を導入した結果,大規模化に対して,性能劣化とプログラミングコストを抑えることに成功した.本研究では,更なる性能最適化のために,HHRT のスワップデータサイズを削減する手法を提案する.その結果,性能が約 1.3〜1.9 倍向上し,元プログラムの約 19〜85 %の性能を達成した.さらに性能予測モデルの構築により,性能に影響を与えるパラメータの絞り込みを可能にした.

CiNii Books

researchmap
Towards Cloud-based Burst Buffers for I/O Intensive Computing in Cloud

Tianqi Xu, Kento Sato, Satoshi Matsuoka

2015年2月

　詳細を見る

researchmap
mrCUDA: Low-Overhead Middleware for Transparently Migrating CUDA Execution from Remote to Local GPUs

Pak Markthub, Akihiro Nomura, Satoshi Matsuoka

2015年

　詳細を見る

researchmap
OpenCLによるFPGAの予備評価

丸山直也, Hamid Reza Zohouri, 松田元彦, 松岡聡

情報処理学会研究報告ハイパフォーマンスコンピューティング（HPC） 2015-HPC-150 2015年

　詳細を見る

researchmap
Efficient Utilization of Multi-level Memory System for Stencil Computation (Unrefereed Workshop Manuscript)

Tianqi Xu, Guanghao Jin, Toshio Endo, Satoshi Matsuoka

研究報告ハイパフォーマンスコンピューティング（HPC） 2014 ( 10 ) 1 - 7 2014年12月

　詳細を見る

記述言語：英語出版者・発行元：一般社団法人情報処理学会

This paper is to efficiently use the multi-level memory system for stencil computation to enable Tera-Scale computation by single GPU. We build a performance model to explain the relationship between different memories and propose a new algorithm to reduce the communication cost between memories and efficiently use the capacity of memories. We evaluated 7 point stencil computation on the multi-level memory system which includes GPU memory, CPU memory and SSD. The evaluation on the real system shows that our algorithm enables the computation on the 23 times bigger domain than GPU memory capacity as well as achieves 5.5 times higher performance than other optimization methods.This paper is to efficiently use the multi-level memory system for stencil computation to enable Tera-Scale computation by single GPU. We build a performance model to explain the relationship between different memories and propose a new algorithm to reduce the communication cost between memories and efficiently use the capacity of memories. We evaluated 7 point stencil computation on the multi-level memory system which includes GPU memory, CPU memory and SSD. The evaluation on the real system shows that our algorithm enables the computation on the 23 times bigger domain than GPU memory capacity as well as achieves 5.5 times higher performance than other optimization methods.

CiNii Books

researchmap
HPC and Interactive Big Data Analytics: Case Study of Distributional Semantics

IPSJ SIG Notes 2014-HPC-146(12) 2014年10月

　詳細を見る

researchmap
GPUクラスタ上の実ステンシルアプリケーションの大規模化に向けた局所性向上の評価

高嵜祐樹, 遠藤敏夫, 松岡聡

研究報告ハイパフォーマンスコンピューティング（HPC） 2014 ( 23 ) 1 - 8 2014年9月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

GPU の登場により，CFD で使われているステンシル計算は性能向上している．しかし，問題サイズの大きさはホストメモリより小さい GPU メモリの容量に制限されてしまっている．この問題に対して，ステンシル計算に対応したメモリアクセスの局所性を向上させる手法による解決策が提案されているが，プログラミングコストの増加が問題となっており，大規模なステンシルアプリケーションへの適応は難しいと考えられる．本研究の目的は，ステンシルアプリケーションにおける高性能化，大規模化，低プログラミングコストの 3 つを実現することである．その実現のために，実局所性向上アルゴリズムと CPU-GPU 間のデータ転送を自動化するメモリスワップランタイムを組み合わせたプログラミングモデルを提案する．本研究では，実ステンシルアプリケーションである都市気流シミュレーションに提案手法を適用し，その性能評価を行った．

CiNii Books

researchmap
大規模分散メモリ環境におけるハイブリッドBFSの最適化

上野晃司, 鈴村豊太郎, 丸山直也, 松岡聡

2014年9月

　詳細を見る

近年,Web グラフやソーシャルグラフなど大規模なグラフデータが多くあり,大規模グラフ解析への関心が高まっている.本論文では,比較的直径の短いグラフで有効な幅優先探索 (BFS) アルゴリズムであるハイブリッド BFS を,計算ノードが数千〜数万あるような大規模なスーパーコンピュータ上で効率よく計算する手法を提案する.ビットマップを使った疎行列表現や,頂点濃度に応じたデータ構造選択,ボトムアップ探索の並列性を上げることによる効率化を行い,数万ノード規模でのスケーラビリティを得られた.「京」を使った性能評価では,65,536 ノードで 17,997GTEPS の性能を達成し,2014 年 6 月の Graph500 ランキングにおいて「京」は 1 位を獲得した.

researchmap
Increasing GPU batch queue’s utilization using rCUDA

IPSJ SIGTechnical Report 2014-HPC-145 ( 24 ) 2014年7月

　詳細を見る

researchmap
GPU間マイグレーションによる効率的な並列実行

鈴木太一郎, 額田彰, 松岡聡

情報処理学会研究報告 Vol.2014-HPC-145(42) 2014年7月

　詳細を見る

researchmap
Visualizing Collectives over InfiniBand Networks

IPSJ SIG Technical Report 2014-HPC-145 ( 13 ) 2014年7月

　詳細を見る

researchmap
Towards Cloud Bursting for Extreme Scale Supercomputers

研究報告ハイパフォーマンスコンピューティング（HPC） 2014-HPC-145 ( 5 ) 1 - 8 2014年7月

　詳細を見る

researchmap
実アプリケーションにおけるウェーブレット変換を用いたチェックポイントデータの非可逆圧縮手法

佐々木尚人, 佐藤賢斗, 遠藤敏夫, 松岡聡

研究報告ハイパフォーマンスコンピューティング（HPC） 2014-HPC-145 ( 7 ) 1 - 8 2014年7月

　詳細を見る

近年，HPC システムやスーパーコンピュータの規模は急速に拡大しつつあり，それに伴いシステムの平均故障間隔が短縮してしまう傾向にある．また，多くのシステムでは耐故障機能としてチェックポインティングが採用されているが，将来的にチェックポイント時間が平均故障間隔を上回ってしまう可能性があることが問題視されている．そこで，我々はチェックポイント時間を短縮するため，チェックポイントデータの非可逆圧縮手法を提案する．具体的には，チェックポイントデータに対してウェーブレット変換，量子化，符号化に加えてスタンダードな圧縮手法を適用することで非可逆圧縮を行う．本研究ではこの提案手法を気象アプリケーション NICAM のチェックポイント対象データに適用し，発生する誤差，圧縮率，圧縮時間について測定，評価を行った．その結果，特定の条件下で，相対誤差の最大が 5% 以内で，チェックポイント時間を約 70%短縮できることを確認した．

researchmap
Performance modeling of a hierarchcial N-body algorithm for arbitrary particle distribution (Unrefereed Workshop Manuscript)

Keisuke Fukuda, Naoya Maruyama, Jeremy S.Meredith, Jeffrey S.Vetter, Satoshi Matsuoka

研究報告ハイパフォーマンスコンピューティング（HPC） 2014 ( 26 ) 1 - 8 2014年7月

　詳細を見る

記述言語：英語出版者・発行元：一般社団法人情報処理学会

Hierarchical algorithms are considered to be important in next-generation large scale scientific computing. Such algorithms are typically compute-intensive and have higher communication locality that are beneficial on future supercomputers with much less B/F ratio. However, one of the big challenges of such algorithms is that the data structures and computation/communication patterns are irregular and it is difficult to analyze and predict the performance. In this paper, we introduce a performance modeling method for Fast Multipole Method, a typical example of hierarchical algorithms for N-body problems, using a domain specific performance modeling language Apsen. We show that our modeling scheme can adapt to various particle distributions parameters and provides useful information to application researchers to optimize algorithmic parameters.Hierarchical algorithms are considered to be important in next-generation large scale scientific computing. Such algorithms are typically compute-intensive and have higher communication locality that are beneficial on future supercomputers with much less B/F ratio. However, one of the big challenges of such algorithms is that the data structures and computation/communication patterns are irregular and it is difficult to analyze and predict the performance. In this paper, we introduce a performance modeling method for Fast Multipole Method, a typical example of hierarchical algorithms for N-body problems, using a domain specific performance modeling language Apsen. We show that our modeling scheme can adapt to various particle distributions parameters and provides useful information to application researchers to optimize algorithmic parameters.

CiNii Books

researchmap
OpenACCディレクティブ拡張によるデータレイアウト最適化

星野哲也, 丸山直也, 松岡聡

研究報告ハイパフォーマンスコンピューティング（HPC） 2014 ( 45 ) 1 - 8 2014年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

近年増加傾向にある GPU 等のアクセラレータを搭載した計算環境への既存プログラムの移植方法として，CUDA・OpenCL に代表されるローレベルなプログラミングモデルを用いる方法に対し，ディレクティブベースの OpenACC のようなハイレベルなプログラミングモデルを用いる方法が注目されている．このようなディレクティブベースのプログラミングモデルの利点として，元のプログラムを維持したまま移植を行えるために，デバイス間の機能的な可搬性が高いことがあげられる．しかし現状の OpenACC などの High-level なプログラミングモデルは，スカラプロセッサとメニーコアアクセラレータの得意とするデータレイアウトの相違に対応することが出来ず，異なる性質を持ったデバイス間の性能可搬性に問題がある．そこで本研究では，データレイアウトを抽象化し，異なるデバイス間での性能可搬性を向上させるための OpenACC の拡張ディレクティブを試作し，姫野ベンチマークのデータレイアウトをトランスレーターにより変更し，マルチコア CPU，Intex Xeon Phi，K20X GPU のそれぞれで評価を行った．その結果，オリジナルと同一のデータレイアウトと比較して，Intel Xeon Phi では 27%，K20X GPU では 24%の性能向上が得られることを確認した．

CiNii Books

researchmap
Performance modeling of a tree-based hierarchical N-body algorithm with arbitrary particle distributions

Keisuke Fukuda, Naoya Maruyama, Jeremy S.Meredith, Jeffrey S.Vetter, Satoshi Matsuoka

2014年7月

　詳細を見る

researchmap
TSUBAME-KFC : 液浸冷却を用いた世界一省エネなスーパーコンピュータ

Endo Toshio, Nukada Akira, Matsuoka Satoshi

Tsubame ESJ. : e-science journal 11 18 - 23 2014年6月

　詳細を見る

記述言語：英語出版者・発行元：東京工業大学学術国際情報センター

researchmap
TSUBAME-KFC : 液浸冷却を用いた世界一省エネなスーパーコンピュータ

遠藤敏夫, 額田彰, 松岡聡

Tsubame ESJ. : e-science journal 11 2 - 7 2014年6月

　詳細を見る

記述言語：日本語出版者・発行元：東京工業大学学術国際情報センター

researchmap
GPUのキャッシュを考慮した疎行列ベクトル積計算手法の性能評価

長坂侑亮, 額田彰, 松岡聡

情報処理学会研究報告 014-HPC-144 ( 5 ) 2014年5月

　詳細を見る

researchmap
Lustre 2.5 Performance Evaluation: Performance Improvements with Large I/O Patches, Metadata Improvements, and Metadata Scaling with DNE

Hitoshi Sato, Shuichi Ihara, Satoshi Matsuoka

2014年4月

　詳細を見る

researchmap
Abstractions for Convergence of Big Data and HPC in Deep Memory Hierarchy Machines

Satoshi Matsuoka, Hitoshi Sato

Workshop on Programming Abstractions for Data Locality (PADAL 2014) 2014年4月

　詳細を見る

researchmap
自動テンポラルブロッキングによる大規模ステンシル計算の実現

河村知輝, 丸山直也, 松岡聡

研究報告ハイパフォーマンスコンピューティング（HPC） 2014 ( 32 ) 1 - 6 2014年2月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

偏微分方程式を解く際に差分法を用いるとステンシル計算に帰着する．この計算は高いメモリバンド幅を要求するため GPU を用いることで高速化が可能である．しかし GPU メモリ容量は小さく，大規模な問題を解く際に GPU メモリ容量が制限となってしまう．この問題に対して，テンポラルブロッキングを行うことで性能低下なく GPU メモリ容量以上の大きなドメインを解くことができることを示す先行研究があるが，プログラミングコストが高いという問題を抱えている．そこで，本研究ではこのテンポラルブロッキングをフレームワークに組み込むことで自動最適化を実現した．また，ブロッキング段数などのパラメータの最適値を導出するために性能モデルを構築した．

CiNii Books

researchmap
CPU-GPUそれぞれに最適なデータレイアウトを選択可能にするOpenACCディレクティブ拡張

星野哲也, 丸山直也, 松岡聡

研究報告ハイパフォーマンスコンピューティング（HPC） 2014 ( 5 ) 1 - 5 2014年2月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

近年増加傾向にある GPU 等のアクセラレータを搭載した計算環境への既存プログラムの移植方法として，CUDA・OpenCL に代表される Low-level なプログラミングモデルを用いる方法に対し，ディレクティブベースの OpenACC のような High-level なプログラミングモデルを用いる方法が考えられる．このようなディレクティブベースのプログラミングモデルの利点として，元のプログラムを壊さずに移植を行えるために，デバイス間の可搬性が高いことがあげられる．しかし現状の OpenACC などのプログラミングモデルは，スカラプロセッサとメニーコアアクセラレータの得意とするデータレイアウトの相違等に対応することが出来ず，異なる性質を持ったデバイス間の性能可搬性に問題がある．そこで本研究では，データレイアウトを抽象化し，異なるデバイス間での性能可搬性を向上させるための OpenACC の拡張ディレクティブを試作し，評価を行った．

CiNii Books

researchmap
Multi-level Temporal Blocking for Stencil Computation for Memory Hierarchy on TSUBAME2.5

Guanghao Jin, Toshio Endo, Satoshi Matsuoka

研究報告ハイパフォーマンスコンピューティング（HPC） 2014 ( 33 ) 1 - 8 2014年2月

　詳細を見る

記述言語：英語出版者・発行元：一般社団法人情報処理学会

The domain of the stencil computation is limited by the memory capacity of GPUs on a GPU cluster. As the domain grows to cope with higher accuracy requirements, more GPUs need to be employed to extend the memory capacity. In this paper, we propose new methods which apply temporal blocking method to device memory and registers of a set of GPUs to allow computations on the domain that is bigger than the memory capacity of GPUs while maintaining high performance on TSUBAME2.5. We also analyze the parameters and performance differences between TSUBAME2.0 and TSUBAME2.5 to apply our methods to wide range GPU clusters.The domain of the stencil computation is limited by the memory capacity of GPUs on a GPU cluster. As the domain grows to cope with higher accuracy requirements, more GPUs need to be employed to extend the memory capacity. In this paper, we propose new methods which apply temporal blocking method to device memory and registers of a set of GPUs to allow computations on the domain that is bigger than the memory capacity of GPUs while maintaining high performance on TSUBAME2.5. We also analyze the parameters and performance differences between TSUBAME2.0 and TSUBAME2.5 to apply our methods to wide range GPU clusters.

CiNii Books

researchmap
不揮発性メモリを用いたHybrid BFSアルゴリズム

岩渕圭太, 佐藤仁, 溝手竜, 安井雄一郎, 藤澤克樹, 松岡聡

研究報告アルゴリズム（AL） 2014 ( 7 ) 1 - 1 2014年2月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

近年、SNS 解析、道路ネットワークの経路探索、スマートグリッド、創薬、遺伝子解析等の様々な分野で大規模なグラフに対する高速処理が求められているが、従来手法では、妥当な性能を得るためには全てのデータを DRAM 上にロードして実行する必要があり、その結果、DRAM の容量を増設することによる消費電力、価格の面でのコストの増加が問題になっている。そこで、我々は、BFS に対して NVM(不揮発性メモリ) を補助的に利用することで、DRAM の容量を超えるサイズのグラフを性能低下を抑えながら高速に処理する手法を提案し、開発を進めている。現時点で、省電力なビッグデータ処理のランキングである GreenGraph500 (2013 年 11 月) のビッグデータカテゴリのリストで 4 位 (1 ノードでは世界一) を達成した。

CiNii Books

researchmap
Burst SSD Buffer: Checkpoint Strategy at Extreme Scale

Kento Sato, Satoshi Matsuoka, Adam Moody, Kathryn Mohror, Todd Gamblin, BronisR.DeSupinski, Naoya Maruyama

研究報告ハイパフォーマンスコンピューティング（HPC） 2013 ( 19 ) 1 - 9 2013年9月

　詳細を見る

記述言語：英語出版者・発行元：一般社団法人情報処理学会

Checkpointing is an indispensable fault tolerance technique, commonly used by HPC applications that run continuously for hours or days at a time. However, when checkpointing extreme scale systems, the bursty nature of the I/O pattern of checkpointing overburdens file systems and also causes huge overhead to be added to an application's runtime. In order to alleviate the overhead and achieve fast checkpoint/restart, we propose a highly-resilient mini-SSD-based burst buffer system, and explore a checkpoint strategy on the system based on our checkpointing model.Checkpointing is an indispensable fault tolerance technique, commonly used by HPC applications that run continuously for hours or days at a time. However, when checkpointing extreme scale systems, the bursty nature of the I/O pattern of checkpointing overburdens file systems and also causes huge overhead to be added to an application's runtime. In order to alleviate the overhead and achieve fast checkpoint/restart, we propose a highly-resilient mini-SSD-based burst buffer system, and explore a checkpoint strategy on the system based on our checkpointing model.

CiNii Books

researchmap
不揮発性メモリを用いたHybrid-BFSアルゴリズムの最適化と性能解析

岩渕圭太, 佐藤仁, 安井雄一郎, 藤澤克樹, 松岡聡

情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 2013 ( 3 ) 1 - 9 2013年9月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

近年さまざまな分野で大規模なグラフに対する高速な処理が求められているが,その処理の特性上,妥当な性能を得るためには全てのデータを DRAM 上にロードして実行する必要があり,その結果,DRAM の容量を増設することによる消費電力,価格面でのコストの増加が問題となっている.そこで,Hybrid-BFS アルゴリズムに対して不揮発性メモリを補助的に利用した場合の I/O の最適化,性能低下要因の解析を行うことで性能低下を抑えながら大規模グラフ処理が実行可能かの評価を行った.その結果,一部データを不揮発性メモリに退避することで DRAM 用量が半分の環境において性能低下を 47.1% まで抑えることができた.また,参照され難いエッジデータをさらに退避することで性能の低下を抑えながらより DRAM 使用量が削減可能なことの確認,さらに,性能低下要因の特定とその改善案を示し,性能低下を抑えながら大規模グラフ処理の実現可能性が示唆された.

CiNii Books

researchmap
不揮発性メモリを用いたGraph500ベンチマークの大規模実行へ向けた予備評価

岩渕圭太, 佐藤仁, 安井雄一郎, 藤澤克樹, 松岡聡

先進的計算基盤システムシンポジウム論文集 2013 130 - 131 2013年5月

　詳細を見る

記述言語：日本語

researchmap
大規模ヘテロ型スーパーコンピュータ向けデータ並列処理フレームワークの設計と実装

佐藤仁, 白幡晃一, 松岡聡

研究報告ハイパフォーマンスコンピューティング（HPC） 2013 ( 24 ) 1 - 7 2013年2月

　詳細を見る

記述言語：日本語

我々は，現在，数千～数万のアクセラレータを搭載したスパコン上でのスケーラブルなデータ並列処理を目指したソフトウェア基盤として Hamar(Highly Accelerated MapReduce) の開発を進めている．本稿では，その初期設計と実装について述べ，アプリケーションとして，MapReduce に基づいた汎用グラフ処理モデルである GIM-V へ適用した事例を述べる．適用した結果，Hamar では，Map，Reduce 処理は CUDA 及び OpenMP で柔軟に記述できることを確認した．また，予備実験として，両実装を 1 台の GPU が搭載された単一計算ノード上で動作させたところ，Map 処理は平均して CUDA 版が OpenMP 版と比較して平均 1.2 倍の性能向上を示し，Reduce 処理は 10 倍以上の性能低下を示した．この構成は，単一計算ノードに GPU 1 台が接続された環境であり，CUDA 版の実装では不利な条件での結果であったものの，更なる大規模計算環境への適用や，性能最適化，自動タスクスケジューリングなどの課題が明らかになった．

CiNii Books

researchmap
不揮発性メモリを用いたGraph500ベンチマークの大規模実行へ向けた予備評価

岩渕圭太, 佐藤仁, 安井雄一郎, 藤澤克樹, 松岡聡

研究報告ハイパフォーマンスコンピューティング（HPC） 2013 ( 31 ) 1 - 6 2013年2月

　詳細を見る

記述言語：日本語

近年大規模グラフはさまざまな分野で出現しており，DRAM の容量を増設することによる消費電力増加の問題やそもそもシングルノード上の DRAM 容量を超えるグラフも出現している．本研究ではGraph 500 ベンチマークに対して不揮発性メモリを補助的に利用することで性能低下を最小限に押さえながらシングルノード上でできる限り大容量のグラフを扱えるようにすることを目指している．そこでまず本論文ではDRAM に乗りきらない問題サイズを実行するための手法を提案し，DRAM と不揮発性メモリの容量の比率が実行性能にどのような影響を与えるかについての予備評価を行った．

CiNii Books

researchmap
ディレクティブベースプログラミング言語OpenACCの性能評価

星野哲也, 丸山直也, 松岡聡

ハイパフォーマンスコンピューティングと計算科学シンポジウム論文集 2013 91 - 91 2013年1月

　詳細を見る

記述言語：日本語

researchmap
Extreme Big Data時代に向けたTSUBAMEスーパーコンピュータでの取り組み

佐藤仁, 松岡聡

大学ICT推進協議会年次大会論文集 8p 2013年

　詳細を見る

記述言語：日本語出版者・発行元：[大学ICT推進協議会]

researchmap
エクサスケールスパコンに向けた耐故障性の評価-TSUBAME2.0を例にして-

松岡聡, 佐藤賢斗, 佐藤賢斗, 遠藤敏夫

情報処理学会研究報告(Web) 2013 ( HPC-141 ) 2013年

　詳細を見る

J-GLOBAL

researchmap
TSUBAME2.0におけるMulti-rail InfiniBandネットワークの性能評価

野村哲弘, 遠藤敏夫, 松岡聡

研究報告ハイパフォーマンスコンピューティング（HPC） 2012 ( 3 ) 1 - 5 2012年12月

　詳細を見る

記述言語：日本語

TSUBAME2.0 のネットワークは Fat tree トポロジであるものの，大規模実行時に集団通信性能が劣化することが観測されている．本稿では想定される原因としてスイッチ間リンクにおけるパケット衝突とスイッチ間リンクの性能劣化に着目し，それぞれの問題を緩和するネットワーク設定を提示し，バンド幅および集団通信性能への影響を示す．ネットワーク設定の改善の結果，通信の確率的な遅延の発生をほぼなくすことができ，大規模実行時のインジェクションバンド幅において 16.0%～39.5% の性能向上を確認した．

CiNii Books

researchmap
TSUBAME2.0におけるMulti-rail InfiniBandネットワークの性能評価

野村哲弘, 遠藤敏夫, 松岡聡

研究報告計算機アーキテクチャ（ARC） 2012 ( 3 ) 1 - 5 2012年12月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

TSUBAME2.0 のネットワークは Fat tree トポロジであるものの，大規模実行時に集団通信性能が劣化することが観測されている．本稿では想定される原因としてスイッチ間リンクにおけるパケット衝突とスイッチ間リンクの性能劣化に着目し，それぞれの問題を緩和するネットワーク設定を提示し，バンド幅および集団通信性能への影響を示す．ネットワーク設定の改善の結果，通信の確率的な遅延の発生をほぼなくすことができ，大規模実行時のインジェクションバンド幅において 16.0%～39.5% の性能向上を確認した．

CiNii Books

researchmap
GPUメモリ容量を超える問題規模に対応する高性能ステンシル計算法

金光浩, 遠藤敏夫, 松岡聡

研究報告計算機アーキテクチャ（ARC） 2012 ( 31 ) 1 - 6 2012年12月

　詳細を見る

記述言語：日本語

GPU 上でのステンシル計算を行う際，その問題サイズは GPU メモリ容量に制限され，その容量は通常ホストメモリより小さい．本論文では GPU メモリ容量を超えた問題サイズへの対応と高性能を両立する最適化手法を提案，評価する．メモリアクセス局所性を向上させるために提案されてきた時間ブロッキング手法に基づき，時間ブロッキングを複数階層について適用し，かつ冗長な計算量を削減する手法を述べる．三次元領域の七点ステンシル計算を評価した結果，単純な方法に比べ 20 倍以上，既存の時間ブロッキング手法に比べ 1.4 倍以上の高速化を実現した．The problem size of the stencil computation on GPU is limited by the GPU memory capacity, which is typically smaller than that of host memory. This paper proposes and evaluates optimization techniques to achieve both larger problem size than GPU memory and high performance. They are based on the temporal blocking method, which has been proposed to improve memory access locality of stencil computation. We apply temporal blocking to several layers, and then reduce redundant computation. Performance evaluation with 3D 7-point stencil computation, we achieved >20 times performance of naive implementation and 1.4 times performance of implementation based on existing temporal blocking.

CiNii Books

researchmap
TSUBAME2.0におけるMulti-rail InfiniBandネットワークの性能評価

野村哲弘, 遠藤敏夫, 松岡聡

研究報告ハイパフォーマンスコンピューティング（HPC） 2012 ( 3 ) 1 - 5 2012年12月

　詳細を見る

記述言語：日本語

TSUBAME2.0 のネットワークは Fat tree トポロジであるものの，大規模実行時に集団通信性能が劣化することが観測されている．本稿では想定される原因としてスイッチ間リンクにおけるパケット衝突とスイッチ間リンクの性能劣化に着目し，それぞれの問題を緩和するネットワーク設定を提示し，バンド幅および集団通信性能への影響を示す．ネットワーク設定の改善の結果，通信の確率的な遅延の発生をほぼなくすことができ，大規模実行時のインジェクションバンド幅において 16.0%～39.5% の性能向上を確認した．

CiNii Books

researchmap
動的タスクスケジューリングエンジンStarPUによるKIFMMの実装と性能評価

福田圭祐, 丸山直也, MiquelPericas, 松岡聡

研究報告ハイパフォーマンスコンピューティング（HPC） 2012 ( 13 ) 1 - 7 2012年9月

　詳細を見る

記述言語：日本語

Fast Multipole Method （FMM）は， N 体問題のアルゴリズムで，近似計算により O(N) の計算量を実現する． FMM は，計算特性が異なり入力データによって負荷が変動する複数の計算ステップから構成される．本研究では，FMM の入力データ（粒子分布）による負荷変動に対して CPU/GPU 間の負荷分散を適切に行うことを目的とする．そのための手法として，動的タスクスケジューリングエンジンを採用し，そのためのライブラリである StarPU 上に Kernel Independent FMM （KIFMM）アプリケーションを実装し，性能を評価した．この実装を，入力データ毎の総当たりによって最適な静的スケジューリングを決定することができる実装と比較した．均一分散では単純なヒューリスティクスを１つ導入することにより静的スケジューリング実装に対して 137.9% ，球表面（不均一）分散においてはヒューリスティクスを用いずに同実装に対して 89.5% の性能を得た．このことから，動的タスクスケジューリングを用いることにより，最適な静的スケジューリング実装に対して競争的なパフォーマンスを発揮しつつ，入力データによる負荷変動に抗して負荷分散を実現することが可能であると言える．

CiNii Books

researchmap
Towards a Dataflow FMM using the OmpSs Programming Model

Miquel Pericas, Abdelhalim Amer, Keisuke Fukuda, Naoya Maruyama, Rio Yokota, Satoshi Matsuoka

研究報告ハイパフォーマンスコンピューティング（HPC） 2012 ( 12 ) 1 - 7 2012年9月

　詳細を見る

記述言語：英語

This paper describes initial efforts towards the development of a dataflow implementation of the ExaFMM Fast Multipole Method code using the OmpSs programming model. We first develop several implementations based on task decomposition which overcome load balancing problems previously identified using traditional parallelization approaches. We then add dataflow extensions to improve task throughput by extracting distant parallelism and removing barriers. Execution profiles and scalability results for a single node of the Tsubame 2.0 supercomputer are then shown.This paper describes initial efforts towards the development of a dataflow implementation of the ExaFMM Fast Multipole Method code using the OmpSs programming model. We first develop several implementations based on task decomposition which overcome load balancing problems previously identified using traditional parallelization approaches. We then add dataflow extensions to improve task throughput by extracting distant parallelism and removing barriers. Execution profiles and scalability results for a single node of the Tsubame 2.0 supercomputer are then shown.

CiNii Books

researchmap
50GFLops/W, PUE<1,100KW/ラックに挑戦するTSUBAME3.0およびエクサへのグリーンスパコン取り組み(インターネット運用・管理,一般招待講演)

松岡聡

電子情報通信学会技術研究報告. IA, インターネットアーキテクチャ 112 ( 212 ) 63 - 63 2012年9月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

将来2020年頃にエクサフロップスのスパコンを20MW程度で実現する世界的技術目標があるが、これは現状の世界トップのBlueGene/Qの25倍の性能電力効率であり、単にCPUだけでなく、メモリ・ストレージ・ネットワーク・冷却などにおいて、最先端のITインフラとしての多くの困難な技術的なチャレンジを提示している。東工大においてもTSUBAME2.0のGreen500における『運用スパコン世界一』の認定に続き、 TSUBAME3.0および将来のエクサフロップスのスパコンに向けて幾つものグリーン化の研究プロジェクトに取り組んでおり、これらの成果はそれらスパコンだけでなくクラウドIT一般のグリーン化に大いに寄与することを期待している

CiNii Books

researchmap
大規模流体アプリケーションのCUDA・OpenACCへの移植性の評価

星野哲也, 丸山直也, 松岡聡

研究報告ハイパフォーマンスコンピューティング（HPC） 2012 ( 42 ) 1 - 9 2012年7月

　詳細を見る

記述言語：日本語

地震や気象予測，航空機や高層ビル設計といったシミュレーションに利用される数値流体力学アプリケーションは，近年一般的になりつつある GPU を用いたスーパーコンピュータにおいて，目覚ましい成果を上げている．しかし，GPU を用いたプログラミングは，高い性能を得ること難しいと言われており，レガシープログラムの GPU 環境への移植が問題となっている．本稿では，実際に利用されている大規模流体アプリケーションである UPACS を手動により CUDA 化し，性能と移植コストの面から評価を行った．また，プログラムの移植性を解決すると期待されている，OpenACC の予備評価を行った．これら評価の結果を示し，今後解決すべき課題について述べる．Computational fluid dynamics (CFD) applications used for an earthquake and meteorological simulation are one of the most important application executed with high-speed supercomputers. Especially, GPU-based supercomputers have been showing remarkable performance of CFD applications. However, GPU-programing is still difficult to obtain high performance, which prevents legacy applications from being ported to GPU environment. We apply classical optimizations to a real-world CFD application UPACS and evaluate it's performance and porting costs, and we also evaluate OpenACC expected to provide portability across CPUs and GPUs. We demonstrate these results of evaluation and mention performance problems should be resolved in the future.

CiNii Books

researchmap
大規模流体アプリケーションのGPUによる高速化手法の評価

星野哲也, 丸山直也, 松岡聡

先進的計算基盤システムシンポジウム論文集 2012 73 - 74 2012年5月

　詳細を見る

記述言語：日本語

CiNii Research

researchmap
汎用グラフ処理モデルGIM-Vの複数GPUによる大規模計算とデータ転送の最適化

白幡晃一, 佐藤仁, 鈴村豊太郎, 松岡聡

研究報告ハイパフォーマンスコンピューティング（HPC） 2012 ( 34 ) 1 - 8 2012年3月

　詳細を見る

記述言語：日本語

近年，SNS 解析、道路ネットワーク等の応用で、数百万頂点～数兆頂点、数億枝～数百兆枝からなる超大規模なグラフに対する高速処理が求められている。大規模グラフ処理手法として，ペタバイト級の大規模データのメモリ階層を自動管理する MapReduce モデルに基づいた GIM-V グラフ処理アルゴリズムが考案されている．また，GPGPU の進展により大規模計算環境への GPU の導入が進んでいる。しかし、大規模グラフ処理に対する GPU の使用による高速化や、効率的なデータ割り振り方法等は明らかではない。我々は複数 GPU を用い、通信量削減手法としてグラフ分割の効果について調査した結果、GPU の使用によりMapフェーズは 7.17 倍の高速化を示した一方，Sort，Reduce については性能改善の余地があることを示した．またグラフ分割によりデータ転送量を 54% 削減したものの、GPU 毎の負荷が不均衡になることを示した。In recent years, fast processing for extremely large-scale graph, consisting of millions to trillions of vertices and billions to hundreds of trillions of edges, is becoming increasingly important. GIM-V graph processing algorithm based on MapReduce, which automatically manages petabyte-scale data, is designed as general graph processing method. Besides, recent large-scale computing systems tend to employ GPUs to gain good peak performance and high memory bandwidth. However, acceleration factor using GPU for large graph processing and the way of efficient data distribution are not clear. We implemented multi GPU based GIM-V system and investigated the effect of graph partitioning, which is a method to reduce inter-node data transfer. Our experiment showed that GPU performed 7.17x faster than CPU on Map but not on Shuffle and Reduce, and graph partitioning reduced data transfer time by 54% but total elapsed time increased due to workload imbalance.

CiNii Books

researchmap
Physis:ヘテロジニアススパコン向けステンシル計算フレームワーク

丸山直也, 野村達男, 佐藤賢斗, 松岡聡

Tsubame e-Science Journal ( 5 ) 2012年

　詳細を見る

J-GLOBAL

researchmap
【招待講演】TSUBAME2.0との1年間とエクサスケールへの飛翔

松岡聡

研究報告数理モデル化と問題解決（MPS） 2011 ( 1 ) 1 - 1 2011年11月

　詳細を見る

記述言語：日本語

CiNii Books

researchmap
動的タスクスケジューリングによるCPU/GPUヘテロジニアス環境でのFMMの最適化

福田圭祐, 丸山直也, 松岡聡

情報処理学会研究報告. 計算機アーキテクチャ研究会報告 2011 ( 28 ) 1 - 9 2011年11月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

FMM は、N 体問題を O(N) 時間で近似的に計算するアルゴリズムであり、他の N 体問題のアルゴリズムと比較してスケーラブルであることから近年着目されている.一方で,FMM は異なる計算特性や依存性を持つ複数の計算フェーズからなるアルゴリズムであり、それらを複数の異種プロセッサを持つ環境上で効率よく実行する方法は明らかではない.本稿では、筆者らの過去の発表18) に引き続き、FMM の実装である kifmm3d の複数のフェーズを GPU 化し、速度向上と実装上の課題について検討した.さらにそれらの実装を元に、動的タスクスケジューリングシステムである StarPU5) を用いて CPU/GPU からなるヘテロジニアス環境上でプロセッサ資源を有効に利用する試みの初期実装および検討を行い,CUDA スレッドの起動や速度に関する不具合,フェーズ分割および filter の実装に関する検討事項など,様々な技術的問題点や検討事項に関する知見を得た.

CiNii Books

researchmap
Towards an Asynchronous Checkpointing System

Kento Sato, Adam Moody, Kathryn Mohror, Todd Gamblin, BronisR.DeSupinski, Naoya Maruyama, Satoshi Matsuoka

研究報告計算機アーキテクチャ（ARC） 2011 ( 18 ) 1 - 8 2011年11月

　詳細を見る

記述言語：英語

The overall failure rate of HPC systems is increasing because the number of components is growing. Checkpoint/Restart, the most common technique to tolerate these faults, enables an application to restart from the last checkpoint even if a failure happens while the application is running. However, writing large checkpoint files may impact application runtime, depending on the bandwidth of the file systems to which checkpoints are written. To minimize the impact, we propose an asynchronous checkpointing system to write checkpoints to the file system in the background. This system uses extra nodes to drain a checkpoint from compute nodes using RDMA (Remote Direct Memory Access) to minimize CPU usage. Our preliminary evaluation shows that our asynchronous checkpointing system reduces checkpointing impact with runtime increases of CPU-bound applications under 1% compared to not checkpointing to a parallel file system.The overall failure rate of HPC systems is increasing because the number of components is growing. Checkpoint/Restart, the most common technique to tolerate these faults, enables an application to restart from the last checkpoint even if a failure happens while the application is running. However, writing large checkpoint files may impact application runtime, depending on the bandwidth of the file systems to which checkpoints are written. To minimize the impact, we propose an asynchronous checkpointing system to write checkpoints to the file system in the background. This system uses extra nodes to drain a checkpoint from compute nodes using RDMA (Remote Direct Memory Access) to minimize CPU usage. Our preliminary evaluation shows that our asynchronous checkpointing system reduces checkpointing impact with runtime increases of CPU-bound applications under 1% compared to not checkpointing to a parallel file system.

CiNii Books

researchmap
グリーンスパコンTSUBAME2.0における電力危機対応運用

遠藤敏夫, 松岡聡, 額田彰, 長坂真路, 四津匡康

情報処理学会研究報告. 計算機アーキテクチャ研究会報告 2011 ( 12 ) 1 - 9 2011年11月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

本稿では,本年三月の大震災に起因する電力危機状況における,東工大 TSUBAME2.0 スーパーコンピュータの運用について報告する.スパコン設計・運用において省エネルギーは第一級の課題であるが,電力供給能力の不足状況においてはさらに,ピーク電力の上限遵守が必須であるという課題が明らかになった.今夏,時間・資源が限られた中で TSUBAME2.0 においてほどこした対策とその将来課題について報告する.

CiNii Books

researchmap
スーパコンピュータTSUBAME 2.0におけるLinpack性能1ペタフロップス超の達成

遠藤敏夫, 額田彰, 松岡聡

情報処理学会論文誌コンピューティングシステム（ACS） 4 ( 4 ) 169 - 179 2011年10月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

2010 年 11 月に稼働開始した TSUBAME 2.0 スーパコンピュータは，Intel プロセッサに加え 4,000 以上の NVIDIA GPU を備えるペタスケールのヘテロ型システムである．この TSUBAME 2.0 における Linpack ベンチマークの実行について報告する．本システムは 2CPU と 3GPU を備えた計算ノードを約 1,400 台持ち，それらはフルバイセクションのファットツリー構造を持つ Dual-Rail QDR InfiniBand ネットワークにより接続される．理論演算性能は TSUBAME 1.0 の約 30 倍となる 2.4PFlops であり，それを TSUBAME 1.0 とほぼ同じ規模の電力で実現している．Linpack ベンチマークのコード改良およびチューニングを GPU を用いた大規模システムの特性に合わせて行い，実行速度として 1.192PFlops を実現した．この結果は日本のスパコンとしては初めて PFlops を超えるものであり，Top500 スパコンランキングに 4 位にランクされた．さらに電力性能比は 958MFlops/W であり，Green500 ランキングにおいて the Greenest Production Supercomputer in the World 賞を獲得した．We report Linpack benchmark results on the TSUBAME 2.0 supercomputer, a large scale heterogeneous system with Intel processors and > 4,000 NVIDIA GPUs, operation of which has started in November 2010. The main part of this system consists of about 1,400 compute nodes, each of which is equipped with two CPUs and three GPUs. The nodes are connected via full bisection fat tree network of Dual-Rail QDR InfiniBand. The theoretical peak performance reaches 2.4PFlops, 30 times larger than that of the predecessor TSUBAME 1.0, while its power consumption is similar to TSUBAME 1.0. We conducted improvement and tuning of Linpack benchmark considering characteristics of large scale systems with GPUs, and achieved Linpack performance of 1.192PFlops. This is the first result that exceeds 1PFlops in Japan, and ranked as 4th in the latest Top500 supercomputer ranking. Also TSUBAME 2.0 has received "the Greenest Production Supercomputer in the World" prize in Green500 ranking for its performance power ratio of 958MFlops/W.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00078062/
Fast GPU Read Alignmennt with Burrows Wheeler Transform Based Index

Aleksandr Drozd, Naoya Maruyama, Satoshi Matsuoka

研究報告ハイパフォーマンスコンピューティング（HPC） 2011 ( 13 ) 1 - 4 2011年7月

　詳細を見る

記述言語：英語

This paper addresses the problem of performing faster read alignment on GPU devices. The computationally-intensive task of DNA sequence processing is approached from the perspective of parallel computation. We found memory limitations to be one of the biggest performance issues, and attempted to decrease memory footprint of alignment algorithm to boost GPU performance. Suggested implementation uses index based on Burrows-Wheeler transform and shows 3-4 time speed improvement over the previous fastest solution.This paper addresses the problem of performing faster read alignment on GPU devices. The computationally-intensive task of DNA sequence processing is approached from the perspective of parallel computation. We found memory limitations to be one of the biggest performance issues, and attempted to decrease memory footprint of alignment algorithm to boost GPU performance. Suggested implementation uses index based on Burrows-Wheeler transform and shows 3-4 time speed improvement over the previous fastest solution.

CiNii Books

researchmap
大規模並列ファイルシステムに対するワークフローアプリケーションのI/O性能解析

斎藤貴文, 佐藤仁, 松岡聡

研究報告ハイパフォーマンスコンピューティング（HPC） 2011 ( 40 ) 1 - 8 2011年7月

　詳細を見る

記述言語：日本語

大規模データを扱うデータインテンシブアプリケーションの増加とスーパーコンピュータに代表される大規模並列分散環境の増加に伴い並列ファイルシステムが注目を集めている。並列ファイルシステムは高性能 I/O を実現するために用いられるが、実際のワークフローアプリケーションのデータのようにデータサイズの大量のデータサイズの小さいファイルに対する I/O やメタデータアクセスの解析は未だ不十分である。また我々は先の研究においてデータインテンシブワークフローを並列ファイルシステム上において実行したところ、I/O 性能に影響を及ぼす要因として計算ノードのメモリにおけるバッファキャッシュと並列ファイルシステムにおけるメタデータアクセスを確認した。本稿ではこれら性能に影響を及ぼす要因について TSUBAME2.0 上で実ワークフローアプリケーションを動かすことで実稼働している二つの並列ファイルシステム (Lustre, GPFS) の比較を行った。その結果、バッファキャッシュは両方のファイルシステムで確認されたが、GPFS よりも Lustre のほうが明確に現れたことが観察された。またメタデータアクセスについてもどちらのファイルシステムにおいてもメタデータサーバへの競合が確認され、メタデータサーバの構成によって影響の度合いが異なることが確認された。Data-intensive scientific applications are becoming popular in astronomy and high-energy physics and parallel filesystems are attracting attentions to acquire tremendous high I/O throughput on a parallel distributed large-scale environment such as supercomputers. However, performance surveys on file-grained I/O and metadata access of workflow applications on parallel file systems are not investigated. This paper reports the performance comparison of fine-grained I/O on Lustre and GPFS file systems in the TSUBAME2.0 supercomputer by using a workflow application called Montage. We observed buffer cache effects of a running application on both file systems; however, the effect clearly became visible on Lustre than on GPFS. Besides, we also observed metadata contentions on both file systems; the influence of the contentions showed different characteristics depending on the composition of the metadata management.

CiNii Books

researchmap
細粒度I/Oを考慮したオンデマンド階層型データストアの実現にむけて

佐藤仁, 松岡聡

研究報告ハイパフォーマンスコンピューティング（HPC） 2011 ( 27 ) 1 - 8 2011年7月

　詳細を見る

記述言語：日本語

細粒度 I/O を考慮したオンデマンド階層型データストアを提案する．提案手法では，スパコン上のジョブスケジューラと連携して計算ノード上のローカルストレージを集約し，スパコン上の共有ファイルシステムとは独立で階層型ストレージ管理を行うデータストアを構築する．これにより，アプリケーションに対して，スパコン上の共有ファイルシステムと同じファイルビューを提供しつつ高いメタデータアクセス及び I/O スループット性能を達成し，かつ，スパコン上の共有ファイルシステムに対するメタデータアクセスや I/O 競合を削減する．予備実験として Montage を用いてワークフローアプリケーションを実行した結果，提案手法がスパコン上の共有ファイルシステムへのファイル操作を抑えられ，getattr の場合で 60% 程度であることを確認した．We propose an on demand hierarchical data store mechanism for massive amounts of small file access. Our proposed mechanism constructs a single virtual data store that federates local storage volumes on a computing node and operates hierarchical storage management (HSM) between the data store and the underlying shared file systems on a supercomputer. Based on these features, our mechanism can reduce massive metadata accesses and I/O contentions to the shared file system on a supercomputer, while providing the same single system image as the underlying shared file system and improved metadata access performance and I/O throughput to running applications. Experimental results by using a Montage work flow application indicates that our technique can reduce file operations onto the shared file system, 60% on the getattr case, compared to the direct file access to the shared file system on a supercomputer.

CiNii Books

researchmap
広域分散環境を提供するHPCI先端ソフトウェア運用基盤の設計

滝澤真一朗, 棟朝雅晴, 宇野篤也, 小林泰三, 實本英之, 松岡聡, 石川裕

研究報告ハイパフォーマンスコンピューティング（HPC） 2011 ( 68 ) 1 - 7 2011年7月

　詳細を見る

記述言語：日本語

平成24年秋の運用開始が予定されているHPCIではHPC研究者がスーパーコンピュータ「京」を有効活用することの支援を目的とし，京と基盤センター群が保有するスーパーコンピュータ間の認証基盤統一，データ共有の実現から開始する．しかしながら，スーパーコンピュータはバッチキューでジョブ管理されていることや，計算ノードでの管理者権限がないため，OSや分散システムの研究を行うHPC研究者向けの利用環境条件を満たさない．そこで我々は，利用者に対してシステムへの管理者権限を付与する広域分散システムのホスティング機能を提供する，先端ソフトウェア運用基盤を設計する．本稿では先端ソフトウェア運用基盤の設計，および，先行システムとして運用されているRENKEI-PoPによる事例を紹介する．The purpose of HPCI, which will be operated from autumn 2012, is to support HPC researchers to use K supercomputer, and its initial services are a federated authentication and global file sharing between K and supercomputers provided by computer centers in Japan. However, supercomputers are not suitable for HPC system researchers as their operations do not give users enough privileges. We design the advanced software deployment infrastructure that hosts distributed systems where researchers can have administrator privileges. We introduce the design of the system and a precedent system implemented on RENKEI-PoPs that use the same software.

CiNii Books

researchmap
GPGPUを用いた高速大規模グラフ処理に向けて

白幡晃一, 佐藤仁, 鈴村豊太郎, 松岡聡

研究報告ハイパフォーマンスコンピューティング（HPC） 2011 ( 14 ) 1 - 8 2011年7月

　詳細を見る

記述言語：日本語

データ量の肥大化，ストレージの省コスト化，オンラインソーシャルネットワークの成功等に伴い大規模グラフ処理の重要性が高まっている．また，GPGPU と呼ばれる，GPU を汎用計算に応用する技術の研究・開発が進んでおり，GPU のスーパーコンピュータやクラウドへの導入が進みつつある．大規模グラフ処理ライブラリの一つに PEGASUS があり，MapReduce の反復処理によって計算することができる．GPU を利用した MapReduce 処理ライブラリの一つに Mars があるが，大規模グラフ処理に対して GPU を使用してどの程度高速化できるのか，またメモリあふれへの対処やマルチ GPU 化した場合のデータの割り振り方法は明らかではない．Mars 上にグラフ処理アプリケーション（PageRank，Random Walk with Restart，Connected Components）を実装し，PEGASUS との比較実験を行った結果，反復 1 回あたり PageRank で 2.17～9.53 倍，RWR で 2.18～5.47 倍，Connected Components で 2.41～8.46 倍の高速化がされることを確認した．Large-scale graph processing is becoming more important due to the large volume of available data, the low cost of storage and the stunning success of online social networks. Besides, recent large-scale computing systems tend to employ GPUs to gain good peak performance and high memory bandwidth. Mars is one of the MapReduce library accelerated with GPUs;however, the problems on GPGPU-based large-scale graph processing, such as the performance improvement by using GPUs, the memory management in GPUs, and the data distribution between multiple GPUs, are not investigated. In order to clarify the problems, we implemented several graph processing applications such as PageRank, Random Walk with Restart(RWR) and Connected Components on top of Mars and compared the results with PEGASUS, one of the large-scale graph processing library. Our experimental results show that the mean time of one iteration in Mars is 2.17-9.53 times faster on PageRank, 2.18-5.47 times on RWR, and 2.51-8.46 times on Connected Components respectively compared with PEGASUS.

CiNii Books

researchmap
超低消費電力ハイパフォーマンスコンピューティング

松岡聡

應用物理 80 ( 7 ) 579 - 584 2011年7月

　詳細を見る

記述言語：日本語出版者・発行元：応用物理学会

CiNii Books

researchmap
ワークフローアプリケーションに対する計算資源割り当ての最適化 (ハイパフォーマンスコンピューティング(HPC) Vol.2011-HPC-129)

斉藤貴文, 千葉立寛, 佐藤仁, 松岡聡

情報処理学会研究報告 2010 ( 6 ) 1 - 7 2011年4月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

大規模データを扱うデータインテンシブアプリケーションは近年増加の一途を辿っており，これらの爆発的に増加するデータを分散並列環境で解析的に処理するフレームワークとしてワークフローシステムが注目されている．ワークフローは複数のタスクで構成されており，それらのタスク間での依存関係をユーザが定義して処理が並列計算環境上で実行されるが，ワークフローそれ自体は目的に応じて構成されるため，実行したいワークフローがその実行環境でどのように配置すれば最適に実行可能かを知ることは難しい．また，クラウドのように動的に計算資源をスケールアウト/イン可能なシステムにおいては，ワークフローの特徴や処理に応じてリソースを増減させることでユーザ・システム側の双方において最適な実行が可能となる．未知の環境に対してもワークフローの性能を利用する環境それぞれで最適化させるために，汎用的に適応可能な性能モデルの構築が必要不可欠である．本稿では，ワークフローアプリケーションの性能モデルを構築し，TSUBAME2.0とAmazon EC2/S3において天文データ解析を行うMontageに対してモデルを適応させた．小規模なワークフローの実行結果をもとに計算性能やI/O性能を見積もり，より大規模なワークフローでの性能の予測を行った．その結果，今回構築したモデル化では表現しきれていないパラメータの影響，特に中間ファイルがメモリキャッシュにのる場合やメタデータファイルへのアクセスコストにより，正確には性能を見積もることは出来なかった．Recently data-intensive scientific applications are becoming more popular in astronomy and high-energy physics. Scientific workflow is expected to handle these huge data efficiently. Workflow is constructed by multiple tasks and programmers describe the dependencies between each tasks as DAG, then the workflow management systems schedule the tasks by following the DAG. Since the structure of DAG varies whenever data set changes, it is difficult to know how many resources we should prepare for the workflow. If we can estimate the performance of workflow in target execution environment, we are able to not only add but also reduce computing resources responded to the feature of workflow, so we need a performance model in order to predict workflow execution time. In this paper we propose performance model for data-intensive workflow, and we estimate the performance by adopting the execution log from test workflow to our performance model. We apply it to Montage workflow in two computing environment; TSUBAME2.0 and Amazon EC2/S3. As a result we discuss the validity of our performance model and also discuss the existing problem.

CiNii Books

researchmap
TSUBAME2.0上でのHadoopの性能評価 (ハイパフォーマンスコンピューティング(HPC) Vol.2011-HPC-129)

佐藤仁, 松岡聡

情報処理学会研究報告 2010 ( 6 ) 1 - 8 2011年4月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

ジョブスケジューラと協調してオンデマンドにHadoop環境を構築しユーザのMapReduceアプリケーションを実行するツール「Tsudoop」のTSUBAME2.0への適用事例を示す．このツールを用いて，TSUBAME2.0上でHadoop付属のRandomWriter, SortによるMapReduceアプリケーションを実行し，weak scaling性能を調査した結果，HDFSでは24ノード，264コアを用いた実行では1ノードでの実行と比較して高々1.1倍の実行の増加に留まり良好なweak scaling性能を示すのに対して，Lustreにおいては1.6～1.8倍の実行時間の増加を示した．We demonstrate an approach for creating an Hadoop-based MapReduce application execution environment on demand in the TSUBAME2.0 supercomputer by using our tool called "Tsudoop". We conduct performance studies for weak scaling performance with RandomWriter and Sort applications in Hadoop by using 24 nodes, 264 cores in TSUBAME2.0. The results indicate that the application executions with HDFS exhibit 1.1 times overheads compared with a single node execution, while the executions with Lustre exhibit 1.6 - 1.8 times overheads.

CiNii Books

researchmap
CPU/GPUを共用したヘテロジニアス環境におけるFMMの最適化 (ハイパフォーマンスコンピューティング(HPC) Vol.2011-HPC-129)

福田圭祐, 丸山直也, 松岡聡

情報処理学会研究報告 2010 ( 6 ) 1 - 8 2011年4月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

本稿はCPU-GPUヘテロジニアス環境上のFast Multipole Method(FMM)の最適化手法を提案する。本研究は目標として、計算特性やプロセッサ特性のモデル化に基づくタスク割り当てや最適化を目指しており、現段階では単一CPU/単一GPU向けに実装を行っている。CPU-GPU混在環境において効率的なプログラム実装を実現するには、並列度の違いやCPU-GPU間のデータ転送量など、プログラムの特性を考慮する必要がある。FMMにおいては、各時間ステップは複数のそれぞれ異なる特性を持つ計算フェーズから成り立ち、フェーズ間の依存関係は複雑である。本稿では各計算フェーズの特性を分析し、GPU上の実行に適したフェーズの特定を行った。そしてFMMの派生アルゴリズムであるKIFMMの既存実装をOpenMPとCUDAを用いて、CPU/GPUそれぞれについて最適化を施した。実装したソフトウェアを、TSUBAME2.0の単一ノード上のIntel Xeon CPUおよびNVIDIA Tesla M2050を用いて評価し、大幅な高速化が達成されたことを示す。This paper proposes optimization methods of Fast Multiple Method (FMM) for CPU-GPU heterogeneous environments. Our goal is to propose optimization and task mapping methods based on modeling properties of computations and processors. Currently we focus on an implementation on a single CPU and GPU environment. In order to achieve efficient implementations on heterogeneous environments, properties of computations have to be considered such as parallelism and communication amount between CPUs and GPUs. In FMM, a time step consists of several computation phases, which have different properties and complicated dependency. We have analyzed properties of those phases and identified which phases should be ported to GPUs. Then we have implemented optimization methods for CPUs and GPUs by using OpenMP and CUDA, based on an existing implementation of KIFMM, a derived algorithm of FMM. We have evaluated our implementation on a single node of TSUBAME 2.0 with Intel Xeon CPU and NVIDIA Tesla M2050 GPU, and demonstrate that it achieves a significant speedup over the original one.

CiNii Books

researchmap
インタークラウド間での大規模データ転送の高速化 (ハイパフォーマンスコンピューティング(HPC) Vol.2011-HPC-129)

千葉立寛, 松岡聡

情報処理学会研究報告 2010 ( 6 ) 1 - 7 2011年4月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

大規模データを用いるデータインテンシブアプリケーションの実行環境としてクラウドが近年注目されている．クラウドを用いることでデータ処理を行うノードを問題サイズに応じて必要な分だけ動的にスケールアウト/インすることが可能となる一方で，処理対象となるデータがクラウドストレージ上へ効率よく転送されない場合，現実的には転送スループットによって性能が律速されてしまう．また，現状多数のクラウドが存在する中，異なるクラウドでの実行やデータプリケーションのためにインタークラウド間でのデータマイグレーションを高速に行うことはデータ量が多くなるにつれてますます重要となる．本稿では，現在利用の盛んな2つのクラウド環境，Amazon EC2/S3，および，Windows Azureを対象として，2つのクラウド間でのデータ転送を高速化する手法について述べる．複数の中継ノードを用意し，それらが協調的に対象となる大規模データを分割して転送を行う．特に，Windows Azure Blobに保存されているデータをAmazon S3へマイグレーションする場合について実験を行い，複数の中継ノードを用いることで転送スループットが向上することを確認した．Recently cloud environments are expected to execute data-intensive applications they use huge data sets. It is possible to dynamically add and remove computing nodes depending on the size of problem, however, application performance will be limited by data transfer throughput, in case the data does not transfer efficiently. Moreover there are many available clouds, high-throughput data staging for migration between inter-clouds is becoming more important as the data size grow. In this paper we address a technique to boost data transfer throughput between inter-couds, especially for Amazon EC2/S3 and Windows Azure Platform they are generally used. We prepare multiple relay nodes and utilize them cooperatively by splitting data and using multiple transfer connections. Especially we focus on from Azure Blob to Amazon S3, and we confirm multiple connections scheme acheive higher data migration throughput.

CiNii Books

researchmap
ヘテロ型スーパーコンピュータTSUBAME 2.0のLinpackによる性能評価 (ハイパフォーマンスコンピューティング(HPC) Vol.2010-HPC-128)

遠藤敏夫, 額田彰, 松岡聡

情報処理学会研究報告 2010 ( 5 ) 1 - 6 2011年2月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

Intel プロセッサに加え NVIDIA GPU を備え，2010 年 11 月に稼働開始したヘテロ型スパコンである TSUBAME 2.0 における Linpack ベンチマークの実行について報告する．本システムは 2CPU と 3GPU を備えた計算ノードを約 1400 台持ち，それらはフルバイセクションのファットツリー構造を持つ QDR InfiniBand ネットワークにより接続される．理論演算性能は TSUBAME 1.0 の約 30 倍となる 2.4PFlops であり，それを TSUBAME 1.0 とほぼ同じ規模の電力で実現している．Linpack ベンチマークのコード改良およびチューニングを GPU を用いた大規模システムの特性に合わせ行い，実行速度として 1.192PFlops を実現した．この結果は日本のスパコンとしては初めて PFlops を超えるものであり，Top500 スパコンランキングに 4 位にランクされた．We report Linpack benchmark results on the TSUBAME 2.0 supercomputer, a large scale heterogenous system with Intel processors and NVIDIA GPUs, operation of which has started in November 2010. The main part of this system consists of about 1400 compute nodes, each of which is equipped with two CPUs and three GPUs. The nodes are connected via full bisection fat tree network of QDR InfiniBand. The theoretical peak performance reaches 2.4PFlops, 30 times larger than that of the predesessor TSUBAME 1.0, while its power consumption is similar to TSUBAME 1.0. We conducted improvement and tuning of Linpack benchmark considering characteristics of large scale systems with GPUs, and achieved Linpack performance of 1.192PFlops. This is the first result that exceeds 1PFlops in Japan, and ranked as 4th in the latest Top500 supercomputer ranking.

CiNii Books

researchmap
GPUにおけるモデルに基づいた電力効率の最適化

長坂仁, 丸山直也, 額田彰, 遠藤敏夫, 松岡聡

研究報告計算機アーキテクチャ（ARC） 2010 ( 2 ) 1 - 6 2010年12月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

GPU の演算性能の飛躍的な発達により、グラフィックス処理だけでなく汎用計算に用いられるようになるにつれて、GPU の消費電力削減の重要性が増している。そこで我々はまず GPU の消費電力予測の必要性とその結果について述べ、さらに、消費エネルギー削減に向けた第一歩として電圧と動作周波数を変更することで消費電力がどのように表現できるかを解析した。その結果、GPU における消費電力は定常状態における静的な要素 (Pstatic) と、プログラム実行による増加分の動的な要素 (Pdynamic) とに分けてることができると仮定した場合、Pstatic は電圧値に、Pdynamic は電圧値の 2 乗と動作周波数にそれぞれ比例して変化している結果を得た。これにより、先の消費電力予測と合わせる事で様々な環境での GPU における消費電力を高精度で予測することが可能となった。GPUs are being employed in large-scale supercomputing environments,where their power consumption is a first-class design constraint.to reduce their power consumption, we present a prediction model that leverages appliction behavior behavior observable through performance counters. In addigion, how power consumption is expressible by the change of the Voltage and the operating frequency as the first step for the consumption energy reduction is analyzed. When the result power consumption in GPU is able to be devided into static element(Pstatic) in the stationary state and element(Pdynamic) dynamic for an increase by the program execution, Pdynamic is proportional to f and square of V and Pstatic is proportional to V. With our model, we show that GPU power in varying frequency and voltage conditions can be accurately estimeted.

CiNii Books

researchmap
OpenCLを用いた異種GPUにおける性能特性に応じた最適化

島田大地, 遠藤敏夫, 丸山直也, 松岡聡

研究報告計算機アーキテクチャ（ARC） 2010 ( 23 ) 1 - 7 2010年12月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

近年、GPU は科学技術計算などに広く用いられおり、現在多くの種類の GPU が存在している。また、CUDA や OpenCL を使用することによりプログラムに可搬性を持たせることが出来る。しかし、各 GPU でアーキテクチャが異なるため性能可搬性は保証されない。したがって、性能向上をさせたい場合にはそれぞれの GPU に対して最適化を行う必要があるが、最適化による効果が必ずしも労力に見合ったものとは限らない。そのため、事前に最適化効果を定量的に把握できると人的リソースを用いるかどうかの指針を得ることができる。本論文では最適化効果を定量的に予測するためにパフォーマンスカウンタから実行時間予測を行いモデルを作成、評価する。Recently various graphic processing units (GPU) are widely accepted to accelerate scientific applications. With the OpenCL language, programmers can develop programs that can be executed on those heterogeneous GPUs. While portability has been realized, performance portability is not, since there exist gaps in characteristics among different GPU architectures. Thus programmers need to optimize their programs depending on GPU architecture. However, it is often hard to say whether performance improvement by such tasks are worthy to commit human resource beforehand. In order to give quantitative hints for such situations, this paper presents a performance model to estimate effects of optimizations on different GPU architectures, by using performance counters.

CiNii Books

researchmap
ステンシル計算を対象とした大規模GPUクラスタ向け自動並列化フレームワーク

野村達雄, 丸山直也, 遠藤敏夫, 松岡聡

研究報告計算機アーキテクチャ（ARC） 2010 ( 7 ) 1 - 9 2010年12月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

近年，GPU を搭載した大規模クラスタが台頭し，科学技術計算への応用が盛んに行われている．科学計算の計算カーネルの一つとしてステンシル計算が頻繁に現れる．ステンシル計算はメモリ律速であり，またメモリのアクセスパターンが比較的単純であるため GPU によるアクセラレーションが有効である．しかし，ステンシル計算それ自身は簡潔に記述できるにも関わらず，並列化のための問題の分割や袖領域の交換などの実装が煩雑になりがちである．そのため，GPU の利用は一部の知識を持った開発者に留まっている．本研究ではハードウェアから独立した，ステンシル計算本来の簡潔な記述を保ったままのコードから GPU クラスタ向けに並列化されたコードを生成するフレームワークを提案する．ステンシル計算の問題例として三次元拡散方程式を手動で実装したものと，提案するフレームワークによって自動生成されたもの性能を評価した．その結果フレームワークによって生成されたコードは手動で書かれたコードと比較して 75%～125% 程度の性能が得られた．In the recent years, large scale clusters equipped with GPUs are considered one of the promising architectures in HPC, and as such studies of scientific applications are being conducted on such machines. The kernel of fluid dynamics typicaly belongs to the class of stencil computations. Problems in this class are usualy memory-intensive, and have a relatively simple pattern of memory access, so that it can benefit from using GPU as an accelarator. Although stencil computations themselves can be described concisely, huge amount of code must be manually written for parallelization such as domain decomposition and boundaries exchange. Those difficulties confine the utilization of GPUs to a handful of people who have expertise in it. Our work is to provide a framework which takes concise description of stencil computation as an input and generate parallelized code for GPU clusters. We have used 3d-diffusion-equation as an example problem for evaluation. We have evaluated the performance of two implementations; One has been implemented manually, and another has been generated by the framework. The code generated by the framework has achieved about 75%-125% of performance of the manual implementation.

CiNii Books

researchmap
GPUを考慮したMapReduceのタスクスケジューリング (ハイパフォーマンスコンピューティング(HPC)) -- (大規模データ処理とスケジューリング)

白幡晃一, 佐藤仁, 松岡聡

情報処理学会研究報告 2010 ( 3 ) 1 - 7 2010年10月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

researchmap
PoP(Point of Presence) によるe-サイエンスリソース連携

滝澤真一朗, 松岡聡, 佐藤仁, 東田学, 友石正彦

電子情報通信学会技術研究報告. IA, インターネットアーキテクチャ 110 ( 206 ) 19 - 24 2010年9月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

ネットワーク分散した種々のリソースを統合して,科学技術の新発見・融合研究領域の開拓を促進する研究手法であるe-サイエンスが注目されている.e-サイエンス基盤として,我々はRENKEI-PoPと名付けたPoint-of-Presenceにて拠点間を接続するネットワーク環境を提案する.RENKEI-PoPはe-サイエンスリソースを提供する拠点に設置され,拠点内リソースとは強く結合し,RENKEI-PoP間ではグリッド認証により連携して,拠点間連携サービスの中継を行う.RENKEI-PoPは,1)e-サイエンス基盤サービス群実行のための仮想マシンによるホスティングと,2)拠点間の汎用データ転送・共有環境を提供する.我々は,日本国内8拠点にRENKEI-PoPを設置し,SINETの提供する10Gbpsネットワークで接続した.現状のシステム構成,ネットワーク,ストレージアクセスの評価結果を示す.

CiNii Books

researchmap
TSUBAME 2.0の全貌

松岡聡, 遠藤敏夫, 丸山直也

Tsubame ESJ. 1 2 - 4 2010年9月

　詳細を見る

記述言語：日本語出版者・発行元：東京工業大学学術国際情報センター

researchmap
e-サイエンス基盤としての計算機センターPOP (Point-of-Presence) 連携

滝澤真一朗, 松岡聡, 佐藤仁, 東田学, 友石正彦, 實本英之

情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 126 e1 - e8 2010年8月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

ネットワーク分散した種々のリソースを統合して，科学技術の新発見・融合研究領域の開拓を促進する研究手法であるe-サイエンスが注目されている．e-サイエンス実現基盤として，我々は RENKEI-PoP と名付けた Point-of-Presence にて拠点間を接続するネットワーク環境を提案する．RENKEI-PoP は e-サイエンスリソースを提供する拠点に設置され，拠点内リソースとは強く結合し，RENKEI-PoP 間ではグリッド認証により連携して，拠点間通信の中継を行う．RENKEI-PoP は，1) e-サイエンス基盤システムを構成するサービス群の実行環境，および分散システム開発・評価環境を仮想マシンで実現する仮想ホスティングと，2) 拠点間の汎用データ転送・共有環境を提供する．我々は，日本国内7拠点に RENKEI-PoP を設置し，SINET の提供する 10 Gbps ネットワークで接続した．現状のシステム構成，ネットワーク，ストレージアクセスの評価結果を示す．As an e-Science infrastructure, We propose a network environment where site resources are connected by a point-of-presence named RENKEI-PoP. RENKEI-PoPs are located in sites that provide resources for e-Science, are integrated with site local resources, and relay communications between sites by cooperating with each other using a grid security infrastructure. RENKEI-PoP provides 1) a virtual hosting environment that supports running and developing e-science infrastructure services and 2)a general-purpose data transfer/sharing environment. We installed RENKEI-PoPs in seven sites in Japan and connected them to SINET 10Gbps network. We propose the current RENKEI-PoP system and show its performance of network and storage access.

CiNii Books

researchmap
GPUクラスタを対象にした並列ステンシル計算の自動生成フレームワーク

野村達雄, 丸山直也, 遠藤敏夫, 松岡聡

情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 126 ( 9 ) I1 - I10 2010年8月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

流体計算のカーネルとしてステンシル計算が頻繁に現れる．ステンシル計算はメモリ律速であり，メモリのアクセスパターンが比較的単純であるため GPU によるアクセラレーションの恩恵を受けやすい．しかし，ステンシル計算それ自身は簡潔に記述できるにも関わらず，並列化のために問題の分割や袖領域の交換など計算以外のコードを大量に書く必要がある．そのため，GPU の利用は一部の知識を持った開発者に留まっている．本研究ではステンシル計算本来の簡潔な記述を保ったまま，GPU に関する知識を必要としないコードから自動で GPU クラスタ向けに並列化されたコードを生成するフレームワークを提案する．ステンシル計算の問題例として三次元拡散方程式を手動で実装したものと，提案するフレームワークによって自動生成されたもの性能を評価した．その結果手動による実装の 3 分の 1 程度記述で 70% 程度の性能を達成できた．今後フレームワークに最適化を実装していくことによって更なる性能向上を目指す予定である．The kernel of fluid dynamics typicaly belongs to the class of stencil computations. Problems in this class are usualy memory-intensive, and have a relatively simple pattern of memory access, since it can benefit from using GPU as an accelarator. Although stencil computations themselves can be described concisely, we have to write huge amount of code which forms parallelization such as domain decomposition and boundaries exchanging. Those difficulties confine the utilization of GPU to a handful of people who has expertise in it. Our work is to provide a framework which takes concise description of stencil computation as an input and generate parallelized code for GPU clusters. We picked 3d-diffusion-equation as an example problem for evaluation. We evaluated the performance of its two implementations; One is implemented manually, and another is auto-generated by our framework. We have allowed the code size to be reduced to one-third approximately, and achieved about 70% of the performance of hand-coded implementation. We are planning to implement optimizations for more performance gain as the future work.

CiNii Books

researchmap
GPUを考慮した MapReduce のタスクスケジューリング

白幡晃一, 佐藤仁, 松岡聡

情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 126 ( 5 ) E1 - E8 2010年8月

　詳細を見る

記述言語：日本語

大規模データ処理のためのプログラミングモデルとして MapReduce モデルがスケーラブルな並列処理が可能となるため注目されている。一方、GPGPU と呼ばれる、GPU を汎用計算に応用する技術の研究・開発が進んでおり、GPU のスーパーコンピュータやクラウドへの導入が進みつつある。しかし、MapReduce のタスクを CPU・GPU に資源を割り振る方法は、GPU 特性の影響からアプリケーションごとに性能は異なるため自明ではない。CPU と GPU が混在する不均質な大規模環境を想定し、CPU 上と GPU 上で実行されている Map タスクの動的なプロファイルを利用してジョブ実行時間を最小化するハイブリッドオンラインスケジューリングを提案する。K-Means アプリケーションで実験を行った結果、CPU のみの使用に対し、2GPU の使用とスケジューリングアルゴリズムの適用をした場合、CPU のみにスケジュールした場合に比べ、ジョブ実行時間において 1.02-1.93 倍の高速化を達成した。MapReduce is a programming model that enables efficient massive data processing in a large-scale computing environment such as supercomputers and clouds. On the other hand, recent such large-scale computers tend to employ GPUs to enjoy its good peak performance and high memory bandwidth. However, scheduling MapReduce tasks onto CPUs and GPUs for efficient execution is difficult, since it depends on running application characteristics and underlying computing environments. To address this problem, we propose a hybrid online scheduling technique for GPU-based computing clusters, which minimizes the execution time of a submitted job using dynamic profiles of map tasks running on CPUs or GPUs. Our experimental results using a K-Means application show that the proposed technique achieves 1.02-1.93 times faster than simple techniques, such as ones that CPU only or GPU only schedulings.

CiNii Books

researchmap
MPI-CUDA Applications Checkpointing

Nguyen Toan, Tatsuo Nomura, Hideyuki Jitsumoto, Naoya Maruyama, Toshio Endo, Satoshi Matsuoka

研究報告ハイパフォーマンスコンピューティング（HPC） 2010 ( 18 ) 1 - 7 2010年7月

　詳細を見る

記述言語：英語

We describe a method to checkpoint MPI applications that use GPUs as accelerators. As current MPI checkpointing tools such as LAM/MPI and Open MPI do not support checkpointing states on GPU, it is a big hindrance for users who want to develop hybrid MPI CUDA applications running on large-scale clusters with high rate of failure. Here we propose a method to checkpoint MPI CUDA applications by integrating Open MPI, BLCR and our CUDA checkpointer. Our CUDA checkpointer hooks CUDA Runtime API calls to record data on GPU for backup during checkpoint/restart sessions and we integrate this checkpointer into the BLCR checkpoint/restart module in Open MPI. In this method, our CUDA checkpointer will monitor and record CUDA resources used on the GPU during program execution. At checkpointing, it is invoked to checkpoint states on GPU by calling our user-defined callback function in BLCR. As restarting, the CUDA checkpointer will perform restoring data and CUDA contexts on the GPU together with Open MPI's restarting service. Based on this methodology, our implementation demonstrates that MPI CUDA applications in which CUDA Runtime API codes are used can be checkpointed and restarted properly in a transparent way. Our implementation also shows a checkpoint overhead of about 38 seconds in checkpointing a 3D stencil application with size 256x256x600 running on 60 GPU-enabled nodes.We describe a method to checkpoint MPI applications that use GPUs as accelerators. As current MPI checkpointing tools such as LAM/MPI and Open MPI do not support checkpointing states on GPU, it is a big hindrance for users who want to develop hybrid MPI CUDA applications running on large-scale clusters with high rate of failure. Here we propose a method to checkpoint MPI CUDA applications by integrating Open MPI, BLCR and our CUDA checkpointer. Our CUDA checkpointer hooks CUDA Runtime API calls to record data on GPU for backup during checkpoint/restart sessions and we integrate this checkpointer into the BLCR checkpoint/restart module in Open MPI. In this method, our CUDA checkpointer will monitor and record CUDA resources used on the GPU during program execution. At checkpointing, it is invoked to checkpoint states on GPU by calling our user-defined callback function in BLCR. As restarting, the CUDA checkpointer will perform restoring data and CUDA contexts on the GPU together with Open MPI's restarting service. Based on this methodology, our implementation demonstrates that MPI CUDA applications in which CUDA Runtime API codes are used can be checkpointed and restarted properly in a transparent way. Our implementation also shows a checkpoint overhead of about 38 seconds in checkpointing a 3D stencil application with size 256x256x600 running on 60 GPU-enabled nodes.

CiNii Books

researchmap
クラウド環境における大規模データブロードキャストの動的最適化

千葉立寛, ティロキールマン, マタイスデンバーガー, 松岡聡

情報処理学会論文誌コンピューティングシステム（ACS） 3 ( 2 ) 126 - 137 2010年6月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

クラウド環境において大規模データセットを用いた並列アプリケーションを実行する場合，巨大なデータを各ノードに効率良く配布する必要がある．従来のクラスタ・マルチクラスタ型並列計算実行環境におけるブロードキャスト通信の最適化手法では，ネットワークトポロジやバンド幅などのモニタリング情報をもとに効率的に転送可能なスパニングツリーを構築してブロードキャストを実現する手法など様々な手法が研究されているが，クラウドのような動的にネットワーク性能が変化するような環境においては，ボトルネックリンクの発生やトポロジが変化した場合，ツリーの再構築を行わなければならず，つねに最適な性能を維持し続けることは難しい．本研究では，クラウド環境として Amazon EC2/S3 を対象とし，S3 に保存された大規模なデータセットを EC2 ノードに高速にブロードキャストする手法を提案する．提案するアルゴリズムは，トポロジ情報を必要とせず，また，各ノードがダウンロードボトルネックリンクに対するロードバランスを行うことで，動的に各ノードのスループットを最大化することを可能とする．本稿では，まず Amazon EC2/S3 の性能を測定して問題点を明らかにし，提案アルゴリズムの実装を行い，EC2/S3 での性能評価を行った．その結果，単純な手法に比べてスケーラブルでかつ高い性能が得られることを確認した．Data-intensive parallel applications on clouds need to deploy large data sets from the cloud's storage facility to all compute nodes as fast as possible. Many optimal broadcast algorithms have been proposed for clusters and grid environments. The most common approach is, for example, to construct one or more optimal spanning trees, which can maximize available bandwith or avoid bottleneck links based on network topology and network monitoring data. Once available bandwidth changes dynamically, however, it is difficult to keep optimal performance. In this paper we focus on Amazon EC2/S3, which is most commonly used clouds, and we propose high performance broadcast algorithms; these algorithms make it possible to broadcast large data from Amazon S3 to multiple Amazon EC2 nodes. The salient features of our algorithms are to construct an overlay network on clouds without network topology information, to optimize node available throughput dynamically, and to increase the download throughput by letting nodes cooperate with each other. As a result, all nodes can download files from S3 quickly, even when the network performance changes while the algorithm is running. We evaluate our algorithms on EC2/S3, and show that they are scalable and consistently achieve high throughput. Both algorithms perform much better than each node downloads all data directly from S3.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00069740/
GPUクラスタにおける科学技術計算の自動最適化 (ハイパフォーマンスコンピューティング(HPC) Vol.2010-HPC-124)

渡辺祐也, 遠藤敏夫, 松岡聡

情報処理学会研究報告 2009 ( 6 ) 1 - 9 2010年4月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

巨大な疎行列を係数行列として持つ連立一次方程式を解く際,疎行列ベクトル積計算が実行時間の大部分を占める.GPU などのメニーコアプロセッサはキャッシュ容量が小さいため,入力ベクトル要素へのランダムアクセスによって多数のキャッシュミスが生じる.そのため疎行列ベクトル積計算性能は著しく低い.我々はメニーコア環境においても高いキャッシュヒット率を達成するために,行列を列方向で分割することで各処理内での入力ベクトル要素の再利用性を向上させたフォーマットと疎行列ベクトル積カーネルを新たに提案する.Florida のデータセットから選出した行列に対して既存手法との比較を行った.その結果,疎行列ベクトル積計算について 2.0 倍,CG 法について 1.12 倍の性能向上を果たした.

CiNii Books

researchmap
GPUクラスタにおける科学技術計算の自動最適化

渡辺祐也, 遠藤敏夫, 松岡聡

情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 124 ( 18 ) R1 - R7 2010年2月

　詳細を見る

記述言語：日本語

高性能計算においてグラフィックプロセッサ (GPU) の利用が，その高い計算性能とメモリバンド幅のために注目されている．さらにクラスタやスパコンに GPU を多数搭載し，並列利用する試みを数多く行われている．一方で，そのような複雑化したシステムにおいてはチューニングパラメータが増大するため，自動チューニングの必要性が増す．本稿では，GPU を用いた三次元熱拡散方程式プログラムを題材とする．対象とするプログラムは，GPU と CPU を併用する，および効率化のために PCI-Express 通信と MPI 通信の並列化を行う，という特徴を持つ．このプログラムについて自動チューニングを行った予備評価の結果と最大 32 GPU で実行した場合の結果を示す．Graphics processors (GPUs) recently attract much attention in high performance computing area, for their excellent performance and memory bandwidth. Also, there have been many attempts that use a lot of GPUs on clusters or supercomputers for parallel applications. For such purposes, auto-tuning methodology is getting more important, since tuning parameters on such systems are increasing. This paper picks up a three-dimensional heat equation program as the target of tuning. The program has the following properties: it cooperatively uses GPUs and CPUs for computation, and PCI-Express communication and MPI communication are done in parallel to reduce overhead. This paper shows results of preliminary experiments with auto-tuning and performance of parallel execution with up to 32 GPUs.

CiNii Books

researchmap
GPUクラスタにおける省電力タスクスケジューリング

浜野智明, 額田彰, 遠藤敏夫, 松岡聡

情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 124 ( 17 ) Q1 - Q9 2010年2月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

GPU を搭載したヘテロ型クラスタシステムの効率的な運用のために，システムのモデリング手法とモデルに基づいたタスクスケジューリング手法を提案する．提案モデルでは複数 CPU (GPU) アプリケーションの競合による性能変化を，アプリケーションの単独実行時間とメモリアクセス量，PCI 通信量から予測する．提案スケジューリング手法はタスクの競合による性能変化を考慮することで，CPU リソースと GPU リソースの両者を有効活用し，システム全体のエネルギー効率の向上を図る．評価はシミュレーションと実測によって行い，タスクの競合による性能変化予測がほぼ正しく行えていることを確認し，また，提案スケジューリング手法により従来手法より高いエネルギー効率を実現できていることを確認した．We propose a performance model and a task scheduling scheme based on the model to improve the efficiency of GPU accelerated clusters. Our model is aware of performance decline of the applications running on the same node concurrently, and predicts it from elapsed time, amount of memory access and PCI transfer which are measured in stand-alone execution. Our scheduling algorithm aims to reduce not only the makespan but also the energy consumption. In the experiments, we confirmed our model almost predicts the performance decline and our scheduling algorithm improves energy efficiency.

CiNii Books

researchmap
大規模計算機システムの資源選択を支援するエキスパートシステム

國府理央, 佐藤仁, 松岡聡

情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 124 ( 12 ) L1 - L8 2010年2月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

大規模計算環境上でアプリケーションを実行する際，ユーザは複雑な資源設定のためのパラメタを選択する必要がある．しかし，ユーザは必ずしも専門家ではないため，自身で適切な資源選択を行うことは困難である．この問題を解決するために，アプリケーションに応じた適切なパラメタ設定を提案するエキスパートシステムを提案する．実際の大規模計算機システムである TSUBAME の実行ログを多変量解析し，エキスパートユーザの利用パターンを抽出することにより，資源選択予測を行うモデルを構築した．またモデルの検証により，実際にアプリケーションに適切な資源選択予測ができることを確認した．Batch queue systems on large-scale shared-resource supercomputers present the users with numerous, often cryptic, site-specific options in order for them to specify the resources, and appropriately instantiate them for effective application executions. Failure to specify the appropriate parameters, often the case for novice users of the system, not only could degrade the quality of service for the user, but also could compromise the effectiveness and the stability of the system. We instead aim to develop an " advisor " expert system which will present the users with appropriate batch queue parameters and other usage information depending on his needs by answering a simple set of questions. We surveyed job execution logs of the Tokyo Tech TSUBAME supercompter and statistical analysises of them allowed us to construct a correlative usage model which revealed several distinctive user usage patterns, which we could lead to create such an expert system based on the model to reflect the user needs accurately.

CiNii Books

researchmap
異種アクセラレータを持つTSUBAMEスーパーコンピュータのLinpack評価(<特集>GPGPUコンピューティングの数理)

遠藤敏夫, 額田彰, 松岡聡

応用数理 20 ( 2 ) 117 - 124 2010年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本応用数理学会

グラフィックプロセッサ(GPU)とSIMD型ClearSpeedアクセラレータを備えたハイブリッド型スパコンである東工大TSUBAMEにおけるLinpackベンチマークの実行について報告する.TSUBAMEの約10000のOpteronコア,640のXeonコア,648基のClearSpeedアクセラレータ,624基のNVIDIA Tesla GPUを全て用いたLinpack実行において,87 TFlopsを達成した.この性能の実現のために必要であった,アクセラレータの特性を考慮したアルゴリズム設計やチューニングについて報告する.ハイブリッド型スパコンとしてはRoadRunnerが挙げられるが,その上のLinpack実装方針と我々のものでは大きく変える必要があった.その点についてもシステムアーキテクチャの観点から議論する.

DOI： 10.11540/bjsiam.20.2_117

CiNii Books

researchmap
仮想マシン動的再配置による大規模データアクセスの高速化

佐藤賢斗, 佐藤仁, 松岡聡, 松岡聡

情報処理学会シンポジウム論文集 2010 ( 5 ) 2010年

　詳細を見る

J-GLOBAL

researchmap
スーパーコンピュータ TSUBAME 上での MapReduce の実現

佐藤仁, 小西史一, 山本泰智, 高木利久, 松岡聡

情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 123 F1 - F7 2009年11月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

TSUBAME 上で Hadoop を実行するためのツール「Tsudoop」を開発した．Tsudoop は，既存システムの構成や運用方針の変更をすることなく，TSUBAME 上のジョブスケジューラである n1ge や Lustre ファイルシステムなどと協調して動作して Hadoop 実行環境を構築し，ユーザの MapReduce アプリケーションを実行する．予備実験として，このツールを用いて，生物医学系の学術論文を対象にした書籍情報データベースである MEDLINE に対してテキストの全文検索を行うアプリケーションを実行した．その結果，1 ノード (16 コア) での実行と 32 ノード (512 コア) での実行とを比較して 14 倍の性能向上を示し，TSUBAME のような高速な共有ファイルシステムやジョブスケジューラが存在するような計算環境でも，MapReduce アプリケーションの実行が可能なことを確認した．We developed a program, called "Tsudoop", which creates a MapReduce application execution environment on the TSUBAME supercomputer. Tsudoop enables application users to be able to run Hadoop-based MapReduce applications on TSUBAME without any modification in existing facilities and operation policies. We executed a MapReduce application, which conducts fulltext search operations to a MEDLINE bibliographic database for life sciences and biomedical information, by using 32 nodes with 512 cores via Tsudoop and confirmed 14 times speedup compared with the execution by using a single node with 16 cores. We demonstrate an example of Hadoop deployment in a computing environment in cooperation with a high-speed shared filesystem and a batch job scheduling system.

CiNii Books

researchmap
GPU向け耐メモリエラーソフトウエアフレームワーク

丸山直也, 額田彰, 松岡聡

情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 123 ( 8 ) H1 - H6 2009年11月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

我々はコモディティ GPU を対象とした耐 DRAM ソフトエラーを実現するソフトウェアフレームを提案する。同フレームワークは符号化によるビットフリップ等の DRAM ソフトエラーを検知する。エラーが検知された場合、ホスト側に取得済みのチェックポイントから GPU カーネルを再実行することでエラーからの復旧を実現する。同フレームワークを CUDA GPU 上で実装した場合の性能を評価し、エラーチェックによるオーバーヘッドは、行列積のような計算負荷の大きいカーネルでは 10 パーセント以下、3D FFT のようなメモリアクセス負荷の大きいカーネルにおいて 35% 程度で抑えられることを示す。We present a high-performance software framework to enhance commodity off-the-shelf GPUs with DRAM fault tolerance. It combines data coding for detecting bit-flip errors and checkpointing for recovering computations when such errors are detected. We analyze performance of data coding in GPUs and present optimizations geared toward memory-intensive GPU applications. We present performance studies of the prototype implementation of the framework and show that the proposed framework can be realized with very low overheads in compute intensive applications such as matrix multiplication, and as low as 35% in a highly-efficient memory intensive 3-D FFT kernel.

CiNii Books

researchmap
増分データと Erasure Coding を利用した高速なチェックポイント手法

實本英之, 中村俊介, 遠藤敏夫, 松岡聡

情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 122 ( 9 ) I1 - I6 2009年10月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

チェックポイント／リスタート手法は多くの大規模 HPC システムで利用されている耐故障機能である。しかし、近年の大規模 HPC システムのメモリサイズの急速な増大に比べ、並列ファイルシステムの I/O 帯域の増大は相対的に低いため、チェックポイント時間が増加してしまう問題がある。本研究では、チェックポイントのオーバヘッドを低く抑えつつ多重故障に対応することを目的とし、Erasure Coding を採用する。処理のボトルネックを避けるために Erasure Coding の符号演算処理を並列化し、かつ並列ファイルシステムの代わりにノードのローカルストレージにプロセスイメージを格納する。さらにプロセスイメージの大きさを削減するために、Incremental Checkpoint 手法を採用する。この手法はチェックポイント時に前回のプロセスイメージとの差分部分を記憶するものである。並列環境において行列積演算および NPB LU ベンチマークを用いた実験の結果、Incremental Checkpoint を用いたときに 28-84% の性能向上を確認した。Checkpointing/restarting is a well-known method as a fault tolerance mechanism in large scale HPC systems. However, overhead of this method tends to get larger, since memory size of recent systems is increasing rapidly, while the improvement of I/O bandwidth of file systems is relatively mild. The purpose of this work is to achieve checkpointing that supports multiple faults with low overhead by utilizing erasure coding. To eliminate the bottleneck, we parallelize encoding and store process images into node-local storage instead of shared file systems. Furthermore, to reduce sizes of process images, we adopt incremental checkpointing, which stores only parts of the process image that are modified since the previous checkpointing. Through parallel experiments using matrix multiply computation and NPB LU benchmark, we have observed 28 to 84% performance improvement by introducing incremental checkpointing.

CiNii Books

researchmap
異種アクセラレータを持つヘテロ型スーパーコンピュータ上のLinpackの性能向上手法 (ハイパフォーマンスコンピューティング(HPC) Vol.2009-HPC-121)

遠藤敏夫, 額田彰, 松岡聡, 丸山直也, Hideyuki Jitsumoto

情報処理学会研究報告 2009 ( 3 ) 1 - 8 2009年10月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

グラフィックプロセッサ (GPU) と SIMD 型 ClearSpeed アクセラレータをを備えたヘテロ型スパコンである東工大 TSUBAME における Linpack ベンチマークの実行について報告する．TSUBAME の約 10000 の Opteron コア，640 の Xeon コア，648 基の ClearSpeed アクセラレータ，624 基の NVIDIA Tesla GPU を全て用いた Linpack 実行において，87 TFlops を達成した．本論文ではまずこの結果を得るためのチューニングや負荷分散について述べる．一方でピーク性能は 163 TFlops であり，ピークに対する実行効率は 53% と，他のシステムより低くなっている．このピークと Linpack 性能の乖離の理由についても，システムアーキテクチャの特質から議論する．We report Linpack benchmark results on the TSUBAME supercomputer, a large scale heterogenous system with graphics processing units (GPUs) and ClearSpeed SIMD accelerators. With all of about 10,000 Opteron cores, 640 Xeon cores, 648 ClearSpeed accelerators and 624 NVIDIA Tesla GPUs, we have achieved 87TFlops. This paper describes careful tuning and load balancing method required to achieve this performance. On the other hand, since the peak speed is 163 TFlops, the efficiency is 53%, which is slower than other systems. This paper also discusses the reason of this gap from the aspect of system architecture.

CiNii Books

researchmap
GPUにおける性能と消費電力の相関性の解析 (ハイパフォーマンスコンピューティング(HPC) Vol.2009-HPC-121)

長坂仁, 丸山直也, 額田彰, 遠藤敏夫, 松岡聡

情報処理学会研究報告 2009 ( 3 ) 1 - 5 2009年10月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

GPU の演算性能の飛躍的な発達により、画像処理だけでなく汎用計算にも用られるようになるにつれて GPU の消費電力削減の重要性が高まっている。我々は、GPU の省電力化に向けた第一歩として消費電力と性能の相関を調べ、性能値より電力を予測するモデルを提案する。GPU 上で実行されるアプリケーションの特性に応じた省電力化を測るため、モデル化にはプログラム実行から得られるパフォーマンスカウンタ値を用い、それらを説明変数とした線形回帰分析により電力を予測する。評価の結果、回帰分析により 92.8% の精度で消費電力を予測できた。また、正の相関が強いものとして、命令スループット、メモリアクセス、レジスタ数、負の相関が強いものとして分岐実行数が特定された。GPUs are being employed in large-scale supercomputing environments, where their power consumption is a first-class design constraint. To reduce their power consumption, we propose a prediction model that leverages application behavior observable through performance counters. It predicts the power consumption of a given GPU kernel by a liner regression that uses the performance counter values when the kernel is executed, such as instruction throughput, register usage, memory accesses, and number of branches. Our experimental studies show that the model achieves up to 92.8% accuracy. We also found that, among others, instruction throughput and memory accesses are the most positively correlated with power, while number of executed branches is the most negatively correlated one.

CiNii Books

researchmap
GPUにおける耐故障性を考慮した数値計算の電力性能 (ハイパフォーマンスコンピューティング(HPC) Vol.2009-HPC-121)

島田大地, 丸山直也, 額田彰, 遠藤敏夫, 松岡聡

情報処理学会研究報告 2009 ( 3 ) 1 - 6 2009年10月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

近年、GPU は画像処理以外に科学技術計算への応用として多くの現場で用いられてきている。しかし、広く用いられてきている反面、GPU に対しての耐故障性は考えられてきていない。耐故障性が考えられていないと一時的な故障が生じた時にプログラムが正しく実行しなくなる可能性があり信頼性が低下する。これまで GPU は主に性能のみについて考えられてきており、信頼性向上手法については十分に議論されていない。そのため、GPU への信頼性の向上と電力性能のコストのトレードオフを検討する必要があるが、十分な評価がされていない。本研究では、CPU に対しての既存の耐過渡故障技術の一つである多重計算を GPU に実装し、評価した。行列積を対象に実装し、評価した結果、元の行列積の 1.88 倍のエネルギーで耐故障性を得ることができることが分かった。Recently, GPU is becoming a viable commodity for not only graphics processing but also scientific computation requiring enormous amount of calculation. However, fault tolerance has not been considered for the calculation in GPUs. Soft errors such as bit ips can produce wrong results unless any fault-tolerance techniques are employed. To establish the guideline toward performance-power efficient fault tolerant GPU computing, we examine redundant computation in matrix multiplication. We implemented eight different versions of redundant matrix multiplication and examined the impact of the power-performance of each version. Our redundant matrix multiplication implementation achieved higher reliability than that of CUDA SDK matrix multiplication with 1.88x energy increase.

CiNii Books

researchmap
CUDA GPU向けの自動最適化FFTライブラリ

額田彰, 松岡聡

情報処理学会論文誌コンピューティングシステム（ACS） 2 ( 3 ) 107 - 115 2009年9月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

NVIDIA CUDA をサポートする GPU はその高いメモリバンド幅から，FFT 等のメモリアクセスの多い計算にも有効である．CUDA 用の FFT カーネルに関してはすでにいくつかの実装が存在するが，GPU のアーキテクチャに有利な 2 のべき乗等のサイズに特化したものが多い．本研究では自動最適化手法によって高性能な FFT カーネルを生成し，より多様な入力サイズに対応する．shared memory へのアクセスの最適化や網羅的な探索により生成されたカーネルの性能は CUFFT ライブラリの 2 倍から 4 倍に相当し，既存のすべての実装を上回る．NVIDIA CUDA capable GPUs have extremely high memory bandwidth which benefits memory intensive applications such as FFT. Already there are several implementations of FFT using CUDA but they are optimized for specific transform sizes like powers of two which are suitable for GPU architecture. In this paper, we present our auto-tuning method to generate high performance CUDA kernels for FFTs of varying transform sizes. The optimized kernels outperform not only NVIDIA CUFFT libraries but also many of existing implementations.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00066245/
次世代光インターコネクトでのMPI通信に関する研究

滝澤真一朗, 遠藤敏夫, 松岡聡

コンピュータソフトウェア 26 ( 3 ) 5 - 19 2009年7月

　詳細を見る

記述言語：日本語出版者・発行元：日本ソフトウェア科学会

DOI： 10.11309/jssst.26.3_5

CiNii Books

researchmap
大規模計算環境におけるユーザ満足度を考慮した資源管理へむけて

國府理央, 佐藤仁, 松岡聡

電子情報通信学会技術研究報告. CPSY, コンピュータシステム 109 ( 168 ) 19 - 24 2009年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

大規模計算環境上でアプリケーションを実行する際,ユーザは複雑な資源設定のためのパラメタを選択する必要がある.しかし,ユーザは必ずしも専門家ではないため,自身で適切な資源選択を行うことは困難である.我々はこの問題を,ユーザの希望に応じた適切なパラメタ設定を提案するエキスパートシステムを構築することで解決できると考えているが,具体的にユーザがどのようにシステムを利用したいのかは明らかではない.そこで,実際のユーザのシステム利用希望パターンをアンケート調査により抽出し,これを利用してユーザの嗜好にあわせた資源選択提示を行うモデルを構築した.またモデルの検証により,実際にユーザの希望にあわせた資源選択提示ができることを確認した.

CiNii Books

researchmap
光サーキットネットワークの補助的利用によるHPCアプリケーション性能向上

滝澤真一朗, 遠藤敏夫, 松岡聡

情報処理学会論文誌コンピューティングシステム（ACS） 2 ( 2 ) 110 - 121 2009年7月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

多数のノードからなる大規模 HPC システムでは，全ノードを高バンド幅で全対全接続するネットワークは金銭コストや電力消費の問題で実現困難である．我々は低バイセクションバンド幅電気パケット（EPS）ネットワークと高バンド幅光サーキット（OCS）ネットワークからなるネットワーク環境と，その環境での通信手法を提案する．この環境では，各ノードは単一リンクで EPS ネットワークに接続され，一部のノードは OCS ネットワークへも単一リンクで接続される．アプリケーションの通信パターンを考慮して，異なる EPS スイッチに属する OCS ネットワークに接続されたノード間に光回線を割り当て，さらに他ノードからのメッセージを中継させることで，EPS ネットワーク上流で起こりうる混雑を回避する．シミュレーションによる評価の結果，全ノードの半数を OCS ネットワークに接続することで，高いバイセクションバンド幅を要求するアプリケーションでの性能向上，特に全対全通信においては Fat Tree EPS ネットワークと同程度の性能を示すことを確認した．For large scale HPC systems which consist of many nodes, it will be unfeasible to construct a fully-connected network with high bisection bandwidth due to cost and power consumption, etc. We propose a hybrid network that is composed of an electronic packet switching (EPS) network with low bisection bandwidth and a high bandwidth supplemental optical circuit switching (OCS) network, and communication method on the network. In this network, each node connects to the EPS network with one link and partial nodes also do to the OCS network with another one link. We assign optical pathways to node pairs that are connected to the OCS network and are not in the same EPS switch by considering application's communication pattern. We avoid contentions on the EPS upstream network by letting these nodes relay messages from other nodes. By conducting simulations, we confirmed that our approach can improve the performance of applications which require high bisection bandwidth by connecting only half of nodes to the OCS network. Moreover, performance of all-to-all communication on our system was almost the same as that on fat tree EPS only network.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00060776/
姫野ベンチマークのGPUマルチノード実行における通信と演算のオーバーラップによる高速化 : 32GPUで700GFLOPS超を達成

加藤季広, 青木尊之, 額田彰, 遠藤敏夫, 松岡聡, 長谷川篤史

情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 120 ( 3 ) C1 - C6 2009年6月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

GPUマルチノードシステム上でプログラムを実行する際は，GPU-GPU間の直接通信が行えないため，CPUを介してのノード間通信が必要となる．CPU-GPU間の通信が頻繁に生じ，スケーラビリティを向上させる上でのボトルネックとなりうる．姫野ベンチマークを対象に，通信と演算を同時に実行することで通信時間を隠蔽し，スケーラビリティの向上を試みた．サイズXLの，配列サイズが最長となる次元をZ方向からX方向に変更した問題について測定を行った．NVIDIA Tesla S1070 32GPUを使用し，709GFLOPSの実効性能（実効メモリバンド幅1.17TByte/sに相当）を実現した．通信と演算のオーバーラップ実行による性能向上は55%超となる．この手法は，通信と演算を同時に処理できる他の問題についても適用可能であり，GPUマルチノードシステム上での高並列化実行について，その可能性を示すことができた．When programs run on GPU multi-node system, communication between CPU and GPU occurs frequently because direct communication between GPU and GPU is unusable and inter-node communication via CPU is inevitable. This can become a bottleneck in improving scalability. We tried to improve scalability of Himeno benchmark by overlapping communication with calculation and hiding communication time behind calculation time. As a result, 709 GFLOPS of sustained performance (corresponding to 1.17 TByte/s of sustained memory bandwidth) with 32 GPUs of NVIDIA Tesla S1070 is achieved about the problem that longest dimension is exchanged from Z-direction to X-direction based on size XL. Increase in performance by such a overlapping is over 55%. Such an approach can be applied to other problems that its communication and calculation can be operated simultaneously. We've succeeded in showing potential of high scalability execution on GPU multi-node systems.

CiNii Books

researchmap
スワップコストの動的推定によるメモリの省電力化手法

細萱祐人, 遠藤敏夫, 松岡聡

情報処理学会研究報告. 計算機アーキテクチャ研究会報告 182 ( 14 ) 85 - 90 2009年2月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

近年,大規模計算機の消費電力のうち,メモリが占める割合が増加している.これはノードに大容量のDRAMが搭載されていることに起因しており,このDRAMの容量を小さくすることで省電力化が実現できる可能性がある.我々はスワップデバイスにFLASHメモリを使用したメモリシステムを提案しており,このシステムではアプリケーションによっては,スワップを起こしてでも電力コストの大きいDRAMの容量を小さくすることでエネルギーの削減が図れることがわかっている.しかし,エネルギーを最小とするメモリ容量はアプリケーションや問題サイズによって異なるため,アプリケーションの実行時にメモリアクセスを観察し,動的に設定する必要がある.我々は,メモリ容量を動的に変化することのできるDRAMの使用を前提とし,その選択可能なメモリ容量すべてで実行した場合のエネルギーを同時に推定する手法を提案し,エネルギーを削減する行う手法を示す.シミュレーションの結果,スワップを起こさないようにメモリ容量を選択した場合と比較して,8%の実行時間の増加で,25%のエネルギー削減ができることを示した.

CiNii Books

researchmap
プロセス間共通メモリイメージを考慮したマイグレーション最適化

山崎翔平, 遠藤敏夫, 松岡聡

情報処理学会研究報告. 計算機アーキテクチャ研究会報告 182 ( 14 ) 145 - 150 2009年2月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

マシンの性能向上に伴いジョブが大規模化する一方、様々な動機からジョブを動的にマイグレーションさせる要求がある。動機の中にはアプリケーション性能向上も含まれており、このケースではマイグレーション先およびタイミングは動的に決定する必要がある。また、そのためにもマイグレーションコストの大幅な削減が必要である。本論文では、プロセス間のメモリイメージの類似性を活用したマイグレーション時間の最適化手法を提案する。本手法は、マイグレーションに必要なデータ転送サイズを削減するだけでなく、実装方法において高い並列性を持つために、ノード数に対して高いスケーラビリティを持つ。本論文の実験では、アプリケーションの問題サイズ、構成ノード数、といったパラメータを変化させたときに、アプリケーションのマイグレーションにかかる時間や、そのマイグレーションプロセスの内訳にどのような変化が表れるかを調べた。

CiNii Books

researchmap
アクセラレータ，再び-スパコン化の切り札-:1.アクセラレータ技術の影と光---ペタ-エクサの次世代HPCの中心的な躍進技術へ

松岡聡

情報処理 50 ( 2 ) 95 - 99 2009年2月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00000017/
GPU向けソフトウェアECCの性能評価

丸山直也, 額田彰, 松岡聡

情報処理学会研究報告 2009 ( 14 ) 25 - 30 2009年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

高い浮動小数点演算性能により、GPUをHPC用途に用いるGPGPUが注目されている。しかし、GPUは本来グラフィックス用途に開発されてきたものであり、HPC用途としては耐故障性に不十分な点が存在する。その一つとして、メモリ誤りの検出、訂正が挙げられる。現状のGPUにはECCを備えたものなく、一般的なHPC計算ノードと比較して信頼性に劣る。我々は、GPUの信頼性向上のために、ソフトウェアによってメモリ誤りの検出、訂正を行う手法を提案している。本手法では、GPGPUアプリケーション中にECCを計算、検査するコードを追加することで、グラフィックスメモリ中のビットフリップなどの誤りを検出、訂正する。提案手法をNvidiaによるC言語拡張CUDA向けにライブラリとして実装し、FFT、行列積、N体問題アプリケーションに適用した。両アプリケーションを用いて、ECC計算による性能オーバーヘッドを調査したところ、FFT、行列積で最大300%程度,N体問題で15%程度のオーバーヘッドになることを確認し、N体問題のようにメモリアクセス頻度に対して計算量の多いアプリケーションでは比較的小さなオーバーヘッドで実現可能であることを確認した。

CiNii Books

researchmap
光サーキットネットワークの補助的利用によるHPCアプリケーション性能向上

滝澤真一朗, 遠藤敏夫, 松岡聡

情報処理学会コンピューティングシステム（ACS） 2 ( 2 ) 110--121 2009年

　詳細を見る

researchmap
CUDA環境における高性能3次元FFT

額田彰, 尾形泰彦, 遠藤敏夫, 松岡聡

情報処理学会論文誌コンピューティングシステム（ACS） 1 ( 2 ) 231 - 239 2008年8月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

NVIDIAの最新GPUがサポートするCUDA環境では共有メモリを用いたスレッド間のデータ共有と，自由度が高いメモリアクセスが可能である．我々はこのCUDA環境に適した高性能3次元FFTアルゴリズムを提案する．GeForce 8シリーズのGPUを用いた3次元FFTにおいて，CUFFTライブラリ1.1と比較して3.1&sim;3.3倍，最大79.5GFLOPSの演算性能を達成した．CUDA environment, which is supported in latest NVIDIA GPUs, allows data sharing between threads using shared memory, and also provides more flexible memory accesses. We propose a high performance 3-D FFT algorithm for the CUDA environment. Using GeForce 8 series GPUs, we achieved a high performance up to 79.5GFLOPS at 3-D FFT, which is from 3.1 to 3.3 times the performance compared with the performance of CUFFT library 1.1.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00018177/
情報爆発時代におけるわくわくするITの創出を目指して : パートI : 情報爆発時代における新しい基盤技術 : 3.情報爆発は情報システムをも「爆発」させる

松岡聡

情報処理 49 ( 8 ) 904 - 911 2008年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00061025/
NAREGIグリッドミドルウェアによる大規模連携接続実証実験

東田学, 友石正彦, 坂根栄作, 佐藤仁, 山梨毅, 大庭淳一, 小林泰三, 水谷文保, 山田清志, 津田知子, 河野貴久, 合田憲人, 松岡聡, 青柳睦, 下條真司

情報処理学会研究報告. [システムソフトウェアとオペレーティング・システム] 109 ( 77 ) 133 - 140 2008年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

大阪大学と東京工業大学、九州大学、名古屋大学の各情報基盤センターは、NAREGI研究開発拠点である国立情報学研究所と分子科学研究所と連携し、実運用中の大規模計算機システムにNAREGIミドルウェアを導入し、短期間ではあるが、全国規模でのこれまでにない大規模なシステム構成による連携接続を実証的に行った。本実証実験では、NAREGIミドルウェアによって、複数の認証局が発行する証明書を用いて仮想組織を構成し利用者情報や計算機資源情報などのグリッド型資源管理が可能であること、および、複数のメタスケジューラが連携して資源予約を行った上で実アプリケーションを認可された計算資源において実行可能であることを検証した。

CiNii Books

researchmap
グリッド環境における MPI_Scatter/Gather 通信アルゴリズムの最適化

千葉立寛, 遠藤敏夫, 松岡聡

情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 116 ( 74 ) 13 - 18 2008年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

ネットワークの状態に応じて最適なネットワークトポロジを構築してグリッド環境上でのMPI集団通信を高速化させるための様々な手法が提案されてきた.それらの手法ではWANのバンド幅は狭く集団通信を実行する上でボトルネックリンクとなるという前提が置かれていた.しかし近年のネットワーク技術の発展により,WANのバンド幅は向上し,またサイト内のネットワークも高速化しており,従来の仮定では適応しなくなっているため,グリッドを構成するWANとLANのネットワーク帯域十分に扱えるように集団通信アルゴリズムを適応させる必要がある.本稿では,このようなネットワーク環境に適応させたマルチレーンScatter/Gather通信アルゴリズムを提案する.下位の通信レイヤにTCP/IPを用いたMPI実装を想定し,エミュレートした複数サイトにまたがるグリッド環境において実験・評価を行い,性能を確認した.

CiNii Books

researchmap
光ネットワークの補助的利用によるHPC性能向上

滝澤真一朗, 遠藤敏夫, 松岡聡

情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 116 67 - 72 2008年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

将来のペタスケールHPCシステムでは,全ノードを高バンド幅で全対全接続するネットワークはコストや電力消費の問題で実現困難である.この問題を解決するために,低バイセクションバンド幅電気パケット(EPS)ネットワークと共に高バンド幅光サーキット(OCS)ネットワークを補助的に使用するネットワーク,およびその上でのEPS-OCS間で中継転送を行うMPIアプリケーション用通信手法を提案する.OCSネットワークに接続された一部のノードが,同一EPSスイッチ下の他のノードからの他EPSスイッチ下ノードへの転送を中継する.シミュレーション評価の結果,EPSネットワークのみの場合より最大で30%の実行時間短縮を確認できた.

CiNii Books

researchmap
仮想クラスタを用いた Data-Intensive Application 実行環境の性能モデル構築と最適化

佐藤賢斗, 佐藤仁, 松岡聡

情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 116 ( 74 ) 25 - 30 2008年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

仮想クラスタ上で実行されるデータインテンシブアプリケーションを対象にしたマイグレーションによるデータアクセスの高速化手法を提案する.アプリケーションがアクセスするファイルの順序とサイズ、実行環境のノード間のネットワークバンド幅が既知であると仮定したときに、ファイルアクセスのコストと仮想マシンのマイグレーションからなるデータアクセスのコストに応じて、どのタイミングで、どのノードにマイグレーションするのかを決定する,我々は、この問題を仮想マシンの存在するノードとアクセス対象のファイルの組を頂点とし、データへのアクセスを辺とする有向非循環グラフ(DAG)として表現し、データアクセスコストを辺の重みとしたときの最短経路問題に帰着することで解く.提案手法をシミュレーションにより評価した結果、リモートからファイルへアクセスする場合に比べ最大で40%、ファイルの存在する場所へ毎回マイグレーションを行う場合に比べ最大で54%のファイルアクセスのスループット向上を確認した.

CiNii Books

researchmap
複数GPUにおけるセルフスケジューリングによる並列数値演算

渡辺祐也, 遠藤敏夫, 松岡聡

情報処理学会研究報告. 計算機アーキテクチャ研究会報告 179 ( 75 ) 85 - 90 2008年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

高性能計算分野において、GPUをはじめとするコモディティアクセラレータが、その価格性能比や電力性能比のために注目されている。それらを多数用いた大規模システムの活用は重要になると期待されるが、そのようなシステムでは段階的なアップグレードにより世代の違うアクセラレータが混在しうる。特にGPUの性能向上の速さのために、性能の異なる複数GPUを効率的に利用する技術は重要になると考える。本研究ではその目的を、各GPUの性能の情報がなくとも達成するために、セルフスケジューリングを用いて動的なタスク分配を行う。計算対象として密行列積演算SGEMMをとりあげる。そして性能差のある複数のGPUを装着したマシンで性能評価と議論を行った。その結果、各GPUの性能を合計した理想的な速度と比較して94%の性能を達成した。

CiNii Books

researchmap
広域分散ファイルシステムにおけるアクセスパターンと性能を考慮したファイル配置

佐藤仁, 松岡聡, 遠藤敏夫

情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 116 ( 74 ) 211 - 216 2008年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

グリッドファイルシステムでの効率的な複製管理を実現するために,アクセス頻度や管理ポリシーに応じて,スループットやストレージ容量などの性能要件を満たし,かつ,複製時間が最小になるように複製配置を決定するアルゴリズムを提案する.この複製配置問題をスループットやストレージ容量などの性能要件や複製転送のコストの最小化を目的関数とする組合せ最適化問題に帰着し,ファイルアクセスをモニタリングすることに得られた情報を利用することにより解く.提案アルゴリズムをシミュレーションで評価した結果,複製作成を行わない手法,アクセス時に複製をキャッシュする手法,サイト毎に複製を持つ手法などの単純な複製管理手法と比較して,ストレージ使用量を低く保ちつつ,かつ,高いスループット性能を達成する複製配置を自動的に実現することを確認した.

CiNii Books

researchmap
ヘテロ並列環境のための省電力タスクスケジューリング

浜野智明, 遠藤敏夫, 松岡聡

電子情報通信学会技術研究報告. CPSY, コンピュータシステム 108 ( 180 ) 97 - 102 2008年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

ClearSpeed等のアクセラレータや本来画像処理のためのデバイスであるGPUは,汎用CPUにくらべて用途は数値演算などに特化される一方,より高い価格性能比・電力性能比を実現する.そこで近年,スパコンやクラスタにそのようなアクセラレータを搭載する手法が関心を集めている.このようなシステムにおいてシステム全体の電力性能および速度性能の最適化を行うためには,以下が必要と考えられる.各タスクが汎用CPUとアクセラレータの双方で自由に実行できることと,エネルギー効率を考慮したタスクスケジューリング手法である.我々は前者が実現されているという仮定のもとでヘテロ型クラスタシステムのモデル化を行った.その上でタスクの性質を考慮するスケジューリング手法の提案を行い,シミュレーションによる評価を行った.

CiNii Books

researchmap
ソフトウェアECCによるGPUメモリの耐故障性の実現と評価

丸山直也, 松岡聡, 尾形康彦, 額田彰, 遠藤敏夫

電子情報通信学会技術研究報告. DC, ディペンダブルコンピューティング : IEICE technical report 108 ( 181 ) 9 - 15 2008年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

高い浮動小数点演算性能により、GPUをHPC用途に用いるGPGPUが注目されている。しかし、GPUは本来グラフィックス用途に開発されてきたものであり、HPC用途としては耐故障性に不十分な点が存在する。その一つとして、メモリ誤りの検出、訂正が挙げられる。現状のGPUにはECCを備えたものなく、一般的なHPC計算ノードと比較して信頼性に劣る。我々は、GPUの信頼性向上のために、ソフトウェアによってメモリ誤りの検出、訂正を行う手法を提案する。本手法では、GPGPUアプリケーション中にECCを計算、検査するコードを追加することで、グラフィックスメモリ中のビットフリップなどの誤りを検出、訂正する。提案手法をNvidiaによるC言語拡張CUDA向けにライブラリとして実装し、行列積とN体問題アプリケーションに適用した。両アプリケーションを用いて、ECC計算による性能オーバーヘッドを調査したところ、行列積で最大300%程度,N体問題で15%程度のオーバーヘッドになることを確認し、N体問題のようにメモリアクセス頻度に対して計算量の多いアプリケーションでは比較的小さなオーバーヘッドで実現可能であることを確認した。

CiNii Books

researchmap
性能モデルに基づくCPU及びGPUを併用する効率的なFFTライブラリ

尾形泰彦, 遠藤敏夫, 丸山直也, 松岡聡

情報処理学会論文誌コンピューティングシステム（ACS） 1 ( 1 ) 40 - 50 2008年6月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

General-purpose GPU（GPGPU）をHPCの分野で利用する手法が，その非常に高いピーク性能のために注目されている．しかし，ホストとの転送I/O帯域幅やメモリサイズの制限等のため，実効性能は大幅に低下する傾向にある．一方で，CPUのマルチコア化も近年急速に進みつつあるため，GPUとCPU上のアプリケーションの実効性能の乖離は小さい場合が多く，両者を併用することにより性能の改善が期待される．このとき，効率的な実行のためにはヘテロなプロセッサへのタスクの分割率を適切に決める必要がある．しかし，最適な分割率は問題サイズ等に依存して変化するために，自明な問題ではない．我々は2D-FFTを対象問題として取り上げ，CPUとGPUを併用するライブラリを実装する．そして最適な分割率を得るために2D-FFTのアルゴリズムを詳細に考慮した性能モデルを構築する．モデルのパラメータは小規模な予備実行により決定され，それをもとに任意の問題サイズと分割率に対して並列実行時間を予測することができる．実験の結果，性能モデルは予備実行の16倍のサイズの問題について，実行時間を15%以内の誤差で予測した．予測から得られた最適分割率は5%の誤差に抑えられ，この誤差に起因する性能低下は1%以内であった．また，最適分割率における並列実行により，CPU 1コアやGPU単体の場合と比較して1.19から1.55倍の性能向上が得られた．General Purpose computing on Graphics Processing Units (GPGPU) is becoming popular in HPC because of it's high peak performance. However, in spite of the potential performance improvements, it might not necessarily perform better than the current high-performance CPUs, especially with recent trends for increases in their number of cores on a single die. This is because the GPU performance can be severely limited by such restrictions as memory size and I/O bandwidth. For this reason, we can expect that performance is improved by using CPU and GPU simultaneously. In heterogeneous environments, we need to find optimal load distribution ratio. We implement a 2D-FFT library that uses heterogeneous CPU-GPU computing resources. To find optimal load distribution ratios, we construct a performance model that predicts execution time of 2D-FFT that captures the respective contributions of CPU vs. GPU. The model parameters are determined by pre-stage performance profiling; based on this, we predict the overall execution time of 2D-FFT for arbitrary problem sizes and load distributions. Preliminary evaluation shows that the performance model can predict the execution time of problem sizes that are 16 times as large as the profile runs with less than 15% error, and that the predicted optimal load distribution ratios have less than 5% error; performance overhead caused by this error is less than 1%. We show that the resulting performance improvement by such heterogeneous parallelization can be 1.19 to 1.55 times compared to using only a CPU core or a GPU.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00018188/
衛星観測データの処理と保管のためのストレージシステムの性能評価

谷村勇輔, 山本直孝, 石橋拓也, 田中良夫, 西川武志, 松岡聡, 関口智嗣

情報処理学会シンポジウム論文集 2008 ( 5 ) 27 - 28 2008年6月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
Intelligent data staging with overlapped execution of grid applications

Yuya Machida, Shin'ichiro Takizawa, Hidemoto Nakada, Satoshi Matsuoka

FUTURE GENERATION COMPUTER SYSTEMS-THE INTERNATIONAL JOURNAL OF ESCIENCE 24 ( 5 ) 425 - 433 2008年5月

　詳細を見る

記述言語：英語

DOI： 10.1016/j.future.2007.07.005

Web of Science

J-GLOBAL

researchmap
Intelligent data staging with overlapped execution of grid applications

Yuya Machida, Shin'ichiro Takizawa, Hidemoto Nakada, Satoshi Matsuoka

FUTURE GENERATION COMPUTER SYSTEMS-THE INTERNATIONAL JOURNAL OF ESCIENCE 24 ( 5 ) 425 - 433 2008年5月

　詳細を見る

記述言語：英語

DOI： 10.1016/j.future.2007.07.005

Web of Science

J-GLOBAL

researchmap
情報爆発に対応する耐故障性MPIフレームワークの提案

實本英之, 遠藤敏夫, 松岡聡

全国大会講演論文集 70 ( 0 ) 133 - 134 2008年3月

　詳細を見る

記述言語：日本語

CiNii Books

researchmap
情報爆発時代におけるモデルベース資源選択による高速な仮想クラスタ構築

山崎翔平, 丸山直也, 松岡聡

全国大会講演論文集 70 ( 0 ) 119 - 120 2008年3月

　詳細を見る

記述言語：日本語

CiNii Books

researchmap
情報爆発に対応するスケーラブルかつ自律的な障害解析

丸山直也, 松岡聡

全国大会講演論文集 70 ( 0 ) 127 - 128 2008年3月

　詳細を見る

記述言語：日本語

CiNii Books

researchmap
情報爆発時代のグリッドファイルシステム上での大規模データ管理

佐藤仁, 松岡聡, 遠藤敏夫

全国大会講演論文集 70 ( 0 ) 121 - 122 2008年3月

　詳細を見る

記述言語：日本語

CiNii Books

researchmap
情報爆発時代の光インターコネクト上でのMPI通信アルゴリズム

滝澤真一朗, 遠藤敏夫, 松岡聡

全国大会講演論文集 70 ( 0 ) 137 - 138 2008年3月

　詳細を見る

記述言語：日本語

CiNii Books

researchmap
情報爆発時代へ向けた不均一アーキテクチャにおけるスーパーコンピューティング

遠藤敏夫, 松岡聡

全国大会講演論文集 70 ( 0 ) 131 - 132 2008年3月

　詳細を見る

記述言語：日本語

CiNii Books

researchmap
情報爆発時代のスーパコンピュータ運用経験 : TSUBAME Grid Clusterにて

西川武志, 松岡聡

全国大会講演論文集 70 ( 0 ) 129 - 130 2008年3月

　詳細を見る

記述言語：日本語

CiNii Books

researchmap
情報爆発時代のグリッド環境に対応したMPI集団通信アルゴリズムの最適化

千葉立寛, 遠藤敏夫, 松岡聡

全国大会講演論文集 70 ( 0 ) 135 - 136 2008年3月

　詳細を見る

記述言語：日本語

CiNii Books

researchmap
Environmental-Aware Optimization of MPI Checkpointing Intervals 査読

Hideyuki Jitsumoto, Toshio Endo, Satoshi Matsuoka

2008 IEEE INTERNATIONAL CONFERENCE ON CLUSTER COMPUTING 326 - 329 2008年

　詳細を見る

記述言語：英語

DOI： 10.1109/CLUSTR.2008.4663790

Web of Science

researchmap
仮想クラスタを用いたData-Intensive Application実行環境の性能モデル構築と最適化に向けて

佐藤賢斗, 佐藤仁, 松岡聡, 松岡聡

情報処理学会シンポジウム論文集 2008 ( 5 ) 2008年

　詳細を見る

J-GLOBAL

researchmap
Sun Fire X4500 と Gfarm を用いた大規模ストレージの構築

谷村勇輔, 山本直孝, 石橋拓也, 田中良夫, 西川武志, 松岡聡, 関口智嗣

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 113 ( 122(HPC-113) ) 1 - 6 2007年12月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

Sun Fire X4500は4ウェイのx86-64と24TBのストレージを統合したサーバであり,大規模データ処理の基盤となるストレージを構築するのに適したサーバの1つである.特に,Gfarmのファイルアフィニティを考慮したデータ処理モデルとの相性が良いと考えられる.そこで,本研究では20ノードのX4500とGfarmを組み合わせたストレージシステムの講築を検討した.Solaris 10が提供するZFS/RAID-Zの特徴を活用して,Gfarmにおいて十分なスループットが得られるように予備実験を行いながら,ZFSのストレージプールの構成を決定した.同様に,Gfarmのメタデータ操作についても性能が得られるようにメタデータを格納するファイルシステムを検討した.これらの検討を踏まえて,実際に256.5TBのストレージを構築して基本性能を検証し,それを拡張してPB規模のストレージを構築するための課題を明らかにした.

CiNii Books

J-GLOBAL

researchmap
インターネット上での分散時刻認証グリッドのタイムスタンプ発行スケーラビリティの評価

西川武志, 松岡聡

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 112 ( 88 ) 1 - 5 2007年9月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

これまで我々は既存の単一点時刻認証局や分散時刻認証局の持つ問題を解決するK=L+M among N for G世代分散時刻認証法を提唱し,プログラムを実装し,毎秒百万タイムスタンプ発行が可能であることを,LAN環境等,低遅延,高バンド幅の環境で示して来た.今回,NTT東日本B-Fletsや欧州のWiFiインターネット接続サービス等のネットワーク上に時刻認証ユニット(TSU)を設置し,インターネット上での分散時刻認証グリッドシステムの動作実験を行った.その結果,突発的なネットワーク遅延やJava VMのガーベージコレクションによる応答遅延が存在しても,十分な数のTSUが存在すれば,インターネット上でも毎秒百万タイムスタンプ取得発行の可能性があることを示した.

CiNii Books

researchmap
Web-site-based partitioning techniques for efficient parallelization of the PageRank computation (ハイパフォーマンスコンピューティング)

ALI CEVAHIR, SATOSHI MATSUOKA

情報処理学会研究報告ハイパフォーマンスコンピューティング（HPC） 2007 ( 88 ) 19 - 24 2007年9月

　詳細を見る

記述言語：英語出版者・発行元：一般社団法人情報処理学会

The efficiency of the PageRank computation is important since the constantly evolving nature of the Web requires this computation to be repeated many times. PageRank computa tion includes repeated iterative sparse matrix-vector multiplications. Due to the enourmous size of the Web matrix to be multiplied PageRank computations are usually carried out on parallel systems. Graph and hypergraph partitioning techniques are widely used for efficient parallelization of matrix-vector multiplications. These techniques suffer from high preprocess ing overhead for PageRank algorithm. In this work we propose Web-site-based partitioning techniques to reduce the preprocessing overhead of Parallel PageRank computation.The efficiency of the PageRank computation is important since the constantly evolving nature of the Web requires this computation to be repeated many times. PageRank computa tion includes repeated iterative sparse matrix-vector multiplications. Due to the enourmous size of the Web matrix to be multiplied, PageRank computations are usually carried out on parallel systems. Graph and hypergraph partitioning techniques are widely used for efficient parallelization of matrix-vector multiplications. These techniques suffer from high preprocess ing overhead for PageRank algorithm. In this work, we propose Web-site-based partitioning techniques to reduce the preprocessing overhead of Parallel PageRank computation.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00028745/
High-performance distributed solar computing (?): towards a grid that computes like trees (ハイパフォーマンスコンピューティング)

松岡聡

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 112 ( 88 ) 61 - 66 2007年9月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

Power-heat dissipation as well as the associated CO_2 emission are becoming serious bottlenecks in scaling of large supercomputers. Indeed a single day's operation of TSUBAME, the fastest supercomputer in Asia-Pacific circa 2007, incurs as much CO_2 emission as an entire Formula-1 race. Instead, the use of photovoltaic power generation is promising to minimize or eliminate the emission altogether. While the traditional methods would incur simple attachment to a power grid, and involve very little effect or merit from grid computing, we actually claim that grids and distributed power generation go hand-in-hand to create a robust and self-sustainable computing infrastructure that could scale to TSUBAME-class applications. For robust operation as a pragmatic operational infrastructure, much continuing research would be required customizing and integrating the results from P2P, autonomic computing, sensor networks, etc.

CiNii Books

researchmap
次世代光インターコネクトでのMPI通信性能の評価

滝澤真一朗, 遠藤敏夫, 松岡聡

日本ソフトウェア科学会大会論文集 24 1 - 11 2007年9月

　詳細を見る

記述言語：日本語出版者・発行元：日本ソフトウェア科学会

CiNii Books

researchmap
分散時刻認証局グリッドとパラメータ依存性の解析

西川武志, 松岡聡

情報処理学会論文誌コンピューティングシステム（ACS） 48 ( 13 ) 117 - 126 2007年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

デジタル時刻認証はデジタルデータがある時点で『存在していた』、『改竄されていない』ということを証明する手段である。現在メインストリームである集中型タイムスタンプ手法は多数のタイムスタンプ要求が集中することに耐えることができない性能スケーラビリティ上の問題がある。したがって集中型タイムスタンプ手法は分散 DoS 攻撃に弱い。集中型タイムスタンプ手法の性能スケーラビリティ上の問題や分散 DoS 攻撃耐性がないという問題を解決するために分散時刻認証法が提唱されている。しかしながら原子時計のような高価な時刻源を用いることや信頼できる第三者による監査に由来する高コスト性は解決されていない。本論文では我々は (N，K = L＋M，G) 手法を用いた TSA Grid と名付けた信頼できる高性能で頑強で安価な分散時刻認証法を提唱する。それは独立の主体によって管理されている peer-to-peer 型の時刻認証プログラムに基づいており、既存の分散時刻認証法のコストの問題を解決する。(N，K = L＋M，G) 手法では、N 個の Time Stamping Units （TSU）に G 世代にわたってタイムスタンプ要求が伝搬される。各世代では L 個の信頼できる TSU と M 個のランダムに選んだ TSU からタイムスタンプが要求・応答される。G と L と行ったパラメータの導入により TSU が相互に自律的に監査すること、時刻認証の期待値の推測を可能にしている。また本論文で TSA Grid の基本的なパラメータ依存性について報告する。Digital time stamping is a technique to prove the existence of a digital data prior to a specific point in time. The centralized time-stamping scheme which is the main stream at present can not stand up to the concentration of numerous time-stamping requests. So, the centralized time-stamping scheme has vulnerability to the distributed DoS (DDoS) attack. Distributed time stamping schemes have been proposed to solve a performance scalability problem such as tolerance to DDoS attack. They still have high cost problems which are caused by a utilization of atomic clock and by audit of trusted third party. In this paper, we define a reliable, a high-performance, a robust, and inexpensive distributed time stamping scheme. It is named "TSA Grid" with (N, K = L + M, G) scheme and its scheme is based on a network of peer-to-peer time-stamping programs managed by administratively independent entities. It solves the cost problem of proposed distributed time stamping schemes. In (N, K = L + M, G) scheme, one time stamp request propagates for G generation to N Time Stamping Units (TSU). In each generation, L time stamps replies from reliable TSU and M time stamps replies from randomly chosen TSU. The G and the L parameters enabled us to expect authorized time of time-stamping. And they also enabled TSU to audit TSU themselves mutually and automatically. We also investigate basic characterisitic of parameter dependencies of the TSA Grid.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00018232/
分散時刻認証グリッドのインターネット上での動作実験

西川武志, 松岡聡

電子情報通信学会技術研究報告. CPSY, コンピュータシステム 107 ( 175 ) 61 - 64 2007年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

これまで我々は既存の単一点時刻認証局や分散時刻認証局の持つ問題を解決するK=L+M among N for G generation分散時刻認証法を提唱してきた.提唱するだけでなくプログラムを実装し,毎秒百万タイムスタンプ発行が可能であることを,LAN環境等,低遅延,高バンド幅の環境で示して来た.今回,NTT東日本B-Fletsや欧州のWiFiインターネット接続サービス等のネットワーク上に時刻認証ユニット(TSU)を設置し,インターネット上での分散時刻認証グリッドシステムの動作実験を行った.その結果,十分な数のTSUが存在すれば,インターネット上でも毎秒百万タイムスタンプ取得発行の可能性があることを示した.

CiNii Books

researchmap
仮想クラスタ構築時間のモデリングおよびその最適化

山崎翔平, 丸山直也, 松岡聡

電子情報通信学会技術研究報告. CPSY, コンピュータシステム 107 ( 175 ) 65 - 70 2007年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

グリッド上の仮想クラスタ構築において、利用可能な計算資源をランダムに選択した場合、構築時間に不必要なオーバーヘッドが生じる場合がある。これは、グリッド上の各資源の不均質性や、仮想クラスタ構築は最も構築に時間のかかる資源に律速されることが原因である。我々は、高速な仮想クラスタ構築のために、各計算ノードにおける仮想マシン(VM)のセットアップ時間を予測するモデルを生成し、そのモデルに基づいた資源選択手法を提案する。モデル生成では、VMセットアッププロセスを5つのステップに分割し、各ステップの経過時間は各計算ノードのCPU周波数およびディスク性能の逆数、追加インストールするパッケージサイズの線形結合で表す。既存の仮想クラスタインストールシステムVPCに、モデルベースの資源選択機能を拡張し、評価実験を行った。その結果、モデルに基づく選択法は、各サイトで追加インストールするパッケージサイズが異なる場合に特に有効であり、登録リスト順に計算ノードを選択する最もナイーブな手法に比べて最大68%、各計算ノードのCPU周波数だけを考慮した選択法に比べて最大60%、ディスク性能だけを考慮した選択法に比べて最大58%の構築時間短縮を達成できることが分かった。

CiNii Books

researchmap
次世代光インターコネクト上でのMPIアプリケーションの評価

滝澤真一朗, 遠藤敏夫, 松岡聡

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 111 183 - 188 2007年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

将来の数万プロセッサ規模のシステムでは,全ノードを高バンド幅で全対全接続するネットワークはコストや電力消費の問題で構築が難しい.この問題を解決するため,低バンド幅電気パケットネットワークと光サーキットネットワークの双方を活用するネットワークを提案する.光ネットワークは電気スイッチをまたぐ離れたノードとの通信にのみサプリメンタルに使用する.この環境でのMPIアプリケーション通信は,光回線に接続されているプロセスが通信パターンから構築したトポロジに沿って,他プロセスのスイッチをまたぐ通信をフォワードことで実現する.提案ネットワーク,提案通信手法をNas Parallel BenchmarksのMGで評価した結果,電気ネットワークだけを用いた場合よりプロセス間距離が短くなり,実行性能向上が見込めることが確認できた.

CiNii Books

researchmap
広域分散環境における大規模データ管理のためのノードグルーピング

佐藤仁, 松岡聡, 遠藤敏夫

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 111 ( 80 ) 109 - 114 2007年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

グリッドファイルシステムでは,1)クライアントからある特定のノードやファイルへのアクセスに時間的局所性がありアクセスが集中する,2)ファイルシステム上のファイルへのアクセスが空間的に遠方に存在するノードへのアクセスとなる,などの要因によりファイルアクセス性能が低下することが問題となる.しかし,効率の良い大規模データ管理を実現するためにどのようにファイルをグリッドファイルシステムを構成する広域に分散したノードに配置すれば良いかの戦略を決定づけるメトリックは明らかではない.我々は,広域に分散した5サイトからなるHPCクラスタを連携してファイルシステムを構成し,その上で,ファイルアクセスの行った際の性能を調査した.その結果,リモートファイルアクセス性能はノード間のバンド幅の影響を受けるが,RTT,バンド幅などのネットワークの限定された情報だけではファイルシステムを構成するノードの関係の推定が困難であること,ローカルファイルアクセス性能でもファイルアクセスパターンにより最大0.1倍の性能に抑えられてしまうこと,が明らかになった.

CiNii Books

researchmap
CPUおよびGPUを併用するFFTライブラリの提案と評価

尾形泰彦, 遠藤敏夫, 松岡聡

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 111 ( 80 ) 13 - 18 2007年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

General-purpose GPU (GPGPU)を科学技術計算のために利用する手法が注目されている。GPUは非常に高速な並列計算を行うことが可能で、かつ価格性能比が非常に高いという特徴を持つ。一方で、CPUのマルチコア化も近年急速に進みつつあり、マルチコアCPUとGPUという、性能特性の異なる2つの並列計算リソースが一つの計算機内に存在するようになってきた。このため、計算機を有効に利用するためには両者をより効率よく併用する必要があり、このヘテロな計算環境への計算量の割り振りを行う必要が出てきている。我々は、このヘテロな計算環境への計算量の割り振りについて、性能モデルを用いて予測することを提案する。この性能モデルは、問題のサイズに対する計算量やデータ量等を元に構築し、実測値からパラメータを与える。また、この性能モデルを用いることで、全体の計算量およびGPUとCPUへの各割り振り率に対する実行時間を予測する。この予測した実行時間の最小値を探索することで最適割り振り率を得る。本提案の実証のためにGPUとCPUを併用する2D-FFTライブラリを実装し、同FFTライブラリに対する性能モデルの構築を行った。同ライブラリと性能モデルを用いた実行性能の予測値と実測値との比較を行い、性能モデルの正確さを評価した。その結果、予備実行の16^2倍までの計算量の問題について、最適割り振り率を高々5%の誤差、実行時間も15%程度の誤差に抑えられ、この性能モデルが十分な予測精度を持つことを確認した。

CiNii Books

researchmap
次世代省電力メモリを用いた並列プログラムの省電力化の評価

細萱祐人, 遠藤敏夫, 松岡聡

情報処理学会研究報告. ARC,計算機アーキテクチャ研究会報告 174 49 - 54 2007年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

近年大規模計算機の省電力化の要求の高まるにつれて,CPUだけでなくメモリの消費電力の削減が重要視されつつある.メインメモリとして使用されるDRAMは揮発性メモリであるため,消費電力,特に待機電力が非常に大きい.しかし,スワップを避けるように設計されるHPCでは必要以上にDRAMを搭載しており,その結果多くの場合搭載された全メモリ使われてはいない.そこで,我々はDRAMメモリの搭載容量を削減するためにメインメモリにMRAMとDRAM,スワップ領域にFLASHを配置した低消費電力システムを提案する.本システムではページングによりメモリアクセスを高速なMRAMに集中させメモリアクセスの最適化を行っている.シミュレーションの結果,DRAM搭載容量を削減することで実行時間の増加を1.3倍に抑え,消費エネルギーを1/3に削減できることを示した.

CiNii Books

researchmap
クラスタシステムにおけるIP-SANを用いたI/O処理の並列ベンチマークによる評価

神坂紀久子, 山口実靖, 小口正人, 松岡聡

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 111 ( 80 ) 225 - 230 2007年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

スーパーコンピュータや大規模なHPCクラスタシステムにおいて,ノード間通信とストレージアクセスのネットワークの統合が実現され始めている.このような統合ネットワークを提供することにより,大規模なクラスタシステムにおいても構成を単純化し,高いストレージアクセス性能を実現しながら運用管理コストを削滅できる.しかし,ノード間通信とストレージアクセスのネットワークを統合することがシステム全体の性能にどのように影響するかについては明らかにされていない.本稿では,ノード間通信とストレージアクセスの統合ネットワークの一つとして,IPをベースにしたSANであるIP-SANを用い,I/Oを伴う並列ベンチマークによる評価を行った.その結果,iSCSI接続のIP-SAN統合型クラスタは,ローカルストレージのみを用いたクラスタの並列処理性能とほぼ同程度となった.このことより本評価においては,IP-SANにおけるネットワーク転送処理ではなく,ノード間通信を含む並列処理もしくはストレージのI/O処理がシステム全体の性能を決めるボトルネックとなっていることがわかった.

CiNii Books

researchmap
ヘテロ型スーパコンピュータTSUBAMEのLinpackによる性能評価

遠藤敏夫, 松岡聡, 橋爪信明, 長坂真路

情報処理学会論文誌コンピューティングシステム（ACS） 48 ( 8 ) 62 - 70 2007年5月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

TSUBAMEスーパコンピュータは，655ノード10480 Opteron coreと360枚のClearSpeed SIMDアクセラレータボードを備えるヘテロ型の大規模クラスタシステムである．本論文ではLinpackの並列実装であるHPLをTSUBAME上で効率的に動作させる技法を述べ，性能評価を行う．均一環境を主な対象としたHPLに対し，比較的軽微な修正を行うという方針をとる．提案技法は，細粒度なプロセスによる不均一な計算資源の共有，非同期通信の採用などを含む．修正したHPLを用いてシステムの評価を行ったところ，47.38TFlopsを達成した．この結果はヘテロな環境におけるLinpackの性能としては世界最速のものである．本研究の成果は，今後増加が予想されるヘテロ型スーパコンピュータの大規模並列計算への適用可能性を示している．The TSUBAME supercomputer is a heterogeneous large-scale cluster system, which is equipped with 10480 Opteron CPU cores on 655 nodes and 360 ClearSpeed SIMD accelerator boards. This paper describes techniques to run HPL, which is a parallel Linpack implementation, on the TSUBAME system efficiently, and evaluates the performance. The techniques include sharing heterogeneous computing resources among fine grained processes, and using asynchronous communications. Through the evaluation of the system with the modified HPL, we have observed 47.38TFlops, which is the world's fastest Linpack performance on heterogeneous systems. The result of this work shows that heterogeneous supercomputers, which are expected to be much more popular in the near future, are promising for large scale parallel computations.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00018254/
グリッド環境におけるマルチレーンを用いたMPIコレクティブ通信アルゴリズム

千葉立寛, 遠藤敏夫, 松岡聡

情報処理学会論文誌コンピューティングシステム（ACS） 48 ( 8 ) 104 - 113 2007年5月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

グリッド環境上におけるMPIコレクティブ通信の性能は，ネットワークトポロジに強く依存しており，これまでにも最適なネットワークトポロジを構築してコレクティブ通信を高速化させるための様々な手法が数多く提案されてきた．また，近年のクラスタシステムでは，各ノードが複数のNICを備えていることが多い．しかしながら，これまでに提案されている手法は，各ノードの送受信が実行できるポートを1つと仮定してトポロジを構築する手法がほとんどである．そこで我々は，各ノードにある2枚のNICのバンド幅を最大限利用するマルチレーンブロードキャストツリー構築アルゴリズムを提案する．このアルゴリズムでは，ブロードキャストするメッセージを2つに分割し，2枚のNICを用いて2つの独立したバイナリツリーを構築して，それに沿って分割したメッセージのパイプライン転送を行う．また，提案アルゴリズムは，クラスタ，グリッド両方のシステムで効果的に実行でき，NICを1枚だけ備えるノードに対しても複数のソケットを用意することで動作可能である．本稿では，ブロードキャスト通信に対してシミュレータ環境上で実験，評価を行い，従来手法よりも性能が向上したことを確認した．The performance of MPI collective operations, such as broadcast and reduction, is heavily affected by network topologies, especially in grid environments. Many techniques to construct efficient broadcast trees have been proposed for grids.On the other hand, recent high performance computing nodes are often equipped with multi-lane network interface cards (NICs), most previous collective communication methods fail to harness effectively. Our new broadcast algorithm for grid environments harnesses almost all downward and upward bandwidths of multi-lane NICs; a message to be broadcast is split into two pieces, which are broadcast along two independent binary trees in a pipelined fashion, and swapped between both trees. The salient feature of our algorithm is generality; it works effectively on both large clusters and grid environments. It can be also applied to nodes with a single NIC, by making multiple sockets share the NIC. Experimentations on a emulated network environment show that we achieve higher performance than traditional methods, regardless of network topologies or the message sizes.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00018258/
情報学を創る - 科研プロジェクトがめざしたもの : ICTは科学の発展に役立つのか？?情報学A05班の挑戦?

下條真司, 野崎一徳, 松岡聡

情報処理 48 ( 5 ) 521 - 526 2007年5月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

現在，さまざまな学問分野で高度な情報通信技術を科学の方法論として取り込んで，利用することにより科学を大きく発展させることが行われつつある．特定領域研究「情報学」の中で我々の研究グループは，グリッド技術により情報通信技術の大きな還流を作ることを狙って，学際的な分野において広帯域通信技術，分散計算技術，知識管理技術を切り口としたプラットフォームや技術開発を通じて必要な人材の育成およびその仕組み作りを行い，それにより，科学全般に対する情報技術の浸透のきっかけとなることを目指した．そのため，我々は数学者，計算物理研究者，電子顕微鏡研究者，ネットワーク研究者，計算機ソフトウェア研究者らが共同して実際のアプリケーション構築を行い，萌芽的ネットワーク技術，データ管理技術を実際の応用レベルにまで引き上げ，フィードバックするということを行った.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00065970/
時刻認証グリッドの構築と基礎実験

西川武志, 松岡聡

電子情報通信学会技術研究報告. CPSY, コンピュータシステム 107 ( 16 ) 13 - 18 2007年4月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

デジタルデータがある時点で存在したこと,改竄されていないことを証明する有効な手段にデジタル署名による時刻認証法がある.従来の単独時刻認証局には運用コストや性能スケーラビリティの問題が存在し,その解決を試みた従来の分散時刻認証法には多数の時刻認証局をどうやって設置するかの問題が存在する.既存のこれらの問題を,我々は,多数の時刻認証ユニットを用いて相互に時刻認証を行うK=L+M among N for G-generation分散時刻認証法で解決出来ることを示して来た.またローカルネットワーク上のクラスタ環境で動作パラメータ依存性等の基本動作を検証して来た.今回はインターネット上の複数のサイトで分散時刻認証ユニットを設置し,すなわち分散時刻認証グリッドを構築し,ネットワーク遅延時間が認証時刻にどのような影響があるかを調査した.さらにその結果から認証時刻を,応答があった場合の算術平均とした場合に時刻認証ユニット数を幾つ用いすれば1秒以内となるかを検討した.その結果,本報告で検討した動作パラメータではTSUが256よりも多く用意すれば認証時間の算術平均が1秒以内となることが明らかとなった.再頻値を用いることで算術平均よりも遅延の小さな認証時間を得られる事が明らかとなった.

CiNii Books

researchmap
NAREGIミドルウェアβ-gLite間における相互ジョブ起動実験 (計算機アーキテクチャ・ハイパフォーマンスコンピューティング「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))

中田秀基, 佐藤仁, 佐賀一繁, 畑中正行, 佐伯裕治, 松岡聡

情報処理学会研究報告 2007 ( 17 ) 269 - 274 2007年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

グリッド標準化団体OGFでは,グリッドミドルウェア間の相互運用技術を確立するために.GIN(Grid Interoperation Now)と呼ばれるコミュニティグループの活動が行われている.この活動の一環として,NAREGIのNAREGIミドルウェアβとEGEE (Enabling Grids for E-Science in Europe)のミドルウェアgLiteの間でジョブ起動およびデータ転送に関する相互運用実験を行い,NAREGIミドルウェアβからgLite,およびgLiteからNAREGIミドルウェアβへのジョブ起動を実現した.前者はgLiteの個々の計算資源(Compute Element)を擬似的にNAREGIミドルウェアβの資源として取り込み,NAREGIミドルウェアβのスケジューラの配下に置くことで実現した.後者は,NAREGIミドルウェアβ全体をひとつの計算資源としてgLiteに対して公開し,gLite側で明示的にNAREGIミドルウェアβを選択する方式で実現した.実験の結果,以下を確認することができた.1)証明書や仮想組織管理のレイヤでは相互運用性に問題はない,2)情報サービスのレイヤでも相違が吸収できる,3)その情報を用いて相互のジョブ起動が可能である.

CiNii Books

J-GLOBAL

researchmap
フォールト/リカバリモデルを考慮した耐故障性をもつMPIフレームワークABARISの提案と評価 (計算機アーキテクチャ・ハイパフォーマンスコンピューティング「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))

實本英之, 遠藤敏夫, 松岡聡

情報処理学会研究報告 2007 ( 17 ) 163 - 168 2007年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

大規模クラスタやグリッド等では,故障が発生しやすく長時間にわたるMPIアプリケーション実行のためには耐故障性が不可欠である.故障発生時の復旧方法は実行環境やアプリケーションによって変わるが,既存の耐故障性MPIは復旧方法の変更にほとんど非対応であり,対応可能でも,故障に応じた復旧方法をアプリケーションコード中に記述する必要がありユーザ負荷が高い.ABARISは実行環境やアプリケーションに合わせた復旧方法を用いることが可能なMPIフレームワークである.ユーザは故障検知と復旧方法のコンポーネントを実行環境やアプリケーションに応じて選択することで復旧方法を変更可能となる.プロトタイプとしてMPICH-P4MPDにABARISを適応し,NPBを用いてオリジナルのMPICH-P4MPDとの性能比較を行った.結果,ABARISを適用することによるオーバーヘッドはほとんど無い(1%以下)であることがわかった.また,故障検知と復旧手法を発生した故障に応じて適切に変えることが,性能に大きな影響を与えることを示した.

CiNii Books

researchmap
キャッシュを用いた仮想クラスタ高速構築手法の性能評価 (計算機アーキテクチャ・ハイパフォーマンスコンピューティング「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))

西村豪生, 丸山直也, 松岡聡

情報処理学会研究報告 2007 ( 17 ) 121 - 126 2007年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

近年グリッド上の大規模資源を仮想計算機を用いて仮想化し,仮想クラスタを構築して効率的に共有する手法が提案されている.そのような大規模資源共有のための仮想クラスタは,環境を柔軟にカスタマイズ可能でありながら,数百台から千台規模でも高速に構築できなくてはならない.そこで我々は,キャッシュイメージを過去の要求履歴から自動生成する高速でスケーラブルな仮想クラスタ構築機構を提案している.本稿では,提案高速化手法についてより多くの条件下でキャッシュイメージ作成前後の構築時間推移を評価し,作成後の平均構築時間が作成前に対して最大66.7%程度減少したことを確認した.また,構築時間のスケーラビリティについての評価を行い,204ノードが40秒以内で構築可能であったことから,千台規模の仮想クラスタでも本手法によって数十秒以内で構築可能であるという知見を得た.

CiNii Books

researchmap
仮想クラスタを用いた複数サイト上でのMPI実行環境 (計算機アーキテクチャ・ハイパフォーマンスコンピューティング「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))

立薗真樹, 丸山直也, 松岡聡

情報処理学会研究報告 2007 ( 17 ) 115 - 120 2007年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

近年、大規模なMPIアプリケーションの実行を広域分散上で行うことが求められている。本稿では、仮想クラスタ技術を用いることで広域分散環境上でのMPI実行環境を提案し、プロトタイプ環境を構築してその評価した結果、アプリケーション特性により広域環境での実行が現実的なものであることを確認した。また仮想クラスタ環境では、計算資源の仮想化技術により仮想ノードの動的な再配置が可能となる。この特徴を利用することで、実行中のアプリケーションの特性を取得し、最適な実行環境へと実行ノードの再配置を行うシステムを提案した。プロトタイプ実装による評価により、システムのスループットの向上を確認し、同時にサイト間通信量がアプリケーションの複数サイト実行への適合度を測る目安となることを確認した。

CiNii Books

researchmap
ハイパフォーマンス分散時刻認証局 : 毎秒百万タイムスタンプ発行の実現

西川武志, 松岡聡

情報処理学会研究報告 2007 ( 17 ) 221 - 226 2007年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

時刻認証はデジタルデータがある時点で存在していた、改ざんされていないということを証明する手段である。我々は分散時刻認証法を開発し既存の集中型時刻認証法の性能スケーラビリティに起因する分散DoS攻撃への脆弱性と高価な時刻源を用いることに由来する高コスト性という大きな二つの問題を解決した。本報告では毎秒百万タイムスタンプ発行が実現可能となるような実装と動作パラメータについての検討を行った。

CiNii Books

researchmap
Outil autonome de surveillance de grilles

Laurent Baduel, Satoshi Matsuoka

Revue de l'Ingenierie des Systemes d'Information 12 ( 3 ) 85 - 104 2007年

　詳細を見る

researchmap
Outil autonome de surveillance de grilles

Laurent Baduel, Satoshi Matsuoka

Revue de l'Ingenierie des Systemes d'Information 12 ( 3 ) 85 - 104 2007年

　詳細を見る

researchmap
TSUBAMEの飛翔 (Extended Abstract)

松岡聡

電子情報通信学会技術研究報告. CPSY, コンピュータシステム 106 ( 287 ) 33 - 36 2006年10月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

CiNii Books

researchmap
SANを用いた高性能コンピュータシステムの将来像と究極の姿

田辺昇, 池井満, 遠藤敏夫, 松岡聡, 畑崎隆雄, 住元真司

電子情報通信学会技術研究報告. CPSY, コンピュータシステム 106 ( 287 ) 49 - 49 2006年10月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

高バンド幅で低遅延のSAN (System Area Network)がHPC用途のPCクラスタのノード間インターコネクトとして広く使われるようになってきた。本パネルでは、SANを用いて、より進んだコンピュータシステムを研究開発するために必要な技術をハードウェア、ソフトウェアの両面から議論し、その将来像と究極の姿を議論する

CiNii Books

researchmap
ORE Grid：仮想計算機を用いたグリッド実行環境の高速な配置ツール

高宮安仁, 山形育平, 青木孝文, 中田秀基, 松岡聡

情報処理学会論文誌コンピューティングシステム（ACS） 47 ( 12 ) 229 - 239 2006年9月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

グリッド上で実行されるジョブの多様化にともない，OS やソフトウェア，ライブラリなどジョブが要求する実行環境も多様化しつつある．しかし，グリッドリソースであるクラスタごとの管理ポリシによる制限により，ジョブの要求を満たす実行環境を得ることは難しい．既存研究では実行環境の仮想化による実行環境の提供をある程度達成しているものの，セットアップできる環境の種類が制限されていることや，セットアップが自動的でないといった問題や，システムの詳細に関する知識を必要とするといった問題があった．そこで我々は，VM 技術を用いて投入されるジョブごとに専用の仮想実行環境を動的に提供するシステムとしてORE（Open Resource Environment）グリッドを提案する．加えて，スクリプトやDAG などツール独自の方法で実行環境の構築手順を記述する代わりに，GUI を用いて実行環境に必要な要素を指定することで容易に実行環境を構築できる．評価では16 台構成の実行環境をORE グリッドを用いてセットアップしジョブを実行させた．結果，実行環境の構築に要する時間は全体で151 秒と高速であり，一般的なグリッド上のジョブ実行時間（数時間～数日間以上）と比較すると十分許容範囲以内であることを確認した．With the increased variety of jobs executed in the Grid, the execution environments such as OSes, softwares, and libraries requested by such jobs have becoming increasingly diversified. However, it is difficult for grid users to acquire the necessary environment suited for each jobs because the job execution environment on the grid are strongly tied to its local administration policies. Recently proposed solutions may achieve virtualization of execution environment at certain level, but are still incomplete that construction of execution environments will again requires manual operations and/or expert knowledge of underlying systems. Instead, we propose the system called ORE (Open Resource Environment) Grid which automatically and dynamically builds exclusive execution environment for each submitted jobs. Moreover, the GUI setup front-end offers succinct methods to pick the necessary features and generate an execution environment description automatically instead of resorting to tool-dependent VM description forms such as shell scripts or DAG descriptions. Our experiences have shown that setup of 16 VM nodes itself will only take 151 seconds, and the setup cost is certainly within an allowable range compared to accumulated running time of general Grid jobs (several hours to several days).

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00018304/
PCクラスタにおける電力実行プロファイル情報を用いたDVS 制御による電力性能の最適化

堀田義彦, 佐藤三久, 木村英明, 松岡聡, 朴泰祐, 高橋大介

情報処理学会論文誌コンピューティングシステム（ACS） 47 ( 12 ) 272 - 284 2006年9月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

本論文では，高性能PC クラスタにおけるプロファイル情報を用いたDVS スケジューリングによる電力性能最適化手法を提案する．近年，従来低消費電力向けプロセッサに実装されていた，消費電力を削減するためにプロセッサの動作周波数・電圧を動的に変更するDVS（Dynamic Voltage Scaling）が高性能プロセッサにも実装されている．性能低下を最小限にし，消費電力を削減するために通信やメモリアクセスの際に適切な周波数スケジューリングを行う必要がある．電力性能を最適化するために，プログラムをいくつかの領域に分割し，領域ごとに適切な周波数を選択する．DVS による周波数変更は，オーバヘッドを発生するため，これを加味した周波数選択アルゴリズムを提案する．システムの詳細な電力消費特性を測定するため，電力測定環境であるPowerWatch を構築した．このシステムにより，異なるプロセッサを使用する2 つのクラスタで提案するアルゴリズムの有効性能の評価を行った．その結果，標準の周波数で動作するときと比べ，最大30%以上のEDP（電力遅延積）を5%以下の性能低下でできることが分かった．Currently, several of the high performance processors used in a PC cluster have a DVS (Dynamic Voltage Scaling) architecture that can dynamically scale processor voltage and frequency. Adaptive scheduling of the voltage and frequency enables us to reduce power dissipation without a performance slowdown during communication and memory access. In this paper, we propose a method of profiled-based power-performance optimization by DVS scheduling in a high-performance PC cluster. We divide the program execution into several regions and select the best gear (combinations of clock frequency and voltage) for power efficiency. Selecting the best gear is not straightforward since the overhead of DVFS transition is not free. We propose an optimization algorithm to select a gear using the execution and power profile by taking the transition overhead into account. We have built and designed a power-profiling system, PowerWatch. With this system we examined the effectiveness of our optimization algorithm on two types of po er-scalable clusters (Crusoe and Turion). According to the results of benchmark tests, we achieved almost 30% reduction in terms of EDP (energy-delay product) without performance impact (less than 5%) compared to results using the standard clock frequency.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00018308/
B-12-10 光バーストスイッチング技術のGridアプリケーションへの適用(B-12.フォトニックネットワーク,一般講演)

小野隆, 高田篤, 古賀正文, 滝澤真一朗, 松岡聡

電子情報通信学会ソサイエティ大会講演論文集 2006 ( 2 ) 296 - 296 2006年9月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

CiNii Books

researchmap
グリッドチャレンジテストベッドの構築と運用 : グリチャレテストベッドの作り方

合田憲人, 大澤清, 大角知孝, 笠井武史, 小野功, 實本英之, 松岡聡, 斎藤秀雄, 遠藤敏夫, 横山大作, 田浦健次朗, 近山隆, 田中良夫, 下坂久司, 梶原広輝, 廣安知之, 藤澤克樹

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 107 ( 87 ) 49 - 54 2006年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

本稿では,2005年12月から2006年5月にかけて実施されたGrid Challenge in SACSIS2006において使用されたグリッド実験環境の構築・運用事例を報告する.Grid Challengeは,大学,研究所が提供する複数の計算資源からなるグリッド実験環境上で,参加者がプログラミング技術を競う大会であり,今大会では1200CPU超の計算資源からなるグリッド実験環境が運用された.本稿では,実験環境ハードウェアおよびソフトウェアの仕様を紹介するとともに,ユーザ管理,ジョブ管理,障害対応といった運用事例についても報告する.

CiNii Books

researchmap
TSUBAMEの飛翔 : ペタスケールへ向けた「みんなのスパコン」の構築

松岡聡

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 107 ( 87 ) 37 - 42 2006年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

TSUBAME (Tokyo-tech Supercomputer and Ubiquitously Accessible Mass-storage Environment)は、アクセラレータ部分を含めると100TFlops近いピーク性能・20TByte以上のメモリ・Fat Nodeおよび高速な間接網を基本とした共有メモリスパコン形アーキテクチャ・並びに1PByte以上のオンラインストレッジを備え、2006年春の時点で、あらゆるパラメタで現在わが国最高性能・最大規模の新型スパコンとして東工大・学術国際情報センターに構築された。TSUBAMEは従来の専用スパコンとPCクラスタ両者の利点を兼ね備え、かつそれぞれの欠点を補うマシンとして設計されており、スパコンとしての柔軟かつ強力なハイエンドの大規模並列計算やデータ処理の能力と、エンドユーザのデスクトップ・ノートブックやPCクラスタ環境との高い親和性との両立を実現している。これらを同時に満たすことが、TSUBAMEが標榜する「みんなのスパコン」であり、現代のIT環境にシームレスに接合して様々なサービスを提供する源となって、大学における教育・研究アーカイブなどの教育研究業務・メイルや事務処理などの統合的なホスティングを行い、将来の計算科学の人材を多数育むものとなる。TSUBAME (Tokyo-tech Supercomputer and Ubiquitously Accessible Mass-storage Environment) is a new supercomputer being hosted at the Global Scientific Information and Computing Center (GSIC), Tokyo Institute of Technology, sporting nearly 100 TFlops of compute power, over 20 TBytes of memory, fat node / shared memory architecture and fast interconnect, and over 1 PBytes of online storage, making it the fastest and the largest supercomputer in Japan. At the same time TSUBAME embodies the benefit of PC-based x86 ecosystem, allowing coexistence of high-end capability computing and synergy to user's PC-based desktop environment. As such TSUBAME can be regarded as "Everybody's Supercomputer", allowing unified hosting of various services including educational, office, as well as high-end supercomputing, becoming the bases of incubating numerous computational scientists of the future.

CiNii Books

researchmap
大規模分散時刻認証局の構築と性能評価 (SWoPP2006)

西川武志, 松岡聡

電子情報通信学会技術研究報告 106 ( 199 ) 25 - 30 2006年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

時刻認証ほデジタルデータがある時点で存在していた、改ざんされていないということを証明する手段である。本報告では既存の集中型時刻認証局の性能スケーラビリティに起因する分散DoS攻撃への脆弱性と高価な時刻源を用いることに由来する高コスト性という大きな二つの問題を解決するため多数の時刻認証届からなる分散時刻認証局の仕組みを提唱し、その構築と性能について報告する。

CiNii Books

researchmap
ヘテロ型スーパーコンピュータTSUBAMEの Linpack による性能評価

遠藤敏夫, 松岡聡, 橋爪信明, 長坂真路, 後藤和茂

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 107 ( 87 ) 43 - 48 2006年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

TSUBAMEスーパーコンピュータは,655ノード10480 Opteron coreと360枚のClearSpeed SIMDアクセラレータボードを備えるへテロ型の大規模クラスタシステムである.TSUBAMEはLinpackベンチマークで38.18TFlopsを記録し,この結果により2006年6月のTop500ランキングに7位としてランクされた.しかしその測定にはOpteronのみが使われ,アクセラレータは川いられていない.本論文は汎用CPUとアクセラレータによる不均一な環境においてLinpack性能を得る上での課題について論じ,解決法を述べる.16ノード256 CPU coreを用いた予備実験では,アクセラレータ8枚を加えたときに8.2%,16枚を加えたときに19%の性能向上が観測された.

CiNii Books

researchmap
仮想計算機と仮想ネットワークを用いた仮想クラスタの構築

西村豪生, 中田秀基, 松岡聡

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 107 ( 87 ) 73 - 78 2006年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

グリッド環境の不均質性を隠蔽するために,分散した資源上に仮想計算機と仮想ネットワークを用いて仮想クラスタを構築する手法が注目されている.仮想クラスタ構築のためには,必要な環境構成を備えた仮想計算機(VM)イメージを実計算資源に配布する必要がある.しかし,一般的にVMイメージのサイズは数100MBytesから数GBytesに及ぶため,その転送時間は無視できない.既存研究ではある程度高速な仮想クラスタ構築システムを提供しているものの,実行環境に制限がある.そこで我々は,ユーザが望む環境を備えたVMイメージを動的に高速に作成する仮想クラスタ構築システムを提案する.本システムでは利用頻度の高いパッケージ構成を含んだキャッシュイメージを自動的に生成する.また,事前に構築時間を見積もってキャッシュを用いることにより,構築に103秒程度要していた仮想クラスタを,75秒程度に短縮できることを確認し,高速化への指針を得た.

CiNii Books

researchmap
フォールト/リカバリモデルを考慮した耐故障性をもつMPIフレームワーク Cuckoo FTMPI の提案と評価

實本英之, 松岡聡

電子情報通信学会技術研究報告. DC, ディペンダブルコンピューティング 106 ( 198 ) 73 - 78 2006年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

並列,広域化に広く用いられるMPIにおいて,耐故障性を備えたものが作られた.しかしそれらは環境ごとに変わるリカバリモデルを考慮した物が少なく,考慮した物も,状況に応じた復旧手段をコード中に記述する必要がありユーザーの負担が多い.本研究では環境に合わせたリカバリモデルを容易に用いることが可能なMPIフレームワークCuckoo FTMPIを提案する.リカバリモデルをコンポーネントとして提供することにより,ユーザーはコンポーネントを選択するだけで,環境に最適な耐故障性MPIを用いることが可能となる.MPICHにCuckoo FTMPIフレームワークを用いた拡張を行い,さらに2種の並列耐故障性コンポーネントを実装し,NPBによる性能評価を行った.結果,コンポーネントをアプリケーションに応じて変更することが性能に大きな影響を与えることを示した.

CiNii Books

researchmap
大規模分散システムにおける故障の解析

丸山直也, 松岡聡

電子情報通信学会技術研究報告. DC, ディペンダブルコンピューティング 106 ( 198 ) 19 - 24 2006年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

クラスタやグリッドなどに代表されるように、システムが大規模化、コモディティ化されるにつれて、故障解析が問題になってきている。しかし、その解析技術はシステムの大規模化に起因する問題に対処できていなく、システム管理者への大きな負担となっている。我々は分散システムの各構成プロセスについて,それぞれの関数呼び出しトレースを取得し、実行時にトレースを解析することで、異常の検知と解析を行う。解析には、分散システムの中心的な処理である、リクエスト処理とイベント処理を単位として行う。これにより従来手法と比較してより広範囲のシステムヘ本手法を適用可能である。本手法の妥当性確認のためプロトタイプ解析器を実装した。クラスタ上のリソースマネージャに適用した予備的な評価を行い、構想の妥当性を確認した。

CiNii Books

researchmap
Design and implementation of NAREGI SuperScheduler based on the OGSA architecture

Satoshi Matsuoka, Masayuki Hatanaka, Yasumasa Nakano, Yuji Iguchi, Toshio Ohno, Kazushige Saga, Hidemoto Nakada

JOURNAL OF COMPUTER SCIENCE AND TECHNOLOGY 21 ( 4 ) 521 - 528 2006年7月

　詳細を見る

記述言語：英語

DOI： 10.1007/s11390-006-0521-y

Web of Science

J-GLOBAL

researchmap
ディペンダビリティとセキュリティ : デバイス、アーキテクチャ、ソフトウェア

坂井修一, 中村宏, 五島正裕, 松岡聡, 橋本幹生, 小檜山清之, 中村友洋

電子情報通信学会技術研究報告. DC, ディペンダブルコンピューティング 106 ( 4 ) 67 - 67 2006年4月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

情報システムで最も大切なことが、ディペンダビリティとセキュリティがある。ところがディペンダビリティという用語は、使う人によって様々な意味をもつ複合的な概念となっている。ある人はLSIの信頼性と解し、ある人はインターネットの信頼性・安全性と考える、という具合に。ここでは、LSIデザイナ、コンピュータアーキテクト、ソフトウェア研究開発者などさまざまな分野を代表する方々に登壇していただき、それぞれが思うディペンダビリティの内容と最大の課題、およびその解決法について述べていただく。相互理解が深まったところで、情報システム全体としてのディペンダビリティを確保するための要件について論じる。

CiNii Books

researchmap
大規模環境向け情報共有手法を用いた分散ジョブスケジューリングシステム (「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))

梅田典宏, 中田秀基, 松岡聡

情報処理学会研究報告 2006 ( 20 ) 223 - 228 2006年2月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

ジョブスケジューリングシステムを利用することで分散した計算資源を統合し、利用することが可能になっている。しかし既存のシステムは、スケジューリングに必要な資源情報収集および実行ジョブと資源のマッチングを少数の計算機で行うことによる単一故障点の存在と資源・投入ジョブ数の増加に対するスケーラビリティの欠如という問題を抱えている。我々は、大規模環境向けの通信手法を用いて資源情報を共有し、耐故障性と資源数の増加に対しスケーラブルな分散ジョブスケジューリングシステムを提案し、シミュレータ上で比較評価を行った。その結果、大規模環境下に於いて既存のシステムより利用効率の低下を小さく抑えられることを確認した。

CiNii Books

researchmap
グリッド上における仮想計算機を用いたジョブ実行環境構築システムの高速化 (「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))

山形育平, 高宮安仁, 中田秀基, 松岡聡

情報処理学会研究報告 2006 ( 20 ) 127 - 132 2006年2月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

グリッド上で実行されるジョブの多様化に伴い、ジョブが要求する実行環境も多様化しつつある.そこで我々は仮想計算機と自動設定・インストールツールを用いて投入されるジョブごとに専用の仮想実行環境を動的に提供するシステムORE Gridを開発している.このシステムを使用することにより約173秒で16台のBLAST実行環境を動的に構築することが可能であるが,今後のグリッドの応用領域の広がりを考慮すると構築時間を短縮することも必要である.この構築時間短縮のため一度構築した仮想計算機環境を保存,再利用するキャッシュサーバーを作成し,ORE Gridに組み込むことを提案する.このキャッシュを使用することによりパッケージインストール時に起こるパッケージサーバーへの負荷集中を回避できる.このシステムを実装し,従来のシステムとの比較を行ったところ約12%の構築時間削減効果が見られた.

CiNii Books

researchmap
光ネットワーク環境におけるMPI集団通信 (「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))

滝澤真一朗, 松岡聡, 中田秀基

情報処理学会研究報告 2006 ( 20 ) 193 - 198 2006年2月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

光バーストスイッチングネットワークでは、通信を行う前に光パスコネクションを確立し、通信終了後にはコネクションを解放しなければならない。コネクション確立・解放コストは合計して平均10msほど要する。そのため、MPIアプリケーション等、コンピュートインテンシブなアプリケーションで集団通信を実行する際にはコネクション確立・解放のオーバーヘッドが顕著になる。そこで、MPI集団通信において通信発生とは独立してコネクション確立・解放を行うことにより、オーバーヘッドを削減する手法を提案する。本手法ではノードの持つポート数に応じてコネクション確立・解放方法を変え、同時コネクション確立を行い高速実行を実現する。本手法と単純に通信のたびにコネクションを張る方法とで、数値解析によるアルゴリズム単体の比較、およびシミュレータを用いて仮想的に実アプリケーションを実行した場合の比較を行い、本手法の優位性を示した。

CiNii Books

researchmap
レプリカ管理システムを利用したデータインテンシブアプリケーション向けスケジューリングシステム (「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))

町田悠哉, 滝澤真一朗, 中田秀基, 松岡聡

情報処理学会研究報告 2006 ( 20 ) 229 - 234 2006年2月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

グリッド環境において既存のスケジューリングシステムはデータ入出力を共有ファイルシステムや単純なステージング機構を利用して行っている。しかしこれらの手法ではデータ保持ノードはアクセス集中によりパフォーマンスが低下、そして最悪の場合にはハングアップしてしまう。またユーザが同一のデータセットを利用する多数のタスクからなるジョブを実行した場合、スケジューリング後に毎回同じデータをステージングするのは非効率である。そこで本研究ではレプリカ管理とジョブスケジューリングをタイトに結合し、データを効率的に再利用する。プロトタイプシステムとして複数ノードへO(1)の転送時間でデータを複製できるスケーラブルなレプリカ管理システムを利用し、効率的なファイル転送を提供するとともにデータ転送と計算を同時実行するような効率的なスケジューリングを可能にした。評価実験によりプロトタイプシステム上で従来手法よりも効率的なジョブ実行、スループット向上が達成されたことを確認した。

CiNii Books

researchmap
Cyber Science Infrastructure Initiative for Boosting Japan’s Scientific Research

Masao Sakauchi, Shigeki Yamada, Noboru Sonehara Shigeo, Urushidani Jun, Adachi Kazunobu Konishi, Satoshi Matuoka

CTWatch Quarterly Journal 2 ( 1 ) 20 - 26 2006年

　詳細を見る

researchmap
Cyber Science Infrastructure Initiative for Boosting Japan’s Scientific Research

Masao Sakauchi, Shigeki Yamada, Noboru Sonehara Shigeo, Urushidani Jun, Adachi Kazunobu Konishi, Satoshi Matuoka

CTWatch Quarterly Journal 2 ( 1 ) 20 - 26 2006年

　詳細を見る

researchmap
Speculative Checkpointing

Ikuhei Yamagata, Satoshi, Matsuoka, Hidemoto Nakada

Proceedings of DSW `06 1 2006年

　詳細を見る

researchmap
Speculative Checkpointing

Ikuhei Yamagata, Satoshi, Matsuoka, Hidemoto Nakada

Proceedings of DSW `06 1 2006年

　詳細を見る

researchmap
Cyber science infrastructure initiative for boosting Japan's scientific research

Masao Sakauchi, Shigeki Yamada, Noboru Sonehara, Shigeo Urushidani, Jun Adachi, Kazunobu Konishi, Satoshi Matsuoka

CTWatch Quarterly Journal 2 ( 1 ) 20 - 26 2006年

　詳細を見る

researchmap
Cyber science infrastructure initiative for boosting Japan's scientific research

Masao Sakauchi, Shigeki Yamada, Noboru Sonehara, Shigeo Urushidani, Jun Adachi, Kazunobu Konishi, Satoshi Matsuoka

CTWatch Quarterly Journal 2 ( 1 ) 20 - 26 2006年

　詳細を見る

researchmap
光ネットワーク環境におけるMPI集団通信

滝澤真一朗, 松岡聡, 松岡聡, 中田秀基, 中田秀基

情報処理学会シンポジウム論文集 2006 ( 5 ) 2006年

　詳細を見る

J-GLOBAL

researchmap
BS-6-4 高性能ネットワークおよびグリッド技術による次世代の科学技術基盤(BS-6.光バーストスイッチング技術の進展とグリッドネットワーク応用への期待, 通信2)

松岡聡

電子情報通信学会ソサイエティ大会講演論文集 2005 ( 2 ) "S - 60"-"S-61" 2005年9月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

CiNii Books

researchmap
Ninf-1/Ninf-G を用いたNMR蛋白質立体構造決定のための遺伝アルゴリズムのグリッド化

小野功, 水口尚亮, 中島直敏, 小野典彦, 中田秀基, 松岡聡, 関口智嗣, 楯真一

情報処理学会論文誌コンピューティングシステム（ACS） 46 ( 12 ) 396 - 406 2005年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

本論文では，Ono らが提案したNMR 蛋白質立体構造決定のための遺伝アルゴリズム（GA）を，複数のWAN 上のPC クラスタ群から構成されるグリッド上で並列化したシステムを提案し，提案システムの性能評価を行った結果を報告する．提案システムは，マスタ，サブマスタ，ワーカから構成される階層的なマスタ・ワーカ方式を用いて並列化されている．マスタと各PC クラスタ間の通信はセキュアなGridRPC ミドルウェアNinf-G を用いて，また，PC クラスタ内の通信は高速なGridRPCミドルウェアNinf-1 を用いて実現されている．さらに，提案システムでは，Ninf-G によるインターネット上の通信遅延を隠蔽するため，スライド転送手法を導入している．5 サイト/1 196CPU から構成されるグリッドテストベッドで，78 残基からなる蛋白質の立体構造決定問題を用いて，提案システムの性能評価を行った結果，高い並列化効率を示すことが確認された．In this paper, we parallelize the genetic algorithm (GA) for NMR protein three-dimensional structure determination, which has been proposed by Ono et al., on a grid that consists of multiple PC clusters on the WAN and report some results on the performance evaluation of the proposed system. The proposed system is parallelized with the hierarchical master-worker paradigm and consists of a master, submasters and workers. The communication between the master and each PC cluster is realized with Ninf-G, which is a secure GridRPC middleware, and that in each PC cluster is implemented by using Ninf-1, which is a fast GridRPC middleware. In the proposed system, we employ the slide transfer technique in order to hide the latency of communication on the Internet by using Ninf-G. The experimental results on the grid testbed consisting of 5 sites/1,196 CPUs showed that the proposed system effectively utilized computing resources on the grid testbed when it was applied to a problem of determining the three-dimensional structure of a 78-residue protein.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00018402/
Ninf‐1/Ninf‐Gを用いたNMR蛋白質立体構造決定のための遺伝アルゴリズムのグリッド化

小野功, 水口尚亮, 中島直敏, 小野典彦, 中田秀基, 松岡聡, 関口智嗣, 楯真一

情報処理学会論文誌 46 ( SIG12(ACS11) ) 396 - 406 2005年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

本論文では，Ono らが提案したNMR 蛋白質立体構造決定のための遺伝アルゴリズム（GA）を，複数のWAN 上のPC クラスタ群から構成されるグリッド上で並列化したシステムを提案し，提案システムの性能評価を行った結果を報告する．提案システムは，マスタ，サブマスタ，ワーカから構成される階層的なマスタ・ワーカ方式を用いて並列化されている．マスタと各PC クラスタ間の通信はセキュアなGridRPC ミドルウェアNinf-G を用いて，また，PC クラスタ内の通信は高速なGridRPCミドルウェアNinf-1 を用いて実現されている．さらに，提案システムでは，Ninf-G によるインターネット上の通信遅延を隠蔽するため，スライド転送手法を導入している．5 サイト/1 196CPU から構成されるグリッドテストベッドで，78 残基からなる蛋白質の立体構造決定問題を用いて，提案システムの性能評価を行った結果，高い並列化効率を示すことが確認された．In this paper, we parallelize the genetic algorithm (GA) for NMR protein three-dimensional structure determination, which has been proposed by Ono et al., on a grid that consists of multiple PC clusters on the WAN and report some results on the performance evaluation of the proposed system. The proposed system is parallelized with the hierarchical master-worker paradigm and consists of a master, submasters and workers. The communication between the master and each PC cluster is realized with Ninf-G, which is a secure GridRPC middleware, and that in each PC cluster is implemented by using Ninf-1, which is a fast GridRPC middleware. In the proposed system, we employ the slide transfer technique in order to hide the latency of communication on the Internet by using Ninf-G. The experimental results on the grid testbed consisting of 5 sites/1,196 CPUs showed that the proposed system effectively utilized computing resources on the grid testbed when it was applied to a problem of determining the three-dimensional structure of a 78-residue protein.

J-GLOBAL

researchmap
PCクラスタにおけるDVS制御による電力性能の最適化 (2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)--研究会・連続同時開催)

堀田義彦, 佐藤三久, 木村英明, 朴泰祐, 高橋大介, 松岡聡

情報処理学会研究報告 2005 ( 80 ) 49 - 54 2005年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

近年, 高性能プロセッサにおいても動的に駆動電圧・動作周波数を変更することで消費電力を削減する機構であるDVS(Dynamic Voltage Scaling)を搭載するプロセッサが増えてきている.プログラムの動作特性に応じて周波数を制御することにより, 消費電力の削減が可能である.PCクラスタの並列アプリケーションにおいては, 通信時に周波数を下げるなどDVSの機能を有効に利用することで, 性能を下げることなく低電力化することが期待できる.本稿では, アプリケーションの実行プロファイルと消費電力の動的な観測に基づき, アプリケーション実行時の計算時や通信時などのフェーズ毎に周波数・電圧の最適化制御を行う手法を提案する.いくつかの周波数で実行した結果を元に, フェーズにおける最適な周波数の選択を行う.本稿では, 通信と計算のフェーズに注目し, いくつかの並列プログラムにおいて, 本手法により電力削減の可能性についての評価実験を行った.DVSを実装しているプロセッサを使用したクラスタを構築し, 実験を行った結果, 定格周波数での動作と比べて最大で約30%のED積の改善ができる可能性があることがわかった.

CiNii Books

researchmap
レプリカ管理システムを利用したデータインテンシブアプリケーション向けスケジューリングシステム

町田悠哉, 滝澤真一朗, 中田秀基, 松岡聡

電子情報通信学会技術研究報告. CPSY, コンピュータシステム 105 ( 226 ) 67 - 72 2005年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

グリッド環境において既存のスケジューリングシステムはデータ入出力を共有ファイルシステムや単純なステージング機構を利用して行っている。しかしこれらの手法ではデータ保持ノードはアクセス集中によりパフォーマンスが低下、そして最悪の場合にはハングアップしてしまう。またユーザが同一のデータセットを利用する多数のタスクからなるジョブを実行した場合、スケジューリング後に毎回同じデータをステージングするのは非効率である。そこで本研究では複数ノードへO(1)の転送時間でデータを複製できるスケーラブルなレプリカ管理システムをステージング機構として利用し、レプリカを再利用するような効率的なスケジューリングを可能とするシステムを提案する。プロトタイプシステム上でサンプルアプリケーションを実行したところ従来の共有ファイルシステムやステージング機構を利用したものより高い性能が確認できた。

CiNii Books

researchmap
カスタマイズ可能な仮想計算機上におけるグリッドでのジョブ実行

山形育平, 青木孝文, 高宮安仁, 中田秀基, 松岡聡

電子情報通信学会技術研究報告. CPSY, コンピュータシステム 105 ( 225 ) 13 - 18 2005年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

近年グリッドでは、ユーザーが投入するジョブが多様化しており、それに伴いユーザーの求める実行環境も多様化している。しかし、すべてのサイトでユーザーの求める実行環境が提供されているとは限らない。そこで我々は仮想計算機とユーザーがカスタマイズ可能なインストレーション機構を組み合わせ、ユーザーがジョブ実行環境を容易に構築できるシステムを提案する。提案システムでは、ユーザは所望の実行環境を指定して、リモートジョブ起動機構GRAMを利用してジョブの投入を行う。計算機資源は、カスタマイズ可能なインストレーション機構であるLucie[5]を用いて動的に仮想計算機内に実行環境の構築を行い、そこでユーザのジョブを実行する。このシステムを評価した結果、既存の計算機環境に影響を与えないジョブの実行が可能であった。環境構築時間も一般的なグリッドジョブの実行時間と比べて許容範囲であることを確認し、本研究の有効性を確認した。

CiNii Books

researchmap
更新やカスタマイズが可能なクラスタ設定のパッケージ化手法

高宮安仁, 栄純明, 山形育平, 松岡聡

電子情報通信学会技術研究報告. CPSY, コンピュータシステム 105 ( 225 ) 19 - 24 2005年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

クラスタ用自動インストーラの有用性が広く知られる一方, 依然として一般のユーザに普及していない主因として, クラスタ設定のカスタマイズにはシステム内部に関する知識が要求される点やインストールするパッケージの選択が初心者にとって難しいことが考えられる.近年提案された手法ではこうした問題をある程度解決しているものの, 詳細な設定が依然として難しい点や設定のパッケージ化には専門的知識を必要とする点などがある.そこで, 我々はメタパッケージと呼ばれる概念を導入し, クラスタ上である機能を実現するパッケージ群および設定ファイルをひとつのパッケージとしてパッケージ化し, インストール処理中でのファーストクラスエンティティとして扱う手法を提案する.また, メタパッケージと共に提供されるツール群によってインストール性能や記述力を損なうことなくメタパッケージを柔軟に, 依存関係を厳密に扱いつつ, エンドユーザによって容易にカスタマイズ可能にできることを示す.また, 我々の自動クラスタインストーラであるLucie上にメタパッケージの機能を実装することによってその有用性を確認する.実験では, 必要なメタパッケージを選択するだけで適当な依存性や衝突関係のチェックが行われ, インストール自体が5-6分といった従来ツールよりも短い時間で完了することを確認した.設定内容の低レベルデバッグにおいても, メタパッケージのサポートツールを用いることに寄ってリスト中から必要なクラスタ機能を選択し, 起こりうる衝突関係の情報を取得しこれを解決することで, 初心者でもクラスタを1時間以内に構築できることを期待する.

CiNii Books

researchmap
仮想計算機を用いて負荷分散を行うMPI実行環境

立薗真樹, 中田秀基, 松岡聡

電子情報通信学会技術研究報告. CPSY, コンピュータシステム 105 ( 225 ) 7 - 12 2005年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

長時間に及ぶ実行や遊休計算機上での実行などにおいては、各計算機間の負荷分散が重要である。我々は仮想計算機を用いた負荷分散可能なMPI実行環境を提案する。これはMPI実行環境を仮想計算機ごとマイグレーションさせることにより、MPIプロセスに透過的なマイグレーションを実現する。仮想計算機としてXen[8]を用い、同計算機が持つマイグレーション機能を用いたプロトタイプを実装した。さらに、VPNを用いたネットワークの仮想化によって、異なるサブネットへのマイグレーションを実現した。同プロトタイプを評価した結果、MPI実行時マイグレーションが可能かつ、仮想化によるオーバーヘッドは10%から、通信の頻繁なものでは50%超えることが分かった。また、同プロトタイプに負荷分散アルゴリズムを実装し、長時間実行されるジョブにおいて実行効率の向上を確認し、本提案の有効性を確認した。

CiNii Books

researchmap
OGSAアーキテクチャに基づくNAREGIスーパースケジューラの設計と実装

畑中正行, 中野恭成, 井口裕次, 大野利男, 佐賀一繁, 秋岡明香, 中田秀基, 松岡聡

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 102 ( 57 ) 33 - 38 2005年6月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

本稿では、OGSA-EMSのサービス・アーキテクチャに沿ったNAREGIスーパースケジューラの設計と実装について述べる。NAREGIスーパースケジューラの実装をとおしてOGSA-EMSアーキテクチャの実現可能性を確認すると同時に、ヘテロかつ多数台の計算資源を要求するMPI並列ジョブの自動資源割当におけるOGSA-EMS仕様の問題点を明確化するとともにそれを解決するOGSA-EMS構成要素への拡張を提案する。

CiNii Books

researchmap
ユーザのステアリングを許すインタラクティブなジョブスケジューリングシステム

飯野彰子, 中田秀基, 下平英寿, 松岡聡

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 102 ( 57 ) 39 - 44 2005年6月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

複数のジョブから構成されるワークフローを、グリッド上でバッチ的に実行する研究は多くなされている。しかし、アプリケーションユーザの持つジョブの中には、基本的にはワークフロー的な構造を持つものの、各ジョブの実行においてユーザからの操作が不可欠なものも少なくない。このようなジョブは既存のワークフロー機構で実行することは難しい。我々は、基本的にはワークフローに従った処理をしつつも、ユーザからの入力が不可欠な場面ではユーザに操作の要求を行う、ワークフロージョブスケジューリングシステムを開発した。ワークフローシステムのベースとしては、CondorのDAGManを用いた。このDAGManの機構を利用して、ユーザからのステアリングを受け付ける機構を実装した。また、本システムを系統樹推定問題に適用し、有効性を確認した。

CiNii Books

researchmap
大学における情報化戦略と理工系情報学科の貢献

岩野和生, 徳田英幸, 松岡聡, 村上和彰, 西村吉雄, 米崎直樹, Kazuo Iwano, Hideyuki Tokuda, Satoshi Matsuoka, Kazuaki Murakami, Yoshio Nishimura, Naoki Yonezaki, 日本IBM株式会社:大和ソフトウェア開発研究所, 慶應義塾大学政策・メディア研究科環境情報学部, 九州大学情報基盤センター大学院システム情報科学研究院情報理学部門, 東京工業大学情報理工学研究科計算工学専攻:理工系情報学科協議会, Software Development Laboratory:IBM Japan Ltd., Graduate School of Media and Governance Faculty of Environmental Information Keio University, Global Scientific Information and Computing Center Tokyo Institute of Technology, Department of Informatics Graduate School of Information Science and Electrical Engineering Kyushu University, Department of Computer Science Graduate School of Information Science and Engineering Tokyo Institute of Technology

コンピュータソフトウェア 22 ( 2 ) 1 - 20 2005年4月

　詳細を見る

記述言語：日本語出版者・発行元：日本ソフトウェア科学会

DOI： 10.11309/jssst.22.2_1

CiNii Books

researchmap
グリッド上での遺伝アルゴリズムによるNMR蛋白質立体構造解析

小野功, 水口尚亮, 中島直敏, 松原彬光, 小野典彦, 中田秀基, 松岡聡, 関口智嗣, 楯真一

電気学会全国大会講演論文集 2005 ( 3 ) 3.S18(11)-3.S18(14) 2005年3月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
グリッド環境におけるモニタリングシステムの自律的構成

白勢健一郎, 松岡聡, 中田秀基

情報処理学会研究報告. ARC,計算機アーキテクチャ研究会報告 162 ( 19 ) 1 - 6 2005年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

グリッド環境での計算機資源のモニタリングは、効率の良い自動的な資源配分やグリッド環境の把握などに必要である。しかし、依存関係を持つ多数の構成要素から成り立っているため、その運用を人間の作業のみで行うのは限界がある。本研究では標準化団体の提案するモニタリングシステムのアーキテクチャに基づき、個々の構成要素が分散アルゴリズムなどを用いて自律的に設定やその更新を行うモデルを提案する。提案に基づいて既存のモニタリングシステムを対象にした管理機構を試作した。テストベッド環境の14個のPCクラスタのログインノードへの初期設定を10分程度で行い、障害修復の機能が動作することを確認した。

CiNii Books

researchmap
ポータブルな耐故障性コンポーネントフレームワークを持つMPI実装に向けて(通信ライブラリ, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))

實本英之, 松岡聡

情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 2005 ( 19 ) 193 - 198 2005年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

クラスタの信頼性の低さから, 並列, 広域化に広く用いられるMPIにおいても, 耐故障性を備えたものが作らた. しかしそれらは環境ごとに変わるFault/Recovery Modelを考慮した物が少なく, 考慮した物も, 状況に応じた復旧手段をコード中に記述する必要がありユーザーの負担が多い. 本研究では環境に合わせたFault/Recovery Modelを容易に用いることが可能なMPIを提案する. Fault/Recovery Modelをコンポーネントとして提供することにより, ユーザーはコンポーネントを選択するだけで, 環境に最適な耐故障性MPIを用いることが可能となる. ナイーブなMPIであるMPICHにFault/Recovery Model Awareな耐故障性を実装し, 東工大松岡研PrestoIIIクラスタ上においてNPB-CGによるベンチマークを行った. 結果, オリジナルのMPICHに比べ最大10%程度の性能向上がみられた.

CiNii Books

researchmap
非対称ネットワークを隠蔽する高速通信インフラストラクチャの設計と実装 (「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))

濱野智行, 中田秀基, 松岡聡

情報処理学会研究報告 2005 ( 19 ) 85 - 90 2005年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

グリッド環境で問題となっている非対称ネットワークを扱う研究は数多く存在するが、十分な接続性とグリッド環境に適したセキュリティ・サイトポリシ非依存性・高通信性能を達成するものは存在しない。そこで、非対称ネットワークを隠蔽し、それを意識せず通信可能であり、グリッド環境に適した通信インフラストラクチャを提案する。また、そのプロトタイプJRouterを実装し、それを用いて実際のグリッド環境でその性能評価を行った。その結果、接続性・セキュリティ・サイトポリシ非依存性において十分な性能であるが、通信性能において十分とは言えないという結論に至ったため、更なる性能向上のための施策について考察を行った。

CiNii Books

researchmap
高性能計算のための低電力・高密度クラスタMegaProto (「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))

中島浩, 中村宏, 佐藤三久, 朴泰祐, 松岡聡, 高橋大介, 堀田義彦

情報処理学会研究報告 2005 ( 19 ) 121 - 126 2005年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

DOI： 10.1109/IPDPS.2005.278

Scopus

CiNii Books

J-GLOBAL

researchmap
グリッド環境におけるスーパースケジューラ連携手法の検討 (「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))

秋岡明香, 竹房あつ子, 中田秀基, 松岡聡, 三浦謙一

情報処理学会研究報告 2005 ( 19 ) 55 - 60 2005年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

グリッド環境において効果的な負荷分散を実現するために、従来からスーパースケジューラの利用が提案されてきた。しかし、グリッド環境にスーパースケジューラが複数存在する場合の挙動は充分な検討がされていない。本稿では、スーパースケジューラの連携手法とその効果について、グリッドシミュレータを用いて検討した。その結果、複数のスーパースケジューラが単独で機能するよりも、階層構造や分散ネットワークを構成して協調することで、アプリケーションの実行待ち時間を短縮し、グリッド計算資源の利用効率を高めることを確認した。さらに、スーパースケジューラが階層構造を構成する場合と分散ネットワークを構成する場合について、利点と欠点を確認した。

CiNii Books

researchmap
ファイルへのアクセスの自動分散を行うグリッド用分散ファイルシステム

佐藤仁, 松岡聡, 中田秀基

情報処理学会研究報告. ARC,計算機アーキテクチャ研究会報告 162 ( 19 ) 7 - 12 2005年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

HPCクラスタやグリッドなどの並列計算環境では, アプリケーションによっては, ファイルを保持するノードへのアクセス集中が発生し, 実行性能の低下が問題となる. 既存の分散ファイルシステム上でこのようなアクセス集中を避けるためには, ユーザがアプリケーションの作成時や実行時に明示的にファイルアクセスの分散を行うことが必要となるが, 環境が不均質であるグリッドではこのような対応は困難であり負担が大きい. 我々は, ファイルシステム側でアクセスの集中を検知し, ファイル複製を積極的に利用して, ファイルへアクセスを分散する手法を提案する. 本稿では, グリッドファイルシステムであるGfarmを用いてファイルへのアクセスが集中する例, 理想的なアクセスパターンの例について検証を行った. また, 提案手法をGfarmに実装したプロトタイプを用いて, ファイルへのアクセスの自動分散の有効性を確認した.

CiNii Books

researchmap
MegaProto: 1 TFlops/10kW rack is feasible even with only commodity technology

Hiroshi Nakashima, Hiroshi Nakamura, Mitsuhisa Sato, Taisuke Boku, Satoshi Matsuoka, Daisuke Takahashi, Yoshihiko Hotta

Proceedings of the ACM/IEEE 2005 Supercomputing Conference, SC'05 2005 2005年

　詳細を見る

記述言語：英語

DOI： 10.1109/SC.2005.45

Scopus

J-GLOBAL

researchmap
ファイルへのアクセスの自動分散を行うグリッド用分散ファイルシステム

佐藤仁, 松岡聡, 中田秀基

コンピュータシステム・シンポジウム 2005 91 - 98 2005年

　詳細を見る

researchmap
Low Power Computing for Fleas, Mice, and Mammoth ? Do They Speak the Same Language ?

Satoshi Matsuoka

CTWatch Quarterly Journal 1 ( 3 ) 2月11日 2005年

　詳細を見る

researchmap
GridRPCシステムNinf-GにおけるUNICOREおよびGT4によるジョブ起動

中田秀基, 田中良夫, 関口智嗣

情報処理学会研究報告 2005-HPC-102 45 - 50 2005年

　詳細を見る

researchmap
非対称ネットワークを隠蔽する高速通信インフラストラクチャの設計と実装

濱野智行, 中田秀基, 松岡聡

インターネットコンファレンス論文集 2005 36 - 42 2005年

　詳細を見る

記述言語：日本語出版者・発行元：インターネットコンファレンス実行委員会

CiNii Books

researchmap
The Titech Grid ～Can a Center Sustain a Large Production Grid on Campus? ～History, Lessons Learned, and the Future～

Satoshi Matsuoka

4 ( 2 ) 17 - 27 2005年

　詳細を見る

researchmap
Primary Study of A Task Farming API over The GridRPC Framework

Yusuke Tanimura, Hidemoto, Nakada, Yoshio Tanaka, Satoshi Sekiguchi

Eighth International Conference on High-Performance Computing in Asia-Pacific Region, 2005 2005 339 - 345 2005年

　詳細を見る

DOI： 10.1109/HPCASIA.2005.78

J-GLOBAL

researchmap
Design and implementation of Condor-UNICORE bridge

Hidemoto Nakada, Jaime Frey, Motohiro Yamada, Yasuyoshi Itou, Yasumasa Nakano, Satoshi Matsuoka

Eighth International Conference on High-Performance Computing in Asia-Pacific Region, Proceedings 307 - 314 2005年

　詳細を見る

記述言語：英語

DOI： 10.1109/HPCASIA.2005.32

Web of Science

J-GLOBAL

researchmap
Ninf-1/Ninf-Gを用いたNMR蛋白質立体構造決定のための遺伝アルゴリズムのグリッド化

小野功, 水口尚亮, 中島直敏, 小野典彦, 中田秀基, 松岡聡, 関口智嗣, 楯真一

先進的計算基盤システムシンポジウム SACSIS2005 143 - 152 2005年

　詳細を見る

researchmap
Megaproto: A low-power and compact cluster for high-performance computing

Hiroshi Nakashima, Hiroshi Nakamura, Mitsuhisa Sato, Taisuke Boku, Satoshi Matsuoka, Daisuke Takahashi, Yoshihiko Hotta

Proceedings - 19th IEEE International Parallel and Distributed Processing Symposium, IPDPS 2005 2005 2005年

　詳細を見る

記述言語：英語

DOI： 10.1109/IPDPS.2005.278

Scopus

J-GLOBAL

researchmap
Low Power Computing for Fleas, Mice, and Mammoth ? Do They Speak the Same Language ?

Satoshi Matsuoka

CTWatch Quarterly Journal 1 ( 3 ) 2005年

　詳細を見る

researchmap
インタラクティブなジョブスケジューリングシステム

飯野彰子, 中田秀基, 中田秀基, 下平英寿, 松岡聡, 松岡聡

情報処理学会シンポジウム論文集 2005 ( 5 ) 2005年

　詳細を見る

J-GLOBAL

researchmap
The Titech Grid ～Can a Center Sustain a Large Production Grid on Campus? ～History, Lessons Learned, and the Future～

Satoshi Matsuoka

4 ( 2 ) 17 - 27 2005年

　詳細を見る

researchmap
Primary Study of A Task Farming API over The GridRPC Framework

Yusuke Tanimura, Hidemoto, Nakada, Yoshio Tanaka, Satoshi Sekiguchi

Eighth International Conference on High-Performance Computing in Asia-Pacific Region, 2005 2005 339 - 345 2005年

　詳細を見る

DOI： 10.1109/HPCASIA.2005.78

J-GLOBAL

researchmap
耐故障性を重視したRPCシステムNinf - C の設計と実装

中田秀基, 田中良夫, 松岡聡, 関口智嗣

情報処理学会論文誌コンピューティングシステム（ACS） 45 ( 11 ) 160 - 170 2004年10月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

耐故障性を重視したRPCシステムNinf-Cの設計と実装に関して述べる．Ninf-Cは，全体として数日から数カ月を要する大規模なマスタワーカ型計算を安定して実行することを目的としたシステムで，ウィスコンシン大学で開発されたスケジューリングシステムCondorの提供する機能を利用することで，マスタを含むシステム全体に耐故障性を持たせている．Ninf-CのRPCは，Condorのファイルステージ機能を用いて実現される．直接ソケット通信を使用せずにファイル経由で通信を行うことで，マスタとワーカのチェックポイントをとることを可能とした．また，ファイルに残った通信記録を用いてマスタの状態を復元する．さらに，Condor-Gを利用することで，Globusによって構築されたグリッド環境下での運用も可能である．Ninf-Cの有効性を確認するため，クラスタ環境で簡単なマスタワーカ型プログラムを長時間実行した．この際，マスタおよびワーカを実行しているマシンをシャットダウンするといった人為的な外乱をあたえたが，プログラムは19時間かけて問題なく実行を終了し，Ninf-Cの耐故障性が実証された．In this paper, we describe design and implementation of a fault tolerant RPC system, Ninf-C. Ninf-C is designed for large-scale master-worker programs, that take from a few days to a few months for its execution. Ninf-C takes Condor, developed by University Wisconsin, as the base structure of the system. It uses file transmission and checkpointing mechanisms and provides system-wide robustness for programmers. In Ninf-C, master and workers communicate each other using file, not the socket, making crash-recovery easy. To prove robustness of the system, we performed an experiment on a heterogeneous cluster consisted of x86 and SPARC. We ran a simple but long-running master-worker program on the cluster and rebooted several machines of the cluster to disturb the program execution. As a result, the program execution finished normally, showing the robustness of Ninf-C.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00018447/
耐故障性を重視したRPCシステムNinf‐Cの設計と実装

中田秀基, 田中良夫, 松岡聡, 関口智嗣

情報処理学会論文誌 45 ( SIG11(ACS7) ) 160 - 170 2004年10月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

耐故障性を重視したRPCシステムNinf-Cの設計と実装に関して述べる．Ninf-Cは，全体として数日から数カ月を要する大規模なマスタワーカ型計算を安定して実行することを目的としたシステムで，ウィスコンシン大学で開発されたスケジューリングシステムCondorの提供する機能を利用することで，マスタを含むシステム全体に耐故障性を持たせている．Ninf-CのRPCは，Condorのファイルステージ機能を用いて実現される．直接ソケット通信を使用せずにファイル経由で通信を行うことで，マスタとワーカのチェックポイントをとることを可能とした．また，ファイルに残った通信記録を用いてマスタの状態を復元する．さらに，Condor-Gを利用することで，Globusによって構築されたグリッド環境下での運用も可能である．Ninf-Cの有効性を確認するため，クラスタ環境で簡単なマスタワーカ型プログラムを長時間実行した．この際，マスタおよびワーカを実行しているマシンをシャットダウンするといった人為的な外乱をあたえたが，プログラムは19時間かけて問題なく実行を終了し，Ninf-Cの耐故障性が実証された．In this paper, we describe design and implementation of a fault tolerant RPC system, Ninf-C. Ninf-C is designed for large-scale master-worker programs, that take from a few days to a few months for its execution. Ninf-C takes Condor, developed by University Wisconsin, as the base structure of the system. It uses file transmission and checkpointing mechanisms and provides system-wide robustness for programmers. In Ninf-C, master and workers communicate each other using file, not the socket, making crash-recovery easy. To prove robustness of the system, we performed an experiment on a heterogeneous cluster consisted of x86 and SPARC. We ran a simple but long-running master-worker program on the cluster and rebooted several machines of the cluster to disturb the program execution. As a result, the program execution finished normally, showing the robustness of Ninf-C.

J-GLOBAL

researchmap
クラスタ設定のパッケージ化の設計と実装

高宮安仁, 松岡聡

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 99 ( 81 ) 55 - 60 2004年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

本研究は,自動インストーラが一般のユーザに普及しない主因が設定の困難さにあると考え,典型的なインストーラ設定のテンプレートをパッケージ化・ネットワーク配布し,これをエンドユーザがカスタマイズ用フロントエンドを通じてカスタマイズすることによって,ローカルサイトごとに用いる設定ファイルを自動生成することを試みた.また,ソフトウェアパッケージ管理システムのデータベース情報と自動インストーラの機能を利用することで,設定ファイル中に起こるインストール対象のソフトウェアパッケージ同士の衝突の高速な解決を試みた.このほか,テンプレートパッケージ開発者支援機構として,同データベースを用いてパッケージ化されたソフトウェア同士の依存関係の問題点を指摘する仕組みや,カスタマイズ用フロントエンド定義の自動生成などの,パッケージ作成支援機能を提供した.

CiNii Books

researchmap
グリッド上のスケーラブルな並列レプリケーションフレームワーク

滝澤真一朗, 高宮安仁, 中田秀基, 松岡聡

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 99 ( 81 ) 247 - 252 2004年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

グリッド環境におけるデータレプリケーション手法として,レプリカ管理とデータ転送の集約およびマルチキャスト転送を利用し,複数サイト間の巨大データの効率的なレプリケートを可能とする,並列レプリケーションフレームワークを提案する.レプリカ情報を集中管理するレプリカ管理サービス,およびデータ要求元に応じて複数レプリカの中から最適なレプリカを選択し,同時並列ファイル転送ツールであるDolly+による高速ファイル転送を行うレプリケーションサービスからなるプロトタイプを実装した.遠隔データサイトに複数クラスタが接続された実際のデータグリッド環境においてプロトタイプの評価を行った結果,ノード数の増加によらずほぼ一定時間内にレプリケーションを完了し,クラスタ内でキャッシュを管理する単純な手法よりも優れたスケーラビリティを示した.

CiNii Books

researchmap
ポータビリティの高いジョブスケジューリングシステム設計と実装

町田悠哉, 中田秀基, 松岡聡

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 99 ( 81 ) 217 - 222 2004年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

グリッド環境に存在する不安定性と非均質性という2つの特徴に対応したジョブスケジューリングシステムJayについて述べる.Jayはウィスコンシン大学で開発されたスケジューリングシステムCondorの構造をベースとし,ポータビリティを高めるためJavaで実装を行った.ここでJavaにはプロセスのユーザIDを安全に変更する手法がないという問題が生じたが,JNIをサポートしていないJava環境においても稼働するようなポータブルなC++デーモンを開発することでこの問題に対処した.小規模環境における評価実験により,本システムが耐故障性と高いポータビリティを備えていることが示ざれた.

CiNii Books

researchmap
Omni/SCASH における性能不均質なクラスタ向け動的負荷分散機能の実装と評価

栄純明, 松岡聡, 佐藤三久, 原田浩

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 99 ( 81 ) 61 - 66 2004年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

HPCの分野に限らず様々な分野でPC/WSを構成単位とするコモディティクラスタが重要なプラットフォームになっている.コモディティクラスタ環境では,プロセッサ技術の急速な進歩,ユーザニーズ,予算上の都合など様々な理由によりノード間に性能の不均-性が生じるケースが増加している.これはロードインバランスの原因のひとつであり,何らかの動的負荷分散機能が必要とされている. これまでに動的負荷分散を実現する実行時性能に基づくループ再分割機能をOmni/SCASHに実装したが,データアクセス範囲の変化を伴うため,データのローカリティが性能に大きな影響を持つようなアプリケーションでは性能低下がみられるケースがあった.本論文では新たに実装したページ参照数に基づくページマイグレーション機能とループ再分割機能と組み合わせた場合の性能に関して報告する.評価の結果,単体でLaplaceを4ノードで実行した際に60%程度の性能向上がえられ,ループ再分割と組み合わせることでデータアクセス範囲の変化による性能低下を改善できることを示した.

CiNii Books

researchmap
PCクラスタ向け故障発生器の設計と実装

丸山直也, 松岡聡

電子情報通信学会技術研究報告. DC, ディペンダブルコンピューティング 104 ( 239 ) 25 - 30 2004年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

PCクラスタ上の故障をソフトウェアにより再現可能な故障発生器であるCFIについて,その設計・実装を報告する.CFIは耐故障性研究のテストベッド環境の構築を目標としたものであり,実際にクラスタ環境で故障が発生した時のシステム・アプリケーションの挙動を体系的に調査することを可能にする.CFIは,ネットワークリンクの故障をソフトウェア的に発生させるLinuxカーネルモジュールとその制御ツールから構成され,ユーザが記述した故障シナリオに基づいてクラスタ全体またはその一部に故障を発生させる.本論文では,CFIを用いた場合のネットワーク性能,アプリケーション性能を評価し,CFIによるオーバーヘッドが十分小さいことを確認し,CFIの有効性を示した.

CiNii Books

researchmap
Speculative チェックポインティングの設計と実装

山形育平, 實本英之, 中田秀基, 松岡聡

電子情報通信学会技術研究報告. DC, ディペンダブルコンピューティング 104 ( 239 ) 31 - 36 2004年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

並列プロセスでの同期チェックポインティングでは,チェックポイントを単一レポジトリに保存する時にディスクI/Oの負荷が時間的に集中する.本研究ではこれを解決する方法として,インクリメンタルチェックポインティングを改善した投機的チェックポインティングを提案する。これはチェックポインティングの合間にページ更新予測に基づく投機的なチェックポインティングを行うことによりチェックポインティングのタイミングを分割させ,ディスクI/O負荷を分散させるものである.また,このプロトタイプとして,逐次プロセスの投機チェックポインタを実装した.これを使用し,並列環境での評価を行なった.その結果,投機的チェックポインティングを実装したものは実装していないものと比較して最大33%チェックポイント時間の削減効果が観測され,投機的チェックポインティングの有効性が示された.

CiNii Books

researchmap
耐故障性を重視したRPCシステムNinf‐Cの設計と実装

中田秀基, 田中良夫, 松岡聡, 関口智嗣

情報処理学会シンポジウム論文集 2004 ( 6 ) 77 - 84 2004年5月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
光ネットワークによるグリッドの未来 : 光ネットワーク時代のグリッド

松岡聡

電子情報通信学会技術研究報告. PN, フォトニックネットワーク 104 ( 1 ) 1 - 4 2004年4月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

高性能計算を実現する将来の科学技術計算用のグリッドインフラは、広帯域および低レーテンシを提供する光ネットワークの存在が欠かせない。本講演では、最近の広帯域ネットワークを擁した大規模なグリッドのプロジェクトを紹介し、さらにpeer-to-peerの光ネットワークを前提とした将来のグリッド像に言及する。

CiNii Books

researchmap
Jojo による遺伝的プログラミングの並列化

徳田拓, 田中康司, 中田秀基, 松岡聡

情報処理学会研究報告. ARC,計算機アーキテクチャ研究会報告 157 ( 20 ) 187 - 192 2004年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

遺伝子間相互作用ネットワーク推定問題とは,遺伝子の発現量データ系列から複数の遺伝子間における制御関係を推測するものである.この相互関係は,非線形連立微分方程式によって表現される.これまで,遺伝子間相互作用ネットワーク推定は,S-system表記の微分方程式を用いたものが一般的であったが,S-system表記の微分方程式は質量作用則表記の近似式であり,遺伝子間の具体的な相互関係を推定することが困難であった.本稿では,質量作用則に基づいた非線形連立微分方程式表記を採用し,進化的計算の一手法である遺伝的プログラミングを用いて,データ系列から相互作用を示す関数を自動推定するシステムを設計・実装した.このシステムより,与えたデータ系列を再現する微分方程式を得ることができた.また,グリッド環境でJavaプログラミングを支援する並列実行環境Jojoを用いて並列化し,実行時間を短縮することができた.

CiNii Books

researchmap
グリッド環境におけるVM上でのジョブ実行の検討

小倉章嗣, 河野健二, 松岡聡, 中田秀基

情報処理学会研究報告. ARC,計算機アーキテクチャ研究会報告 157 ( 20 ) 25 - 30 2004年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

グリッド上で利用される計算機において、ユーザの権限に応じた、適切で細粒度な各種内部リソースヘのアクセス制御を行うために、プロセスの仮想化手法を用いる近年複数提案されているが、個々の手法のコストは、対象となるアプリケーションの性質やアクセスポリシによって異なり、かつ制御を行う有効性自身も未解決である。そこで、アプリケーションの性質やポリシによって仮想化手法を選択し、常に低オーバヘッドな仮想化を実現する手法を提案し、かつそれぞれの手法の適用性を実際のグリッド上で選択されるクラスタノード上の種々のベンチマークを通じて検証する。作成したプロトタイプはGlobus Toolkit2.4を用いてユーザとポリシに基づいて仮想化手法を選択し、ジョブマネージャの一つとして仮想化環境内でジョブを起動する。NPB2.4ベンチマークによる結果では、適切な仮想化手法を用いることでオーバーヘッドを最小にすることが可能で、かつ通信を頻繁に行なうアプリケーションではライブラリコールの仮想化が最適であり、複数プロセスの仮想化にはカーネルモジュールを用いたシステムコールの仮想化が最適でるなどの詳細な指針を得た。

CiNii Books

researchmap
グリッド技術を用いた進化系統樹推定の並列化

山本洋, 中田秀基, 下平英寿, 松岡聡

情報処理学会研究報告. ARC,計算機アーキテクチャ研究会報告 157 ( 20 ) 181 - 186 2004年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

進化系統樹の推定では最尤法を用いた手法が最も優れた推定法の1つとされているが、最尤法の計算量は大きく、種の個数が増えると系統樹の個数は莫大となるため全系統樹の尤度を求めることは事実上不可能となる。系統樹の構成要素であるスプリットの尤度を最尤法によって計算し、スプリットの尤度を用いた行列計算によって系統樹の尤度を近似計算する手法が提案されている。しかし、種の個数がさらに増大すると、近似計算であってもすべての系統樹に対して行うことは困難になる。本研究では、系統樹の推定を系統樹空間における探索問題とみなし、最適化手法を適用することで、近似計算の対象となる系統樹の個数を削減する。また、グリッドミドルウェアを用いたマスタ・ワーカ方式を採用し、尤度計算および最適化手法の並列実行を可能にした。生物9種の系統樹推定において16ワーカを用いた結果、64.0倍の性能向上が得られた。

CiNii Books

researchmap
Condor の汎用グリッドインターフェイスの設計とUNICOREへの適用

中田秀基, Frey Jaime, 山田基弘, 伊藤泰善, 中野恭成, 松岡聡

情報処理学会研究報告. ARC,計算機アーキテクチャ研究会報告 157 ( 20 ) 37 - 42 2004年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

本稿では、Condorシステムにおける、汎用の外部グリッドシステムヘのインターフェイス機構の設計および実装に関して述べる。Condorシステムは特定の外部グリッドシステムに対するインターフェイスを持っているが、これを使用するにはCondorシステム内部の変更が必要になり、新たな外部グリッドシステムのサポートを追加することが難しかった。われわれは、任意の外部グリッドシステムヘのインターフェイスを容易に構築するための汎用インターフェイスを設計し、この問題を解決した。さらに、この汎用インターフェイスを用いて、UNICOREシステムを外部グリッドシステムとして利用するブリッジを実装し、汎用インターフェイスによる手法の有効性を確認した。

CiNii Books

researchmap
我が国におけるグリッドコンピューティングプロジェクト(<特集>大規模計算機シミュレーション特集号)

下條真司, 関口智嗣, 三浦謙一, 松岡聡

システム／制御／情報 48 ( 7 ) 244 - 249 2004年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人システム制御情報学会

DOI： 10.11509/isciesci.48.7_244

CiNii Books

researchmap
超低電力メガスケールシステムのプロトタイプ : MegaProto

中島浩, 中村宏, 佐藤三久, 朴泰祐, 松岡聡

情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 96 ( 102 ) 85 - 90 2003年10月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

本報告では「低電力化とモデリング技術によるメガスケールコンピューティング」プロジェクトにて開発中のプロトタイプシステムMegaProtの仕様について述べる.MegaProtoは本プロジェクトの基本方針である,低電力プロセッサの高密度実装による価格性能比や電力・面積性能比に優れた超大規模並列システム構築技術を具現化するものである.また同時に,プロジェクトで開発中の低電力化コンパイル技術,高信頼・高性能ネットワーク技術,高信頼クラスタ構築技術,多重並列プログラミング技術などを実証するためのプラットフォームとしても機能する.MegaProtoは19インチラックに搭載可能な1Uサイズのクラスタユニットを単位として構成され,一つのユニットには16個の低電力プロセッサと,それらを結合するプロセッサあたり2Gbpsの高バンド幅ネットワークが搭載される.ユニットあたりのピーク性能14.4GFlops,ユニット内およびユニット間のネットワークバンド幅はそれぞれ32Gbps,8Gbpsであり,これを300W以下の消費電力で達成することにより,高密度・低消費電力・高性能を同時に実現する構成となっている.

CiNii Books

researchmap
GridRPCを用いたタスクファーミングAPIの試作

中田秀基, 田中良夫, 松岡聡, 関口智嗣

情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 96 ( 102(HPC-96) ) 61 - 66 2003年10月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

タスクファーミングとは、大量の同じタスクを異なるパラメータで、複数の計算機で実行することである。このタスクファーミングの実行手段のひとつとしてGridRPCがある。GridRPCはグリッド上のミドルウェアであり、いくつかのアプリケーションの実装を通してその有効性が確認されている。しかし、GridRPC APIは簡潔さを旨に設計されているため、耐故障性やスケジューリングなどの機能を持たず、アプリケーションプログラマの負担となっている。本稿では、GridRPC API上に構築したタスクファーミングAPIの設計と実装について述べる。本APIはマスタ・ワーカ型の計算を支援することを意図して設計されており、再実行による耐故障性とセルフスケジューリングを実現する。また、タスクファーミングAPIを用いたプログラム例を示す。

CiNii Books

J-GLOBAL

researchmap
グリッドコンピューティングの現状と未来

中田秀基, 松岡聡

計算数理工学レビュー 2003 ( 1 ) 9 - 12 2003年10月

　詳細を見る

記述言語：日本語出版者・発行元：日本計算数理工学会

researchmap
Lucie：大規模クラスタに適した高速セットアップ・管理ツール

高宮安仁, 真鍋篤, 松岡聡

情報処理学会論文誌コンピューティングシステム（ACS） 44 ( 11 ) 79 - 88 2003年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

コモディティクラスタリングシステムにおける，ノード数規模の急激なスケールアップにともない，クラスタのセットアップおよび保守コストは増大しつつある．また，各ノードのローカルディスク上に数GB単位のデータベースファイルを必要とする，いわゆるデータインテンシブアプリケーションがクラスタ上で用いられつつあるが，インストール時における，大規模データのセットアップに着目したツールは重視されてこなかった．そこで我々は，大規模クラスタ向けセットアップ/管理ツールであるLucie，およびデータ配布ツールDolly+を開発している．Lucieでは，インストール用メディアを用いないネットワークブート/インストール機構，および用途に応じたインストーラ自体の再構成といった拡張機構を実現する．また，Dolly+では，仮想リング構造による高速データ転送によって，耐故障性を保ちつつ，インストール時に高速に数GB単位のデータを全ノードへ配布することができる．本稿では，Lucieのインストール性能，およびインストール時のDolly+とLucieによる大規模データ配布性能について評価を行った．結果，性能はノード数によらずほぼ一定であり，本研究の将来的な目標であるプラグアンドプレイクラスタリングの基礎技術として有用であることが分かった．Rapid increase in the number of nodes for commodity clustering is mandating the handling the potential cost of setup and maintenance clusters as the norm. Moreover, with arising of data intensive applications which requires several GBs of data on each cluster nodes, it is revealed that there were no installation tool aimed at installation-time setup of such large-scaled data. In this paper, we propose a new cluster installation/administration tool called Lucie which allows network boot/installation mechanism with no specific installation media and configurability which allows reconstruction of installer itself on demand. Additionally, we propose a new data distribution mechanism called Dolly+which deploys fault tolerant, high-speed virtual ring topology data transferring. With Dolly+, one could distribute several GBs of images to all cluster nodes in installation-time maintaining fault tolerance. Our several benchmarks show that Lucie and Dolly+can install and setup the whole cluster in constant time. This result shows that Lucie and Dolly+are scalable and efficient, and could well serve as a basis for 'Plug-and-Play'clustering.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00018534/
Javaによる階層型グリッド環境Jojoの設計と実装

中田秀基, 松岡聡, 関口智嗣

情報処理学会論文誌コンピューティングシステム（ACS） 44 ( 11 ) 46 - 56 2003年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

本稿では，グリッド環境でのJavaプログラミングを支援する実行環境Jojoについて述べる．JojoはJavaを用いて実装された，階層構造を持つ環境に適した分散実行環境で，階層構造に適した柔軟な多階層実行機構，Globusやsshを用いた安全な起動と通信，直感的で並列実行に適したメッセージパッシングAPI，プログラムコードの自動アップロードといった特徴を持つ．Jojoを用いれば，グリッド上で動作する並列分散システムが非常に容易に構築できる．本稿ではJojoの設計と実装の詳細，プログラミングAPI，設定ファイル，簡単なプログラム例を示す．さらにマスタ・ワーカプログラムを用いた性能評価を行い，多階層構造の有効性を確認する．This paper introduces a java-based programming environment for the Grid; Jojo. Jojo is a distributed programming environment implemented in Java, which is suitable for hierarchal grid environment. Jojo provides several features, including remote invocation using Globus GRAM, intuitive message passing API suitable for parallel execution and automatic user program staging. Using Jojo, users can construct parallel distributed application on the Grid with ease. In this paper, we show design and implementation of Jojo, its programming API, configuration file syntax and a working program example. We also show preliminary performance evaluation results that prove effectiveness of multi-hierarchal execution.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00018531/
Javaによる階層型グリッド環境Jojoの設計と実装

中田秀基, 松岡聡, 関口智嗣

情報処理学会論文誌 44 ( SIG11(ACS3) ) 46 - 56 2003年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

本稿では，グリッド環境でのJavaプログラミングを支援する実行環境Jojoについて述べる．JojoはJavaを用いて実装された，階層構造を持つ環境に適した分散実行環境で，階層構造に適した柔軟な多階層実行機構，Globusやsshを用いた安全な起動と通信，直感的で並列実行に適したメッセージパッシングAPI，プログラムコードの自動アップロードといった特徴を持つ．Jojoを用いれば，グリッド上で動作する並列分散システムが非常に容易に構築できる．本稿ではJojoの設計と実装の詳細，プログラミングAPI，設定ファイル，簡単なプログラム例を示す．さらにマスタ・ワーカプログラムを用いた性能評価を行い，多階層構造の有効性を確認する．This paper introduces a java-based programming environment for the Grid; Jojo. Jojo is a distributed programming environment implemented in Java, which is suitable for hierarchal grid environment. Jojo provides several features, including remote invocation using Globus GRAM, intuitive message passing API suitable for parallel execution and automatic user program staging. Using Jojo, users can construct parallel distributed application on the Grid with ease. In this paper, we show design and implementation of Jojo, its programming API, configuration file syntax and a working program example. We also show preliminary performance evaluation results that prove effectiveness of multi-hierarchal execution.

J-GLOBAL

researchmap
You Don't Really Need Big Fat Switches Anymore--Almost (2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003)研究会・連続同時開催)

Matsuoka Satoshi

情報処理学会研究報告. ARC,計算機アーキテクチャ研究会報告 154 ( 84 ) 157 - 162 2003年8月

　詳細を見る

記述言語：英語出版者・発行元：一般社団法人情報処理学会

Although commodity cluster computing based on very fast and inexpensive commodity processors are proliferating today, one of the prohibitive factors towards its large-scale deployment is the high cost of the network switching fabric in order to retain properly high bandwidth. We argue that, except for the most demanding applications, appropriate aggregation of inexpensive switches, with collective communication algorithms that utilize the characteristics of such networks, will accommodate a bulk of parallel applications, even those with substantial communication requirements. We present 3 techniques for implementing high-bandwidth collective communications in such a setting, and provide preliminary performance measurements that hint the effectiveness of our proposal. The technique can be extended to interconnect a set of clusters for implementing high-bandwidth Grid interconnect as well as replacing SAN for high-bandwidth I/O.

CiNii Books

researchmap
レプリカ交換分子動力学シミュレータREMD Toolkitのグリッド上での実行

佐藤仁, 伊藤正勝, 中田秀基, 松岡聡

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 95 ( 83 ) 41 - 46 2003年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

レプリカ交換法は,問題の粒度が大きく,計算機間のデータの通信量が少ないため,グリッドシステム上での計算に向いていると考えられている.しかし,実際にレプリカ交換法のアルゴリズムを実装したプログラムをグリッドシステム上で実行した場合の性能は明らかになっていない.われわれは,レプリカ交換法システムREMD Toolkit をさまざまな環境下で実行し,実行性能を測定した.さらにREMD toolkit に対して性能ヘテロな環境での実行を考慮した改良を加えた.この結果,1)REMDツールキットは100台規模まで十分にスケールすること,2)性能ヘテロに対応した改良版では性能ヘテロな環境で有効であることを確認した.

CiNii Books

researchmap
アプリケーションのインストール, データの配布, 更新をサポートするグリッドポータル構築ツールキット(PCT4G)の開発

白砂哲, 鈴村豊太郎, 中田秀基, 松岡聡

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 95 ( 83 ) 173 - 178 2003年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

グリッド技術が実用化するにつれ、数多くのグリッドポータルと呼ばれるユーザ親和なインタフェースを備えたシステムがさまざまな分野で構築され利用されている。また、グリッドポータル構築者の負担を軽減するため、グリッドポータルを構築を支援するためのいくつかのツールキットも開発されている。しかし、それらのツールキットを利用しても、すべてのノードに利用するアプリケーションをインストールする必要があるなど、グリッド構築者の負担は大きい。更に、バイオインフオマティックス分野に代表されるアプリケーションでは、アプリケーションが利用するデータを最新の状態に保つ必要がある。これらの作業を自動化するため、我々はグリッドポータル構築ツールキットPCT4Gを開発した。 PCT4Gは、アプリケーションのインストール、データの管理、Webインタフェース作成をサポートし、グリッドポータル構築者の負担を軽減する。また、PCT4Gは、一般ユーザがWebインタフェースを用いて独自のグリッドポータルを構築するための機能も提供する。

CiNii Books

researchmap
グリッドコンピューティングにおけるモニタリングシステムの自律的構成

白勢健一郎, 小川宏高, 中田秀基, 松岡聡

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 95 ( 83 ) 89 - 94 2003年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

グリッド環境における計算機やソフトウエアのモニタリングシステムは、役割ごとに分割されたコンポーネントから構成されている。コンポーネント間の依存関係をふまえた設定の複雑さやモニタリングシステムを常時稼働させる必要性を考えると、人間の手で管理のすべてを行うには限界がある。このため自律的管理の仕組みが必要である。本研究では、モニタリングシステムを自律的に管理するシステムを提案し、その機能の一部として、既存のモニタリングシステムの自動設定と障害復旧を行うシステムを実装した。実装したシステムをキャンパス内のグリッド環境のテストベッドで動かした結果、10個の計算機に対して約2分程度の時間で設定を完了する事ができた。

CiNii Books

researchmap
次世代グリッド基盤OGSAにおけるC言語動作環境提供システムの試作と評価

濱野智行, 中田秀基, 鈴村豊太郎, 松岡聡

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 95 ( 83 ) 179 - 184 2003年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

従来のグリッドアーキテクチャとWebサービスとを融合させた次世代のアーキテクチャであるOGSAが注目されている.OGSIはOGSAの基盤となる技術であるが、1)現状のOGSI実装においてはC言語でのサービス開発が不可能、2)XMLベースプロトコル通信によるパフォーマンスの低下、といった問題が懸念されている。本稿では、OGSI上にC/C十十/Fortranの動作環境を提供するシステムを提案し、そのシステム上でサービスを開発する際の補助ツールを提供する。さらに、提案したシステムを用いて、そのシステムの有効性と現状のOGSI実装の問題点を確認する。

CiNii Books

researchmap
自律的な通信回復を行うFault Tolerant MPIの実装と評価

實本英之, 高宮安仁, 松岡聡

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 95 ( 83 ) 149 - 154 2003年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

クラスタシステムでは、ノード数の増大によりシステム全体の障害発生の潜在的可能性が高い。そのため、長時間にわたる計算を安定して行うには、耐故障性を持ったミドルウエアが必要になる。本研究では、耐故障性を持ったMPIの実装と評価を行った。このMPIは逐次プロセスのチェックポインタと耐故障性通信路によりMPIプロセスのチェックポインティング/リスタートを行う。ベースとしてMPICHを用い、通信路の耐故障性はRocksライブラリ、チェックポインタはckptライブラリを用いた。32プロセスを用いたNPB-CGの結果、本実装では、オーバーヘッドがオリジナルMPICHの高々8%程度に抑えられることを確認した。

CiNii Books

researchmap
Javaによる階層型グリッド環境Jojoの設計と実装

中田秀基, 松岡聡, 関口智嗣

情報処理学会シンポジウム論文集 2003 ( 8 ) 113 - 120 2003年5月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
ヘテロなクラスタ環境におけるNAS Parallel Benchmarksの適用化

笠生健, 松岡聡

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 93 ( 29 ) 1 - 6 2003年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

本研究ではヘテロな計算環境でのアルゴリズム研究を目的として,NAS Parallel BenchmarksのCG,EP,FT,IS,MGの5種類のカーネルベンチマークについて,通信の発生する頻度,デー夕分割法などの点から解析・分類した.そして,CPUヘテロなクラスタ上での負荷分散手法として,多次元配列データをブロック分割しているアルゴリズムについては,各PEの性能に応じて割り当てるブロックの個数を変えるという手法を用い,1次元配列データを分割するアルゴリズムについては,各PEの性能に応じて分割の幅を変えるという手法を用いて実装し,CPU性能のみヘテロなクラスタ環境においてヘテロ対応手法の評価実験を行った.その結果,EP,IS,MGでは性能向上が見られたものの,CG,FTでは通信のオーバーヘッドの増大により逆に性能低下を招く結果となった.

CiNii Books

researchmap
蛋白質立体構造の進化的解析の為のNinf板並列MGGとその性能評価

小野功, 今出広明, 中田秀基, 小野典彦, 松岡聡, 関口智嗣, 楯真一

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 93 ( 29 ) 119 - 154 2003年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

核磁気共鳴法(NMR)は,ポストシーケンスにおける最重要課題の一つである蛋白質立休構造解析の有望な手段である.しかし,専門家でさえ一つの蛋白質のデータ解析に数ヶ月程度の試行錯誤が必要なことが深刻な問題となっている.これに対し,小野らは遺伝的アルゴリズム(CA)に基づくデータ解析の自動化手法を提案し,小規模な問題において比較的良好な性能を得られたと報告している.本報告では,本手法を高速化するために,産総研が提案しているミドルウェアNinfを用いて,GAの世代交代モデルMinimal Generation Gapの並列化実装を行い,評価実験によりその動作検証および性能評価を行う.

CiNii Books

researchmap
グリッド向け実行環境Jojoを用いた遺伝的アルゴリズムによる蛋白質構造決定

中田秀基, 中島直敏, 小野功, 松岡聡, 関口智嗣, 小野典彦, 楯真一

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 93 ( 29 ) 155 - 160 2003年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

Javaはグリッド上でのプログラミング言語として、1)クラスファイルのポータビリティによりアーキテクチャヘテロな環境への対応が容易、2)マルチスレッドによるレイテンシの隠蔽が期待できる、などの点で有望である。また、遺伝的アルゴリズムは実問題に応用範囲が広く、並列化や実行粒度の調節が容易なことから、グリッド上のアプリケーションとして適していると考えられる。われわれはこれらの点に着目し、Javaによる遺伝的アルゴリズム実行支援環境jPop-GAの開発をすすめている。しかし、グリッド上で遺伝的アルゴリズムの効率的な実行を可能にする並列化方式については指針を欠いていた。本稿では、遺伝的アルゴリズムのグリッド上での並列化に関する指針を得るべく、実アプリケーションである遺伝的アルゴリズムによる核磁気共鳴分光法による蛋白質構造解析をJavaで実験し、これをJava向けグリッド実行環境Jojoを用い、2つの並列化指針に基づいて並列化した。さらにそれぞれの実装に対して問題サイズを変えて評価を行い並列化手法に関する指針を得た。

CiNii Books

researchmap
Omni/SCASHにおける実行時性能評価に基づく動的負荷分散拡張の評価

栄純明, 松岡聡, 佐藤三久, 原田浩

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 93 ( 29 ) 131 - 136 2003年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

コモディティクラスタ環境では様々な理由によりノード間に性能のheterogeneityが生じるケースが増加している.これはロードインバランスの原因の一つであり,何らかの動的負荷分散機能が必要である.本論文ではOmni/SCASHに対して我々が現在行っている動的負荷分散機能拡張に関して報告する.動的負荷分散機能を用いることによって,アプリケーションプログラマが明示的にデータやタスクの配置を指定することなく,ランタイムシステムによって性能ヘテロなクラスタにおいてロードバランシングが行える.動的負荷分散拡張の一つであるループ再分割機能の評価の結果,ループ再分割機能白身の効果を確認した一方で, page migration機能との協調動作が重要であることも確認した.

CiNii Books

researchmap
Preliminary evaluation of dynamic load balancing using loop re-partitioning on Omni/SCASH

Y Sakae, S Matsuoka, M Sato, H Harada

CCGRID 2003: 3RD IEEE/ACM INTERNATIONAL SYMPOSIUM ON CLUSTER COMPUTING AND THE GRID, PROCEEDINGS 463 - 470 2003年

　詳細を見る

記述言語：英語

DOI： 10.1109/CCGRID.2003.1199402

Web of Science

J-GLOBAL

researchmap
蛋白質立体構造の進化的解析のためのNinf 版並列MGG とその性能評価

小野功, 今出広明, 中田秀基, 小野典彦, 松岡聡, 関口智嗣, 楯真一

情報処理学会研究報告 2002-HPC-93(HOKKE2003) 149 - 154 2003年

　詳細を見る

researchmap
Omni/SCASH のループ再分割を用いた動的負荷分散拡張の実装と評価

栄純明, 松岡聡, 佐藤三久, 原田浩

先進的計算基盤システムシンポジウム SACSIS2003 論文集 307 - 314 2003年

　詳細を見る

researchmap
Evaluation of the inter-cluster data transfer on Grid environment

S Ogura, S Matsuoka, H Nakada

CCGRID 2003: 3RD IEEE/ACM INTERNATIONAL SYMPOSIUM ON CLUSTER COMPUTING AND THE GRID, PROCEEDINGS 374 - 381 2003年

　詳細を見る

記述言語：英語

DOI： 10.1109/CCGRID.2003.1199390

Web of Science

J-GLOBAL

researchmap
グリッド環境に適した並列組み合わせ最適化システム jPoP における分枝限定法の実装

秋山智宏, 中田秀基, 松岡聡, 関口智嗣

第6回プログラミングおよび応用のシステムに関するワークショップ SPA 2003 2003年

　詳細を見る

researchmap
Lucie: 大規模クラスタに適した高速セットアップ・管理ツール

高宮安仁, 真鍋篤, 松岡聡

先進的計算基盤システムシンポジウム SACSIS2003 論文集 365 - 372 2003年

　詳細を見る

researchmap
グリッド環境に適したJava用階層型実行環境Jojoの設計と実装

中田秀基, 松岡聡, 関口智嗣

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 92 ( 99 ) 31 - 36 2002年10月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

本稿では、グリッド環境でのJavaプログラミングを支援する実行環境Jojoについて述べる。JojoはJavaを用いて実装された、階層構造を持つ環境に適した分散実行環境で、Globusを用いた起動、直感的で並列実行に適したメッセージパッシングAPI、プログラムコードの自動アップロードといった特徴を持つ。Jojoを用いれば、グリッド上で動作する並列分散システムが非常に容易に構築できる。本稿ではJojoの設計と実装の詳細、プログラミングAPI、設定ファイル、簡単なプログラム例を示す。さらに予備的な性能評価の結果も示す。

CiNii Books

researchmap
Gridポータル構築ツールキットNinf-Portal

中田秀基, 齊藤真幸, 鈴村豊太郎, 田中良夫, 松岡聡, 関口智嗣

情報処理学会論文誌. ハイパフォーマンスコンピューティングシステム 43 ( 5 ) 172 - 183 2002年9月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

広域に分散した各種資源を集合的に使用して大規模計算を行う計算機構Gridが注目を集めている.多様な管理主体に属する資源から構成されるGrid環境上のプログラムを多くのユーザに使用させるためには,ポータルと呼ばれる機構が必要である.このため,Gridへのポータルを構築するためのツールキットがいくつか提案されている.しかしこれらのツールキットを用いる場合でも,ポータル構築者がフロントエンドとなるポータルのユーザインタフェース部,バックエンドとなる実際のGridプログラムの2つを記述しなければならず,ポータル構築者の負担が大きい.我々は,前者に対してXMLベースのユーザインタフェース生成系を,後者に対してGrid RPCシステムであるNinf-Gを使用することでプログラマの負荷を軽減するポータル開発キットを提案する.さらに,提案したシステムを用いて,実用的なプログラムをポータル化し有効性を確認した。

CiNii Books

J-GLOBAL

researchmap
ペタバイトスケールデータインテンシブコンピューティングのためのGrid Datafarmアーキテクチャ

建部修見, 森田洋平, 松岡聡, 関口智嗣, 曽田哲之

情報処理学会論文誌. ハイパフォーマンスコンピューティングシステム 43 ( 5 ) 184 - 195 2002年9月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

広域で共有されるペタバイトスケールデータインテンシブコンピューティングのためのGrid Datafarmアーキテクチャを設計し,参照実装としてGfarmを開発している.Grid Datafarmは,グリッド上の複数のクラスタを利用してペタバイト規模の広域並列ファイルシステムを構成し,その上の並列I/OAPIおよびファイルアフィニティスケジューリングによりスケーラブルI/Oバンド幅,スケーラブル並列処理を実現する.初期性能評価ではPresto III Athlonクラスタ64ノードを利用し,並列I/Oによる書き込み,読み込みにおいて,それぞれ1.74GB/s, 1.97GB/sを達成した.また,並列ファイル複製ではMyrinet 2000 において23並列で443MB/sを達成した.

CiNii Books

researchmap
グリッド環境におけるクラスタ間データ転送に評価

小倉章嗣, 松岡聡, 中田秀基

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 91 ( 80 ) 155 - 160 2002年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

大規模ストレージシステムを構築する際に、クラスタ計算機同士でグリッドを構成し、より大規模なストレージを構築する試みがなされている。グリッド上のストレージを構成するクラスタ間でデータ転送を行う場合、RTT×bandwidthの大きい環境では通信路の性能を生かし切れないことが問題になる。また、各クラスタノード間での通信のように同時に多対多で通信を行う場合は、複数の通信で通信路を共有しなければならないため、通信路のバンド幅以上にデータが流れ込んでしまうことが問題になる。本研究では、これらの問題を解決するために、同時に通信を行うノード数、ストライプ数等のパラメータについて、自動的に通信路に合ったパラメータを決定するシステムを提案する.本稿では、いくつかの環境を想定し、その上でクラスタ間データ転送のシミュレーションを行ない、それぞれの環境に応じた最適なパラメータについて考察する。

CiNii Books

researchmap
Grid Datafarmにおけるスケジューリング・複製手法の性能評価

竹房あつ子, 建部修見, 松岡聡, 森田洋平

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 91 ( 80 ) 137 - 142 2002年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

グリッド技術を基盤にした大容量データに対する遍在するアクセスを可能にする技術をデータグリッドと呼び,複数のシステムの設計・実装が行われている.しかしながら,それらは実験段階にあり,データグリッドアーキテクチャの設計方針の妥当性や性能に関する緒論は不十分である.本稿では,Bricksグリッドシミュレータにデータグリッドシステムに対する拡張を行い,Grid Datafarmアーキテクチャに基づくデータグリッドモデルとその性能について比較・調査した.データグリッドモデルでは,CentralモデルとTierモデルを比較し,Tierモデルでは様々なスケジューリングと複製アルゴリズムを適用し,2006年に行われるCERNの高エネルギー物理実験を想定し,その性能を評価した。

CiNii Books

researchmap
Lucie : 大規模クラスタに適した高速セットアップ・管理ツール

高宮安仁, 真鍋篤, 白砂哲, 松岡聡

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 91 ( 80 ) 131 - 136 2002年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

コモディティクラスタリングシステムにおける,ノード数規模の急激なスケールアップに伴い,クラスタのセットアップおよび保守コストは増大しつつある。また、各ノードのローカルディスク上に数GB単位のデータベースファイルを必要とする、いわゆるデータインテンシブアプリケーションがクラスタ上で用いられつつあるが、インストール時における,大容量データのセットアップに着目したツールは重視されてこなかった。我々は、大規模クラスタ向けセットアップ/管理ツールであるLucieを開発している。Lucieでは、インストール用メディアを用いないネットワークブート/インストール機構、および用途に応じたインストーラ自体の再構成といった拡張機構を実現する。また、仮想リング構造による高速データ転送機構によって、耐故障性を保ちつつ、インストール時に高速に数GB単位のデータを全ノードへ配布することができる。本稿では、Lucieのインストール性能、およびインストール時の大容量データ配布性能について評価を行った。結果、性能はノード数によらずほぼ一定であり、本研究の将来的な目標であるプラグアンドプレイクラスタリングの基礎技術として有用であることがわかった.

CiNii Books

researchmap
動的なアプリケーション開発実行を可能にするグリッドポータルアーキテクチヤ

鈴村豊太郎, 中田秀基, 松岡聡, 関口智嗣

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 91 ( 80 ) 191 - 196 2002年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

近年,グリッドポータルはグリッドに対する高位のインタフェースとして重要な役割を担っている.我々は,グリッドポータルの開発を支援する為のツールとして,ポータルに必要となるユーザインタフェースの自動化とバックエンドのグリッドアプリケーションの開発を支援するツールNinf Portalの開発を進めている.本稿では,グリッドポータルにおける動的なアプリケーションの開発実行環境のアーキテクチャの提案を行なう.具体的には,Ninf-GのクライアントAPIにJavaバインディングを実装し,そのパインディングを基盤に,スクリプト言語Pythonのインタフェースを実装した。次に,ポータル上でそのスクリプトインタフェースを用いてグリッドアプリケーションを記述し,ページのフォームにユーザインタフェースの情報を入力することによって,動的にユーザに特化したアプリケーションの生成を支援する環境のアーキテクチャの設計を行なった.

CiNii Books

researchmap
HPLのパラメータチューニングの解析

笹生健, 松岡聡

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 91 ( 80 ) 125 - 130 2002年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

LINPACKベンチマークの実装の一つであるHPLプロセスは,Top500リストの順位付けを決定する性能評価のために多くの計算機上で用いられている.HPLはパラメータを設定することでシステムの性能を引き出した評価が可能という特徴があるが,HPLのパラメータは非常に数が多く,プロセッサのキャッシュサイズやメモリサイズ,ネットワーク性能等,並列システムのアーキテクチャに依存するため.最適なパラメータを決定するのは困難である.そのためHPLを使用するユーザーにとって様々なアーキテクチャの並列システム上におけるHPLのパラメータ設定に関する情報は非常に有益である.本稿では第19回Top500リストにおいて47位を達成したPrestoIIIクラスタがTop500の際に使用したHPLのパラメータを公開すると共に,PrestoIIIクラスタ上での様々なパラメータ設定による比較を行った.それにより最適なパラメータ設定の方針に関する知見を得た.

CiNii Books

researchmap
Grid環境に適した並列組み合わせ最適化システムの提案

秋山智宏, 中田秀基, 松岡聡, 関口智嗣

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 91 ( 80 ) 143 - 148 2002年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

多次元パラメータ関数の最適値を求める組合せ最適化問題の解法としては、分枝限定法や遺伝的アルゴリズムなどが知られている。これらの解法は自明な並列度が大きく、粒度の調整も比較的容易なためGrid上での実行に適している。しかしGrid環境での分散並列プログラミングは煩雑である上、実行時にも実行ファイルや設定ファイルをユーザがインストールしなければならないといった問題がある。われわれはこれらの問題を解決し、最適化問題解法のGrid上での実行を容易にするシステムjPoPを提案する。jPoPは各解法に対してテンプレートとなるクラスを提供しプログラミングを支援する。また、動的なプログラムのアップロードによってGrid上での実行を支援する。本稿ではjPoPの概要と遺伝アルゴリズム問題のテンプレート、さらにjPoPの実装について述べる。

CiNii Books

researchmap
Webサービス技術を基盤とするGridRPCシステムの評価

白砂哲, 中田秀基, 松岡聡, 関口智嗣

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 91 ( 80 ) 197 - 202 2002年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

Grid上のミドルウェアであるGridRPCは科学技術計算に多く用いられる。しかし、ぞれのGir-dRPCシステムが独自のプロトコルを利用しているため。インタオペラビリティが重要な課題となっている.一方,Webサービスの分野では,SOAPやWSDLといったXML基盤の標準仕様が用いられており,広く使用されることが期待されている。そのため,GridRPCにおいてもこれらの仕様を用いてインタオペラビリティを確保することが可能であると考えられるが,1)ビジネスアプリケーションを念頭としたこれらの仕様がGridRPCに適した記述力を有しているか,2)コストが高いXMLを用いて十分な性能を得ることができるか,などが明らかではない.本研究では,SOAPとWSDLを基盤とするGridRPCを実装し.評価した.その結果,SOAP基盤のGridRPCのナイーブな実装においては大きなオーバヘッドが大きいが,いくつかの性能向上を行なうことにより,本来のバイナリ転送に近い性能が得られた。一方,配列パラメタの扱いなどのGridRPC特有なさまざまな機能を実現することは,WSDLの制限により困難であり,WSDLの仕様の拡張が必要であることが分かった.

CiNii Books

researchmap
未来の広域分散処理としてのグリッド

松岡聡

計算工学 7 ( 3 ) 529 - 532 2002年7月

　詳細を見る

記述言語：日本語出版者・発行元：日本計算工学会

CiNii Books

researchmap
Access Gridの構築とGrid上での国際会議

首藤一幸, 田中良夫, 小松弘幸, 松岡聡, 南里豪志, 岡村耕二, 関口智嗣

情報処理学会研究報告. ARC,計算機アーキテクチャ研究会報告 147 ( 22 ) 31 - 36 2002年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

Access GridはGrid上でのヒューマンインタラクションを支援するソフトウェアおよびプロジェクトであり,その基本部分は大規模ビデオ会議システムである.我々は,ひとつのパッケージにまとめられたAccess Gridノードを設計,構築し,運用してきた.SC2001国際会議では,,AccessGridを活用したSC GlobalというGrid上の会議が併設された.40を越える拠点からの参加があり,我々もApGridパネルディスカッションの企画や,日本とデンバーからの参加という形で取り組んできた.本稿では,これらの取り組み,経験を紹介する.

CiNii Books

researchmap
Grid環境における大規模クラスタ向けジョブマネージメントアーキテクチャの実装及び性能評価

岩崎聖, 松岡聡, 曽田哲之, 平野基孝, 建部修見, 関口智嗣

情報処理学会研究報告. ARC,計算機アーキテクチャ研究会報告 147 ( 22 ) 37 - 42 2002年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

我々はGrid Data Farm(Gfarm)システム用のジョブ起動アーキテクチャの設計・実装を行っている.Gfarmシステムは数千から数万ノード規模のPCクラスタで構成され,ノード間の通信・認証にGSIを用いている.このため,Gfarmシステムでジョブを起動する際,ナイーブな実装を用いるとノード数に比例したGSI認証コストが発生し,数千プロセスからなるジョブの起動に数千秒かかることが予想される.本稿で述べるアーキテクチャでは,あらかじめ確立済みのコネクションを用いることで起動要求伝達時の認証コストを回避する.実装中のシステムでジョブの起動に要する時間を計測した結果,15ノードで3.5秒,63ノードで6秒と想定したスケーラビリティは得られなかったが,これはジョブ起動プロトコルに問題があり,プロトコルを改善することでさらなるスケーラビリティが得られると考えている.

CiNii Books

researchmap
情報処理学会の終焉? : IPSJのあり方

村岡洋一, 土居範久, 戸田巖, 萩谷昌己, 松岡聡

情報処理 43 ( 2 ) 37 - 37 2002年2月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

学会で「学会のあり方」を議論すると, 非常に単純化した言い方とするならば, 次のような図式になります.(1)学会は論文のaccreditaion機関(2)加えて, 研究発表の機会提供機関(3)これらの活動をコストパフォーマンスよく行いたい.そのためには経済的基盤の確立が必須(4)さあ, 一般会員の数を増やそう.会員のメリットのために質の良い会誌が不可欠(5)でも市販雑誌に太刀打ちできるかしら(6)ということで, あの手この手の会員エンタテインメント策の立案でもこれだけで本当にいいのでしょうか.たとえば, 以下のような疑問があります.(1)研究活動の場として, 学会はドッグイヤーとか称するこの時代に対応できるほど, 身軽に動いているのでしょうか?(2)そもそもそれほど大事にしているはずの研究活動が, 本当に世のため, 自分のためになるものでしょうか?単なる自己満足だけでなければいいのですが.(3)身軽に, 素晴らしい研究成果を世に問う場所である学会が, 重たくなっていないでしょうか.なんでもできる場である学会になるためには, もっと強力なサポートインフラの構築がいらないでしょうか?(4)そもそも学会は, 研究成果の発表の場だけでいいのでしょうか?これからの大不況時代を技術者・研究者として生き延びていくために, もっと智恵を発揮する場になる必要はないでしょうか?このような疑問も含め, 常日ごろから学会のあり方について「建設的な破壊的ご意見(?)」をお持ちの論客の方々にご参加いただき, 「春の嵐」を巻き起こしたいと思います.若人よ, 黙っていると学会は解体されてしまいますよ!!

CiNii Books

researchmap
Overview of GridRPC: A remote procedure call API for grid computing

K Seymour, H Nakada, S Matsuoka, J Dongarra, C Lee, H Casanova

GRID COMPUTING - GRID 2002 2536 274 - 278 2002年

　詳細を見る

記述言語：英語

Web of Science

researchmap
1-1 東工大キャンパスグリッドプロジェクト : 次世代ハイエンドコンピューティング基盤へ向けて

中田秀基, 松岡聡

計算力学講演会講演論文集 2002 ( 0 ) 685 - 686 2002年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本機械学会

Evolving "e-science" requires more and more computing power. Considering power consumption and cooling, it is getting impossible to provide computing resources from a single centralized site, like ordinary "University Computer Center". Global Scientific Information and Computing Center (GSIC) at Tokyo Institute of Technology deployed a new form of the computation infrastructure, called Titech Grid, utillzing Grid technology, commodity PC cluster technology and newly introduced hi-speed network. Here, we give presice description of Titech Grid configuration and operation.

DOI： 10.1299/jsmecmd.2002.15.685

CiNii Books

researchmap
The Ninf Portal : An Automatic Generation Tool for Computing Portals

Toyotaro Suzumura Hidemoto Nakada, Masayuki Saito, Satoshi Matsuoka, Yoshio Tanaka, Satoshi Sekiguchi

Joint ACM Java Grande - ISCOPE 2002 Conference, Seattle, Washington, November 3-5, 2002 2002年

　詳細を見る

researchmap
Evaluating Web Services Based Implementations of GridRPC.

Satoshi Shirasuna, Hidemoto Nakada, Satoshi Matsuoka, Satoshi Sekiguchi

In Proceedings of the 11th IEEE International Symposium on High Performance Distributed Computing (HPDC-11 2002) 237 - 245 2002年

　詳細を見る

DOI： 10.1109/HPDC.2002.1029923

J-GLOBAL

researchmap
Towards Dynamic Load Balancing Using Page Migration and Loop Re-partitioning on Omni/SCASH

Yoshiaki Sakae, Satoshi, Matsuoka Mitsuhisa Sato, Hiroshi Harada

In Proceedings of The Fourth European Workshop on OpenMP (EWOMP 2002) 2002年

　詳細を見る

researchmap
Grid datafarm architecture for petascale data intensive computing

Osamu Tatebe, Youhei Morita, Satoshi Matsuoka, Noriyuki Soda, Satoshi Sekiguchi

2nd IEEE/ACM International Symposium on Cluster Computing and the Grid, CCGrid 2002 2002年

　詳細を見る

記述言語：英語

DOI： 10.1109/CCGRID.2002.1017117

Scopus

J-GLOBAL

researchmap
ユーザー透過な耐故障製を実現するMPIへ向けて

高宮安仁, 松岡

情報処理学会・電気通信処理学会並列処理シンポジウム JSPP2002 論文集 217 - 224 2002年

　詳細を見る

researchmap
ヘテロなクラスタ環境における並列LINPACKアルゴリズム

笹生健, 松岡聡, 建部修見

情報処理学会・電気通信処理学会並列処理シンポジウム JSPP2002 論文集 71 - 78 2002年

　詳細を見る

researchmap
Grid Datafarm architecture for petascale data intensive computing

O Tatebe, Y Morita, S Matsuoka, N Soda, S Sekiguchi

CCGRID 2002: 2ND IEEE/ACM INTERNATIONAL SYMPOSIUM ON CLUSTER COMPUTING AND THE GRID, PROCEEDINGS 102 - 110 2002年

　詳細を見る

記述言語：英語

DOI： 10.1109/CCGRID.2002.1017117

Web of Science

J-GLOBAL

researchmap
ペタスケール広域分散データ解析のためのGrid Datafarmアーキテクチャ

建部修見, 森田洋平, 松岡聡, 関口智嗣, 曽田哲之

情報処理学会論文誌：ハイパフォーマンスコンピューティングシステム，HPCS2002論文集情報処理学会 89 - 96 2002年

　詳細を見る

researchmap
XMLベースGridRPCシステムの構築と評価

白砂哲, 中田秀基, 松岡聡, 関口智嗣

日本ソフトウエア科学会第５回プログラミングおよび応用システムに関するワークショップ（SPA2002） 2002年

　詳細を見る

researchmap
Towards Dynamic Load Balancing Using Page Migration and Loop Re-partitioning on Omni/SCASH

Yoshiaki Sakae, Satoshi, Matsuoka Mitsuhisa Sato, Hiroshi Harada

In Proceedings of The Fourth European Workshop on OpenMP (EWOMP 2002) 2002年

　詳細を見る

researchmap
Evaluating Web services based implementations of GridRPC

S. Shirasuna, H. Nakada, S. Matsuoka, S. Sekiguchi

Proceedings of the IEEE International Symposium on High Performance Distributed Computing 2002- 237 - 245 2002年

　詳細を見る

記述言語：英語出版者・発行元：Institute of Electrical and Electronics Engineers Inc.

DOI： 10.1109/HPDC.2002.1029923

Scopus

J-GLOBAL

researchmap
The Ninf Portal : An Automatic Generation Tool for Computing Portals

Toyotaro Suzumura Hidemoto Nakada, Masayuki Saito, Satoshi Matsuoka, Yoshio Tanaka, Satoshi Sekiguchi

Joint ACM Java Grande - ISCOPE 2002 Conference, Seattle, Washington, November 3-5, 2002 2002年

　詳細を見る

researchmap
Gridポータル構築ツールキットNinf-Portal

中田秀基, 齊藤真幸, 鈴村豊太郎, 田中良夫, 松岡聡, 関口智嗣

情報処理学会・電気通信処理学会並列処理シンポジウム JSPP2002 論文集 209 - 216 2002年

　詳細を見る

researchmap
Grid RPC システムのAPIの提案

中田秀基, 田中良夫, 松岡聡, 関口智嗣

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 88 ( 78 ) 37 - 42 2001年10月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

RPC(Remote Procedure Call)に基づく計算システムは、広域分散計算環境である(Grid上のミドルウェアの一形態として有望である。Grid上のRPCシステムは、Ninf、Netsolveなどいくつか提案されている。しかしAPIに標準規格が存在しないため、RPCシステムを用いて記述したプログラムに互換性がなく、このことがGrid上のRPCの普及を防げている。本稿では、Grid上のRPCシステムの標準APIの候補として、一つのAPIを提案する。このAPIは、数年にわたるNinfシステムにおける経験に基づき、必要十分の機能を提供しながら、最小限となるように設定されている。我々はGlobal Grid Forumなどの場で、この規格案の標準化を促進していく予定である。

CiNii Books

researchmap
Towards performance evaluation of high-performance computing on multiple Java platforms

S Matsuoka, S Itou

FUTURE GENERATION COMPUTER SYSTEMS 18 ( 2 ) 281 - 291 2001年10月

　詳細を見る

記述言語：英語

DOI： 10.1016/S0167-739X(00)00099-6

Web of Science

J-GLOBAL

researchmap
Ninfシステムにおけるフォールトトレランス

白砂哲, 中田秀基, 松岡聡

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 87 ( 77 ) 153 - 158 2001年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

グリッドの使用が広く広まるにつれ、グリッドにおけるフォールトトレランスは重要な研究テーマになりつつある。グリッドでは計算資源は豊富であるが、不安定であり、専用の資源ではないため、すべての段階での障害をユーザ透過に扱わなければならない。GridRPCは、グリッド環境におけるプログラミングモデルの一つである。本研究では、GridRPCにおける計算の過程において、フォールトトラランスのさまざまな側面に対し、それぞれを別々に対処する必要があることを示す。今回、計算時におけるフォールトトレランスを実現するためにGridRPCシステムであるNinfをCondorと統合した。この統合はユーザ透過であり、粒度の大きい計算に対しオーバヘッドが比較的小さいことが分かった。しかし、粒度の小さい計算に対しては、計算の起動に対してのチェックポイントライブラリ転送のコスト以外に、変則的なオーバヘッドが生じる。

CiNii Books

researchmap
Grid 環境におけるモニタリング手法の評価

秋山智宏, 中田秀基, 松岡聡

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 87 ( 77 ) 159 - 164 2001年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

広域ネットウーク上に分散した計算資源や情報資源を活用し、大規模計算を行うためのGridと呼ばれる広域分散システムが注目されている。このような環境においては、故障検出、性能予測等のため、システム上の各資源の性能の計測が重要となる。Global Grid Forum内の組織の一つであるGrid Performance Working Groupが、モニタリングシステムの基本的なアーキテクチャとXMLによるデータ形式を定義・提案しているが、この提案に対しては、1)アーキテクチャのスケーラビリティ、2)XMLを用いたデータ表現のコスト、3)データ形式の拡張性、が検証されていない。本研究ではこれらを検証するために、GridRPCシステムであるNinf上に提案アーキテクチャの一部を実装し、評価をおこなった。その結果、アーキテクチャが現実的な設定範囲内では十分スケーラブルであり、XMLを用いたデータ形式のコストは許容できる大きさであり、データ形式の拡張性も十分であることを確認した。

CiNii Books

researchmap
ユーザ透過な耐故障性を実現するMPIへ向けて

高宮安仁, 松岡聡

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 87 ( 77 ) 129 - 134 2001年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

コモディテイクラスタリングシステムにおける, ノード数規模の拡大, 計算実行時間およびメモリ空間の急激なスケールアップに伴い, アプリケーションおよびシステムの障害発生の潜在的可能性への対処が急務となっている.しかし, クラスタ等の並列計算分野では, これまでこうした耐故障性についてのソフトウェア開発が重視されておらず, 十分ではなかった.また, 信頼性, ユーザ透過性, 実行時オーバヘッドの兼ね合いをユーザが指定することのできる, 柔軟な耐故障性機構が求められているが, 従来のクラスタ向け耐故障性システムでは, 単一のポリシ/機構専用のものがほとんどであった.加えて, 実アプリケーションを用いた場合のオーバヘッドも明らかではなかった.本稿では, 耐故障性機構をもつMPIである, Parakeetシステムを提案する.Parakeetシステムを用いることによって, ユーザは性能を損ねることなく, 容易に耐故障性, リカバリのポリシ/機構を指定できる.本稿では予備段階として, ユーザレベルチェックポインタ, プロセスマイグレーション, Coordinated CheckpointingをMPICH上にユーザ透過に実装した.予備的な評価の結果, Parakeetシステムは移植性を保ちつつ効率的であり, 本研究の将来的な目標であるプラグアンドプレイクラスタリングの基礎技術として有用であることがわかった.

CiNii Books

researchmap
高性能広域計算基盤 Grid へのポータルシステムの設計と実装

鈴村豊太郎, 松岡聡, 中田秀基

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 87 ( 78 ) 171 - 176 2001年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

本稿では, 分散オブジェクト技術Jiniを基盤に構築したComputing PortalシステムJiPANG(Jini-based Portals Augment Grid)の概要を示す.JiPANGは, Grid上に任意に存在するサービスを一元的に管理するインフラストラクチャと, そこに登録されたサービスの統一的かつ透過的な使用を可能にするプログラミング環境を提供する.JiPANGを用いることによって, NinfやNetSolve, Globus等の多様なGrid技術に同一のライブラリからアクセスできる他, 最新のバージョンのサービスが自動的にダウンロードされる等, Grid環境で動作するアプリケーション開発のコストを大幅に削減することができる.

CiNii Books

researchmap
広域大規模データ解析のための Grid Datafarm アーキテクチャ

建部修見, 森田洋平, 松岡聡, 関口智嗣, 曽田哲之

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 87 ( 77 ) 177 - 182 2001年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

ペタバイトスケールデータインテンシブコンピューティングのためのGrid Datafarmアーキテクチャの設計と実装を行っている.Grid Datafarmは, PCクラスタのローカルディスクを利用した広域データ並列ファイルシステムを提供し, オンラインでペタバイト規模の大容量と, ローカルI/Oバンド幅を利用したスケーラブルなI/Oバンド幅が特徴である.Gfarm並列I/O APIおよびGfarmコマンドにより, 単一システムイメージの操作を可能とする.ファイルの複製, ヒストリによる再生成などにより, 自動的な耐故障性, 負荷分散も目指している.

CiNii Books

researchmap
Javaによるソフトウェア分散共有メモリシステムの構築

中田秀基, 早田恭彦, 小川宏高, 松岡聡

情報処理学会論文誌プログラミング（PRO） 42 ( 7 ) 85 - 85 2001年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

コモディティ技術を生かした並列計算システムとして，PCクラスタが注目されている．このようなクラスタ上で稼動するソフトウェアシステムの候補の1つとして，ヘテロな環境においてもポータビリティに優れる，Java言語を用い，ソフトウェアにより分散共有メモリを実現したマルチスレッド実行環境がある．我々はこれまでに，クラスタをターゲットとしたJavaによる分散共有メモリシステムを提案，プロトタイプシステムを実装し，この機構の有用性を確認している．しかしこのプロトタイプシステムには，1)プログラムごとにクラスタ上にシステムを起動するため，起動に大きな時間がかかる，2)ユーザプログラムのクラスファイルをクラスタに，あらかじめユーザが転送しておかなければならない，といったシステム上の問題点があった．本稿では，これを解決するべく開発した，新たなシステムを紹介する．本システムは，クラスタ上の各ノードにサーバを常駐し，複数のアプリケーションプログラムがサーバを共有することで，起動時間を削減する．また，アプリケーションプログラムのクラスファイルをクライアントとサーバが協調して，自動的にサーバ側に転送することでクラスファイル転送のコストを軽減する．さらに，クラスタ上で稼動するプログラムに対して，クライアントマシンのファイルシステムアクセスを提供する．Due to rapid commoditization of advanced hardware, parallel machines are being commoditized in the form of PC clusters. Software DSM systems using Java language, which is portable on heterogenous systems, are good candidates for such computing environment. In our previous paper, we proposed a java based software DSM system for clusters. The system successfully proved its usefulness, but we found some defects including 1) long startup time due to remote invocation of Java VM and 2) troublesome labor to transfer class files on each nodes. In this paper, we introduce our new Java DSM system, which enables Java VMs to settle on each nodes, reducing startup time. It automatically transfers application class files and provides access to the client file system.

CiNii Books

researchmap
ヘテロなクラスタ環境における並列LINPACKの最適化

笹生健, 松岡聡, 建部修見

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 86 ( 49 ) 49 - 54 2001年5月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

本研究ではLINPACK BenchmarkのひとつであるHPLをヘテロなクラスタ環境向けに最適化して実装し, CPUが異なるノードの混在するCPUヘテロなクラスタ上での評価を行なった.用いた最適化手法は, 各ノードの性能差に応じて割り当てるデータサイズを変えることによってロードバランスを取るというものである.それにより, ピーク性能において理論性能の57.1%, 通常のHPLと比べ最大1.49倍の性能を達成した.

CiNii Books

researchmap
Java向けソフトウェア分散共有メモリの実現

早田恭彦, 中田秀基, 小川宏高, 松岡聡

情報処理学会論文誌プログラミング（PRO） 42 ( 3 ) 14 - 26 2001年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

近年のハードウェアの急速なコモディティ化とネットワーク技術の発展により，Grid Computingに代表されるWide Area HPCがさかんに研究されている．異なるアーキテクチャの計算機で構成されるGrid Computingにおいて，プラットフォームポータビリティとパフォーマンスポータビリティを満たすにはJava言語を利用するのが1つの適当な手法である．しかし，Javaをコモディティクラスタ上で動作させるためには，分散共有メモリを実現する必要があるが，既存の研究ではJVMへの変更が必要であり，ポータビリティが考慮されていない．そこで，本研究ではJavaのポータビリティを損なわないソフトウェア分散共有メモリのソフトウェアアーキテクチャを考察し，プロトタイプシステムJDSMを作成した．このソフトウェア分散共有メモリを異なる通信インタフェースを用いてコモディティクラスタ上で性能評価を行い，C言語での実現に比べメモリコンシステンシ処理が大きいことなどが分かった．Rapid commoditization of advanced hardware and progress of networking technology is now making wide area high-performance computing a.k.a.エ the `Grid' Computing a reality. Since a Grid will consist of vastly heterogeneous sets of compute nodes, especially commodity clusters, some have articulated the use of Java as a suitable technology to satisfy portability across different machines. Since Java's natural model of parallelism is shared memory multithreading, one will have to support distributed shared memory (DSM) in a portable manner; however, none of the previous work on implementing Java on DSM has been portable solution. Instead, we propose a software architecture whose goal is to achieve portability of DSM implementations across different commodity clustering platforms, and implemented a prototype system JDSM. Benchmark results show that the current implementation on Java incurs increased memory coherency maintenance cost compared to C-based DSMs, thus limiting scalability to some degree, and we are currently working on a solution to alleviate this cost.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00016879/
ソフトウェア分散共有メモリ上のOpenMP Omni/SCASHのSPLASH2による性能評価 (計算機アーキテクチャ,ハイパフォーマンスコンピューティング合同研究報告第8回「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2001))

栄純明, 松岡聡, 佐藤三久, 長谷川篤史, 原田浩

情報処理学会研究報告 2001 ( 22 ) 187 - 192 2001年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

共有メモリ向け並列化インタフェースであるOpenMPを,分散メモリシステム上で実装するシステムの一つとしてOmni/SCASHがある.Omni/SCASHにより分散メモリシステム,共有メモリシステムの両方のアーキテクチャで同一のプログラムが透過的に動作可能となる.本稿ではOmni/SCASHの性能評価を共有メモリ向けのベンチマークプログラムであるSPLASH2のうちFFT,Ocean,Waterを用いて行った.SPLASH2プログラムのOpenMP化,Omni/SCASHに特有な変更,キャッシュヒット率,フォールトハンドラ・バリア同期実行頻度の解析結果などを報告する.さらに,性能ヘテロなクラスタにおけるOmni/SCASHの評価も行った.

CiNii Books

researchmap
An evaluation of multiple pointing input systems

K Fukuchi, S Matsuoka

HUMAN-COMPUTER INTERACTION - INTERACT'01 739 - 740 2001年

　詳細を見る

記述言語：英語

Web of Science

researchmap
A Foundation of Solution Methods for Constraint Hierarchies

Hiroshi Hosobe, Satoshi Matsuoka

Constraints Journal, Special Issue on Soft Constraints 2001年

　詳細を見る

researchmap
Implementation of a Portable Software DSM in Java

Yukihiko Sohda, Hidemoto, Nakada Satoshi, Matsuoka Hirotaka Ogawa

Proceedings of ACM JavaGrande/ISCOPE 2001,San Francisco, pp.163--172, June, 2001.JavaGrande/ISCOPE 2001 Conference, Jun. 2001 163 - 172 2001年

　詳細を見る

researchmap
Grid Data Farm for Petascale Data Intensive Computing

Osamu Tatebe, Youhei Morita Satoshi, Matsuoka Noriyuki Soda, Hiroyuki Sato, Yoshio Tanaka, Satoshi Sekiguchi, Yoshiyuki Watase, Masatoshi Imori, Tomio Kobaya

Techinical Report, Electrotechnical Laboratory, TR-2001-4 2001年

　詳細を見る

researchmap
A Grid Programming Primer, (Draft 2.4)

Craig Lee, Satoshi, Matsuoka Domenico Talia Alan, Sussman Nicholas Karonis Gabrielle Allen Mary Thomas

Whitepaper for Global Grid Forum Advanced Programming Models Working Group 2001年

　詳細を見る

researchmap
OpenJIT 2: The Design and Implementation of Application Framework for JIT Compilers

Fuyuhiko Maruyama Satoshi, Matsuoka Hirotaka Ogawa Naoya, Maruyama Kouya Shimura

USENIX Java Virtual Machine Research and Technology Symposium (JVM'01), Work in Progress session. Monterey. April 23-24 2001 2001年

　詳細を見る

researchmap
A Jini-based Computing Portal System

Toyotaro Suzumura, Satoshi Matsuoka, Hidemoto Nakada

Proceedings of IEEE/ACM Supercomputing '2001, IEEE Computer Society, Denver, Colorado, Nov. 2001 2001年

　詳細を見る

researchmap
Network-Enabled Server Systems and the Computational Grid

Henri Casanova, Satoshi, Matsuoka Jack Dongarra

High Performance Computing Symposium (HPC'01),Advanced Simulation Technologies Conference, April 22-26 in Seattle, Washington (USA), 2001 2001年

　詳細を見る

researchmap
Ninfシステムにおけるフォールトトレランス

白砂哲, 中田秀基, 松岡聡

情報処理学会研究報告 2001-HPC-87(SwoPP2001沖縄), July 2001 159 - 164 2001年

　詳細を見る

researchmap
Implementation of a Portable Software DSM in Java

Yukihiko Sohda, Hidemoto, Nakada Satoshi, Matsuoka Hirotaka Ogawa

Proceedings of ACM JavaGrande/ISCOPE 2001,San Francisco, pp.163--172, June, 2001.JavaGrande/ISCOPE 2001 Conference, Jun. 2001 163 - 172 2001年

　詳細を見る

researchmap
A Foundation of Solution Methods for Constraint Hierarchies

Hiroshi Hosobe, Satoshi Matsuoka

Constraints Journal, Special Issue on Soft Constraints 2001年

　詳細を見る

researchmap
Grid data farm for atlas simulation data challenges

Y Morita, O Tatebe, S Matsuoka, N Soda, H Sato, Y Tanaka, S Sekiguchi, S Kawabata, Y Watase, M Imori, T Kobayashi

PROCEEDINGS OF CHEP 2001 699 - 701 2001年

　詳細を見る

記述言語：英語

Web of Science

researchmap
A study of deadline scheduling for client-server systems on the Computational Grid

A Takefusa, H Casanova, S Matsuoka, F Berman

10TH IEEE INTERNATIONAL SYMPOSIUM ON HIGH PERFORMANCE DISTRIBUTED COMPUTING, PROCEEDINGS 406 - 415 2001年

　詳細を見る

記述言語：英語

Web of Science

researchmap
OpenJIT 2: The Design and Implementation of Application Framework for JIT Compilers

Fuyuhiko Maruyama Satoshi, Matsuoka Hirotaka Ogawa Naoya, Maruyama Kouya Shimura

USENIX Java Virtual Machine Research and Technology Symposium (JVM'01), Work in Progress session. Monterey. April 23-24 2001 2001年

　詳細を見る

researchmap
Grid計算環境におけるデッドラインスケジューリング手法の性能

竹房あつ子, 松岡聡

情報処理学会電気通信処理学会並列シンポジウムJSPP 2001 論文集 2001.06 263 - 270 2001年

　詳細を見る

researchmap
Java向けソフトウエア分散共有メモリの実現

早田恭彦, 中田秀基, 小川宏高, 松岡聡

情報処理学会論文誌 ,Vol.42 No.SIG 3 (PRO10), March. 2001 12 - 24 2001年

　詳細を見る

researchmap
Problem Solving Environment Comparison

Rajkummar Buyya, Tom Eidson Dennis Gannon Erwin Laure Satoshi, Matsuoka Thierry, Priol Joel Saltz, Seidel Yoshio Tanaka

Whitepaper for Global Grid Forum Advanced Programming Models Working Group 2001年

　詳細を見る

researchmap
MPC plus plus performance for commodity clustering

Y Sakae, S Matsuoka

HIGH-PERFORMANCE COMPUTING AND NETWORKING 2110 503 - 512 2001年

　詳細を見る

記述言語：英語

Web of Science

researchmap
Network-Enabled Server Systems and the Computational Grid

Henri Casanova, Satoshi, Matsuoka Jack Dongarra

High Performance Computing Symposium (HPC'01),Advanced Simulation Technologies Conference, April 22-26 in Seattle, Washington (USA), 2001 2001年

　詳細を見る

researchmap
Grid Data Farm for Petascale Data Intensive Computing

Osamu Tatebe, Youhei Morita Satoshi, Matsuoka Noriyuki Soda, Hiroyuki Sato, Yoshio Tanaka, Satoshi Sekiguchi, Yoshiyuki Watase, Masatoshi Imori, Tomio Kobaya

Techinical Report, Electrotechnical Laboratory, TR-2001-4 2001年

　詳細を見る

researchmap
A Grid Programming Primer, (Draft 2.4)

Craig Lee, Satoshi, Matsuoka Domenico Talia Alan, Sussman Nicholas Karonis Gabrielle Allen Mary Thomas

Whitepaper for Global Grid Forum Advanced Programming Models Working Group 2001年

　詳細を見る

researchmap
Problem Solving Environment Comparison

Rajkummar Buyya, Tom Eidson Dennis Gannon Erwin Laure Satoshi, Matsuoka Thierry, Priol Joel Saltz, Seidel Yoshio Tanaka

Whitepaper for Global Grid Forum Advanced Programming Models Working Group 2001年

　詳細を見る

researchmap
JavaでのOpen Just-In-Timeコンパイラ技術 OpenJIT

小川宏高, 松岡

2001年

　詳細を見る

researchmap
分散オブジェクト技術Jiniを用いたComputing Portal Systemの実装

鈴村豊太郎, 松岡聡, 中田秀基

情報処理学会研究報告 2001-HPC-87(SwoPP2001沖縄), July 2001 171 - 176 2001年

　詳細を見る

researchmap
2010年 : シミュレーションの旅 : コモディティ技術によるPetaFLOPSコンピューティングへの道しるべ

松岡聡

シミュレーション 19 ( 4 ) 238 - 245 2000年12月

　詳細を見る

記述言語：日本語出版者・発行元：日鉄技術情報センタ-

Commodity High-Performance Computing which utilizes commodity computing building blocks for high-performance computing is expected to reduce the cost of computing by a factor of over ten thousand over the next ten years, implementing the so-called Petaflops computing as well as making Terascale computing prevalent. As a result, simulations of unprecedented scale or resolution will become possible, making the role of simulation ever more important in science and technology. We attempt to predict the advances of computing power by exploring the technical trends, and investigate how such advances will affect to revolutionize simulation.

CiNii Books

researchmap

その他リンク： http://dl.ndl.go.jp/info:ndljp/pid/11082261
MPC++-on-MPIのコモディティクラスタ環境における評価

栄純明, 石川裕, 松岡聡, 高橋俊行

情報処理学会論文誌. ハイパフォーマンスコンピューティングシステム 41 ( 2 ) 60 - 72 2000年11月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

MPC++のようにfiner-grainedなマルチスレッド・リモートメソッド起動・グローバルメモリリード/ライトや同期構造体を言語レベルでサポートする並列言語は, C+MPIのようなものに比べて, 表現力・記述性が高い.finer-grainedな言語の構造上, こういった並列言語は従来高速で高価なネットワーク上の専用のユーザレベル通信ライブラリを用いて実装されてきた.一方で, これらの並列言語が広く受け入れられるためには, 比較的安価なネットワークを使用したコモディティハードウェア上のポータブルなメッセージ通信ライブラリを用いて実装される必要がある.しかし, コモディティハードウェア上に実装された並列言語で(1)既存の並列プログラムを容易に記述することができるか, (2)その場合, コモディティハードウェア/ソフトウェアを用いたことによる性能の低下はどれくらいになるか, (3)専用のハードウェア/ソフトウェアを用いて実装したものに比べてどのくらいのスケーラビリティを得ることができるか, を系統的に検証した例はほとんどない.我々は, このようなコモディティな実装の有効性を検証するため, MPC++をMyrinetと100Base-T Ethernetという費用や性能の異なるネットワーク上の, 異なるMPIの実装上に移植した.さらに, NASPARのアプリケーションをMPC++上に移植し, ベンチマークを行った.その結果, (a)既存のMPIで記述されたプログラムをMPC++に移植するのは容易であること, (b)MPC++の通信レイヤにMPIを使うことによるオーバヘッドは小さく, NASPARアプリケーションでは無視できる程度であること, (c)データセットが大きいときには100Base-T上のMPC++/MPIでもMyrinet上のC+MPIやオリジナルの専用実装であるMPC++ on PM/Myrinetと同等の性能を示すことが分かった.

CiNii Books

researchmap
コモディティな並列処理のORにおける可能性 : クラスタとGridコンピューティングの動向(特別部会セッション : 数理計画)

松岡聡

日本オペレーションズ・リサーチ学会秋季研究発表会アブストラクト集 2000 258 - 259 2000年9月

　詳細を見る

記述言語：日本語出版者・発行元：公益社団法人日本オペレーションズ・リサーチ学会

CiNii Books

researchmap
インタラクティブ・エッセイ x86アンドロイドは電気牛の夢を見るか

松岡聡

情報処理 41 ( 9 ) 1072 - 1074 2000年9月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

CiNii Books

researchmap
MPC++ Multi-Thread Template Library の様々な通信レイヤ上での実装と性能評価

野田裕介, 栄純明, 松岡聡, 小川宏高

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 82 ( 73 ) 137 - 142 2000年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

MPC++を含めた並列プログラミング言語は, ユーザレベルスレッド, リモートメソッド起動, リモートメモリアクセスなど細粒度並列処理に必要な様々な機能を言語機能として有する.これらの言語は, その性質ゆえ, 特定のハードウェアに依存して実装される場合が多く, コモディティハードウェアによるPCクラスタのように潜在的に多種多様な環境(プロセッサ, OS, ネットワーク)へのポータブルかつ高効率な実装方法については十分に検討されているとは言い難い.そこで我々は, MPC++の環境依存部分である通信レイヤおよびユーザレベルスレッド機能を他の部分から分離するとともに, 通信レイヤをMPIに代表される汎用かつ高速なメッセージ通信ライブラリを利用して実現することで, 並列プログラミング言語の実装におけるポータビリティと高効率の両立を試みている.本稿では, 通信レイヤとして軽量かつ汎用な通信機構であるVIAを用いてMPC++を実装し、他の様々な実装とともに, 基本性能およびNAS Parallel BenchmarkのCGカーネルの実行性能を評価した.現状のVIAによる実装は不十分であるため, 3ノード以上での評価は行えなかったが, 既存のMPIを用いた実装に比べて, 特に小量のデータ通信において顕著な改善が見られた.また, スループットも32bytesの場合に190%改善した.

CiNii Books

researchmap
PCクラスタにおける Ethernet による高速ユーザレベルバリアの性能評価

岩崎聖, 松岡聡, 栄純明, 小川宏高

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 82 ( 73 ) 131 - 136 2000年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

PCクラスタ、特にバリア同期のように集中的な通信が求められる高性能なクラスタには、Myrinetなどの高価で低レイテンシかつ高バンド幅のネットワークが不可欠だと信じられている。我々はこれらのネットワークを用いた場合と同等の性能のバリア同期をコモディティネットワーク、特にFast Ethernet上で実現するために、マルチキャストや複数ネットワークを利用する方法を提案し、詳細な検討を行った。我々はまず、VIAのようにNICに直接アクセスすることで低レイテンシを実現するとともに、マルチキャスト機能をサポートした実験用通信ライブラリを実装した。その上で、複数のバリアアルゴリズムを実装し、性能評価を行った。ベンチマークの結果、32ノード時にShuffle Exchangeアルゴリズムでは170μ秒とMyrinetと比較して十分高速であった。マルチキャストを利用した場合には現状では200μ秒以上かかってしまったが、LogPモデルを用いて理論的に分析した結果、ライブラリの設計を見直すことでShuffle Exchangeより高速なバリアが達成できるという指針を得た。これらの結果から、コモディティネットワークはクラスタにおいて十分な性能を発揮し、より低コストにクラスタを構築できるという結論に達した。

CiNii Books

researchmap
インタラクティブ・エッセイ：これでいいのか？日本のスパコン／がんばるぞ，日本のスパコン／これからはクラスタでいいじゃん - ソフト屋の独り言／日本のスパコン，悪いのは君じゃない／It's still the Bandwidth!

朴泰祐, 渡辺貞, 松岡聡, 関口智嗣, 朴泰祐

情報処理 41 ( 7 ) 877 - 884 2000年7月

　詳細を見る

記述言語：日本語

CiNii Books

researchmap
これでいいのか?日本のスパコン

朴泰祐, 渡辺貞, 松岡聡

情報処理 41 ( 7 ) 877 - 878 2000年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

CiNii Books

researchmap
これからはクラスタでいいじゃん - ソフト屋の独り言

松岡聡

情報処理 41 ( 7 ) 880 - 882 2000年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

CiNii Books

researchmap
複数ポインティング入力システムの構築

福地健太郎, 松岡聡

情報処理学会研究報告. HI,ヒューマンインタフェース研究会報告 89 ( 61 ) 15 - 21 2000年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

複数のポインティング入力デバイスを同時に並行に操作可能なシステムをビデオカメラ入力ベースで構築した。一般的なGUIシステムでは、画面上の複数の操作対象を並行に操作する事はできず、ーつのポインティングデバイスを使って逐次的に処理する必要があった。本環境ではユーザーは最大8箇所まで同時に位置情報を入力する事ができ、GUI画面上のオブジェクトを並行に操作する事ができる。各デバイスは透明なアクリル板の上で操作し、その様子は下からビデオカメラで撮影し、その画像から各デバイスの座標値を計算する。

CiNii Books

researchmap
Network Enabled Server System の設計

中田秀基, 松岡聡, 佐藤三久, 関口智嗣

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 81 ( 57(HPC-81) ) 69 - 74 2000年6月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

Network Enabled Serverはグローバルコンピューティングのミドルウェアとして有望な形態である。本稿では、Network Enabled Serverシステムの設計において設計上の選択点を整理し、それぞれの設計方針の得失を検討する。選択点としては、クライアント/サーバ間の接続の方式、プロトコルの方式、セキュリティ機構の方式が挙げられる。われわれはこの検討を踏まえて、Network Enabled ServerシステムNinfを新たに設計、実装した。本稿では、このNinf新システムの設計に関して、セキュリティ機構に重点をおいて紹介する。

CiNii Books

J-GLOBAL

researchmap
Jiniを用いた Computing Portal System の開発

鈴村豊太郎, 松岡聡, 中田秀基, 関口智嗣

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 81 ( 57 ) 57 - 62 2000年6月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

本稿では, 様々な Grid システムに統一的にアクセスできる Computing Portal システム JiPANG(Jini-based Portal Augmenting Grids)を提案する.JiPANG システムは, 分散オブジェクト技術 Jini を基盤に構築されている.JiPANG システムでは, Globus や Ninf等の様々な Grid システムが管理する計算サービスやリソースを統合管理するための仮想的な計算基盤 JiPANG Pool を導入し, その heterogeneity を吸収し, 統一的かつ簡便に使用するためのクライアントインタフェース JiPANG API と JiPANG Browser を提供する.JiPANG APIは, 各 Grid システムが提供するサービスに統一的にアクセスできる Java のプログラミングインタフェースである.JiPANG Browserは, プログラミングをすることなく直接的に Grid システムを使用することができるユーザインタフェースである.これらを用いることにより, ユーザはクライアントパッケージをインストールすることなく, 最新バージョンのGridシステムを使用することができ, Gridに簡便かつ統一的に, しかも透過的にアクセスすることが可能になる.

CiNii Books

researchmap
グローバルコンピューティングのためのスケジューリングフレームワーク

中田秀基, 竹房あつ子, 松岡聡, 佐藤三久, 関口智嗣

情報処理学会論文誌 41 ( 5 ) 1617 - 1627 2000年5月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

ネットワーク技術の発展にともない，グローバルコンピューティングシステムがいくつか提案されているが，その計算/通信リソースを十分活用するための手法はいまだ確立されていない．リソースを有効に活用するためには，グローバルコンピューティングに特有なリソースの変動と不安定さを考慮し，関連する複数のタスクに対して一括して適切にリソースを割り当てるスケジューリング手法が必要である．本稿では，グローバルコンピューティング環境において個々のアプリケーションの性能とシステム全体のスループットを両立させるための，階層化されたスケジューリングフレームワークを提案する．さらに，このフレームワークに準拠したNinfシステムのメタサーバスケジューリングフレームワークの実装について述べ，試験的に複数のスケジューリング手法をメタサーバ上に実装しその動作を確認する．この結果，本フレームワークが十分にフレキシブルであることが示された．Rapid progress in networking technology is now making global computingsystems feasible. Although there have been proposals of globalcomputing systems, it is still a research issue as to how to achieveefficient usage of computing resources in global computing. Inparticular, we need to devise appropriate schedulingstrategies/algorithms of computing resources over wide-area networks,which are often dynamic and unstable in nature.This paper presents ourpreliminary scheduling framework for unifying application and jobscheduling in global computing. The proposed framework establishes alayer of scheduling and resource allocation subframeworks.We show our software framework Ninf metaserver which provides low-levelscheduler and resource monitor. We also evaluate some scheduling strategies using the framework.The evaluation results prove that the framework is flexible enoughto implement plural scheduling algorithms on top of it.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00012320/
グローバルコンピューティングのスケジューリングのための性能評価システム

竹房あつ子, 合田憲人, 松岡聡, 中田秀基, 長嶋雲兵

情報処理学会論文誌 41 ( 5 ) 1628 - 1638 2000年5月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

グローバルコンピューティングシステムが複数提案される一方，グローバルコンピューティングシステムのスケジューリング手法に対する考察が不十分である．これは大規模かつ再現性のある評価実験が困難であることに起因する．本稿ではグローバルコンピューティングシステムのスケジューリングアルゴリズムとそのフレームワークのための評価基盤を提供するBricksシステムを提案する．Bricksでは様々な性能評価環境やスケジュールアルゴリズムおよびスケジューリングに関するモジュールを設定可能である．また，これらのモジュールを既存グローバルコンピューティングシステムモジュールに置き換えることで，Bricks上での既存システムの機能試験を実施することができる．他システムのBricksへの組み込み例としてリソース情報の予測システムであるNWSを用いて本システムの評価実験を行ったところ，Bricksが実環境と同等の挙動を示すことを確認した．さらに，NWSがBricks上で正常に動作したことから，Bricksが既存の外部モジュールに対して機能試験環境を提供できることを示した．While there have been several proposals of high performance globalcomputing systems, scheduling schemes for the systems have notbeen well investigated.The reason is difficulties of evaluation bylarge-scale benchmarks with reproducible results. Our Bricks performance evaluationsystem would allow analysis and comparison of various schedulingschemes on a typical high-performance global computing setting.Bricks can simulate various behaviors of global computing systems, especiallythe behavior of networks and resource scheduling algorithms.Moreover, Bricks is componentalized such that not only itsconstituents could be replaced to simulate various different systemalgorithms, but also allows incorporation of existing global computingcomponents via its foreign interface.To test the validity of the latter characteristics, we incorporatedthe NWS system, which monitors and forecasts global computing systems behavior.Experiments were conducted by running NWS under a realenvironment versus the simulated environment given the observedparameters of the real environment.We observed that Bricks behaved in the same manner as the real environment, and NWS also behavedsimilarly, making quite comparative forecasts under both environments.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00012321/
OpenJITフロントエンドシステムの設計

小川宏高, 松岡聡, 丸山冬彦, 早田恭彦, 志村浩也

情報処理学会論文誌プログラミング（PRO） 41 ( 2 ) 1 - 12 2000年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

Open Compilerは，自己反映計算をベースとして，コンパイラにさまざまな言語拡張や最適化のためのモジュールを組み込む技術である．我々は，Java言語のJust?In?TimeコンパイラにOpen Compilerの技術を適用し，クラス単位での最適化のためのカスタマイゼ一ションを可能にしたOpenJITを開発している．OpenJITは，アプリケーションや計算環境に特化した動的な言語機能の拡張や最適化が可能であり，新たなコンパイル技術の研究基盤としての役目を果たす．OpenJITは，可搬性を確保するために99%がJava言語で記述されており，フロントエンドシステムとバックエンドシステムから構成される．前者はより高レベルな中間表現での最適化・特化を支援するバイトコード変換器のフレームワークを提供し，後者はコード生成レベルでの最適化を行い，実行時コードを生成する．本稿では，フロントエンドシステムの実現について述べるとともに，それを用いた単純な例による評価を行う．The so-called 'Open Compilers' is a technique to incorporate various self-descriptive modules for language customization and optimization based on computational reflection. We apply the open compiler technique to a Java Just-In-Time compiler to develop the OpenJIT compiler, which allows class-specific customization and optimization, fostering research of new compilation techniques such as application-specific customization and dynamic optimizations. The OpenJIT is largely divided into the frontend and the backend. The frontend takes the Java bytecodes as input, performs higher-level optimizations involving source-to-source transformations, and passes on the intermediate code to the backend. The backend takes the intermediate code from the frontend as input, performs lower-level optimizations, and outputs the native code for direct execution. In this paper, we describe the internal architecture of the frontend system and evaluate it for a simple loop example.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00016944/
Java による並列LUの性能評価

長谷川広和, 松岡聡, 伊藤茂雄

情報処理学会研究報告. ARC,計算機アーキテクチャ研究会報告 137 ( 23 ) 83 - 88 2000年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

Javaで高い可搬性と性能を両立する並列BLASライブラリであるAJaPACKを研究開発した。AJaPACKは任意のJava環境に自己で適合したチューニングを行いその環境に最も適したメモリ最適化を施したBLASライブラリとしてインストールされる。性能評価ではC版のATLASなど、最適化されたネイティブライブラリと比較して1 / 2〜1 / 3程度の速度を達成し、かつ並列化によりSMP環境ではネイティブライブラリを上回る性能を自動的に得る。これは従来報告されたPure JavaによるBLAS性能の数倍から数十倍の性能でありJavaが科学技術系のHPCに用いられるために有用な技術であるといえる。一方でBlocked LU分解においても相応の速度向上を得ているがAJaPACKでは部分行列操作のオーバヘッドにより性能が低下している。これはJavaにおける数値計算ライブラリの構築が未だ容易でなく高性能をあげるためにJava特有のプログラミング技法を必要としている事を示している。

CiNii Books

researchmap
Are Global Computing Systems Useful? Comparison of Client-server Global Computing Systems Ninf, NetSolve Versus CORBA

SATOSHI MATSUOKA

14th IEEE International Parallel \& Distributed Processing Symposium 547 - 556 2000年

　詳細を見る

researchmap
Performance Issues in Client-Server Global Computing

SATOSHI MATSUOKA

International Workshop on Global and Cluster Computing (WGCC'2000).2000.03 2000年

　詳細を見る

researchmap
AJaPack; A Performance Portable Parallel Java Numerical Library

SATOSHI MATSUOKA

Proceedings of the ACM 2000 Java Grande Conference, The ACM Press,June, 2000 140 - 149 2000年

　詳細を見る

researchmap
Performance Issues in Client-Server Global Computing

SATOSHI MATSUOKA

International Workshop on Global and Cluster Computing (WGCC'2000).2000.03 2000年

　詳細を見る

researchmap
Open JIT：Javaのための開放型自己反映的JITコンパイラフレームワーク

松岡聡

日本ソフトウエア科学会第三回プログラミングおよび応用システムに関するワークショップ（SPA2000,口頭発表）,March 2000 2000年

　詳細を見る

researchmap
AJaPack; A Performance Portable Parallel Java Numerical Library

SATOSHI MATSUOKA

Proceedings of the ACM 2000 Java Grande Conference, The ACM Press,June, 2000 140 - 149 2000年

　詳細を見る

researchmap
Are Global Computing Systems Useful? Comparison of Client-server Global Computing Systems Ninf, NetSolve Versus CORBA

SATOSHI MATSUOKA

14th IEEE International Parallel \& Distributed Processing Symposium 547 - 556 2000年

　詳細を見る

researchmap
NetCFD: A Ninf CFD component for global computing, and its Java applet GUI

M. Sato, K. Kusano, H. Nakada, S. Sekiguchi, S. Matsuoka

Proceedings - 4th International Conference/Exhibition on High Performance Computing in the Asia-Pacific Region, HPC-Asia 2000 1 501 - 506 2000年

　詳細を見る

記述言語：英語出版者・発行元：Institute of Electrical and Electronics Engineers Inc.

DOI： 10.1109/HPC.2000.846605

Scopus

J-GLOBAL

researchmap
OpenJIT: An open-ended, reflective JIT compiler framework for Java

H Ogawa, K Shimura, S Matsuoka, F Maruyama, Y Sohda, Y Kimura

ECOOP 2000 - OBJECT-ORIENTED PROGRAMMING 1850 362 - 387 2000年

　詳細を見る

記述言語：英語

Web of Science

researchmap
Javaバイトコードをデコンパイルするための効果的なアルゴリズム

丸山冬彦, 小川宏高, 松岡聡

情報処理学会論文誌プログラミング（PRO） 40 ( 10 ) 39 - 50 1999年12月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

機械語命令列から同じ意味のソースプログラムを復元するデコンパイルという技術は古くから知られており主にリバースエンジニアリングのための手段の一つとして利用されてきた.実際に Javaとそのバイトコードに関してもいくつかの処理系が提案されているがこれまで提供されてきた処理系では Java言語には無いgotoを挿入するなど Java言語の文法を逸脱した結果を出力することがある.またデコンパイルのアルゴリズムがアドホックで応用の利かないものであるため我々のOpenJITコンパイラが要求するような任意のバイトコードから正しいソース構造を復元するでコンパイラフロントエンドとして用いることができない.そこで我々はJavaバイトコードから適切なJava言語の制御構造を復元するための効果的なアルゴリズムを新しく考案した.アルゴリズムの基本となる考え方はメソッドのコントロールフローグラフに対するドミネータツリーを用いるものである.これはブロック構造が完全な入れ子になる言語の場合制御構造を表す任意のプログラム片はドミネータツリーにおいてただ一つのサブツリーをなすという性質に基づいている.この一般性によりアルゴリズムはJava以外の言語に適用することも可能である.OpenJITでの予備的な実装による評価では他のデコンパイラが制御構造の復元に失敗するプログラムであっても我々のアルゴリズムは適切にそれを復元しかつ実行速度は同程度であることを示した.The technique called decompilation that reads sequences of machine code and generates the corresponding source program has been known for some time, and utilized primarily for reverse-engineering. For Java and its bytecode, although there have been several proposals of decompilers, most generate outputs that are inappropriately extend the Java language, such as insertion of gotos not present in Java. Moreover, the decompilation algorithms are somewhat ad-hoc and difficult to extend of verify its applicability, which is a hindrance to out OpenJIT compiler which requires a decompiler frontend to recover the correct source structure from arbitrary bytecode. Instead, we have devised a new and effective algorithm for decompilation, with emphasis on properly recovering control structures. The key idea is to base the algorithm around the dominator tree of the control flow graph of a method. This is based on the observation that, for a properly-nested block-structured language, each part of program representing a control structure corresponds to just a single subtree in the dominator tree. As such, the algorithm is general enough to be applied to other languages besides Java. The evaluation of our preliminary implementation in OpenJIT shows that our algorithm properly recovers control structures where other existing decompilers fail, and with relatively equivalent execution speeds.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00016961/
手書きスケッチによる3次元モデリングシステム Teddy--フリーハンドで自由曲線を描くだけで手軽に3次元モデルを作成できる

五十嵐健夫, 松岡聡, 田中英彦

日経CG ( 156 ) 110 - 117 1999年9月

　詳細を見る

記述言語：日本語出版者・発行元：日経BP社

CiNii Books

researchmap
クライアント・サーバ型のグローバルコンピューティングシステムの比較 : Ninf, NetSolve, CORBA, Ninf-on-Globus の性能評価

鈴村豊太郎, 中川貴之, 松岡聡, 中田秀基

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 77 ( 66 ) 197 - 202 1999年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

Ninf,NetSolve,Globusをはじめとするグローバルコンピューティングシステムの近年の発展により,広域ネットワークを利用して高性能計算を提供することが可能となってきている.しかし,それらの研究の多くは,アーキテクチャやアプリケーションの構築例に偏っており,その種のシステムが本質的に満たすべき性質については検証されていない.本稿では,Ninf,NetSolve,CORBAを用いて実アプリケーションを実装し,各システムの比較を行った.その結果,NinfやNetSolveのようなグローバルコンピューティング専用のシステムは,CORBAと比較し性能面・管理面・プログラマビリティの点のいずれにおいても勝ることが明らかになった。また,Globusの通信サービスであるNexusを用いて,Ninfシステムを構築した.その結果,前提とする通信モデルの相違により,繁雑な実装になり性能の低下を招いた.このことから,グローバルコンピューティングにおける理想的なソフトウエアアーキテクチャを選定する為に,多くのシステムにわたる研究が必要であると言える。

CiNii Books

researchmap
MPC++ Multi-Thread Template Library のMPIによる実装と性能評価

栄純明, 石川裕, 松岡聡, 小川宏高

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 77 ( 66 ) 41 - 46 1999年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

並列言語MPC++は新情報処理開発機構で開発されたクラスタシステムソフトウェアであるSCore以外の環境では利用できなかった.我々はプラットホームポータビリティのために,通信レイヤにMPIを用いてMPC++を実装したが,MPIの特性はプラットホーム毎に異なるため,性能の可搬性が問題となる.測定の結果データサイズが8Kbytes以上の時には通信のオーバヘッドは無視できることが分かった.さらにNas Parallel BenchmarksのCGカーネルベンチマークでは,ノード数が少ないときにはMPC++on MPIで書かれたものがMPIで書かれたものに性能面で迫る.しかしノード数が増加すると,ネットワーク性能の低いコモディティプラットホームでは性能が著しく低下するのに対し,高速なネットワークを持つMPP上と,高性能なネットワークを持ったコモディティプラットホーム上ではスケールした.この結果MPC++on MPIは高性能なネットワークを持ったプラットホーム上ではその有効性が確認できたが,コモディティネットワークに対しては更なる最適化が必要であることが分かった.

CiNii Books

researchmap
グローバルコンピューティングシステムNinfを用いた数値流体解析コンポーネントnetCFD

佐藤三久, 草野和寛, 中田秀基, 関口智嗣, 松岡聡

年会一般講演 18 369 - 370 1999年7月

　詳細を見る

記述言語：日本語

CiNii Books

researchmap
並列処理 Javaによる大域的並列計算環境Ninflet

高木浩光, 松岡聡, 中田秀基, 関口智嗣, 佐藤三久, 長嶋雲兵

情報処理学会論文誌 40 ( 5 ) 2203 - 2214 1999年5月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
Javaによる大域的並列計算環境Ninflet

高木浩光, 松岡聡, 中田秀基, 関口智嗣, 佐藤三久, 長嶋雲兵

情報処理学会論文誌 40 ( 5 ) 2203 - 2214 1999年5月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

地球規模の広域分散計算システムを魅力的なものとするためには不特定の者に対してシステムの利用だけでなく応用プログラムの作成をも解放する必要があると考える. その実現のためには安全性を保証しながら任意のプログラムを実行できる仕組みが必要である. そこで Javaのセキュリテイ機構を活用してこれを実現した大域的並列計算環境「Ninflet」を提案する. これを用いることで任意の計算を他人が所有する計算機上でさせることが可能となる. このシステムは夜間利用されていない計算機を地球の裏側の昼間の地域に貸し出すといった地球規模の共同利用メタコンピュータシステムを実現するためやまたワークステーションクラスタ上に並列処理環境を構築するためにも利用することのできるものである. 本論文では Ninfletシステムのアーキテクチャを提案するとともに並列処理環境として利用する場合の予備的な性能評価を行う.To make global-wide distributed computing system attractive, the system should be open to an arbitrary individual not only for its usage but also for construction of wide variety of application programs. For this purpose, the system must supply a secure environment for safely executing arbitrary programs. Our proposed global computing environment "Ninflet" fulfills such a requirement by exploiting the security mechanism of the Java language, allowing computation to occur on machines not owned or administered by the individual invoking the computation. Ninflet realizes a globally-shared metacomputer which would allow "lending" of computing cycles of machines which would be otherwise unused at nights to the other side of the globe, or to simply build a parallel execution environment on a heterogeneous sets of workstation clusters. We present the system architecture of Ninflet and a preliminary performance evaluation when used as a parallel execution environment.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00012665/
加法性を持つ拡張インタラクション・ネット : 線形論理に基づく新しいプログラミング言語

松岡聡

情報処理学会論文誌プログラミング（PRO） 40 ( 4 ) 72 - 72 1999年5月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

この論文では新しいプログラミング言語を提案する. これはY.Lafontにより提案されたインタラクション・ネットの加法性を付加することによる拡張である. 加法性の付加は一階のユニフィケーション変数の導入による : インタラクション・ネットの中のそれぞれのエージェントがユニフィケーション変数が含まれる一階の項を保持する. このことによりエージェントがインタラクションをするときインタラクション・ネット上の情報が一階のユニフィケーションにより分散して送られる. J.-Y.Girardの乗法性と加法性をもつプルーフ・ネットはこの拡張インタラクション・ネットの特別なケースと考えられる. われわれはこの拡張インタラクション・ネットがある種の並行オブジェクト指向プログラミング言語である後方証明探索に基づく線形論理プログラミング言語よりもある目的特に最近Java BeansやActive Xなどで注目されているコンポーネント・べースのプログラミングの形式化においては利点をもつと考える. さらに SLD-レゾリューションやπ-計算に似た論理プログラミング言語をこの拡張インタラクション・ネットに埋め込むことができる.We propose a new programming language, which is an extension of Lafont's interaction nets to the additive case. The extension here is to introduce first-order unification variables: each agent in interaction nets has several first order terms with unification variables. When agents interact, information on interaction nets can be distributed by first order unification. In contrast with the standard interaction nets, our interaction nets with first order terms do not have the Church-Rosser property: several rewrite rules may apply to an additive interaction net. Girard's additive proof nets can be considered as a special case of our interaction nets with first order terms. We consider the extended interaction nets as a better substitute for linear logic programming languages based on backward proof search, which is a concurrent object oriented programming language, for some purposes, especially for formalization of componentbased programming, which is a trend in real computing, e.g. Java Beans and Active X. We can encode a π-calculus-like logic programming language as well as the SLD-resolution into the additive interaction nets.

CiNii Books

researchmap
グローバルコンピューティングシステムのシミュレーションによる評価

竹房あつ子, 合田憲人, 中田秀基, 小川宏高, 松岡聡, 佐藤三久, 関口智嗣, 長嶋雲兵

情報処理学会論文誌 40 ( 5 ) 2192 - 2202 1999年5月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

グローバルコンピューティングを実現する試みが行われる一方グローバルコンピューティングのスケジューリングに関する明確な知見は得られていない. これは広域ネットワークでは再現性のある大規模性能評価が非常に困難で性能要素に関する調査が十分なされていないためである. 本稿ではグローバルコンピューティングシステムにおけるスケジューリングの公正な性能評価を行うシミュレータの設計および実装と本シミュレータを用いた性能評価実験を行った. 本シミュレータではネットワークとサーバを待ち行列で表しその組合せにより多様なグローバルコンピューティングシステムが表現可能である. 本シミュレータで実際のグローバルコンピューティングシステムをシミュレーションした結果実測とほぼ同様の結果が得られた. また本シミュレータを用いたスケジューリング手法の性能評価では資源状況を適切に考慮したスケジューリングが有効であることが分かった.While there have been several proposals of high performance global computing systems, scheduling schemes for the systems have not been well investigated. The reason is difficulties of evaluation by large-scale benchmarks with reproducible results. This paper describes design and implementation of the simulator that evaluates scheduling schemes on a typical high-performance global computing system. The simulator can simulate various features of global computing systems by adopting a queueing model. Effectiveness of the simulator was verified by the simulation results, which showed very similar results to the experimental results on a real global computing system. This paper also shows simulation results of simple scheduling schemes by the simulator. Results show it is important to consider resource conditions appropriately for overall system performance.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00012664/
3次元音場を利用したモービルコンピューティング向けのナビゲーションインターフェイス

城井学, 松岡聡, 林一輝

情報処理学会研究報告. HI,ヒューマンインタフェース研究会報告 83 31 - 36 1999年5月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

3次元音場を用いたナビゲーションシステム3D Audio Compassを提案する。ユーザは3次元音場によって従来のナビゲーションシステムより直感的なナビゲーションを受けることができる。更に、視線や身体の自由を奪わないので、ユーザは実世界タスクに集中できる。また、そのプロトタイプをVRMLを用いて実装し、仮想空間上でのナビゲーションタスクによって評価を行った。その結果、3次元音場によるナビゲーションが有効であるという知見を得た。

CiNii Books

researchmap
高可搬な自己反映計算によるソフトウエア分散共有メモリの性能評価

八木澤直哉, 小川宏高, 早田恭彦, 松岡聡

情報処理学会研究報告. ARC,計算機アーキテクチャ研究会報告 132 ( 21 ) 109 - 114 1999年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

近年の計算機構成技術の発展に伴って多様化するソフトウエア実行環境の上でプラットフォームボータビリティを確保することは希求の課題である。特にPCクラスタ/WSクラスタ等の分散メモリ並列機上の並列言語処理系に関しても同様のことが求められる。つまり, 汎用性・保守性を維持しつつ, 実行時環境に最適化されたプログラムを生成できなければならない。このような要求を満たす処理系を実現する一つの方法は自己反映計算を用いることである。我々は, C++言語のOpen CompilerであるOpenC++2.5のCompile-time MOPを用いて, SPMDスタイルで書かれたC++の並列プログラムに対して, 分散共有メモリ機能を付加する並列言語処理系OMPC++を実装した。本稿ではSPLASH2を用いて本システムの評価を行い, 自己反映計算によるプログラム変換を用いたソフトウエアDSMが可搬性・保守性に優れており, かつ高性能DSMに匹敵する性能を達成し得ることを示す。

CiNii Books

researchmap
複数の Java 処理系における高性能計算の性能評価にむけて

伊藤茂雄, 松岡聡

情報処理学会研究報告. ARC,計算機アーキテクチャ研究会報告 132 ( 21 ) 25 - 30 1999年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

Java言語はプラットフォーム間の可搬性が特徴であるが, JITコンパイラなどでの最適化は科学技術計算をポータブルな方法で高速に実行するためには, 効果的ではない可能性がある。従って, Javaにおいて異なる処理系間の「性能の可搬性」は必ずしも保証されない, そこで我々は, 複数のJava処理系のベンチマークを行える基盤を構築し, 果たしてJavaが異なる処理系において性能の可搬性を維持できるかどうか検証して, 将来Java言語やシステムにフィードバックすることを目指している。今回は, Cの最適化BLASコード生成システムであるATLASのJava版を開発し, 複数のJava処理系のBLASのピーク性能を調べ, あらにソースレベルで可能な最適化と性能比較をすることによって, ソースレベル最適化の可搬性を検証した。

CiNii Books

researchmap
グローバルコンピューティングシミュレータの概要

竹房あつ子, 合田憲人, 中田秀基, 松岡聡, 長嶋雲兵

情報処理学会研究報告. ARC,計算機アーキテクチャ研究会報告 132 ( 21 ) 31 - 36 1999年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

グローバルコンピューティングシステムが複数提案される一方, グローバルコンピューティングシステムのスケジューリング手法に対する考察が不十分である。これは大規模かつ再現性のある評価実験が困難であることに起因する。本稿ではグローバルコンピューティングシステムのスケジューリングアルゴリズムとそのフレームワークのための評価基盤を提供するシミュレータBricksを提案する。Bricksでは様々なシミュレーション環境やスケジュールアルゴリズムおよびスケジューリングに関するモジュールを設定可能である。また, これらのモジュールを既存グローバルコンピューティングシステムモジュールに置き換えることで, Bricks上での既存システムの機能試験を実施することができる。他システムのBricksへの組み込み例としてリソース情報の予測システムであるNWSを用いて本システムの評価実験を行ったところ, Bricksが実環境と同等の挙動を示すことを確認した。さらに, NWSがBricks上で正常に動作したことから, Bricksが既存の外部モジュールに対して機能試験環境を提供できることを示した。

CiNii Books

researchmap
Ninfによる遠隔計算資源アクセスシステムの構築とグローバルコンピューティングシステムの性能評価

佐藤三久, 田中良夫, 草野和寛, 中田秀基, 関口智嗣, 長嶋雲兵, 松岡聡

情報処理学会研究報告. ARC,計算機アーキテクチャ研究会報告 132 ( 21 ) 37 - 42 1999年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

グローバルコンピューティングのためのミドルウエアである、ネットワーク情報ライブラリNinfを用いて、広域のネットワークで接続された計算機を利用するいくつかのシステムを試作している。Ninfにより、遠隔の計算資源をクライアント側のプログラムの一つの計算コンポーネントとして利用できるようになる。プロトタイプとして、数値流体解析コンポーネントnetCFDと分子軌道計算コンポーネントnetMOを開発した。流体計算では、途中結果の大量のデータの出力が必要となることがあるが、計算とデータの入出力をオーバーラップさせることによって、遠隔の計算資源でも効率的に利用できる。netCFDを利用したデモシステムとして、Java appletを用いて広域ネットワーク上のWebブラウザから利用可能なシステムを構築した。appletはサーバ上でNinfインタフェースでサービスされている流体解析解析プログラムを起動して計算を行い、callbackのインタフェースにより計算途中でappletの可視化ルーチンを起動することで可視化させることができる。

CiNii Books

J-GLOBAL

researchmap
「世紀末討論会 : 20世紀, コンピュータ・サイエンスは何の役に立ったか? : <現場エンジニアvs理論研究者たちの壮絶バトル>」

竹内郁雄, 鯵坂恒夫, 荒木啓二郎, 石田喬也, 上原三八, 土屋正登, 松岡聡

情報処理 40 ( 2 ) 32 - 32 1999年2月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

CiNii Books

researchmap
OpenC++のリフレクション機能を用いた分散共有メモリの実現

早田恭彦, 小川宏高, 松岡聡

情報処理学会論文誌プログラミング（PRO） 40 ( 1 ) 13 - 22 1999年2月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

近年の計算機構成技術の発展に伴って多様化するソフトウェア実行環境の上でプラットフォームポータビリティを確保することは希求の課題である. 特にPCクラスタ/WSクラスタ等の分散メモリ並列機上の並列言語処理系に関しても同様のことが求められる. つまり汎用性・保守性を維持しつつ実行時環境に最適化されたプログラムを生成できなければならない. このような要求を満たす処理系を実現する一つの方法はリフレクションを用いることである. 本稿では C++言語のOpen CompilerであるOpenC++2.5のCompile-time MOPを用いて SPMDスタイルで書かれたC++の並列プログラムに対して共有分散メモリ機能を付加する並列言語処理系を実現した. 具体的にはCompile-time MOPを用いたプログラム変換によって共有変数に対応する共有メモリ管理オブジェクトの生成・初期化共有変数へのアクセスの管理オブジェクトを介したアクセスへの変換などを行ってMPC++のプログラムを生成する. Myrinetで接続された8台構成のPCクラスタ上で性能評価しリフレクションを用いた分散共有メモリ実現の有効性を確認した.Platform portability is one of the utmost demanded properties of a system today, due to the diversity of runtime execution environment of wide-area networks, and parallel programs are no exceptions. However, parallel execution environments are VERY diverse, could change dynamic any, while performance must be portable as well. As a result, techniques for achieving platform portability are sometimes not appropriate, or could restrict the programming model, e.g., to simple message passing. Instead, we propose the use of reflection for achieving platform portability of parallel programs. As a prototype experiment, a soft ware DSM system was created which utilizes the compile-time metaprogramming features of OpenC++ 2.5 to generate a message-passing MPC++ code from a SPMD-style, shared-memory C++ program. The translation creates memory management objects on each node to manage the consistency protocols for objects arrays residing on different nodes. Read-and write-barriers are automatically inserted on references to shared objects. We evaluated this system on a PC cluster linked by the Myrinet gigabit network.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00017020/
Teddy: A sketching interface for 3D freeform design

T Igarashi, S Matsuoka, H Tanaka

SIGGRAPH 99 CONFERENCE PROCEEDINGS 409 - 416 1999年

　詳細を見る

記述言語：英語

Web of Science

researchmap
OMPC++ --- A Portable High-Performance Implementation of DSM using OpenC++ Reflection

Yukihiko Sohda, Hirotaka Ogawa, Satoshi Matsuoka

Proc. of Reflection'99, Springer LNCS 1616 215 - 234 1999年

　詳細を見る

researchmap
Teddy: A Sketching Interface for 3D Freeform Design

Takeo Igarashi, Satoshi Matsuoka, Hidehiko Tanaka

Proc. ACM SIGGRAPH'99 409 - 416 1999年

　詳細を見る

researchmap
OMPC++ --- A Portable High-Performance Implementation of DSM using OpenC++ Reflection

Yukihiko Sohda, Hirotaka Ogawa, Satoshi Matsuoka

Proc. of Reflection'99, Springer LNCS 1616 215 - 234 1999年

　詳細を見る

researchmap
OpenJIT--自己反映計算に基づいた動的に変更可能なJava JITコンパイラ (特集ネットワ-クコンピュ-ティングの新展開--オ-プンJavaのもたらすもの)

松岡聡

Computer today 15 ( 6 ) 4 - 11 1998年11月

　詳細を見る

記述言語：日本語出版者・発行元：サイエンス社

CiNii Books

researchmap
Java における高速化の動向

松岡聡

計測と制御 = Journal of the Society of Instrument and Control Engineers 37 ( 9 ) 627 - 632 1998年9月

　詳細を見る

記述言語：日本語出版者・発行元：公益社団法人計測自動制御学会

DOI： 10.11499/sicejl1962.37.627

CiNii Books

researchmap
Java を用いた広域並列計算システム Ninflet 上の通信クラスライブラリの実現

大久光崇, 高木浩光, 松岡聡, 小川宏高

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 72 ( 72 ) 67 - 72 1998年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

Javaを含むネットワーク可搬性が高い言語処理系を用いて、夜間などに稼働していない遊休計算機資源を活用した広域並列計算システムが数多く研究されており、我々のNinfletシステムはその一つである。しかし、これらのシステムでは、単純なマスターワーカーモデルの並列計算でしか評価していないことが多く、また、RMIやMPIなどの低レベルな通信プリミティブをそのまま使用し繁雑なプログラミングスタイルをとっている。本研究では、広域並列計算を容易にプログラムすることを支援するために、通信を含む並列処理のアルゴリズムを、デザインパターンを用いて抽象化したNinfletシステム用のクラスライブラリを実装し、従来のプログラミング手法と比較、検討する。

CiNii Books

researchmap
広域計算システムNinfにおけるユーザ認証

中田秀基, 松岡聡, 佐藤三久, 関口智嗣

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 72 ( 72(HPC-72) ) 79 - 84 1998年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

昨今の急速なネットワーク技術の発展により分散高性能計算が可能となり、これを支援するソフトウェアフレームワークとしてわれわれのNinfを含む幾つかのシステムが提唱されており、技術的にも成熟しつつある。しかし、この種のテクノロジの普及に必要とされるユーザの制限や計算機使用量に応じた課金、データの機密性保持といったシステムの社会的側面の研究は途上にある。本稿ではこの種の要請に答えるためのセキュリティ機構の一部であるユーザ認証をとりあげ、分散高性能計算に要請される認証機構について論じる。認証の強度とシステム利用の簡便性はトレードオフの関係にあり、システムの使用形態に応じて複数の認証機構を使い分けることが重要である。

CiNii Books

J-GLOBAL

researchmap
Ninfシステムにおけるジョブスケジューラの実装と予備的評価

竹房あつ子, 中田秀基, 合田憲人, 小川宏高, 松岡聡, 長嶋雲兵

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 72 ( 72 ) 73 - 78 1998年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

ネットワーク技術の発展により, グローバルコンピューティングシステムが複数提案されているが, その計算リソースを有効に利用するための議論が十分になされていない.特に, 広域ネットワーク経由の計算固有の変動や不安定さを考慮して, 計算リソースを適切に割り当てるスケジューリング手法が必要である.本稿では, グローバルコンピューティングにおいてアプレケーションスケジューリングとジョブスケジューリングを統合するための階層化されたスケジューリングフレームワークを提案するとともに, それに準拠したNinfシステムのメタルサーバスケジューリングフレームワークの実装について述べる.さらに, 実環境と性能評価モデルを用いてスケジューリング手法の評価を行い, グローバルスケジューリングにおける課題を明らかにした.

CiNii Books

researchmap
OpenJIT : 自己反映的な Java JITコンパイラ

松岡聡, 小川宏高, 志村浩也, 木村康則, 堀田耕一郎, 高木浩光

電子情報通信学会技術研究報告. CPSY, コンピュータシステム 98 ( 234 ) 49 - 56 1998年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

Open Compilerは, 自己反映計算をベースとして, コンパイラにさまざまな言語拡張や最適化の為のモジュールを組み込む技術である.我々は, Java言語のJust-In-TimeコンパイラにOpen Compilerの技術を適用し, クラス単位での最適化の為のカスタマイゼーションを可能にしたOpenJITを開発している.OpenJITは, アプリケーションや計算環境に特化した動的な言語機能の拡張や最適化が可能であり, 新たなコンパイル技術の研究基盤としての役目を果たす.

CiNii Books

researchmap
Ninfによる広域分散並列計算

中田秀基, 高木浩光, 松岡聡, 長嶋雲兵, 佐藤三久, 関口智嗣

情報処理学会論文誌 39 ( 6 ) 1818 - 1826 1998年6月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

ローカルなネットワーク上でのメッセージパッシングライブラリを用いた分散並列計算はすでに広く行われている．しかし，ネットワークの高速化によって現実的になりつつある広域ネットワーク上での分散並列計算については，ソフトウェアの枠組みがいまだ十分に整備されていない，我々は，広域分散並列計算に適した分散計算の枠組みとして「Ninf」を提案している．Ninfは広域分散環境でのマクロデータフローによる並列実行を支援するシステムで，広域での動的負荷分散とスケジューリングを特徴とする．メッセージパッシングライブラリを用いた手法と比較して，（1）広域ネットワークに適した通信パターンを用いる，（2）ユーザにとってプログラミングが容易でかつ再利用性が高い，（3）既存のライブラリの再利用が容易，（4）ネットワーク上の資源の利用が可能，といった特長を持つ．Distributed computing using message passing libraries in a LAN(Local Area Network) environment is already accepted as an effective supercomputing methodology.On the other hand,although distributed computing in WAN(Wide Area Network) environment is becoming practical due to recent development of high-speed network facilities,software framework for supercomputing in WAN is yet to be established.We propose 'Ninf',a distributed computing framework for globally distributed computing environment.Ninf enables parallel computing in WAN based on the macro dataflow model,and facilitates automatic dynamic load distribution and scheduling.Ninf has the following advantages over using existing message passing libraries in WAN supercomputing:(1) communication protocol suited for globally distributed environment,(2) ease of programming (3) reuse of existing libraries,(4) integration with existing data resources on the Internet.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00013059/
部分計算を用いたMPIプログラム最適化システムOMPI

小川宏高, 松岡聡

情報処理学会論文誌 39 ( 6 ) 1700 - 1708 1998年6月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

MPI (Message Passing Interface）は並列計算機を用いた高性能計算のためのメッセージ通信ライブラリの標準として広く普及しつつある．MPIは様々な通信方式を強力かつ柔軟に支援している反面，そのAPIの複雑さゆえに大きなソフトウェアオーバヘッドがかかり，MPIの適用範囲を定型的な粗粒度計算に限定する結果となっている．我々のOMPIはプログラム中のMPIライブラリ呼び出しにかかわる静的情報を用いて部分計算を行うことで余分なオーバヘッドの大部分を削減するシステムである．また，本システムでは部分計算のみでは不可能なさらなる最適化のために「テンプレート関数」を導入して利用する．ベンチマークを行った結果，わずかな実行コード量増加で通信主体の並列プログラムの性能が2倍に向上するとともに，従来の動的な最適化手法との比較でも大きな性能向上が見られた．MPI is gaining widespread acceptance as a standard for message passing in high-performance computing,due to its powerful and flexible support of various communication styles.However,the complexity of its API poses significant software overhead,and as a result,applicability of MPI has been restricted to rather regular,coarse-grained computations.Our OMPI (Optimizing MPI) system removes much of the excess overhead by employing partial evaluation techniques,which exploit static information of MPI calls.Because partial evaluation alone is insufficent,we also utilize template functions for further optimization.Benchmarks show that OMPI improves execution efficiency by as factor of two for communication-intensive application core with minimal code increase.It also performs significantly better than previous dynamic optimization technique.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00013046/
複数クライアントによるLAN/WANでのNinfの性能

竹房あつ子, 小川宏高, 松岡聡, 中田秀基, 高木浩光, 佐藤三久, 関口智嗣, 長嶋雲兵

情報処理学会論文誌 39 ( 6 ) 1827 - 1838 1998年6月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

広域ネットワークの整備につれ，高性能広域分散計算を実現する試みが我々のNinfを含めていくつか行われている．しかしこのような広域計算システムの，特にWANにおいて複数のクライアントが複数のサイトに分散している状況下での性能特性に関する議論は十分になされていない．本稿では，Ninfおよび類似のシステムの実現可能性を調査するため，LAN／WAN環境でLinpack／EPベンチマークを実施し，次のような結果を得た．1）十分なバンド幅があれば，Ninfを用いた方がLocal実行するより高速になる．2）既存の高性能計算機は性能や耐久性の点で広域計算システムの運用に十分なプラットフォームである．3）ベクトル並列計算機（Cray J90）では，高性能並列ライブラリが有効利用できる，すなわち既存の高性能ライブラリの再利用性がある．4）計算主体の計算（EP）では現状の広域計算システムで十分に運用できる．5）通信主体の計算（Linpack）では，LAN環境ではサーバの稼働率が性能を支配し，WAN環境では通信性能と設置条件によって性能に与える影響に一定の傾向がある．Rapid increase in speed and availability of network of supercomputers is making high-performance global computing possible,including our Ninf system.However,critical issues regarding system performance characteristics in global computing have been little investigated,especially under multi-client,multi-site WAN settings.In order to investigate the feasibility of Ninf and similar systems,we conducted benchmarks under various LAN and WAN environments,and observed the following results:1)Given sufficient communication bandwidth,Ninf performance quickly overtakes client local performance,2)current supercomputers are sufficient platforms for supporting Ninf and similar systems in terms of performance and OS fault resiliency,3)for a vector-parallel machine (Cray J90),employing optimized dataparallel library is a better choice compared to conventional task-parallel execution employed for non-numerical data servers,4)computationally intensive tasks such as EP can readily be supported under the current Ninf infrastructure,and 5)for communication-intensive applications such as Linpack,server CPU utilization dominates LAN performance,while communication bandwidth dominates WAN performance,and furthermore,aggregate bandwidth could be sustained for multiple clients located at different Internet sites;as a result,distribution of multiple tasks to computing servers on different networks would be essential for achieving higher client-observed performance.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00013060/
Javaによる大域的並列計算環境Ninflet

高木浩光, 松岡聡, 中田秀基, 関口智嗣, 佐藤三久, 長嶋雲兵

情報処理学会シンポジウム論文集 98 ( 7 ) 135 - 142 1998年6月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
対話的整形による幾何学的図形の高速描画

五十嵐健夫, 松岡聡, 河内谷幸子, 田中英彦

情報処理学会論文誌 39 ( 5 ) 1373 - 1384 1998年5月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

本論文では，幾何学的な図形を計算機上で手早く描くことを可能にする対話的整形という描画手法を提案し，そのアルゴリズムおよびプロトタイプシステムを用いた評価実験の結果について述べる．既存の描画システムでは，平行や対称といった性質を満たす幾何学的図形を描画するために回転や複製といった複雑な編集操作を適切に組み合わせて用いなくてはならず，特に初心者にとって短期間に正確な描画を行うことは困難である．対話的整形とは，計算機がユーザの手書き入力を受け取り必要な幾何学的制約を自動的に推測して整形を行うものであり，編集操作をいっさい使用することなく幾何学的制約を満たすことを可能にする．対話的整形では，図形全体でなくストローク1本1本に対して整形を行うことで意図と大幅に異なる変形を防ぎ，もっともらしい整形結果の候補を複数生成してユーザに提示することで入力の曖昧性に対処している．アルゴリズムは，手書きの入力図形から必要な幾何学的制約を推測して抽出する制約抽出部と，抽出された幾何学的制約から整形図形を生成する制約解消系からなっており，実時間での効率的な動作を実現している．直線のみからなる図形を描くことのできるプロトタイプシステムが実装されており，描画実験により，既存の描画システムに比べて描画時間が短縮され，かつ図形の幾何学的制約の充足度も改善されていることを確認した．Diagram drawing with conventional computer-assisted drawing editors often tend to take considerable amount of time despite their seeming ease of use.The causes of the problem are too many commands and unintuitive procedures to satisfy geometric constraints.To solve the problem,we propose interactive beautification,a technique for rapid geometric design,and developed a prototype system Pegasus to verify the efficiency of the technique.Interactive beautification system receives the user's freestroke and beautifies it considering geometric constraints among segments.Using the technique,the user can draw precise diagrams with geometric relations rapidly without using any editing commands.Current prototype system supports drawings comprised of straight lines,and a user study was performed using the prototype system,a commercial CAD,and an OO-based drawing system.The result showed that the users can draw required diagrams more rapidly and more precisely using the prototype system.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00013100/
Java言語いま何が課題なのか：エッセイ：Javaとプログラム言語研究

松岡聡

情報処理 39 ( 4 ) 301 - 301 1998年4月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

CiNii Books

researchmap
応用の新展開-メタコンピューティングへの応用-

高木浩光, 松岡聡

情報処理 39 ( 4 ) 302 - 305 1998年4月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

CiNii Books

researchmap
超広域分散数値情報データベースNinfDBの構築について

稲木貴光, 松岡聡, 小川宏高

全国大会講演論文集 56 ( 0 ) 258 - 259 1998年3月

　詳細を見る

記述言語：日本語

CiNii Books

researchmap
クラスタ型並列計算機における Implicit Co-scheduling の性能評価

福地健太郎, 松岡聡, 堀敦史, 石川裕

情報処理学会研究報告. ARC,計算機アーキテクチャ研究会報告 128 ( 18 ) 43 - 48 1998年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

Implicit co-schedulingはBerkeley NOWプロジェクトで提案された、大域スケジューラを持たず、オーバーへッドが少い・実装が容易である等の利点を持つ並列ジョブスケジューリング技法である。これまでの性能評価では実行時間の対ギャングスケジューリング比にして0.6〜1.6程度の性能が出るとされているが、実用的なアプリケーションでの性能評価はなされていない。本研究では、大規模高性能クラスター上で、NAS並列ベンチマークを用いる事で、implicit co-schedulingの実践的な性能を測定した。その結果、 FT, CGにおいて実行時間の対ギャングスケジューリング比にして最大2.3倍という結果を得ており、Berkeleyの評価が再現しなかった。これは、ネットワークの混雑等が原因と予測され、現在追試中である。

CiNii Books

researchmap
Ninf and PM: Communication libraries for global computing and high-performance cluster computing

M Sato, H Tezuka, A Hori, Y Ishikawa, S Sekiguchi, H Nakada, S Matsuoka, U Nagashima

FUTURE GENERATION COMPUTER SYSTEMS 13 ( 4-5 ) 349 - 359 1998年3月

　詳細を見る

記述言語：英語

DOI： 10.1016/S0167-739X(97)00036-8

Web of Science

J-GLOBAL

researchmap
Ninflet: a Migratable Parallel Objects Framework using Java

Hiromitsu Takagi, Satoshi, Matsuoka Hidemoto, Nakada Satoshi Sekiguchi, Mitsuhisa Satoh, Umpei Nagashima

ACM 1998 Workshop on Java for High-Performance Network Computing 151 - 159 1998年

　詳細を見る

researchmap
Pegasus: A Drawing System for Rapid Geometric Design

Takeo Igarashi, Satoshi Matsuoka, Sachiko Kawachiya, Hidehiko Tanaka

CHI'98 Summary (ACM Conference on Human Factors in Computing Systems) 24 - 25 1998年

　詳細を見る

出版者・発行元：ACM

DOI： 10.1145/286498.286511

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/chi/chi1998a.html#IgarashiKTM98
Popup Vernier: A Tool for Sub-Pixel-Pitch Dragging with a Smooth Mode Transition

Yuji Ayatsuka Satoshi, Matsuoka Jun Rekimoto

Proceedings of ACM Symposium on User Interface Software and Technology (UIST'98) 39 - 48 1998年

　詳細を見る

出版者・発行元：ACM

DOI： 10.1145/288392.288407

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/uist/uist1998.html#AyatsukaRM98
Utilizing the Metaserver Architecture in the Ninf Global Computing System

Hidemoto Nakada Hiromitsu, Takagi Satoshi, Matsuoka Umpei Nagashima Mitsuhisa Sato, Satoshi Sekiguchi

Proc. High-Performance Computing and Networking '98, Springer LNCS 1401 607 - 616 1998年

　詳細を見る

researchmap
OpenJIT ---A Reflective Java JIT Compiler

S. Matsuoka, H. Ogawa, K. Shimura, Y. Kimura, K. Hotta, H. Takagi

Proc. OOPSLA '98 Workshop on Reflective Programming in C++ and Java 16 - 20 1998年

　詳細を見る

researchmap
Layered penumbrae: An effective 3D feedback technique

Y Ayatsuka, S Matsuoka, J Rekimoto

3RD ASIA PACIFIC COMPUTER HUMAN INTERACTION, PROCEEDINGS 202 - 209 1998年

　詳細を見る

記述言語：英語

Web of Science

researchmap
Ninflet: a Migratable Parallel Objects Framework using Java

Hiromitsu Takagi, Satoshi, Matsuoka Hidemoto, Nakada Satoshi Sekiguchi, Mitsuhisa Satoh, Umpei Nagashima

ACM 1998 Workshop on Java for High-Performance Network Computing 151 - 159 1998年

　詳細を見る

researchmap
Popup Vernier: A Tool for Sub-Pixel-Pitch Dragging with a Smooth Mode Transition

Yuji Ayatsuka Satoshi, Matsuoka Jun Rekimoto

Proceedings of ACM Symposium on User Interface Software and Technology (UIST'98) 39 - 48 1998年

　詳細を見る

researchmap
A Constraint-Based Approach for Visualization and Animation

Shin Takahashi, Satoshi Matsuoka, Ken Miyashita, Hiroshi Hosobe, Tomihisa Kamada

Constraints 3 ( 1 ) 61 - 86 1998年

　詳細を見る

記述言語：英語出版者・発行元：Kluwer Academic Publishers

DOI： 10.1023/A:1009708715411

Scopus

researchmap
OpenJIT ---A Reflective Java JIT Compiler

S. Matsuoka, H. Ogawa, K. Shimura, Y. Kimura, K. Hotta, H. Takagi

Proc. OOPSLA '98 Workshop on Reflective Programming in C++ and Java 16 - 20 1998年

　詳細を見る

researchmap
Pegasus: A Drawing System for Rapid Geometric Design

Takeo Igarashi, Satoshi Matsuoka, Sachiko Kawachiya, Hidehiko Tanaka

CHI'98 Summary (ACM Conference on Human Factors in Computing Systems) 24 - 25 1998年

　詳細を見る

DOI： 10.1145/286498.286511

researchmap

その他リンク： https://dblp.uni-trier.de/db/conf/chi/chi1998a.html#IgarashiKTM98
Utilizing the metaserver architecture in the Ninf global computing system

H Nakada, H Takagi, S Matsuoka, U Nagashima, M Sato, S Sekiguchi

HIGH-PERFORMANCE COMPUTING AND NETWORKING 1401 607 - 616 1998年

　詳細を見る

記述言語：英語

Web of Science

researchmap
A performance evaluation model for effective job scheduling in global computing systems

K Aida, A Takefusa, H Nakada, S Matsuoka, U Nagashima

SEVENTH INTERNATIONAL SYMPOSIUM ON HIGH PERFORMANCE DISTRIBUTED COMPUTING - PROCEEDINGS 352 - 353 1998年

　詳細を見る

記述言語：英語

Web of Science

researchmap
Reduction of overhead in drawing figures with computer - Detailed analyses of drawing tasks

S Kawachiya, T Igarashi, S Matsuoka, H Tanaka

3RD ASIA PACIFIC COMPUTER HUMAN INTERACTION, PROCEEDINGS 11 - 18 1998年

　詳細を見る

記述言語：英語

Web of Science

researchmap
Javaに関する技術・応用・表現大賞'97

松岡聡

情報処理 38 ( 12 ) 1093 - 1098 1997年12月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00003323/
ABCL/EM ? 4：データ駆動並列計算機上の並列オブジェクト指向言語処理系の実装と評価

八杉昌宏, 松岡聡, 米澤明憲

情報処理学会論文誌 38 ( 9 ) 1790 - 1799 1997年9月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

並列オブジェクト指向計算は，計算モデルとしての強力な表現力と自然なMIMD的並列性を持っている．しかしながら，従来のMIMD並列計算機では，（1）リモート通信に要するコスト，（2）オブジェクト間のコンテキストスイッチに要するコスト，が非常に高く，並列オブジェクト指向計算はその性能を十分に発揮できないという問題があった．我々の提案したソフトウェア／ハードウェアアーキテクチャ（ABCL／EM?4）は，RISC的アプローチ，すなわち，ハードウェアは簡潔で高速化可能なものとし，複雑な処理は最適化されたソフトウェアで行うというアプローチにより，リモートメッセージパッシングやコンテキストスイッチのコストを，逐次の手続き呼び出しに匹敵するオーダーに削減することを可能にした．本稿では，データ駆動並列計算機EM?4をターゲットとして開発したABCL／STコンパイラを用いて，EM?4実機による処理系の評価を行ったので報告する．Concurrent object-oriented computing provides modeling power and natural MIMD parallelism through concurrency of objects.Unfortunately the high costs of inter-node message passing and intra-node scheduling make the implementation of concurrent object-oriented languages inefficient.To overcome these problems,we have proposed a new software/hardware architecture(ABCL/EM-4)which realizes efficient parallel execution of programs based on a concurrent object-oriented computation model.Our ABCL/EM-4 achieved high performance with a combination of simple and fast hardware mechanisms and sophisticated software design,where the cost of a remote message-passing and/or a context-switch can be almost comparable to that of a sequential procedure call.This paper shows the evaluation results with the developed ABCL/ST compiler on the data-driven parallel computer EM-4.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00013334/
スレッドベース実行における積極的データ転送のためのPlan ? Do型コンパイル技法とその評価

八杉昌宏, 松岡聡, 米澤明憲

情報処理学会論文誌 38 ( 9 ) 1840 - 1848 1997年9月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

分散メモリ型並列計算機において積極的データ転送を行うための新しいコンパイルの枠組みとして，Plan?Doコンパイル技法を開発した．この技法は近年の細粒度アーキテクチャにて，高スループット低遅延の通信手法?パイプライン送信?を実現するときに特に有効である．変換関数を先頭から適用することで，高レベルのPlan?Do型コードから，より低レベルの積極的データ転送を行うコードへ変換できる．また，開発したABCL／STコンパイラを用いて並列計算機EM?4における実験を行い，良い性能が得られることを確認した．Plan-Do compilation technique is a new,advanced compilation framework for eager data transfer on distributed-memory parallel architectures.The technique is especially effective for a recent breed of fine-grain architectures by realizing a high-throughput low-latency communication scheme,pipelined sends.The compilation of high-level,plan-do style code into low-level,eager data transfer code is achieved via straightforward application of the translation function.Benchmark results on a real parallel architecture,EM-4,with the developed ABCL/ST compiler exhibit good performance.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00013338/
高性能広域計算システムNinfのスケジューリングに関する予備的考察

小川宏高, 竹房あつ子, 中田秀基, 合田憲人, 松岡聡

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 67 ( 75 ) 85 - 90 1997年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

広域ネットワークの整備につれ, 分散する多数の超高性能計算機を利用して大規模計算を実現する試みが我々のNinfを含めてなされつつある. しかし, このような広域計算システムの, 特にWAN上で複数のクライアントが複数のサイトに分散している状況下での性能特性に関する議論は十分になされていない. それゆえクライアントに一定性能を保証するような広域スケジューリングの有効な手法は確立できていない. 本稿では, 広域計算システムのジョブスケジューリングのための予備的考察として, WANにおいて単ーサイト/複数サイトに複数のクライアントを設置して評価実験を行い, 通信主体の計算においては通信が性能を支配すること, 設置条件によって通信が性能に与える影響に一定の傾向があることを確認した. また, この結果を元にして待ち行列理論に基づいたシミュレーションモデルを提案した. さらに現在実装を進めているスケジューリングサーバMetaserverによる評価結果を示した.

CiNii Books

researchmap
Ninfによる広域分散並列計算

中田秀基, 高木浩光, 松岡聡, 長嶋雲兵, 佐藤三久, 関口智嗣

並列処理シンポジウム論文集 1997 281 - 288 1997年5月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
手早く正確な図を描くことのできる描画システム

五十嵐健夫, 河内谷幸子, 松岡聡, 田中英彦

全国大会講演論文集 54 ( 0 ) 425 - 426 1997年3月

　詳細を見る

記述言語：日本語

計算機上での図形描画システムはすでに一般に広く普及しており、簡単な操作で紙の上の作業では困難であった正確な図形を手早く描くことが可能になっている。しかし、ただ単に独立した図形要素を適当に並べるだけでなく各種の幾何的位置関係を満たした図形を描こうとした場合には、通常複雑な操作を組み合わせて使用することが必要となる。たとえば、対称な図形を描く場合には複製、反転、移動、といった操作を組み合わせて使わなければならず、また斜線に垂直な線分を描く場合には複製、90度回転、といった操作が必要になる。これらの複雑な操作は、描画作業の効率を下げる原因であり、また適切な操作の組み合わせを見つけられないことによる不完全な図形描画の原因にもなり得る[2]。我々は、このような幾何制約充足に関わる編集操作からユーザを解放する「対話的整形」という描画手法を提案、プロトタイプシステムを実装している[1]。図1に、プロトタイプシステム上での描画例を示す。本手法により、この図のように左右対称や平行垂直、接続、平行線分間の距離の一致といった複雑な制約を満たす図形を、複製や反転・回転といった編集操作や特殊な描画モードを一切使用することなく描くことが可能となる。

CiNii Books

researchmap
ネットワーク数値情報システムNinf : マルチクライアント環境での性能

竹房あつ子, 小川宏高, 松岡聡, 中田秀基, 佐藤三久, 関口智嗣, 長嶋雲兵

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 65 ( 21(HPC-65) ) 3 - 8 1997年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

ネットワーク数値情報システムNinfは,広域ネットワークに分散した計算資源や情報資源を利用して高速・高性能・高品質な科学技術計算を実現するための碁盤システムである.本稿ではNinfの全体構成について述べるとともに, Linpack benchmarkを用いて,シングル/マルチクライアント環境での本システムの性能評価を実施した.この結果,現実的な広域分散利用条件でのNinfシステムの実用性,堅牢性を確認した.また,既存のベクトルパラレルマシンを始めとする並列計算機がNinfによってネットワーク計算資源として有効に活用されることを示した.

CiNii Books

J-GLOBAL

researchmap
MPC++による様々な並列処理プログラミングスタイルのサポートとその性能

二上敦行, 松岡聡, 石川裕, 佐藤三久

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 65 ( 21 ) 57 - 62 1997年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

並列処理の普及のためには,汎用的なハードウェアやソフトウェアをベースとすることが今後望まれ、並列(プログラミング)言語も例外ではない.しかし、同時に並列言語は本来要求される広範な並列プログラミングスタイルへの対応,使いやすさ,実用的な性能を満たすことも必要不可欠である.我々は,既存のオブジェクト指向言語がそのような要求を満たしているかを調べるために、C++で特殊な言語拡張をせず本来の言語機能のみ用いることにより,様々な並列プログラミングスタイルがサポート可能であることを示した.具体的には,C++をテンプレートとインヘリダンスのみで拡張したMPC++をベースに,3つの並列プログラミングスタイルをサポートするテンプレート/クラスライブラリを作成し,ワークステーションクラスタ上で代表的なベンチマークの性能測定を行い、その有効性を検証した。

CiNii Books

researchmap
Ninfによる広域分散並列計算

中田秀基, 高木浩光, 松岡聡, 長嶋雲兵, 佐藤三久, 関口智嗣

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 65 ( 21(HPC-65) ) 9 - 14 1997年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

ローカルなネットワーク上でのメッセージバッシングライブラリを用いた分散並列計算はすでに広く行なわれている。しかし、ネットワークの高速化によって現実的になりつつある広域ネットワーク上での分散並列計算については、ソフトウェアの枠組が未だ十分に整備されていない。我々は、広域分散並列計算に適した分散計算の枠組として「Ninf」を提案している。Ninfは広域分散環境でのマクロデータフローによる並列実行を支援するシステムで、広域での動的負荷分散とスケジューリングを特徴とする。メッセージパッシングライブラリを用いた手法に比較して(1)広域ネットワークに適した通信パターンを用いる、(2)ユーザにとってプログラミングが容易でかつ再利用性が高い、(3)既存のライブラリの再利用が容易、(4)ネットワーク上の食源の利用が可能、といった特長をもっている。

CiNii Books

J-GLOBAL

researchmap
Ninflet:JavaによるWorld-Wide High Performance Computing環境 (インターネットコンファレンス'97論文集) -- (Session 3(Application)〔和文〕)

高木浩光, 松岡聡, 中田秀基

インタ-ネットコンファレンス論文集 ( 1997 ) 133 - 147 1997年

　詳細を見る

記述言語：日本語出版者・発行元：日本ソフトウェア科学会インタ-ネットテクノロジ研究会〔ほか〕

CiNii Books

researchmap
Multi-client LAN/WAN Analysis of Ninf : a High-Performance Global Computing System

SATOSHI MATSUOKA

Proceedings of IEEE Supercomputing '97, San Jose, CA 1997年

　詳細を見る

DOI： 10.1145/509593.509615

J-GLOBAL

researchmap
Interactive Beautification : A Technique for Rapid Geometric Design

SATOSHI MATSUOKA

Proceedings of ACM Symposium on User Interface Software and Technology (UIST'97), Banff, Canada 1997年

　詳細を見る

researchmap
A Methodology for Specifying Data Distribution using only Standard Object-Oriented Features

SATOSHI MATSUOKA

Proceedings of ACM/IEEE International Conference on Supercomputing (ICS'97), Vienna, Austria 116 - 123 1997年

　詳細を見る

researchmap
Multi-client LAN/WAN Analysis of Ninf : a High-Performance Global Computing System

SATOSHI MATSUOKA

Proceedings of IEEE Supercomputing '97, San Jose, CA 1997年

　詳細を見る

DOI： 10.1145/509593.509615

J-GLOBAL

researchmap
Interactive Beautification : A Technique for Rapid Geometric Design

SATOSHI MATSUOKA

Proceedings of ACM Symposium on User Interface Software and Technology (UIST'97), Banff, Canada 1997年

　詳細を見る

researchmap
A Methodology for Specifying Data Distribution using only Standard Object-Oriented Features

SATOSHI MATSUOKA

Proceedings of ACM/IEEE International Conference on Supercomputing (ICS'97), Vienna, Austria 116 - 123 1997年

　詳細を見る

researchmap
ネットワーク数値情報ライブラリ : Ninfを用いた数値計算環境システムの開発 : NinfCalcの試作

新居由佳子, 高木浩光, 長嶋雲兵, 中田秀基, 佐藤三久, 松岡聡, 関口智嗣

全国大会講演論文集 53 ( 0 ) 467 - 468 1996年9月

　詳細を見る

記述言語：日本語

コンピュータネットワークの発展に伴い、WWWに代表される情報提供サービスが普及し、ネットワーク経由で情報を共有することが可能となった。科学技術計算の分野においては、情報資源の共有化は、WWWのようなデータ資源のみに留まらず、計算資源自体の共有にも期待が寄せられている。従来より、科学技術計算の基盤となる行列計算や特殊関数の計算等は、必要に応じて自前でプログラムを作成して行なうことが多い。基本的な計算は既製のライブラリを使用することもできるが、インストールの手間がかかるなどの点で不便であった。そこで我々は、サーバクライアント型の計算システムNinf を提案している。本稿では、Ninfクライアントのひとつである、WWWブラウザからの対話的な行列演算を実現するツールNinfCalcについて述べる。

CiNii Books

researchmap
ネットワーク数値情報ライブラリ Ninf-システム実装と評価

関口智嗣, 中田秀基, 佐藤三久, 長嶋雲兵, 松岡聡

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 62 ( 81(HPC-62) ) 153 - 158 1996年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

科学技術計算におけるGlobal Computingを実現する基盤システムとしてネットワーク数値情報ライブラリNinf (Network based Information Library for Global World-Wide Computing Infrastructure)を提案している. Ninfでは広域ネットワーク上に分散された計算資源や情報資源へのアクセスを容易に実現することによりハイパフォーマンスコンピューテイングを支援することを目標とする. サーバーをインターネット上に複数設定し, 遠隔地のユーザは提供されたインターフェース関数を通じてNinfのライブラリ関数を呼び出すだけで, Ninfサービスを受けられる. 本稿ではNinfシステムの概観と実現について述べ, Ninf-RPCを用いたLinpackによる性能評価を行う. この結果, 問題サイズが小さくてもNinfを用いたネットワークコンピューティングの現実的可能性を実証することができた.

CiNii Books

J-GLOBAL

researchmap
Parallel STLによる並列プログラミング

中田秀基, 佐藤三久, 松岡聡, 石川裕, 松田元彦

情報処理学会研究報告. PRO, [プログラミング] 96 ( 82 ) 85 - 90 1996年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

C++においてテンプレートを用いた並列プログラミング向けライブラリ構築の試みがなされている。本稿では、並列プログラミングのインターフェイスとしてのテンプレート技術の応用について考察する。並列テンプレートライブラリを用いると、プロセッサの構成を意識することなく並列プログラミングを行うことができる。データ並列のテンプレートライブラリは、データの局所性を利用した計算を可能にする。タスク並列のテンプレートライブラリは、負荷分散と同期をユーザから隠蔽し、困難なタスク並列計算を支援する。

CiNii Books

researchmap
分散メモリ計算機用 Ninf API の実現に向けて

小川宏高, 松岡聡, 中田秀基, 佐藤三久, 関口智嗣

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 62 ( 81(HPC-62) ) 159 - 164 1996年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

ネットワ-ク数値情報ライブラリNinf (Network based Information library for High Performance Computing)は, 広域に分散した計算資源や情報資源を利用した超分散並列計算の基盤を提供するソフトウェアシステムである. 本稿では, このNinfシステム上で分散メモリ型並列計算機を計算資源として利用する場合に, フロントエンドマシンやI/Oプロセッサ等の単一ノードで動作するNinfサーバに計算情報が集中して律速となる問題を指摘する. この問題を解決するため, 初期データ分散を記述するための共通のAPIを提供すると共に, クライアントとの接続を各ノードに対して適切に順次ハンドオフしていく機構の導入を提案する. また, ハンドオフ機構のコア部分を富士通のAP1000上に実現し予備評価を行った結果, 16%の性能向上を得た.

CiNii Books

J-GLOBAL

researchmap
Implementing MPI in a High-Performance, Multithreaded Language MPC++

O'CARROLL FRANCIS B., 堀敦史, 手塚宏史, 石川裕, 松岡聡

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 62 ( 81 ) 141 - 146 1996年8月

　詳細を見る

記述言語：英語出版者・発行元：一般社団法人情報処理学会

We have ported the MPICH implementation of MPI to the high-performance, multithreaded programming language MPC++. We discuss our modifications to the design of MPICH to support multiple threads. MPICH now runs experimentally on top of MPC++ on a Sun workstation cluster connected by Myrinet and achieves higher performance than standard MPICH on Myrinet TCP/IP on the same hardware.

CiNii Books

researchmap
自動認識整形機能をもったペンによる描画システム

五十嵐健夫, 河内谷幸子, 松岡聡, 田中英彦

情報処理学会研究報告. CG,グラフィクスとCAD研究会報告 81 ( 77 ) 85 - 90 1996年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

既存のペンによる描画システムは、基本的に長方形や楕円を基本とするオブジェクト・ベースであり、ペンの持つ本来の柔軟さを生かすことができていなかった。我々は、ペンによる図形描画と制約に基づく整形を有機的に融合することにより、ペンのもつ自由度を生かし短時間で正確な図形を描くことを可能にする描画システムを開発中である。本稿では、この描画システムの特徴である、ペンによる自然な描画技法と動的な整形結果調整機構を利用した高度な対話的処理、およびその基礎となるセグメントによる図形データ表現と知覚的制約にもとづく認識・整形アルゴリズムについて説明する。

CiNii Books

researchmap
並列自己反映言語システムの部分計算によるコンパイル技法

増原英彦, 松岡聡, 米澤明憲

情報処理学会論文誌 37 ( 7 ) 1290 - 1298 1996年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

並列自己反映言語システムは並列アプリケーションの最適化等を簡潔に記述するメタプログラミングの機能を持つ一方解釈実行に基づくモデルから来る効率上の問題を持つ.本論文では部分計算を用いた並列自己反映言語のコンパイル技法を提案する.この技法では副作用について拡張された部分計算やプログラム変換を適用することで基本的に解釈実行を除去し直接実行のみとする.並列計算機上の実験では並列アプリケーションのメタレベルに記述された最適化が 7?17%のオーバヘッドで実行できるという結果が得られている.Meta-programmability of parallel reflective language systems is beneficial for parallel applications to describe optimizations, etc. On the other hand, their execution model based on interpretation is an obstacle to efficient implementation. We propose a compilation technique for parallel reflective languages using partial evaluation. The technique, which effectively eliminates program interpretation, includes partial evaluation extended for side-effects, and several program transformation techniques. Benchmarks on a MPP show that parallel applications with meta-level optimizations can be executed with small overhead.

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00013611/
UbiquitousLinks : 実世界環境に埋め込まれたハイパーメディアリンク

綾塚祐二, 暦本純一, 松岡聡

情報処理学会研究報告. HI,ヒューマンインタフェース研究会報告 67 23 - 30 1996年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

ハードウェア技術の進歩は高機能な計算機を携帯可能にし、ユーザと現実世界の間に常に計算機が介在することが可能になってきている。一方、計算機上の世界ではWolrd Wide Webが普及し、多種多様な情報をユーザが手軽に得ることができる。これらの情報は現実世界のオブジェクトに関するものも多いが、その関連性は現実世界のオブジェクトからは自明ではない。本研究では現実世界のオブジェクトとWWWの世界との連携をとることを目的とするハイパーメデイアシステムを提案する。具体的には、携帯型の計算機と、現実世界のオブジェクト群に添付されたIDを用い、現実世界のオブジェクトからWWW上の情報ヘ繋がるリンクを構築する。

CiNii Books

researchmap
ICOTにおけるプログラム言語とその実装に関するコメント―偉大なる先人に敬意を込めて―

松岡聡

情報処理 37 ( 5 ) 407 - 410 1996年5月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

CiNii Books

researchmap
ドローエディタで作成された図の構造の分析

五十嵐健夫, 松岡聡, 田中英彦

全国大会講演論文集 52 ( 0 ) 89 - 90 1996年3月

　詳細を見る

記述言語：日本語

IDRAWやMacDRAWといったようなドローエディタでは、テキストや長方形といった基本的な単位の上に、グループ化によってユーザが任意の構造をつくることができる。これらの構造は、実際の描画作業を効率的に進めるために使われており、なんらかの法則に従っていることが考えられる。もしこのような一般的な法則を見つけることができれば、ドローエディタ上での構造の自動認識[3][1]や一般的な視覚言語の構造解析[2]を行なう上で役立つ知見が得られるであろう。このような視点から、我々は過去に発表された論文を電子的な形で収集しそののなかからドローエディタで描かれた図を抽出・解析する作業を行なった。この様な解析法は、実験用に被験者に作業を行なわせるといった類の特殊な状況で作られたデータでなく、現実の描画作業で使われた構造を調べることができる点で優れている。さらに、人手を煩わすことがないということから、WWWなどで公開されている文書ファイルから自動的に収集・解析を行なうというといったことも可能である。本稿では準備段階として手作業で解析を行なった結果とそこから得られた知見について報告する。

CiNii Books

researchmap
ネットワーク数値ライブラリNinfにおけるメタサーバアーキテクチャ

中田秀基, 草野貴之, 松岡聡, 佐藤三久, 関口智嗣

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 60 ( 22(HPC-60) ) 77 - 82 1996年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

ネットワーク数値情報ライプラリ Ninf (Network based Information library for High Performance Computing)は、高速なネットワークを前提として、主に数値演算の分野において、計算自体を多くのユーザに提供することを目指したシステムてある。本稿では、Ninfシステムを講築する要素の一つであるメタサーバに関して、そのアーキテクチヤを示し、簡単な性能予備評価を示す。メタサーバは、サーバとクライアントの間にたちサーバの場所をクライアントに対して隠蔽する役割を果たす。また、メタサーバを用いることにより、簡単な分散並列計算が可能になる。

CiNii Books

J-GLOBAL

researchmap
OMPI : Optimizing MPI programs using Partial Evaluation

SATOSHI MATSUOKA

Proc. IEEE/ACM Supercomputing '96, Pittsburgh, PA, IEEE Society Press, 1996 (proceedings in CD-ROM). 1996年

　詳細を見る

researchmap
OMPI : Optimizing MPI programs using Partial Evaluation

SATOSHI MATSUOKA

Proc. IEEE/ACM Supercomputing '96, Pittsburgh, PA, IEEE Society Press, 1996 (proceedings in CD-ROM) 1996年

　詳細を見る

researchmap
COMPILING AWAY THE META-LEVEL IN OBJECT-ORIENTED CONCURRENT REFLECTIVE LANGUAGES USING PARTIAL EVALUATION

H MASUHARA, S MATSUOKA, K ASAI, A YONEZAWA

SIGPLAN NOTICES 30 ( 10 ) 300 - 315 1995年10月

　詳細を見る

記述言語：英語

DOI： 10.1145/217839.217869

Web of Science

J-GLOBAL

researchmap
最適化問題への応用のための並列制約論理型言語の拡張

今野和浩, 長塚雅明, 小林直樹, 松岡聡, 米澤明憲

全国大会講演論文集 51 ( 0 ) 77 - 78 1995年9月

　詳細を見る

記述言語：日本語

並列制約論理型言語PARCSは大規模並列計算機上での実装に向いた宣言的な言語であり、優先度に基づく並列実行制御、整数有限領域上の制約解消と枝刈り、暗黙のOR並列実行などの特徴を持つ。PARCSの枝刈り機構はある探索枝から将来分岐する枝の数を劇的に減らすことができる一方で、ある探索枝での結果が他の枝の探索の実行に大きな影響を及ぼす並列のα-β剪定や分枝限定法などのアルゴリズムにおける枝刈りはこれまで記述できなかった。本研究ではこのような最適化のためのアルゴリズムを記述するために優先度の制御と枝刈りの新しい枠組を提案する。

CiNii Books

researchmap
オブジェクト指向'95シンポジウム(OO '95)報告

青山幹雄, 西岡健自, 岸知二, 上原三八, 松岡聡, 中所武司, 深澤良彰

情報処理学会研究報告. SE,ソフトウェア工学研究会報告 105 ( 84 ) 89 - 97 1995年9月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

1995年6月1日(木)〜2日(金)に情報処理学会ソフトウェア工学研究会の主催で,慶応義塾大学三田校舎新館でオブジェクト指向,95シンポジウム(OO'95)が開催され:326名の参加者があった.「オブジェクト指向によるシステム開発の理論実践」をテーマに,基調講演.チュートリアル.一般講演.パネル討論と内容の充実したシンポジウムであった.本稿では,同シンポジウムのもようを,初日の事例セション,2日目のパネル討論を中心に報告する.なお,本シンポジウムは来年も同時期に開催の予定である.

CiNii Books

researchmap
階層的コレクションに基づくオブジェクト指向分散ライブラリについて

佐藤直人, 松岡聡, 米澤明憲

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 57 ( 81 ) 37 - 42 1995年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

並列性と分散とをどの様に適切に分離するかは,高性能超並列計算の実現ための重要な問題となっている.大規模な並列プログラムの作成の費用を考慮してプログラムから分散の詳細を隠蔽したいとする要請がある一方で,高い性能を達成するために計算環境に適応させられる様にする必要もある.我々は,このために,階層的コレクションというオブジェクト指向分散クラスライブラリ構築のための仕組を提案した.階層的コレクションは,分散の詳細をクラス利用者から隠蔽する一方で,様々な計算環境に応じたクラスの導出を可能にする.本稿では,いくつかの具体的な分散法をとりあげ,実際に階層的コレクションをどの様に定めればよいかについて述べる.

CiNii Books

researchmap
MPIのソフトウェアオーバーヘッド除去による最適化手法の評価

小川宏高, 松岡聡

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 57 ( 81 ) 13 - 18 1995年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

並列計算機用メッセージ通信ライブラリの標準インタフェースMPIの一般的実装では,動的に与えられるデータ型や通信コンテクストの扱いを実現する必要がある.このため,一回の通信あたりのソフトウェアオーバーヘッドが大きく,本来ハードウェアの持つ通信性能を損なってしまう.本稿ではMPIプログラムに対して静的解析を行い,得られた情報を元にMPIプログラムを特殊化してオーバーヘッドを除去したプログラムを生成する最適化手法を提案する.その予備実験として,富士通AP1000上に最適化された実装をし,基本通信性能におけるこの最適化手法の効果を評価した.一対一通信でオーバーヘッドが338μsecから76μsecに減少し,スループットも最適な通信方式を採用することで大幅に改善された.

CiNii Books

researchmap
並列オブジェクト指向言語ABCL/fのメタレベルアーキテクチャ

増原英彦, 松岡聡, 米澤明憲

情報処理学会研究報告. PRO, [プログラミング] 95 ( 82 ) 65 - 72 1995年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

並列アプリケーションのための機能拡張や最適化を行う手段として、自己反映計算によるメタレベルプログラミングが有効であることが認められつつあるが、実際のアプリケーションに応用した場合の有効性は、メタアーキテクチャの設計に大きく左右される。現在我々は、並列オブジェクト指向言語ABCL/fのメタアーキテクチャを設計している。特徴は、メタインタプリタ・メタオブジェクトによる拡張、annotationによるメタレベルへの指示、継承によるメタプログラムの再利用などである。本論文では、いくつかの並列プログラムにおける機能拡張の例を挙げ、それらがどのように記述されるかを検討することで、メタアーキテクチャの有効性を確かめる。

CiNii Books

researchmap
ユーザによるレイアウトの適応的認識

五十嵐健夫, 松岡聡, 増井俊之

情報処理学会研究報告. HI,ヒューマンインタフェース研究会報告 61 ( 70 ) 33 - 38 1995年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

ハイパーテキストを利用したカード操作は,発想支援や情報整理のために有効な手法となりうる.この作業を支援するために,配置されたカードの位置関係から,はっきり明示されていない構造を取り出すことが助けなる.しかし,これらの構造は本質的に曖昧であり,かつユーザの個人的な嗜好に強く依存しているので,既存の生成規則による構文解析的な手法には限界がある.我々はこれらの曖昧な構造の認識に適した空間パーザを、人間の視覚構造についての考察に基づいて設計する手法を提案する.さらに我々のパーザは,遺伝的アルゴリズムを利用することによりユーザの好みを反映するように対話的に修正することが可能である.

CiNii Books

researchmap
特集「並列処理」の編集にあたって

山口喜教, 松岡聡

情報処理学会論文誌 36 ( 7 ) 1503 - 1503 1995年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

CiNii Books

researchmap
ネットワーク数値情報ライブラリNinfの通信方法の予備的考察

飯岡美恵, 新居由佳子, 長嶋雲兵, 関口智嗣, 佐藤三久, 松岡聡, 細矢治夫

情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] 55 ( 28(HPC-55) ) 81 - 88 1995年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

関口らの提唱したコンピュータネットワークを利用した数値情報ライブラリNinfのシステムのモデルであるクライアント-サーバ方式の実現方法の検討を行った。ネットワーク上でのメッセージパッシングの実現手段としてUNIX標準のTCP/IPとメッセージパッシングライブラリのPVMを考え、それぞれを用いてシステムを試作し、プログラミングの容易さおよび関数呼び出しの実行時間の比較.検討等を行った。TCP/IPを用いたプログラムはPVMを用いたプログラムに比べ約10倍程度高速であったが、様々なエラーチェック等のプログラミングが必要であり、労力が大きい。

CiNii Books

J-GLOBAL

researchmap
複数の視覚的例による直接操作インターフェイスの対話実現

宮下健, 松岡聡, 高橋伸, 米澤明憲, Ken Miyashita, Satoshi Matsuoka, Shin Takahashi, Akinori Yonezawa, ソニー(株)中央研究所情報通信研究部門1グループ, Information & Communication System Research Division Research Center SONY Co. Ltd., Department of Mathematical Engineering Faculty of Engineering University of Tokyo., Department of Information Science Faculty of Science University of Tokyo., Department of Information Science Faculty of Science University of Tokyo.

コンピュータソフトウェア 11 ( 6 ) 41 - 51 1994年11月

　詳細を見る

記述言語：日本語出版者・発行元：日本ソフトウェア科学会

グラフィカルユーザーインターフェイス(以下GUI)の構築には多大な労力が必要となるが,その1つの原因は,アプリケーションプログラム中のテキストベースのデータとそれを視覚化した絵との間の双方向変換のプログラミングに手間がかかることにある.本研究では,プログラマーの与えたアプリケーションデータとそれに対応する視覚表現との複数の対応例を汎化することで,GUIを自動構築する手法を提案する.この手法の最大の特徴は,システムが示した視覚化の例をプログラマーが対話的に変更することで,間接的に双方向変換のプログラムを訂正していくことができるという点である.これによって,自動生成したプログラムの訂正が困難であるという従来の「例によるプログラミング」の問題点を解決した.

CiNii Books

researchmap
アルゴリズムアニメーション作成システムにおける宣言的記述方法について

高橋伸, 宮下健, 松岡聡, 米澤明憲, Shin Takahashi, Ken Miyashita, Satoshi Matsuoka, Akinori Yonezawa, 東京大学理学部情報科学科:(現)ソニー中央研究所, Department of Information Science The University of Tokyo., Department of Information Science The University of Tokyo:(Present address) Research Center Sony Co., Department of Mathematical Engineering The University of Tokyo., Department of Information Science The University of Tokyo.

コンピュータソフトウェア 11 ( 6 ) 83 - 94 1994年11月

　詳細を見る

記述言語：日本語出版者・発行元：日本ソフトウェア科学会

アニメーションは様々な動きや機能,特にその動的な特徴を表すのに役立つ.しかし,アニメーションの作成は一般に複雑で繁雑である.本研究では,アニメーションを取り扱うために,我々が以前提案した双方向変換モデルを拡張して,時間の概念を取り入れ,またモデル内の各データ表現上での操作を定義した.このモデルでは,アニメーションは基本的に連続するアプリケーションデータを視覚化した図を補間することによって表現される.アニメーションの作成者は,アプリケーションデータの視覚化方法の指定に加えて,補間の方法を抽象操作との対応規則によって指定することのみによってアニメーションを作成できる.

CiNii Books

researchmap
高並列計算における動的資源管理のための自己反映並列オブジェクト指向言語

増原英彦, 松岡聡, 米澤明憲

情報処理学会研究報告. [プログラミング-言語基礎実践-] 94 ( 65 ) 57 - 64 1994年7月

　詳細を見る

記述言語：英語出版者・発行元：一般社団法人情報処理学会

データや通信パターンが実行時のみに定まるような,不規則な並列アプリケーションを高並列計算機上で効率よく実行するためには,計算資源の実行時管理ポリシーが重要である.本論文では,様々な動的資源管理システムを柔軟に記述するための自己反映(リフレクティブ)並列オブジェクト指向言語ABCL/R3を提案する.ABCL/R3では,抽象化されたシステムのメタレベルに対する変更・拡張をアプリケーションから隠蔽された形で記述することで,スケジューリング・オブジェクト配置・負荷分散などの資源管理が柔軟に提供できる.本論文ではまた,並列計算機AP1000上に作成したプロトタイプシステムを用いて,予備的な評価を行った.

CiNii Books

researchmap
自己反映並列オブジェクト指向言語ABCL/R2の設計と実現

増原英彦, 松岡聡, 渡部卓雄, Hidehiko Masuhara, Satoshi Matsuoka, Takuo Watanabe, 東京大学理学部情報科学科:(現)東京大学工学部計数工学科, 東京大学理学部情報科学科:(現)北陸先端科学技術大学院大学情報科学研究科, Department of Information Science The University of Tokyo., Department of Information Science The University of Tokyo:(Present address) Department of Mathematical Engineering The University of Tokyo, Department of Information Science The University of Tokyo:(Present address) School of Information Science Japan Advanced Institute of Science and Technology

コンピュータソフトウェア 11 ( 3 ) 15 - 32 1994年5月

　詳細を見る

記述言語：日本語出版者・発行元：日本ソフトウェア科学会

並行オブジェクトの間で共有される計算資源の概念をとり入れた自己反映計算モデルであるHybrid Group Architectureと,その記述言語ABCL/R2を提案した.ABCL/R2では,オブジェクト単位の自己反映計算と,オブジェクトグループ単位での自己反映計算の両方が可能なため,スケジューリングのような,並列・分散システムにおける共有計算資源に関する制御を,本来の計算から隠蔽された形をとりつつ,言語の枠内から柔軟に記述できる.また,自己反映システムの効率的な処理系は,作成が困難とされていたが,部分コンパイル・段階的なメタレベル生成・軽量オブジェクトなどの技法による効率的な処理系の作成方法を示した.実際に共有記憶型並列計算機上に作成したABCL/R2処理系では,自己反映計算を行うことによる速度低下を,行わない場合の10倍以下に抑えられ,非自己反映計算の実行速度は,非自己反映処理系とほぼ同等であるというベンチマーク結果を得た.

CiNii Books

researchmap
実行時カーネルのないリフレクティブな並列オブジェクト指向言語の実現方法

一杉裕志, 松岡聡, 米澤明憲, Yuuji Ichisugi, Satoshi Matsuoka, Akinori Yonezawa, Electrotechnical Laboratory., Department of Mathematical Engineering The University of Tokyo., Department of Information Science The University of Tokyo.

コンピュータソフトウェア 11 ( 3 ) 65 - 77 1994年5月

　詳細を見る

記述言語：日本語出版者・発行元：日本ソフトウェア科学会

分散環境で稼働する,リフレクティブな並列オブジェクト指向言語RbClとその実現方法について述べる.RbClの処理系を構成するすべての実行時ルーチンは,言語のユーザが動的に変更・拡張可能である.つまり,並列実行やリフレクションを含むすべての言語機構が,固定された実行時カーネルとしてではなく,ユーザが置き換え可能な形で実現されている.記述言語との言語的共生と,直接実行のリフレクティブタワーという2つの概念によってこのような言語が実現可能になることを示した.

CiNii Books

researchmap
スレッドベース実行における積極的データ転送のためのPlan-Do型コンパイル技法

八杉昌宏, 松岡聡, 米澤明憲

情報処理学会研究報告, 94-PRG-18 (SWoPP '94) 94 ( 65 ) 9 - 16 1994年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

分散メモリ型並列計算機において積極的データ転送を行うための新しいコンパイルの粋組みとして,Plan-doコンパイル技法を開発した.この技法は近年の細粒度アーキテクチャにて,高スループット低遅延の通信法-パイプライン送信-を実現するときに特に有効である.適切な変換規則を順に適用することで,高レベルのPlan-Do型コードから,より低レベルの積極的データ転送を行うコードへ変換できる.また,並列計算機EM-4における実験を行い,より高速化が達成されすことを確認した.

CiNii Books

researchmap
並列オブジェクト指向言語のマルチコンピュータ上における効率的な実装法

田浦健次朗, 松岡聡, 米澤明憲

人工知能学会全国大会論文集 = Proceedings of the Annual Conference of JSAI 7 39 - 42 1993年7月

　詳細を見る

記述言語：日本語

CiNii Books

researchmap
IMSA'92国際リフレクションワークショップ

松岡聡, 増原英彦, Satoshi Matsuoka, Hidehiko Masuhara, 東京大学理学部情報科学科, 東京大学理学部情報科学科, Department of Information Science the University of Tokyo., Department of Information Science the University of Tokyo.

コンピュータソフトウェア 10 ( 4 ) 76 - 82 1993年7月

　詳細を見る

記述言語：日本語出版者・発行元：日本ソフトウェア科学会

CiNii Books

researchmap
Mu1tilispの操作的意味及び実現

浅井健一, 松岡聡, 米澤明憲

全国大会講演論文集 41 ( 0 ) 8 - 9 1990年9月

　詳細を見る

記述言語：日本語

近年、並列Lispが関数型言語の潜在的な並列性を大きく引き出せるものとして注目されている。実際にMultilisp[3]をはじめとしてMultischeme[6],Mul-T[5],QIisp[2]などたくさんの並列が開発され並列計算機上で高い性能が報告されている。しかし、現在のところ並列Lispは並列計算機上での性能を向上させることを目的としているのでもっぱら性能に関しての議論がなされ、言語の意味に関する考察はほとんどなされていない。そのため言語仕様があいまいになるし、言語仕様の変更も難しくなっている。このことはスケジューリング方式の固定化を引き起こし、ひいては自己反映計算[8]の実現を難しくしている。そこでMultiLispの操作的意味記述[1]を与え、これを用いて逐次型計算機上にSchme[7]によるインタプリタを作成した。さらにこれをもとに表示的意味記述を与える。またその記述から導かれるfutureとcall/ccとの相互干渉について述べる。

CiNii Books

researchmap
並列オブジェクト指向言語におけるSynchronization Constraintsと継承について

松岡聡, 米澤明憲

全国大会講演論文集 41 ( 0 ) 28 - 29 1990年9月

　詳細を見る

記述言語：英語

On developing large-scale programs with object-orientedconcurrent programming (OOCP) languages, we generally acknowledge that inheritance is one of the most essential features. However, it has been previously pointed out that in heritance and synchronization constraints in concurrent object systems often conflict with each other. For this reason, some languages such as ABCL/1[13] do not employ inheritance. Although several solutions[3, 4, 7,10,12] have been proposed in the past, we argue that, unfortunately,most of the proposals render inheritance totalLy useless.

CiNii Books

researchmap
並列オブジェクト指向言語への安全な継承の導入について

脇田建, 松岡聡

全国大会講演論文集 41 ( 0 ) 26 - 27 1990年9月

　詳細を見る

記述言語：日本語

並列オブジェクト指向言語では,同期制約の記述を継承することの困難が指摘されて以来,さまざまな言語で同期制約の記述の工夫が図られてきた.その多くのものは,同期制約を受理可能なメッセージの集合で表すものであったが,本稿はその方法の問題点を指摘し,それに対する解決として同期制約の論理式による表現法を挙げる.さらに,このように表現されたプログラムをプログラム変換を用いて実現することを提案する.

CiNii Books

researchmap
対話型グラフィックスの形式的取扱いについて

松岡聡, 川合慧

全国大会講演論文集 39 ( 0 ) 846 - 847 1989年10月

　詳細を見る

記述言語：日本語

最近User Inter face Management System(UIMS)、特にその中でも対話型グラフイックスの研究が盛んだが、その記述を形式的に与える試みは、その必要性が指摘されているにもかかわらず未だ少ない。対話型グラフィックスの記述にあたっては、そのObservational(External)Behaviorと意味の記述を分けて考える必要があるが、今までの研究ではプログラミング言語になぞらえた曖昧な操作のレベル分けに終始しており、Direct Manipulationの特質を何ら形式的な体系に基づいて議論できないのが実情である。我々の研究では、小野寺が定義したVisualizing Pipeline(VP)を拡張することによって対話型グラフィックスの形式的な記述体系を構成することを目指している。今回は対話的なグラフィックスのObservational Behaviorの記述の一部を示す。(なお、今回はスペースの都合上、全ての証明を省略する。)

CiNii Books

researchmap

▼全件表示

講演・口頭発表等

Distributed Diskless Checkpoint for Large Scale Systems

10 IEEE/ACM International Symposium on Cluster, Cloud and Grid Computing (CCGrid 2010) 2010年

　詳細を見る

researchmap
HPC in the Cloud---A Hype, the End of SCs, or Peaceful Coexistence?

2010年

　詳細を見る

researchmap
Auto-Tuning of a Scientific Application on GPU clusters

IPSJ SIG Technical Report 2010年

　詳細を見る

researchmap
クラウド環境における大規模データブロードキャストの動的最適化

ハイパフォーマンスコンピューティングと計算科学シンポジウム (HPCS2010) 2010年

　詳細を見る

researchmap
Improving the Large-Scale Data Access Using Virtual Machine Migration

2010年

　詳細を見る

researchmap
Performance Evaluation of Software Framework for Memory Fault Tolerance in GPU Accelerators

SIAM Conference on Parallel Processing and Scientific Computing (PP10), MS36: Trends and Experiences in Heterogeneous Many-core Computing 2010年

　詳細を見る

researchmap
Accelerated Computing in TSUBAME 1.2/2.0

2010年

　詳細を見る

researchmap
HPC in the Cloud---A Hype, the End of SCs, or Peaceful Coexistence?

2010年

　詳細を見る

researchmap
GPU クラスタにおける科学技術計算の自動最適化

HPC研究会 2010年

　詳細を見る

researchmap
Linpack Evaluation on a Supercomputer with Heterogeneous Accelerators

IEEE International Parallel & Distributed Processing Symposium (IPDPS 2010) 2010年

　詳細を見る

researchmap
A High-Performance Fault-Tolerant Software Framework for Memory on Commodity GPUs

24th IEEE International Parallel and Distributed Processing Symposium (IPDPS'10) 2010年

　詳細を見る

researchmap
GPU Acceleration: a Fad or the Yellow Brick Road onto Exascale

2010年

　詳細を見る

researchmap
大規模計算機システムの資源選択を支援するエキスパートシステム

情報処理学会研究報告2009-HPC-124 2010年

　詳細を見る

researchmap
GPUクラスタにおける省電力タスクスケジューリング

第124回HPC研究会 2010年

　詳細を見る

researchmap
Dynamic Load-Balanced Multicast for Data-Intensive Applications on Clouds

The 10th IEEE/ACM International Symposium on Cluster, Cloud and Grid Computing 2010年

　詳細を見る

researchmap
Distributed Diskless Checkpoint for Large Scale Systems

10 IEEE/ACM International Symposium on Cluster, Cloud and Grid Computing (CCGrid 2010) 2010年

　詳細を見る

researchmap
仮想マシン動的再配置による大規模データアクセスの高速化

情報処理学会先進的計算基盤システムシンポジウム論文集 (SACSIS2010) 2010年

　詳細を見る

researchmap
Dynamic Load-Balanced Multicast for Data-Intensive Applications on Clouds

The 10th IEEE/ACM International Symposium on Cluster, Cloud and Grid Computing 2010年

　詳細を見る

researchmap
Rise of the commodity vectors

2008 8th International Meeting High Performance Computing for Computational Science 2008年

　詳細を見る

researchmap
性能モデルに基づくCPU及びGPUを併用する効率的なFFTライブラリ

情報処理学会ハイパフォーマンスコンピューティングと計算科学シンポジウム(HPCS2008) 2008年

　詳細を見る

researchmap
Bandwidth intensive 3-D FFT kernel for GPUs using CUDA

2008 ACM/IEEE conference on Supercomputing (SC08) 2008年

　詳細を見る

researchmap
HPC-GPGPU: Large-scale commodity accelerated clusters and its application to advanced structural proteomics

AHeDD2008/IPAB2008 Joint Symposium 2008年

　詳細を見る

会議種別：ポスター発表

researchmap
Hundred million cores in commodity---Why not? (or, will `custom'*finally* prevail?)

CCGSC2008 2008年

　詳細を見る

researchmap
Coupled-simulation e-science support in the NAREGI grid

IEEE Computer 2008年

　詳細を見る

researchmap
情報爆発時代のグリッド環境に対応したMPI集団通信アルゴリズムの最適化

第70回情報処理学会全国大会 2008年

　詳細を見る

researchmap
HPC-GPGPU: Large-scale commodity accelerated clusters and its application to advanced structural proteomics

Microsoft Science All-Hands-Meeting 2008年

　詳細を見る

会議種別：ポスター発表

researchmap
情報爆発に対応する耐故障性 MPI フレームワークの提案

第70回情報処理学会全国大会 2008年

　詳細を見る

researchmap
情報爆発時代の光インターコネクト上でのMPI通信アルゴリズム

第70回情報処理学会全国大会 2008年

　詳細を見る

researchmap
Grid'BnB: A parallel branch & bound framework for grids

14th International Conference on High Performance Computing (HiPC) 2008年

　詳細を見る

researchmap
省電力ページング方式を実装した次世代メモリアーキテクチャ上での並列プログラムの評価

情報処理学会ハイパフォーマンスコンピューティングと計算科学シンポジウム(HPCS2008) 2008年

　詳細を見る

researchmap
情報爆発時代へ向けた不均一アーキテクチャにおけるスーパーコンピューティング

第70回情報処理学会全国大会 2008年

　詳細を見る

researchmap
情報爆発時代のグリッドファイルシステム上での大規模データ管理

第70回情報処理学会全国大会 2008年

　詳細を見る

researchmap
情報爆発に対応するスケーラブルかつ自律的な障害解析

情報処理学会第70回全国大会 2008年

　詳細を見る

researchmap
情報爆発時代におけるモデルベース資源選択による高速な仮想クラスタ構築

情報処理学会第70回全国大会 2008年

　詳細を見る

researchmap
An efficient, model-based CPU-GPU heterogeneous FFT library

International Heterogeneity in Computing Workshop (HCW '08) 2008年

　詳細を見る

researchmap
Performance evaluation of parallel applications on next generation memory architecture with power-aware paging method

The Fourth Workshop on High-Performance 2008年

　詳細を見る

researchmap
Massive supercomputing coping with heterogeneity of modern accelerators

IEEE International Parallel & Distributed Processing Symposium (IPDPS 2008) 2008年

　詳細を見る

researchmap
Locality aware MPI communication on a commodity opto-electronic hybrid network

Workshop on Large-Scale Parallel Processing (LSPP) 2008年

　詳細を見る

researchmap
情報爆発時代のスーパコンピュータ運用経験:TSUBAME Grid Clusterにて

情報処理学会第70回全国大会 2008年

　詳細を見る

researchmap
NAREGIグリッドミドルウェアによる大規模連携接続実証実験

情報処理学会研究報告 2008年

　詳細を見る

researchmap
Index distribution technique for efficient search on unstructured peer-to-peer networks

2008年

　詳細を見る

researchmap
A decentralized, scalable, and autonomous grid monitoring system

11th International Conference on Principles of Distributed Systems (OPODIS) 2008年

　詳細を見る

researchmap
Model-based fault localization in large-scale computing systems

The 22nd IEEE International Parallel and Distributed Processing Symposium (IPDPS'08) 2008年

　詳細を見る

researchmap
Index distribution technique for efficient search on unstructured peer-to-peer networks

The International Conference in Electrical Engineering/Electronics 2008年

　詳細を見る

researchmap
Rise of the commodity vectors

2008 8th International Meeting High Performance Computing for Computational Science 2008年

　詳細を見る

researchmap
モデルベース資源選択による効率的な仮想クラスタ構築

情報処理学会先進的計算基盤システムシンポジウム(SACSIS2008) 2008年

　詳細を見る

researchmap
グリッド環境におけるMPI Scatter/Gather通信アルゴリズムの最適化

並列/分散/協調処理に関するサマーワークショップ(SWoPP2008) 2008年

　詳細を見る

researchmap
ソフトウェアECCによるGPUメモリの耐故障性の実現と評価

並列/分散/協調処理に関するサマーワークショップ(SWoPP2008) 2008年

　詳細を見る

researchmap
CUDA 環境における高性能3次元FFT

情報処理学会先進的計算基盤システムシンポジウム(SACSIS2008) 2008年

　詳細を見る

researchmap
Time stamping authoruty grid

Eighth IEEE International Symposium on Cluster Computing and the Grid (CCGrid'08) 2008年

　詳細を見る

researchmap
不均一な複数GPUにおけるセルフスケジューリングによる並列数値演算

情報処理学会先進的基盤システムシンポジウム (SACSIS2008) 2008年

　詳細を見る

会議種別：ポスター発表

researchmap
ヘテロ計算環境のための省電力タスクスケジューリング

情報処理学会先進的基盤システムシンポジウム (SACSIS2008) 2008年

　詳細を見る

会議種別：ポスター発表

researchmap
ヘテロ計算環境のための省電力タスクスケジューリング

並列/分散/協調処理に関するサマーワークショップ(SWoPP2008) 2008年

　詳細を見る

researchmap
Rise of the Commodity Vectors or Democratization of Supercomputing

NVISION2008 2008年

　詳細を見る

researchmap
Access-pattern and bandwidth aware file replication algorithm in a grid environment

The 9th IEEE/ACM International Conference on Grid Computing (Grid 2008) 2008年

　詳細を見る

researchmap
Environmental-aware optimization of MPI checkpointing intervals

The 2008 IEEE International Conference on Cluster Computing (Cluster 2008) 2008年

　詳細を見る

会議種別：ポスター発表

researchmap
HPC-GPGPU: Large-scale commodity accelerated clusters and its application to advanced structural proteomics

AHeDD2008/IPAB2008 Joint Symposium 2008年

　詳細を見る

会議種別：ポスター発表

researchmap
Model-based Optimization for Data-Intensive Application on Virtual Cluster

The 2008 9th IEEE/ACM International Conference on Grid Computing (Grid 2008) 2008年

　詳細を見る

会議種別：ポスター発表

researchmap
光ネットワークの補助的利用によるHPC性能向上

並列/分散/協調処理に関するサマーワークショップ(SWoPP2008) 2008年

　詳細を見る

researchmap
広域分散ファイルシステムにおけるアクセスパターンと性能を考慮したファイル配置

並列/分散/協調処理に関するサマーワークショップ(SWoPP2008) 2008年

　詳細を見る

researchmap
仮想クラスタを用いたData-Intensive Application 実行環境の性能モデル構築と最適化に向けて

2008年

　詳細を見る

会議種別：ポスター発表

researchmap
仮想クラスタを用いたData-Intensive Application 実行環境の性能モデル構築と最適化

情報処理学会研究報告 2008年

　詳細を見る

researchmap
Bandwidth intensive 3-D FFT kernel for GPUs using CUDA

2008 ACM/IEEE conference on Supercomputing (SC08) 2008年

　詳細を見る

researchmap
複数GPUにおけるセルフスケジューリングによる並列数値演算

並列/分散/協調処理に関するサマーワークショップ(SWoPP2008) 2008年

　詳細を見る

researchmap
High-performance MPI broadcast algorithm for grid environments utilizing multi-lane NICs

Seventh IEEE International Symposium on Cluster Computing and the Grid (CCGrid'07) 2007年

　詳細を見る

researchmap
Virtual clusters on the fly - fast, scalable, and flexible installation

Seventh IEEE International Symposium on Cluster Computing and the Grid (CCGrid'07) 2007年

　詳細を見る

researchmap
Web-site-based partitioning techniques for efficient parallelization of the PageRank Computation

2007年

　詳細を見る

researchmap
High-performance distributed solar computing (?) --- Towards a grid that computes like trees---

2007年

　詳細を見る

researchmap
Data management on grid filesystem for data-intensive computing

SAINT 2007 Workshop on Middleware Architecture in the Internet 2007年

　詳細を見る

researchmap
Peer-to-peer scheduling system with scalable information sharing protocol

SAINT 2007 Workshop on Middleware Architecture in the Internet 2007年

　詳細を見る

researchmap
A peer-to-peer infrastructure for autonomous grid monitoring

The 3rd International Workshop on Hot Topics in Peer-to-Peer Systems at the International Parallel & Distributed Processing Symposium 2007 2007年

　詳細を見る

researchmap
ABARIS: An adaptable fault detection/recovery component framework for MPIs

12th IEEE Workshop on Dependable Parallel 2007年

　詳細を見る

researchmap
TSUBAME 1.2 の概要---世界初のGPU加速された大規模スパコン

SGI セミナー 2008年

　詳細を見る

researchmap
最新TSUBAMEシステム

IPAB セミナー 2008年

　詳細を見る

researchmap
NAREGIミドルウェアβ-gLite 間における相互ジョブ起動実験

情報処理学会研究報告2007-HPC-109(HOKKE2007) 2007年

　詳細を見る

researchmap
ABARIS: An adaptable fault detection/recovery component framework for MPIs

12th IEEE Workshop on Dependable Parallel 2007年

　詳細を見る

researchmap
ハイパフォーマンス分散時刻認証局：毎秒百万タイムスタンプ発行の実現

情報処理学会研究報告2007-HPC-109(HOKKE2007) 2007年

　詳細を見る

researchmap
グリッド環境におけるマルチレーンを用いたMPIコレクティブ通信アルゴリズム

情報処理学会ハイパフォーマンスコンピューティングと計算科学シンポジウム(HPCS2007) 2007年

　詳細を見る

researchmap
ヘテロ型スーパーコンピュータTSUBAMEのLinpackによる性能評価

2007年ハイパフォーマンスコンピューティングと計算科学シンポジウムHPCS2007 2007年

　詳細を見る

researchmap
Data management on grid filesystem for data-intensive computing

SAINT 2007 Workshop on Middleware Architecture in the Internet 2007年

　詳細を見る

researchmap
Peer-to-peer scheduling system with scalable information sharing protocol

SAINT 2007 Workshop on Middleware Architecture in the Internet 2007年

　詳細を見る

researchmap
Autonomically-adapting master-worker programming framework for multi-layered grid-of-clusters

HPC Asia 2007 2007年

　詳細を見る

researchmap
Model-based resource selection for efficient virtual cluster deployment

2nd International Workshop on Virtualization Technology in Distributed Computing (VTDC'07) 2007年

　詳細を見る

researchmap
Job invocation interoperability between NAREGI Middleware Beta and gLite

HPC Asia 2007 2007年

　詳細を見る

researchmap
フォールト／リカバリモデルを考慮した耐故障性をもつMPI フレームワークABARIS の提案と評価

情報処理学会研究報告2007-HPC-109(HOKKE2007) 2007年

　詳細を見る

researchmap
High-performance MPI broadcast algorithm for grid environments utilizing multi-lane NICs

Seventh IEEE International Symposium on Cluster Computing and the Grid (CCGrid'07) 2007年

　詳細を見る

researchmap
Virtual clusters on the fly - fast, scalable, and flexible installation

Seventh IEEE International Symposium on Cluster Computing and the Grid (CCGrid'07) 2007年

　詳細を見る

researchmap
CPUおよびGPUを併用するFFTライブラリの提案と評価

情報処理学会研究報告 2007-HPC-111(SWOPP2007) 2007年

　詳細を見る

researchmap
クラスタシステムにおけるIP-SANを用いたI/O処理の並列ベンチマークによる評価

情報処理学会研究報告 2007-HPC-111(SWOPP2007) 2007年

　詳細を見る

researchmap
仮想クラスタを用いた複数サイト上でのMPI実行環境

情報処理学会研究報告2007-HPC-109(HOKKE2007) 2007年

　詳細を見る

researchmap
キャッシュを用いた仮想クラスタ高速構築手法の性能評価

情報処理学会研究報告2007-HPC-109(HOKKE2007) 2007年

　詳細を見る

researchmap
分散時刻認証局グリッドとパラメータ依存性の解析

情報処理学会先進的計算基盤システムシンポジウム(SACSIS2007) 2007年

　詳細を見る

researchmap
A peer-to-peer infrastructure for autonomous grid monitoring

The 3rd International Workshop on Hot Topics in Peer-to-Peer Systems at the International Parallel & Distributed Processing Symposium 2007 2007年

　詳細を見る

researchmap
仮想クラスタ構築時間のモデリングおよびその最適化

電子情報通信学会技術研究報告 2007-CPSY (SWOPP2007) 2007年

　詳細を見る

researchmap
次世代省電力メモリを用いた並列プログラムの省電力化の評価

情報処理学会研究報告 2007-HPC-111(SWOPP2007) 2007年

　詳細を見る

researchmap
High-performance distributed solar computing (?) --- Towards a grid that computes like trees---

2007年

　詳細を見る

researchmap
分散システムにおける故障の自律的な解析

ソフトウェア科学会第24回大会 2007年

　詳細を見る

researchmap
Web-site-based partitioning techniques for efficient parallelization of the PageRank Computation

2007年

　詳細を見る

researchmap
インターネット上での分散時刻認証グリッドのタイムスタンプ発行スケーラビリティの評価

情報処理学会研究報告2007-HPC-112,HPC Asia併設WS 2007年

　詳細を見る

researchmap
時刻認証グリッドの構築と基礎実験

電子情報通信学会技術研究報告 2007-CPSY (SWOPP2007) 2007年

　詳細を見る

researchmap
分散時刻認証グリッドのインターネット上での動作実験

電子情報通信学会技術研究報告 2007-CPSY (SWOPP2007) 2007年

　詳細を見る

researchmap
次世代光インターコネクトでの MPI 通信性能の評価

日本ソフトウェア科学会第24回大会（2007年度） 2007年

　詳細を見る

researchmap
広域分散環境における大規模データ管理のためのノードグルーピング

情報処理学会研究報告 2007年

　詳細を見る

researchmap
次世代光インターコネクト上での MPI アプリケーションの評価

情報処理学会研究報告 2007-HPC-111(SWOPP2007) 2007年

　詳細を見る

researchmap
Autonomically-adapting master-worker programming framework for multi-layered grid-of-clusters

HPC Asia 2007 2007年

　詳細を見る

researchmap
Model-based resource selection for efficient virtual cluster deployment

2nd International Workshop on Virtualization Technology in Distributed Computing (VTDC'07) 2007年

　詳細を見る

researchmap
Job invocation interoperability between NAREGI Middleware Beta and gLite

HPC Asia 2007 2007年

　詳細を見る

researchmap
Multi-replication with intelligent staging in data-intensive grid applications

The 7th IEEE/ACM International Conference on Grid Computing 2006年

　詳細を見る

researchmap
Multi-Replication with Intelligent Staging in ata-Intensive Grid Applications.

In The 7th IEEE/ACM International Conference on Grid Computing 2006年

　詳細を見る

researchmap
Speculative checkpointing

DSW 2006 2006年

　詳細を見る

researchmap
Profile-based optimization of power-performance by using dynamic voltage scaling on a PC cluster

20th IEEE International Parallel and Distributed Processing Symposium (IPDPS 2006) 2006年

　詳細を見る

researchmap
Speculative checkpointing

DSW 2006 2006年

　詳細を見る

researchmap
Construction and Operation of the Grid Challenge Testbed

2006年

　詳細を見る

researchmap
MegaProto/E: Power-aware high-performance cluster with commodity technology

20th IEEE International Parallel and Distributed Processing Symposium (IPDPS 2006) 2006年

　詳細を見る

researchmap
光ネットワーク環境におけるMPI集団通信

第159回計算機アーキテクチャ・第105回ハイパフォーマンスコンピューティング合同研究発表会（HOKKE-2006） 2006年

　詳細を見る

researchmap
レプリカ管理システムを利用したデータインテンシブアプリケーション向けスケジューリングシステム

第159回計算機アーキテクチャ・第105回ハイパフォーマンスコンピューティング合同研究発表会（HOKKE-2006） 2006年

　詳細を見る

researchmap
グリッド上における仮想計算機を用いたジョブ実行環境構築システムの高速化

第159回計算機アーキテクチャ・第105回ハイパフォーマンスコンピューティング合同研究発表会（HOKKE-2006） 2006年

　詳細を見る

researchmap
大規模環境向け情報共有手法を用いた分散ジョブスケジューリングシステム

第159回計算機アーキテクチャ・第105回ハイパフォーマンスコンピューティング合同研究発表会（HOKKE-2006） 2006年

　詳細を見る

researchmap
ＴＳＵＢＡＭＥの飛翔: ペタスケールへ向けた「みんなのスパコン」の構想.

情報処理学会研究報告 2006-HPC-107 2006年

　詳細を見る

researchmap
動的なノード群構成機構を備えた階層型グリッド環境: Jojo2

先進的計算基盤システムシンポジウム SACSIS2006 2006年

　詳細を見る

researchmap
MegaProto/E: Power-aware high-performance cluster with commodity technology

20th IEEE International Parallel and Distributed Processing Symposium (IPDPS 2006) 2006年

　詳細を見る

researchmap
Profile-based optimization of power-performance by using dynamic voltage scaling on a PC cluster

20th IEEE International Parallel and Distributed Processing Symposium (IPDPS 2006) 2006年

　詳細を見る

researchmap
仮想計算機を用いたグリッド上でのMPI実行環境

先進的計算基盤システムシンポジウム SACSIS2006 2006年

　詳細を見る

researchmap
ORE Grid：仮想計算機を用いたグリッド実行環境の高速な配置ツール

先進的計算基盤システムシンポジウム SACSIS2006 2006年

　詳細を見る

researchmap
グリッドチャレンジテストベッドの構築と運用縲怎Oリチャレテストベッドの作り方縲鰀

並列／分散／協調処理に関する『高知』サマー・ワークショップ（SWoPP2006） 2006年

　詳細を見る

researchmap
仮想計算機と仮想ネットワークを用いた仮想クラスタの構築

並列／分散／協調処理に関する『高知』サマー・ワークショップ（SWoPP2006） 2006年

　詳細を見る

researchmap
フォールトモデルを考慮した耐故障性をもつ MPI フレームワーク Cuckoo FTMPI の提案と評価

電子情報通信学会技術研究報告 2006年

　詳細を見る

researchmap
ヘテロ型スーパーコンピュータTSUBAMEのLinpackによる性能評価

並列／分散／協調処理に関する『高知』サマー・ワークショップ（SWoPP2006） 2006年

　詳細を見る

researchmap
ＴＳＵＢＡＭＥの飛翔：ペタスケールへ向けた「みんなのスパコン」の構想

並列／分散／協調処理に関する『高知』サマー・ワークショップ（SWoPP2006） 2006年

　詳細を見る

researchmap
Being "BYTES-oriented" in HPC leads to an Open Big Data/AI Ecosystem and Further Advances into the Post-Moore Era (Keynote Talk) 招待

Satoshi Matsuoka

2017 IEEE International Conference on Big Data 2017年12月

　詳細を見る

researchmap
レプリカ管理システムを利用したデータインテンシブアプリケーション向けスケジューリングシステム

ハイパフォーマンスコンピューティングと計算科学シンポジウム 2006年

　詳細を見る

researchmap
Converging HPC and Big Data / AI in an Open Public Infrastructure: Tokyo Tech. Tsubame3 and AIST ABCI 招待

Satoshi Matsuoka

The 19th IEEE International Conference on High Performance Computing and Communications (HPCC2017). 2017年12月

　詳細を見る

researchmap
Energy Efficiency Gains From Software: Retrospectives and Perspectives (Panelist Talk) 招待

Satoshi Matsuoka

The International Conference for High Performance Computing, Networking, Storage and Analysis (SC17) 2017年11月

　詳細を見る

researchmap
Multi-Replication with Intelligent Staging in ata-Intensive Grid Applications.

In The 7th IEEE/ACM International Conference on Grid Computing 2006年

　詳細を見る

researchmap
Efficient Sparse General Matrix-Matrix Multiplication Algorithms for Many-Core Processors

Yusuke Nagasaka, Aydın Buluç, Ariful Azad, Akira Nukada, Satoshi Matsuoka

SIAM Conference on Parallel Processing for Scientific Computing (SIAM PP'18) 2018年3月

　詳細を見る

researchmap
大規模分散システムにおける故障の解析

電子情報通信学会技術研究報告 DC2006-16 2006年

　詳細を見る

researchmap
Toward Training a Large 3D Cosmological CNN with Hybrid Parallelization

Yosuke Oyama, Naoya Maruyama, Nikoli Dryden, Peter Harrington, Jan Balewski, Satoshi Matsuoka, Marc Snir, Peter Nugent, Brian Van Essen

PDML19 @ ICPP2019 2019年8月

　詳細を見る

researchmap
データインテンシブコンピューティングのためのグリッドファイルシステム上でのデータ管理

コンピュータシステム・シンポジウム(Compsys 2006) 2006年

　詳細を見る

researchmap
Cambrian Explosion of Computing and Big Data in the Post-Moore Era

HPDC 2018 2018年

　詳細を見る

researchmap
Multi-replication with intelligent staging in data-intensive grid applications

The 7th IEEE/ACM International Conference on Grid Computing 2006年

　詳細を見る

researchmap
From Post-K to Cambrian Explosion of Computing and Big Data in the Post-Moore Era

HPC2018 - International Advanced Workshop, From Clouds and Big Data to Exascale and Beyond 2018年

　詳細を見る

researchmap
You Don't Really Need Big Fat Switches Anymore --- Almost

情報処理学会研究報告 2003-ARC-154, SWoPP 2003 2003年

　詳細を見る

researchmap
Converging HPC and BD/AI: Tokyo Tech TSUBAME3.0 and AIST ABCI (Booth Talk at Nvidia Booth) 招待

Satoshi Matsuoka

The International Conference for High Performance Computing, Networking, Storage and Analysis (SC17) 2017年11月

　詳細を見る

researchmap
Java 言語向け適応的部分計算の設計と実装

第6回プログラミングおよび応用のシステムに関するワークショップ SPA 2003 2003年

　詳細を見る

researchmap
Blurring the Lines: High-End Computing and Data Science (Panelist Talk) 招待

Satoshi Matsuoka

The International Conference for High Performance Computing, Networking, Storage and Analysis (SC17) 2017年11月

　詳細を見る

researchmap
OpenJITコンパイラフレームワークにおける実行時特化システム

日本ソフトウエア科学会第4回プログラミングおよび応用システムに関するワークショップ（SPA2001）,March 2001 2001年

　詳細を見る

researchmap
Converging HPC and BD/AI: Tokyo Tech TSUBAME3.0 and AIST ABCI (Booth Talk at Tokyo Tech Booth) 招待

Satoshi Matsuoka

The International Conference for High Performance Computing, Networking, Storage and Analysis (SC17) 2017年11月

　詳細を見る

researchmap
Grid RPC meets Data Grid: Network Enabled Services for Data Farming on the Grid

Proceedings of IEEE Symposium on Cluster Computing and the Grid Brisbane, Australia, May 2001 (Invited Paper) 2001年

　詳細を見る

researchmap
Converging HPC and BD/AI: Tokyo Tech TSUBAME3.0 and AIST ABCI (Booth Talk at DDN Booth) 招待

Satoshi Matsuoka

The International Conference for High Performance Computing, Networking, Storage and Analysis (SC17) 2017年11月

　詳細を見る

researchmap
Japanese Computional Grid Research Project: NAREGI

Proceedings of the IEEE 2005年

　詳細を見る

researchmap
Japanese Computional Grid Research Project: NAREGI

Proceedings of the IEEE 2005年

　詳細を見る

researchmap
Large-scale Dynamic Graph Processing on HPC Systems

Keita Iwabuchi, Roger Pearce, Maya Gokhale, Satoshi Matsuoka

Minisymposium @ SIAM 2017 2017年1月

　詳細を見る

researchmap
Exploring User Level Burst Buffer on Public Cloud and HPC 招待

Satoshi Matsuoka

Dagstuhl Seminar: Challenges and Opportunities of User-Level File Systems for HPC 2017年5月

　詳細を見る

researchmap
Overview of a Performance Evaluation System for Global Computing Scheduling Algorithms

Proceedings of 8th IEEE International Symposium on High Performance Distributed Computing (HPDC8) 1999年

　詳細を見る

researchmap
HPCとビッグデータ・AIの融合インフラ招待

松岡聡

産総研IMPULSEコンソセミナー（第3回） 2017年10月

　詳細を見る

researchmap
Grid RPC meets Data Grid: Network Enabled Services for Data Farming on the Grid

Proceedings of IEEE Symposium on Cluster Computing and the Grid Brisbane, Australia, May 2001 (Invited Paper) 2001年

　詳細を見る

researchmap
Results from Tsubame 3.0 - A 47 AI-PFLOPS System for HPC and AI Convergence 招待

Satoshi Matsuoka

HP-CAST29 2017年11月

　詳細を見る

researchmap
Highly Efficient and Encapsulated Re-use of Synchronization Code in Concurrent Object-Oriented Languages Washington D. C., Sep. 1993.

Proceedings of ACM OOPSLA '93 1993年

　詳細を見る

researchmap
FLOPS to BYTES: Accelerating Beyond Moore's Law is Data-Oriented 招待

Satoshi Matsuoka

PPAM2017 2017年9月

　詳細を見る

researchmap
Overview of a Performance Evaluation System for Global Computing Scheduling Algorithms

Proceedings of 8th IEEE International Symposium on High Performance Distributed Computing (HPDC8) 1999年

　詳細を見る

researchmap
TSUBAME3/ABCI and AI 招待

Satoshi Matsuoka

The 3rd International High Performance Computing Forum (IHPCF2017) 2017年9月

　詳細を見る

researchmap
アプリケーションのEmpiricalな性能モデル構築のためのプロファイル情報の収集 (オーガナイズドセッション: 計算科学と計算機科学のコデザインのためのミニアプリ)

野村哲弘, 三浦信一, 遠藤敏夫, 松岡聡

2015年ハイパフォーマンスコンピューティングと計算科学シンポジウム 2015年5月

　詳細を見る

researchmap
Can Local Binary Convolutions Make Neural Networks Models Smaller?

Haoyu Zhang, Wahib Mohamed, Pen Chen, Satoshi Matsuoka

International Conference on Parallel Processing (ICPP' 2019)

　詳細を見る

researchmap
Finishing GPU Jobs running on a Multi-GPU Batch-Queue Node-Sharing System Earlier with Remote GPU Execution and Migration

Pak Markthub, Akihiro Nomura, Satoshi Matsuoka

ISC2016 PhD Forum 2016年6月

　詳細を見る

researchmap
Dynamic Optimization for large data Broadcast on Clouds

2010年

　詳細を見る

researchmap
Evaluations of Directive Based Programming Model for GPUs and Extensions for Performance Portability

Tetsuya Hoshino, Naoya Maruyama, Satoshi Matsuoka

SIAM Conference and Computational Science (CSE) 2015 2015年3月

　詳細を見る

researchmap
Highly Efficient and Encapsulated Re-use of Synchronization Code in Concurrent Object-Oriented Languages Washington D. C., Sep. 1993.

Proceedings of ACM OOPSLA '93 1993年

　詳細を見る

researchmap
A General Framwork for Bi-Directional Translation between Abstract and Pictorial Data.

ACM Transactions on Information Systems 1992年

　詳細を見る

researchmap
Increasing Jobs that a Multi-GPU Batch-Queue System can serve, with GPU Remoting and Migration

Pak Markthub, Akihiro Nomura, Satoshi Matsuoka

TJIA 2016 : The 8th Thailand-Japan International Academic Conference (TJIA) 2016年10月

　詳細を見る

researchmap
A General Framwork for Bi-Directional Translation between Abstract and Pictorial Data.

ACM Transactions on Information Systems 1992年

　詳細を見る

researchmap
A Resource Selection Support Expert System for Large-Scale Computing Environments

2010年

　詳細を見る

researchmap
Performance Evaluation of Software Framework for Memory Fault Tolerance in GPU Accelerators

SIAM Conference on Parallel Processing and Scientific Computing (PP10), MS36: Trends and Experiences in Heterogeneous Many-core Computing 2010年

　詳細を見る

researchmap
Accelerated Computing in TSUBAME 1.2/2.0

2010年

　詳細を見る

researchmap
Power-Aware Task Scheduling on GPU Accelerated Clusters

2010年

　詳細を見る

researchmap
GPU Acceleration: a Fad or the Yellow Brick Road onto Exascale

2010年

　詳細を見る

researchmap
Linpack Evaluation on a Supercomputer with Heterogeneous Accelerators

IEEE International Parallel & Distributed Processing Symposium (IPDPS 2010) 2010年

　詳細を見る

researchmap
A High-Performance Fault-Tolerant Software Framework for Memory on Commodity GPUs

24th IEEE International Parallel and Distributed Processing Symposium (IPDPS'10) 2010年

　詳細を見る

researchmap
Access-pattern and bandwidth aware file replication algorithm in a grid environment

The 9th IEEE/ACM International Conference on Grid Computing (Grid 2008) 2008年

　詳細を見る

researchmap
TSUBAME 1.2 and the Road to TSUBAME 2.0 - Accelerated Multi-Petascale Commodity Computing for Everyone

2009年

　詳細を見る

researchmap
Speculative checkpointing: Exploiting temporal affinity of memory operations

HPC ASIA 2009 2009年

　詳細を見る

researchmap
Fast Conjugate Gradients with Multiple GPUs

Lecture Notes in Computer Science 2009年

　詳細を見る

researchmap
A Model-Based Algorithm for Optimizing I/O Intensive Applications in Clouds using VM-Based Migration

Proceedings of Cloud2009 in the 2009 9th IEEE/ACM International Symposium on Cluster Computing and the Grid 2009年

　詳細を見る

researchmap
Preliminary evaluation of software-based memory fault tolerance for GPGPU

2009年

　詳細を見る

会議種別：ポスター発表

researchmap
Fast conjugate gradient solver on multi-GPU systems

2009年

　詳細を見る

会議種別：ポスター発表

researchmap
Environmental-aware optimization of MPI checkpointing intervals

HPC ASIA 2009 2009年

　詳細を見る

researchmap
HPC Application Performance Improvement by a Supplemental Optical Circuit Switching Network

High Performance Computing Symposium 2009 2009年

　詳細を見る

researchmap
An Efficient Conjugate Gradient Solver on Double Precision Multi-GPU Systems

2009年

　詳細を見る

researchmap
Adaptive Resource Indexing Technique for Unstructured Peer-to-Peer Networks

9th IEEE/ACM International Symposium on Cluster Computing and the Grid 2009年

　詳細を見る

researchmap
Linpack Tuning Method on a Heterogeneous Supercomputer with Hybrid Accelerators

Summer United Workshops on Parallel, Distributed and Cooperative Processing (SWoPP2009) 2009年

　詳細を見る

researchmap
Towards user-satisfaction-based resource management in a large-scale computing environment

SWoPP2009 2009年

　詳細を見る

researchmap
Petascaling Commodity onto Exascale: GPUs as Multithreaded Massively-Parallel Vector Processors - the Only Road to Exascale

2009年

　詳細を見る

researchmap
A High-Performance Fault-Tolerant Software Framework for Memory on Commodity GPUs

2009年

　詳細を見る

会議種別：ポスター発表

researchmap
GPU Accelerated Computing---From Hype to Mainstream, the Rebirth of Vector Computing

2009年

　詳細を見る

researchmap
File Clustering Based Replication Algorithm in a Grid Environment

The 2009 9th IEEE/ACM International Symposium on Cluster Computing and the Grid 2009年

　詳細を見る

researchmap
GPU accelerated computing窶吐rom hype to mainstream, the rebirth of vector computing

Scientific Discovery through Advanced Computing (SciDAC 2009) 2009年

　詳細を見る

researchmap
Software-Based ECC for GPUs

2009 Symposium on Application Accelerators in High Performance Computing (SAAHPC'09) 2009年

　詳細を見る

researchmap
The Efficient Checkpoint based on Erasure Coding with Incremental Method

SIG HPC 2009年

　詳細を見る

researchmap
Power-Aware Dynamic Task Scheduling for Heterogeneous Accelerated Clusters

The Fifth Workshop on High-Performance, Power-Aware Computing (HPPAC), in conjunction to IEEE IPDPS 2009 2009年

　詳細を見る

researchmap
プロセス間共通メモリイメージを考慮したマイグレーション最適化

情報処理学会ハイパフォーマンスコンピューティングと計算科学シンポジウム(HPCS2009) 2009年

　詳細を見る

会議種別：ポスター発表

researchmap
四種プロセッサからなるヘテロ型スーパーコンピュータにおけるLinpackチューニング

情報処理学会ハイパフォーマンスコンピューティングと計算科学シンポジウム(HPCS2009) 2009年

　詳細を見る

会議種別：ポスター発表

researchmap
Fast conjugate gradient solver on multi-GPU systems

2009年

　詳細を見る

会議種別：ポスター発表

researchmap
SWAPアクセス数の実行時推定によるメモリの省電力化手法

情報処理学会ハイパフォーマンスコンピューティングと計算科学シンポジウム(HPCS2009) 2009年

　詳細を見る

会議種別：ポスター発表

researchmap
Petascaling Commodity onto Exascale with GPUs on TSUBAME1.2 onto TSUBAME2.0

2009年

　詳細を見る

researchmap
Auto-Tuning 3-D FFT Library for CUDA GPUs

2009 ACM/IEEE conference on Supercomputing (SC09) 2009年

　詳細を見る

researchmap
複数 GPU システムに対応する自動最適化 3D-FFT ライブラリ

情報処理学会ハイパフォーマンスコンピューティングと計算科学シンポジウム(HPCS2009) 2009年

　詳細を見る

会議種別：ポスター発表

researchmap
Petascaling Commodity onto Exascale with GPUs and Windows HPC

2009年

　詳細を見る

researchmap
MapReduce Implementation on the TSUBAME Supercomputer

2009年

　詳細を見る

researchmap
CG on GPU-enhanced Clusters

2009年

　詳細を見る

researchmap
TSUBAME 1.2 and the Road to TSUBAME 2.0 - Accelerated Multi-Petascale Commodity Computing for Everyone

2009年

　詳細を見る

researchmap
Speculative checkpointing: Exploiting temporal affinity of memory operations

HPC ASIA 2009 2009年

　詳細を見る

researchmap
A Model-Based Algorithm for Optimizing I/O Intensive Applications in Clouds using VM-Based Migration

Proceedings of Cloud2009 in the 2009 9th IEEE/ACM International Symposium on Cluster Computing and the Grid 2009年

　詳細を見る

researchmap
スワップコストの動的推定によるメモリの省電力化手法

計算機アーキテクチャ・ハイパフォーマンスコンピューティング合同研究発表会（HOKKE-2009） 2009年

　詳細を見る

researchmap
四種プロセッサからなるヘテロ型スーパーコンピュータにおけるLinpackチューニング

計算機アーキテクチャ・ハイパフォーマンスコンピューティング合同研究発表会（HOKKE-2009） 2009年

　詳細を見る

researchmap
Environmental-aware optimization of MPI checkpointing intervals

HPC ASIA 2009 2009年

　詳細を見る

researchmap
プロセス間共通メモリイメージを考慮したマイグレーション最適化

計算機アーキテクチャ・ハイパフォーマンスコンピューティング合同研究発表会（HOKKE-2009） 2009年

　詳細を見る

researchmap
Preliminary evaluation of software-based memory fault tolerance for GPGPU

2009年

　詳細を見る

会議種別：ポスター発表

researchmap
GPU向けソフトウェアECCの性能評価

計算機アーキテクチャ・ハイパフォーマンスコンピューティング合同研究発表会（HOKKE-2009） 2009年

　詳細を見る

researchmap
光サーキットネットワークの補助的利用によるHPCアプリケーション性能向上

情報処理学会ハイパフォーマンスコンピューティングと計算科学シンポジウム(HPCS2009) 2009年

　詳細を見る

researchmap
TSUBAME2.0における高バンド幅なペタフロップス・コンピューティングの可能性

2009年

　詳細を見る

researchmap
姫野ベンチマークのGPUマルチノード実行における通信と演算のオーバーラップによる高速化～ 32GPUで700GFLOPS超を達成～

HPC研究会 2009年

　詳細を見る

researchmap
GPUにおける耐故障性を考慮した数値計算の電力性能

2009年

　詳細を見る

会議種別：ポスター発表

researchmap
GPUにおける性能と消費電力の相関性の解析

2009年

　詳細を見る

会議種別：ポスター発表

researchmap
CUDA GPU向けの自動最適化FFTライブラリ

先進的基盤システムシンポジウム SACSIS 2009 2009年

　詳細を見る

researchmap
File Clustering Based Replication Algorithm in a Grid Environment

The 2009 9th IEEE/ACM International Symposium on Cluster Computing and the Grid 2009年

　詳細を見る

researchmap
Adaptive Resource Indexing Technique for Unstructured Peer-to-Peer Networks

9th IEEE/ACM International Symposium on Cluster Computing and the Grid 2009年

　詳細を見る

researchmap
Fast Conjugate Gradients with Multiple GPUs

Lecture Notes in Computer Science 2009年

　詳細を見る

researchmap
Power-Aware Dynamic Task Scheduling for Heterogeneous Accelerated Clusters

The Fifth Workshop on High-Performance, Power-Aware Computing (HPPAC), in conjunction to IEEE IPDPS 2009 2009年

　詳細を見る

researchmap
An Efficient Conjugate Gradient Solver on Double Precision Multi-GPU Systems

2009年

　詳細を見る

researchmap
Software-Based ECC for GPUs

2009 Symposium on Application Accelerators in High Performance Computing (SAAHPC'09) 2009年

　詳細を見る

researchmap
GPU Accelerated Computing---From Hype to Mainstream, the Rebirth of Vector Computing

2009年

　詳細を見る

researchmap
A High-Performance Fault-Tolerant Software Framework for Memory on Commodity GPUs

2009年

　詳細を見る

会議種別：ポスター発表

researchmap
異種アクセラレータを持つヘテロ型スーパーコンピュータ上のLinpack の性能向上手法

並列/分散/協調処理に関するサマーワークショップ(SWoPP2009) 2009年

　詳細を見る

researchmap
TSUBAME2.0におけるGPGPUによるスケーラブルなペタフロップス・ベクトル・スーパーコンピューティング

2009年

　詳細を見る

researchmap
Petascaling Commodity onto Exascale: GPUs as Multithreaded Massively-Parallel Vector Processors - the Only Road to Exascale

2009年

　詳細を見る

researchmap
GPUにおける耐故障性を考慮した数値計算の電力性能

情報処理学会研究報告2009-HPC-121 2009年

　詳細を見る

researchmap
GPU における性能と消費電力の相関性の解析

情報処理学会研究報告2009-HPC-121 2009年

　詳細を見る

researchmap
大規模計算環境におけるユーザ満足度を考慮した資源管理へむけて

2009年並列／分散／協調処理に関する『仙台』サマー・ワークショップ（SWoPP仙台2009） 2009年

　詳細を見る

researchmap
GPU accelerated computing窶吐rom hype to mainstream, the rebirth of vector computing

Scientific Discovery through Advanced Computing (SciDAC 2009) 2009年

　詳細を見る

researchmap
増分データとErasure Coding を利用した高速なチェックポイント手法

HPC研究会 2009年

　詳細を見る

researchmap
CG on GPU-enhanced Clusters

2009年

　詳細を見る

researchmap
GPU向け耐メモリエラーソフトウェアフレームワーク

情報処理学会研究報告 2009-HPC-123 2009年

　詳細を見る

researchmap
Hundred million cores in commodity---Why not? (or, will `custom'*finally* prevail?)

CCGSC2008 2008年

　詳細を見る

researchmap
Coupled-simulation e-science support in the NAREGI grid

IEEE Computer 2008年

　詳細を見る

researchmap
Grid'BnB: A parallel branch & bound framework for grids

14th International Conference on High Performance Computing (HiPC) 2008年

　詳細を見る

researchmap
Auto-Tuning 3-D FFT Library for CUDA GPUs

2009 ACM/IEEE conference on Supercomputing (SC09) 2009年

　詳細を見る

researchmap
スーパーコンピュータTSUBAME上でのMapReduceの実現

情報処理学会研究報告2009-HPC-123(HOKKE17) 2009年

　詳細を見る

researchmap
Petascaling Commodity onto Exascale with GPUs and Windows HPC

2009年

　詳細を見る

researchmap
Petascaling Commodity onto Exascale with GPUs on TSUBAME1.2 onto TSUBAME2.0

2009年

　詳細を見る

researchmap
Index distribution technique for efficient search on unstructured peer-to-peer networks

2008年

　詳細を見る

researchmap
HPC-GPGPU: Large-scale commodity accelerated clusters and its application to advanced structural proteomics

Microsoft Science All-Hands-Meeting 2008年

　詳細を見る

会議種別：ポスター発表

researchmap
An efficient, model-based CPU-GPU heterogeneous FFT library

International Heterogeneity in Computing Workshop (HCW '08) 2008年

　詳細を見る

researchmap
Performance evaluation of parallel applications on next generation memory architecture with power-aware paging method

The Fourth Workshop on High-Performance 2008年

　詳細を見る

researchmap
Time stamping authoruty grid

Eighth IEEE International Symposium on Cluster Computing and the Grid (CCGrid'08) 2008年

　詳細を見る

researchmap
Index distribution technique for efficient search on unstructured peer-to-peer networks

The International Conference in Electrical Engineering/Electronics 2008年

　詳細を見る

researchmap
Massive supercomputing coping with heterogeneity of modern accelerators

IEEE International Parallel & Distributed Processing Symposium (IPDPS 2008) 2008年

　詳細を見る

researchmap
Locality aware MPI communication on a commodity opto-electronic hybrid network

Workshop on Large-Scale Parallel Processing (LSPP) 2008年

　詳細を見る

researchmap
A decentralized, scalable, and autonomous grid monitoring system

11th International Conference on Principles of Distributed Systems (OPODIS) 2008年

　詳細を見る

researchmap
Model-based fault localization in large-scale computing systems

The 22nd IEEE International Parallel and Distributed Processing Symposium (IPDPS'08) 2008年

　詳細を見る

researchmap
Environmental-aware optimization of MPI checkpointing intervals

The 2008 IEEE International Conference on Cluster Computing (Cluster 2008) 2008年

　詳細を見る

会議種別：ポスター発表

researchmap
Rise of the Commodity Vectors or Democratization of Supercomputing

NVISION2008 2008年

　詳細を見る

researchmap
Model-based Optimization for Data-Intensive Application on Virtual Cluster

The 2008 9th IEEE/ACM International Conference on Grid Computing (Grid 2008) 2008年

　詳細を見る

会議種別：ポスター発表

researchmap

▼全件表示

Works（作品等）

the Lucie project, a turn-key network installer for large-scaled cluster

2003年 - 2006年

　詳細を見る

作品分類：芸術活動

researchmap
大規模クラスタ用セットアップ・管理ツールの実用化

2003年 - 2006年

　詳細を見る

作品分類：芸術活動

researchmap
グリッド技術に基づくディペンダブルな大規模モディティクラスタ構築技術

2001年 - 2006年

　詳細を見る

作品分類：芸術活動

researchmap
クラスタグリッドテストベッド開発グリッド上数理最適化ライブラリアプリケーションの構築 Grid RPC/Ninfスケーラブル高信頼性拡張の研究

2001年 - 2004年

　詳細を見る

作品分類：芸術活動

researchmap

受賞

HPCwire 35 Legends

2024年11月 HPC Wire

　詳細を見る

researchmap
情報処理学会 2022年度フェロー

2023年3月

　詳細を見る

受賞区分：国内学会・会議・シンポジウム等の賞受賞国：日本国

「高性能計算技術研究開発への貢献」

researchmap
2022年度SCAT会長賞

2023年1月

　詳細を見る

受賞区分：出版社・新聞社・財団等の賞受賞国：日本国

「世界最高性能スーパーコンピュータ「富岳」による新型コロナウイルス感染症対策への貢献」。

researchmap
2022 IEEE Computer Society Seymour Cray Computer Engineering Award

2022年10月

　詳細を見る

IEEE Computer Societyの最高レベルの業績賞の一つで、スーパーコンピュータ・HPC分野に対する重要かつ革新的な貢献に対して授与されるスパコン界の最高峰賞。 TSUBAMEシリーズや「富岳」など、スーパーコンピュータのシステム設計における長期にわたる世界的リーダーシップが評価された。

researchmap
公益財団法人NEC C&C財団 2022年度Ｃ＆Ｃ賞

2022年10月

　詳細を見る

受賞区分：出版社・新聞社・財団等の賞受賞国：日本国

スーパーコンピュータの構成法とシステムソフトウェアに関する研究に取り組み、世界に先駆けてGPUを取り入れるなど、高性能、低コスト、省電力、かつ、実アプリ性能を重視した使いやすい計算機を開発し、省電力を含む数々の指標で世界のトップランクを獲得。「みんなのスーパーコンピュータ」として産学に広く開放されたTSUBAMEシリーズの開発や、「富岳」の総責任者としてその最初の研究開発から利活用に至るまで先頭に立って推進するなど、世界的にも顕著な業績が評価された。

researchmap
令和4年春紫綬褒章

2022年4月

　詳細を見る

受賞国：日本国

計算機科学の分野において、現代のスーパコンピュータの劇的な性能進化に先駆的な研究で大いに寄与するだけでなく、それらの成果を直接的に世界トップクラスの実運用スーパコンピュータに適用し、世界トップの技術として普及させた。計算機科学研究への功績が評価された。

researchmap
情報処理学会 2021年度功績賞

2022年

　詳細を見る

受賞区分：国内学会・会議・シンポジウム等の賞受賞国：日本国

researchmap
The Gordon Bell Special Prize for High Performance Computing-Based COVID-19 Research

2021年11月 Association for Computing Machinery

　詳細を見る

researchmap
HPCwire 2020 Editor's Choice Awards Outstanding Leadership in HPC

2020年11月 HPCwire

　詳細を見る

researchmap
日本ソフトウェア科学会 2020年度フェロー

2020年8月

　詳細を見る

受賞国：日本国

researchmap
SC Asia 2019 Asia HPC Leadership Award

2019年

　詳細を見る

Asia HPC Leadership Award は、スーパーコンピュータのコミュニティにおいてすぐれたリーダーシップを発揮した個人に与えられる賞。高性能計算、特にシステムソフトウェアやシステム設計、性能モデリングと計測、低電力コンピューティング、HPCとビッグデータ/AIとの融合などの成果が評価されての受賞。

researchmap
2018 ACM HPDC Achievement Award

2018年

　詳細を見る

本賞は、並列分散コンピューティングの分野において抜きんでた貢献を果たした個人を称えるもので、並列分散計算のための高性能システムおよびソフトウェアの設計、実装、応用における先駆的な研究が評価された。

researchmap
電子情報通信学会通信ソサイエティ活動功労賞

2018年

　詳細を見る

researchmap
東京工業大学「末松賞『ディジタル技術の基礎と展開』支援」創設記念特別賞

2018年

　詳細を見る

researchmap
People to Watch in 2017

2017年 The HPC Wire

　詳細を見る

researchmap
HPC Wire 2015 Readers Choice Awards Outstanding Leadership in HPC

2015年 HPC Wire

co-award with Prof. Jack Dongarra, Univ. Tennessee

　詳細を見る

researchmap
Sidney Fernbach Memorial Award

2014年 IEEE Computer Society

　詳細を見る

researchmap
大川出版賞 2013年度

2014年（公財）大川情報通信基金岩波講座計算科学別巻「スーパーコンピュータ」

　詳細を見る

受賞国：日本国

researchmap
楽天テクノロジーアワード2013 金賞

2013年

　詳細を見る

researchmap
文部科学大臣表彰科学技術賞（開発部門）

2012年文部科学省「運用世界一グリーンペタスパコンの開発」

　詳細を見る

researchmap
第59回電気科学技術奨励賞

2011年（公財）電気科学技術奨励会「運用世界一グリーンスパコンのTSUBAME2.0を実現した研究開発」

　詳細を見る

受賞国：日本国

researchmap
Fellow

2011年 Association for Computing Machinery

　詳細を見る

researchmap
The Gordon Bell Prize

2011年 Association for Computing Machinery

　詳細を見る

researchmap
ESPS Award

2011年 The Promotion Foundation for Electrical Science

　詳細を見る

researchmap
People to Watch in 2010

2010年 The HPC Wire

　詳細を見る

researchmap
Fellow

2009年 International Supercomputing Conference

　詳細を見る

researchmap
ISC 2008 Award

2008年 International Supercomputing Conference

　詳細を見る

researchmap
The 28th Top500 "No.1 SuperComputer in Asia"

2006年

　詳細を見る

researchmap
第2回日本学術振興会賞

2006年日本学術振興会

　詳細を見る

受賞国：日本国

researchmap
IEEE Supercomputing StorCloud Challenge " Most Innovative Use of Storage In Support of Science " Award

2005年 IEEE

　詳細を見る

受賞区分：国際学会・会議・シンポジウム等の賞

researchmap
Computerworld Computing Honors Laureate

2002年

　詳細を見る

受賞区分：国際学会・会議・シンポジウム等の賞

researchmap
ACM Recognition of Service Award

2002年

　詳細を見る

受賞区分：国際学会・会議・シンポジウム等の賞

researchmap
情報処理学会 1998年度坂井記念特別賞

1999年情報処理学会

　詳細を見る

受賞区分：国内学会・会議・シンポジウム等の賞受賞国：日本国

researchmap
情報処理学会1996年度論文賞

1996年情報処理学会

　詳細を見る

受賞区分：国内学会・会議・シンポジウム等の賞受賞国：日本国

researchmap
Best Paper Award, IEEE Visual Languages Symposium

1995年 IEEE

　詳細を見る

受賞区分：国際学会・会議・シンポジウム等の賞

researchmap

▼全件表示

共同研究・競争的資金等の研究課題

メモリアクセス性能ボトルネックを解消する新アーキテクチャ研究

2021年4月 - 2023年3月

富士通株式会社共同研究

松岡聡, 遠藤敏夫, 野村哲弘

　詳細を見る

担当区分：研究代表者資金種別：産学連携による資金

researchmap
社会インフラ映像処理のための高速・省資源深層学習アルゴリズム基盤

2019年4月 - 2023年3月

科学技術振興機構 CREST 10万ノード超並列処理と資源スケジューリング

篠田浩一, 松岡聡, 大西正輝, 横田理央, 村田剛志, 中原啓貴, 鈴木大慈

　詳細を見る

担当区分：研究分担者

ドライブレコーダーや監視カメラの大量の高精細映像から実時間で物体の検出や異常の検知を行うための、高性能かつ省コストな深層学習アルゴリズム基盤を構築します。この目的のために、機械学習分野と高性能計算分野の研究者が綿密に連携し、システムからアプリケーションまでの多くの要素技術を垂直統合して開発するCo-Designフレームワークのもと、全体の最適化を行います。

researchmap
次世代コンピュータシステムのソフト・ハードアーキテクチャと適用アプリに関する研究

2017年4月 - 2021年3月

株式会社富士通研究所共同研究

松岡聡, 遠藤敏夫, 野村哲弘

　詳細を見る

担当区分：研究代表者資金種別：産学連携による資金

researchmap
社会インフラ映像処理のための高速・省資源深層学習アルゴリズム基盤（スモールフェーズ課題）

2016年12月 - 2019年3月

科学技術振興機構 (JST) 戦略的創造研究推進事業(CREST)

篠田浩一, 松岡聡, 村田剛志, 横田理央

　詳細を見る

担当区分：研究分担者資金種別：競争的資金

researchmap
再構成可能なハードウェアを介したＨＰＣアプリケーションカーネルの加速化

研究課題/領域番号：16F16764 2016年11月 - 2019年3月

日本学術振興会科学研究費助成事業特別研究員奨励費特別研究員奨励費

松岡聡, PODOBAS ARTUR

　詳細を見る

配分額：2200000円（直接経費：2200000円）

高性能コンピューティングでFPGAを利用するために、三種の性能特性が異なるプロセッサ・アクセラレータを作成し、 Rodina HPCベンチマークでこれらを比較評価した。その結果、手作業でコードを最適化せずとも、非常に深いパイプラインによるレイテンシの隠蔽と償却に焦点を当てることがFPGAに最も適した実行モデルであること、ほとんどのベンチマークでOpenCLプログラミングモデルが十分な性能を示すことを示した。
また、ステンシル計算用のFPGAベースのアクセラレータを設計・評価した。ステンシル計算は一般的にFPGAに適していると言われていたが、様々なステンシルのパターンに汎用に適合する回路を自動設計する枠組みはなかったため、シングルFPGAで、汎用かつ高速にステンシル計算するFPGAアクセラレータ（入力サイズ制限なし）を自動設計する手法を開発した。本アクセラレータは、CPUやGPUと比較し、小さいサイズのステンシルアプリケーション（天気予報など）が非常に高速で実行され、消費電力も大幅に削減される事を示した。
また、FPGAを使用して2つの相異なる生物学的ニューロンモデルのニューロモルフィック計算を高速化するスパイキングニューラルネットワーク(SNN)アクセラレータを作成した。最新の汎用プロセッサIntel KNLなどで、汎用のSNNシミュレータのNESTを実行するよりも最大300％高速である事を示した。
また、我々はFPGA上で500MHz程度のクロックでパイプライニングによる高速実行が可能な浮動小数点形式POSITの演算回路生成器を世界で初めて作成した。生成されたハードウェアはOpenCLプログラムから統合して使用できるため、大きなオーバーヘッドがないPositの迅速な統合とテストが可能になった。

researchmap
機械学習の処理高速化に関する研究

2016年10月 - 2020年3月

株式会社デンソーアイティーラボラトリ共同研究

松岡聡, 横田理央, 野村哲弘

　詳細を見る

担当区分：研究代表者資金種別：産学連携による資金

researchmap
次世代HPC のソフト・ハードアーキテクチャと適用アプリに関する研究

2016年10月 - 2017年3月

株式会社富士通研究所共同研究

　詳細を見る

担当区分：研究代表者資金種別：産学連携による資金

researchmap
圧縮性流体解析プログラムの高速化に関する研究

2015年11月 - 2016年3月

株式会社IHI 共同研究

　詳細を見る

担当区分：研究代表者資金種別：産学連携による資金

researchmap
機械学習の処理高速化に関する研究

2015年10月 - 2016年9月

株式会社デンソー共同研究

　詳細を見る

担当区分：研究代表者資金種別：産学連携による資金

researchmap
EBD：次世代の年ヨッタバイト処理に向けたエクストリームビッグデータの基盤技術

2013年10月 - 2019年3月

科学技術振興機構(JST) 戦略的創造研究推進事業(CREST)

松岡聡, 建部修見, 鯉渕道紘, 秋山泰, 三好建正

　詳細を見る

担当区分：研究代表者資金種別：競争的資金

researchmap
高性能計算のためのプログラミングモデル

研究課題/領域番号：12F02044 2012年 - 2013年

日本学術振興会科学研究費助成事業特別研究員奨励費特別研究員奨励費

松岡聡, PERICASGLEIM M.

　詳細を見る

配分額：2300000円（直接経費：2300000円）

本研究の主たる目的は次世代スーパーコンピュータにおいて高性能・高電力効率と生産性を両立させる並列プログラミング手法の開発である。本年度はタスクパラレルモデルとデータフローモデルのランタイム評価と資源管理に焦点を置き、研究計画を推進した。前年度に行ったexaFMMを対象とした解析において、スケジューラーによるアプリケーションの性能差は、スケジューリング法の差によるプロセッサアイドル時間では説明がつかず、資源管理によるものと考えられたことによる。インターコネクトの制約が増大する将来のシステムでは、この点は性能・電力両面からより重要性が増すと考えられる。
この目的のため、タスクパラレルモデルとデータフローモデルにおけるreuse distance methodの解析手法の開発を行った。Reuse distanceは、ある特定のデータ要素への2回のアクセスの間にアクセスされたデータの量を示す指標である。この手法は資源管理において最も重要となるメモリアクセスの時間的局所性を解析するための強力な手法であり、プロセッサキャッシュの利用効率と高い相関がある。しかし、元来シングルコアプロセッサ向けに開発されたものであり、本研究に用いるための実装手法は明らかではなかった。そこで、克服すべき課題(トレースの生成、トレースのサイズ、計算の複雑さ)を抽出し、実現手法を提案した。
まず、このような手法が調査対象となる計算カーネルのデータサイズより十分大きい距離に関しては正確なreuse distanceを計算できる一方でトレースのサイズを大幅に削減することができる手法を示した。この手法の有効性を示すため、トレースの生成がほぼオーバーヘッド無しで測定できることを示すプロトタイプを構築した。加えてこの手法は、先行研究よりも大規模・長時間にわたる実行へもスケール可能である。これらの結果を、二報の論文として発表した。

researchmap
１０億並列・エクサスケールスーパーコンピュータの耐故障性基盤

研究課題/領域番号：23220003 2011年4月 - 2016年3月

日本学術振興会科学研究費助成事業基盤研究(S) 基盤研究(S)

松岡聡, 實本英之, 遠藤敏夫, 佐藤仁, 丸山直也, 滝澤真一朗, 佐藤賢斗

　詳細を見る

配分額：213720000円（直接経費：164400000円、間接経費：49320000円）

エクサ(10の18乗)フロップス・10億並列のエクサスケール・スーパーコンピュータ実現には、規模の増大による故障率の増加に対応する必要がある。このための耐故障性基盤を確立することを目的として耐故障にかかわる複数の要素を対象とした複合的数理モデルの提案とそれを用いた軽量かつ高度な耐故障化手法を提案・評価した。また、開発したシステムの一部についてはオープンソースでの公開を行っている。

researchmap
1億並列・エクサスケールスーパーコンピュータの耐故障性基盤

研究課題/領域番号：23240006 2011年

日本学術振興会科学研究費助成事業基盤研究(A) 基盤研究(A)

松岡聡

　詳細を見る

配分額：13000000円（直接経費：10000000円、間接経費：3000000円）

科学技術分野において、大規模なシミュレーションではスーパーコンピュータ(スパコン)の利用が不可欠となっている。しかし、スパコンに搭載される機器の増大・複雑化により、障害発生率が増加し、システムが実質的に動作しなくなると危惧されており、チェックポイント/リスタートなどの耐障害手法の適用が不可避となっているが、ポストペタースケールスパコンでは、技術的な課題が残る。このため、初年度は、1億スレッド・ポストペタのための基礎的な複合的なチェックポイント・リスタートを行うための耐故障性の数理モデル・性能モデルを探求し、特にポストペタスケールアプリケーションに適した耐障害手法の億単位のスレッド時の定量的性質を明らかにすることを目的として研究に従事した。実際、ポストペタ・エクサスケールスパコンの最有力アーキテクチャである細粒度長並列プロセッサ+粗粒度プロセッサを併用するハイブリッド型アーキテクチャにおいて、チェックポイント/リスタートは種々の技術的困難を伴う技術であったが、我々は、単一GPUにおける「リプレイ手法(メモリ割り当てやメモリーコピーの履歴を取り、リスタートの際に、その履歴に基づいて再現実行"リプレイ"を行うことにより、整合性の取れたチェックポイントを取る手法)」を拡張し、ノード内およびノード外の複数のCPU・GPUを使用するアプリケーションにおいて、安定かつ一貫性のとれたチェックポインティングを実現した。また、性能面においても、許容されるレベルのオーバーヘッドまでに押さえた。また、我々が開発したライブラリでは既存のプログラムに変更を加えることなく、これを実現することが可能であり、可用性にも優れている。超細粒度並列・ハイブリッド型アーキテクチャにおける透過的なチェックポイントの実現は、学術的インパクトも大きいと期待される。

researchmap
ゲノム科学の総合的推進に向けた大規模ゲノム情報生産・高度情報解析支援

研究課題/領域番号：221S0002 2010年4月 - 2016年3月

日本学術振興会科学研究費助成事業新学術領域研究(研究領域提案型)

小原雄治, 加藤和人, 豊田敦, 黒木陽子, 菅野純夫, 鈴木穣, 林哲也, 山本健, 辻省次, 井ノ上逸朗, 黒川顕, 森下真一, 中村保一, 田畑哲之, 久原哲, 岩崎渉, 瀬々潤, 高橋弘喜, 浅井潔, 笠原雅弘, 榊原康文, 矢田哲士, 山縣然太朗, 武藤香織, 位田隆一, 増井徹, 栗山真理子, 高木利久, 藤山秋佐夫, 服部正平, 小椋義俊, 徳永勝士, 桑野良三, 大橋順, 伊藤武彦, 平川英樹, 野口英樹, 松岡聡, 小笠原直毅, 中村建介, 浜田道昭, 金谷重彦, 安西祐一郎, 岡田清孝, 榊佳之, 高久史麿, 豊島久真男, 中村桂子, 堀田凱樹, 米澤明憲, 吉川寛, 吉田光昭, 猪子英俊, 戸田達史, 稲澤譲治, 五條掘孝, 漆原秀子, 武田洋幸, 城石俊彦, 伊藤隆司, 佐藤矩行, 松田秀雄, 五斗進, 津田雅孝, 桑野良三, 徳永勝士, 小笠原直毅

　詳細を見る

国際的にも解析技術が予想以上の速度で進展した中、拠点集約により情報解析を含めた最先端の技術支援を進めることができた。毎年60-90件、総数465件の公募選定課題を支援し、シーラカンスゲノム解読など363報の論文成果が得られた。支援課題は科研費のすべての種目、生物系のほぼすべての分科に及び、この活動が生命科学の基盤として必須であることを示した。また、困難なゲノム解読の切り札ともなったゲノムアッセンブルソフトウェアPlatanusの独自開発に成功したことなど、支援と解析技術の高度化の好循環が進んだ。

researchmap
ULP-HPC: 次世代テクノロジのモデル化・最適化による超低消費電力ハイパフォーマンスコンピューティング

2007年10月 - 2013年3月

科学技術振興機構(JST) 戦略的創造研究推進事業(CREST)

松岡聡, 須田礼仁, 青木尊之, 本多弘樹, 鯉渕道紘, 合田(日向寺) 祥子

　詳細を見る

担当区分：研究代表者資金種別：競争的資金

researchmap
情報爆発に対応する新IT基盤研究支援プラットホームの構築

研究課題/領域番号：18049073 2006年 - 2010年

日本学術振興会科学研究費助成事業特定領域研究特定領域研究

安達淳, 田中克己, 西田豊明, 國吉康夫, 須藤修, 黒橋禎夫, 原隆弘, 松岡聡, 田浦健次朗, 建部修見, 棟朝雅晴, 廣津登志夫, 松原仁, 下條真司, 千葉滋, 湯淺太一, 松山隆司, 近山隆, 近堂徹, 河野健二, 岡本正宏, 合田憲人, 鎌田十三郎, 喜連川優, 山名早人, 中村豊, 小林広明, 中島浩, 喜連川優, 下條真司, 千葉滋

　詳細を見る

配分額：644600000円（直接経費：644600000円）

本特定領域に参加する計画・公募研究班で共用するための研究基盤を構築し、研究活動の支援を行った。これにより、限られた経費の中で研究資源の共用を図り研究連携を深める効果を発揮した。具体的には開放型検索エンジンTSUBAKIによる大規模コーパスの提供、広域分散コンピューティングテストベッドInTrigger、実世界インタラクション計測分析環境IMADE、そしてセンサーネットワーク予防医療の実験環境を構築した。

researchmap
情報爆発時代に対応する高度にスケーラブルな高性能自律構成実行基盤

研究課題/領域番号：18049028 2006年 - 2010年

日本学術振興会科学研究費助成事業特定領域研究特定領域研究

松岡聡, 合田憲人, 中田秀基, 竹房あつ子, 丸山直也, 實本英之, 佐藤仁, 滝澤真一朗

　詳細を見る

配分額：87100000円（直接経費：87100000円）

100万のオーダーのノードからなる超分散環境上で多種なアプリケーションを安全安心に実行するための真の高度にスケーラブルな自律的実行基盤「リジリエント・グリッド(Resilient Grid)」の構築のための研究開発を推進し、高性能基盤技術、実行基盤の自律的構成、次世代ネットワークと実行基盤の融合、性能モデリングとシミュレーションの点において要素技術を確立した。

researchmap
情報爆発時代に向けた新しいIT基盤技術の研究

研究課題/領域番号：17077001 2005年 - 2011年

日本学術振興会科学研究費助成事業特定領域研究特定領域研究

喜連川優, 安達淳, 松岡聡, 松山隆司, 須藤修

　詳細を見る

配分額：60400000円（直接経費：60400000円）

平成17年～平成22年度のご年間にわたり、総括班、支援班、および四つの柱A01(計画研究5件、公募研究26件)、A02(計画研究4件、公募研究9件)、A03(計画研究3件、公募研究11件)、B01(計画研究1件、公募研究5件)による研究を推進し、本年度は事後評価審査を9月に、最終成果を広く公開するためにウェブ上にデモビデオをアップロードし、1月16,17日に情報爆発国際シンポジウムを開催した。
・事後評価ヒアリング
平成22年3月9日～11日に五年間にわたる領域全体の成果報告会議を開催し、海外も含めた評価委員から高い評価を得た。その結果を基に、9月6日に事後評価ヒアリングが行われ、設定した目標を十分に達成すると共に、産業界、実利用を狙える研究成果の成熟度、若手研究者の大幅な育成、新たなIT技術研究プロジェクトへのアウトリーチなど、五年間の成果が高く評価され、Aの評価を頂戴した。
・研究成果のデモビデオを情報爆発ウェブ上にアップロードし、広く一般に研究成果を公開した。
http://www.tkl.iis.u-tokyo.ac.jp/info-plosion/demomovies/
・電子情報通信学会会誌8月号にて、本特定領域研究で得られた成果のなかから、分かりやすい成果をまとめるとともに、情報爆発後の情報処理技術の研究、開発を視野にいれた小特集号「情報爆発が作り出すサイバーフィジカルな情報処理」を企画し、報告した。
・国際シンポジウム「情報爆発を越えて(Beyond the Info-plosion)」を平成24年1月17,18日に開催した。
http://www.infoplosion.nii.ac.jp/info-plosion/html/houkokukai-h23/
海外からの招待講演4件、パネル2件、鼎談2件、講演2件の中で、本特定領域で何をなしえたかを総括すると共に、IT研究における次の重要課題について活発な議論が交わされ、725名の参加者があった。

researchmap
グリッドのプログラミングモデルProActiveを大規模テストベッド上でGridRPCなどと比較する

研究課題/領域番号：05F05791 2005年 - 2007年

日本学術振興会科学研究費助成事業特別研究員奨励費特別研究員奨励費

松岡聡, DADUEL Laurent, BADUEL LAURENT, BADUEL. LAURENT

　詳細を見る

配分額：1000000円（直接経費：1000000円）

これまで、自律的でスケーラブルな効率の良いグリッドモニタリングシステムの構築を行ってきた。このモニタリングシステムは自律的に動作するためにP2Pネットワークを通して、情報のやり取りを行う。一般的にシステムのモニタリングは、イベントのモニタリングを行い、その結果得られた情報を必要とするシステムへ通信することにより行われる。
現在のモニタリングシステムの問題点は、中央管理型であり、また構成の静的な決定を前提とすることである。中央管理型は単一故障点が存在し、ボトルネックを発生させる。また、環境の静的構成は大規模システムにおいて、すべての構成ノードの位置を正確に知る必要があり管理者に大きな負担を与える。これらの問題を解決するために、我々はP2Pネットワークの大規模性、単一故障点の回避による頑健性を利用した自律的モニタリングシステムを提案した。提案システムを利用することにより、自律構成、自己最適化、自己回復、および自己保護が実現可能となり、システムの完全な自律運用が可能となった。
本年度は、上記提案の開発を進めた。これまでのプロイタイプは、自律構成を実装し、実環境で運用可能であった。これに加え、システム運用時の振る舞いを利用した自己最適化を実装した。自己最適化は通信量、分散データベース、情報の分散速度、システムの適応性と動的なサイズ決定、グリッドサービスの協調性、システムを構成するコンポーネントの構成に焦点をあてて行っている。

researchmap
OpenMPによる次世代高性能クラスタ計算機向け高度並列プログラミング環境の研究

研究課題/領域番号：14208026 2002年 - 2004年

日本学術振興会科学研究費助成事業基盤研究(A) 基盤研究(A)

佐藤三久, 石川裕, 松岡聡, 本多弘樹, 朴泰祐, 高橋大介, 田浦健次朗

　詳細を見る

配分額：34970000円（直接経費：26900000円、間接経費：8070000円）

次世代の64ビット高性能クラスタシステムにおいて、OpenMPによる並列プログラミングを可能とするために分散メモリ並列システムであるクラスタで実行するためのソフトウエア分散共有メモリ(SDSM)の実行時支援システム技術を用いたOpenMPのプログラミング環境の研究を行った。さらに、OpenMPのプログラムの開発を支援するための並列プログラミング支援環境、数値計算ライブラリの研究を行った。
1、まず、SCoreクラスタシステムソフトウエアを64bitプロセッサに対応させ、このシステムのSDSMシステムであるSCASHの性能評価を行った。
2、SDSMの可搬性を向上させるために、様々な高速ネットワークで利用可能なMPIを通信レイヤにもちいたSCASH-MPIを開発した。これにより、64bitの広いアドレス空間できるようになり、PMを用いたものに比べ6%程度のオーバヘッドに抑えることができることがわかった。
3、また、IA64アーキテクチャのハードウエアの機構を用いて、アクセスパターンを解析し、効率的な通信を行うSDSMシステムFDSMを開発した。これにより、従来のSCASHの性能を超えることができた。
4、ヘテロな構成のクラスタに対応して、ページマイグレーションとループ再スケジューリングによるDSMシステム向けOpenMPの最適化について検討・性能評価を行い、性能が改善されることを確認した。
5、OpenMPプログラムの開発を支援する対話型ツールOMP/iPatを開発した。このツールにより、ユーザはエディタ上にて対話的に並列性の解析した結果を用いて並列化を容易にできる。
6、OpenMPのベンチマークであるSPEC-OMPでの性能評価を行うとともに、IA-64アーキテクチャの共有メモリ型並列計算機において並列FFTの再帰アルゴリズムのOpenMPによる提案、実装を行った。

researchmap
Gridにおけるpeer-to-peer大規模データ処理に関する研究

研究課題/領域番号：13224034 2001年 - 2005年

日本学術振興会科学研究費助成事業特定領域研究特定領域研究

松岡聡, 合田憲人, 松田裕幸, 森田洋平, 中田秀基, 建部修見, 小川宏高

　詳細を見る

配分額：113200000円（直接経費：113200000円）

データグリッドにおける大規模クラスタの広域Peer-to-peer連携並びにデータ転送,そのためのプログラミングや定量的なモデル並びに解析・シミュレーション技術,さらにはデータの仮想的なマネージメントなどを研究し,ペタバイト級のデータ処理をする基盤技術を開発して実際のCERNのLHC/ATLAS検出器データ処理並びにそのミドルウェアのGfarmプロジェクトの一端を担うことを目指し,主に,1)データグリッドにおける大規模クラスタの広域Peer-to-peer連携並びにデータ転送,2)Peer-to-peerなデータグリッド上のプログラミングならびに解析・シミュレーション技術,3)大規模データの仮想的なマネージメント技術に関して研究を行った.
1)に関して,データグリッドでのクラスタ間広域Peer-to-peer連携と大規模データ転送に関する研究を進めた.また,大規模データ転送実証実験として,米国で開催されたBandwidth Challenge 2002,2003,StorCloud 2005に参加し,グリッドデータファーム上で実アプリケーションを動作させることにより,超大規模データセンターの実現や,国際的な共同実験の超大規模データ解析に目処をつけた.
2)に関して,データグリッドシステムの性能モデリング・解析を行うために,Bricksシミュレータを開発し,データグリッド環境のシミュレーションを行い,グリッドデータファームアーキテクチャに関する知見を得た.また,Peer-to-peerなデータグリッドに特化したポータビリティの高いグリッドプログラミング環境Jayの研究開発を行った.
3)に関して,データグリッド環境で問題となるアプリケーションのファイルアクセス集中を回避することを目的としたグリッド用分散ファイルシステムをグリッドデータファームの拡張によって実現し,その有効性を検証した.

researchmap
多変数多項式方程式系の全ての実根および複素根を計算する多面体的ホモトピー法の開発

研究課題/領域番号：13650444 2001年 - 2002年

日本学術振興会科学研究費助成事業基盤研究(C) 基盤研究(C)

小島政和, 藤沢克樹, 松岡聡

　詳細を見る

配分額：3000000円（直接経費：3000000円）

この研究の目的は,大規模な多変数多項式方程式系の全ての根を計算する実用的な計算手法を開発することにあった.ここで用いた多面体的ホモトピー法は,フェイズ1:多面体的ホモトピー多項式の構築
フェイズ2:予測子・修正子法によるホモトピーパスの追跡
フェイズ3:全ての実根および複素根が計算出来たかの検証
からなる.平成13年度の研究では,それぞれのフェイズに関して基本的なアルゴリズムを構築している.平成14年度の研究では以下を行った.
1.それぞれのフェイズで用いられているアルゴリズムの計算効率の向上.フェイズ1では,対称性をもつ多項式方程式系に対して多面体的ホモトピー多項式の構築に関する研究を行い,その計算効率の向上させた.フェイズ2では,数値計算ライブラリLAPACKを導入し,計算効率を向上させた.フェイズ3では,cyclic polynomialの解の分類に関する新しいアルゴリズムを開発した.
2.フェイズ3で用いられているアルゴリズムの数値的な安定性の向上.予測子および修正子で生ずる線形方程式系の係数行列はしばしば非常に退化に近くなり,正確な解を求めるのに困難を生じる.これを解消するために,特異値分解に基づく方法,および,係数行列の新たなスケーリングの採用を行った.これにより,数値的な安定性が向上した.
3.3つのフェイズの統合したソフトウェアPHoMの開発行い,インターネットを通して公開した.数値実験を通してPHoMがこれまで解かれていなかった規模の多項式方程式系を計算効率よく解くことを検証した.これにより,2年間に渡るこの研究の目標は達成されたと言える.
4.PHoMの並列化に着手した.この部分は次年度以降に継続して研究する予定.

researchmap
セキュリティポリシーの記述体系とその交渉モデルに関する研究

研究課題/領域番号：12133205 2000年 - 2003年

日本学術振興会科学研究費助成事業特定領域研究特定領域研究

柴山悦哉, 高橋伸, 脇田建, 松岡聡

　詳細を見る

配分額：32200000円（直接経費：32200000円）

記述,利用者,システムの3方向から,安全な次世代情報基盤の構築方式を検討するために,以下の3項目を主要な柱として設定して研究を行った.
1.高度で柔軟なセキュリテイポリシーの記述と強制のための基礎研究
見知らぬ他人同士がインターネット上で商取引や共同作業を行う場合を想定し,プライバシー保護と両立可能なセキュリテイポリシーのモデルに関する研究を行った.個人情報の漏洩を最小限に抑えた認証を実現するために属性認証を用いたセキュリティポリシーの交渉モデル,セキュリティオートマトンをベースとした記述方式,コード書き換えに基づく強制方式,部分計算による最適化方式などの成果が得られた.
2.安全なシステムを容易に構築・運用するための基礎研究
システム開発者,システム運用者,エンドユーザなどがセキュリティを守るための作業を自動的または半自動的に行えるようにする方式に関する研究を行った。ソフトウェアパッケージ情報からのセキュリテイポリシーの自動抽出,安全な言語の半自動生成,安全なソフトウェアのための開発環境(ビジュアル言語やデバッグ手法)などの成果が得られた.
3.次世代情報基盤(Grid, P2P, Ubiquitous)を構築するための基礎研究
膨大なリソースを用いた計算(特にGrid計算)を故障や攻撃から守り,安全かつ信頼性の高い形で行うための方式に関する研究を行った.高性能な耐故障通信ライブラリ,スケーラブルな認証方式,クラスタシステムのリカバリを自動化する方式,仮想機械技術を用いて複数の仮想組織間での相互干渉を防止する方式などの成果が得られた.

researchmap
焦点予測機構を備えたズーミングインタフェースに関する研究

研究課題/領域番号：12480070 2000年 - 2002年

日本学術振興会科学研究費助成事業基盤研究(B) 基盤研究(B)

柴山悦哉, 高橋伸, 松岡聡, 田中二郎

　詳細を見る

配分額：7200000円（直接経費：7200000円）

本研究では,ズーミングインタフェースの応用として,宣言的データフロー型ビジュアル言語の実行トレースの可視化とさまざまな情報を格納したディレクトリ構造の可視化に取り組んだ.また,デスクトップ環境以外への展開に関する研究を行った.
1.言型データフロー型ビジュアル言語で記述されたプログラムの全実行過程を1枚の巨大かつ静的な絵で表現し,複数焦点ズーミングインタフェースを用いて,このグラフの必要箇所に焦点をあてながら閲覧できる対話的可視化システムを試作した.この可視化システムでは,プログラム実行の任意複数箇所とそのコンテクストを同時に表示し,さらにユーザからのナビゲーション要求に応えることができる.また,トレースビューという概念を導入し,プロセスに対する入出力の同時表示,依存関係の表示なども可能としている.
2.ファイルシステムなどのディレクトリ構造を,複数焦点ズーミングインタフェースを用いて対話的に可視化表示するシステムの試作を行なった.このシステムでは,ディレクトリ構造の親子関係をたどるナビゲーション,キーワード検索によるナビゲーション,類似ファイル検索によるナビゲーションを支援している.焦点箇所と同時に,焦点箇所を直接または間接的に含むディレクトリの構造がコンテクストとして概形表示される点に特長がある.
3.将来の壁面ディスクプレイやウェラブル環境での利用を想定し,大画面表示や複合現実(mixed reality)の環境における基本的なユーザインタフェースの構築方式についても検討を行った.

researchmap
j-GRID構築の研究

研究課題/領域番号：12558031 2000年 - 2001年

日本学術振興会科学研究費助成事業基盤研究(B) 基盤研究(B)

村岡洋一, 関口智嗣, 合田憲人, 松岡聡, 建部修見, 田中良夫

　詳細を見る

配分額：13200000円（直接経費：13200000円）

(1)GCIの開発本研究は、メタコンピュータを構成するための一方式をまとめるものである。本研究では、プログラマに対してメタコンピュータを提供することを目標とし、そのためのシステムソフトウェアの構成法としてJavaを分散処理に適した処理系、すなわち分散オブジェクトと実行状態の移送機能を付加することを提案した。分散オブジェクトはネットワークの先にあるオブジェクトを操作する機能で、オブジェクト指向言語から複数コンピュータを活用するための一般的な手段である。
本研究の成果は、Java仮想マシン間でメタコンピュータ実現に不可欠な、異機種間・非同期スレッド移送が可能であることを、実証的に示したこと、ネットワーク透過な分散オブジェクトシステムの開発が可能であることを、実証的に示したこと、Javaコンパイラとして既存のものをさらに数倍以上に性能向上させることが可能であることを、実証的に示したこと、などである。
(2)AP-GRIDおよびSC-GRIDの実証
SuperComputing 01において、アメリカのGRIDグループと協力して、日本・アメリカおよびヨーロッパを結ぶグローバルなGRIDの実証的実験を行い、その実現性を確認した。このために、大規模計算能力を分散利用するための技術を開発するとともに、ネットワークのスケジューリング機能を開発した。
(3)Knowledge GRID開発
知識共用のためのKnowledge GRIDの実現に向けて、ハイパーオムニビジョンカメラ(360度全方位カメラ)によって撮影した映像を元に、利用者の視線方向をジャイロで検出して、利用者の付けているヘッドマウントディスプレイに仮想的に利用者があたかもその物理空間にいるかのように周囲空間を表示する技術、分散サーチロボットで高速にWeb情報を収集し、これらを利用者の興味の観点等から分類し、インデックスを構成する技術、遠隔地間で撮影した映像を実時間で1つの画像に接続・合成し、これをヘッドマウントディスプレイに表示することにより、あたかも2つの空間が物理的に同一であるかのように見せる技術として、2つの遠隔画面をシームレスに張り合わせて単一画面に合成する技術などを開発した。

researchmap
並列最適化問題解決のための超広域高性能クラスタ計算機の構築

研究課題/領域番号：12480068 2000年 - 2001年

日本学術振興会科学研究費助成事業基盤研究(B) 基盤研究(B)

松岡聡, 合田憲人, 戴陽, 小島政和, 小川宏高, 藤澤克樹

　詳細を見る

配分額：12500000円（直接経費：12500000円）

本研究では,超広域高性能計算技術を用いて最新の数理最適化問題アルゴリズムを、専用クラスタ計算機の広域連合により広域分散並列化し、従来には達成されなかった大規模で複雑な問題に取り組んだ。更にその計算力が広域ネットワークを用いて広範にアクセス可能な枠組みを構築した。また、最新の主双対内点法を拡張した半正定値計画問題(Semidefinite Programming, SDP略)の高速解法アルゴリズムおよび一般の非凸計画問題まで解ける逐次凸緩和法(Successive Convex Relaxation Method,以下SCRMと略)アルゴリズムの並列化を行い、かつ並列化されたアルゴリズムを効率良く実行する専用の並列クラスタ計算機を構築した。
具体的には,SDPAの本格的な並列化のため、SDPAをOpenMPでスレッド並列に実行できるようアルゴリズムを開発し、ワークシェアリング並列化によってほぼ完全な並列化が可能となることを示した。また、各クラスタノード計算機で分散して並列計算を行なう場合も、入力問題の規模や各行列の非零要素の数から最適なデータ構造や計算方法を自動的に選択できるようアルゴリズムを改良した。
次に,超広域高性能計算(Grid)上の計算システムであるNinfを用いて、クラスタを「最適化問題広域高性能計算サーバ」として構築した。昨年度より東工大に設置している256CPUのPrestoIIクラスタ、京都大学の小型クラスタ、電総研の256プロセッサのBambooクラスタ計算機を合わせ、昨年と比較すると十倍の規模のリモートライブラリアクセスの性能評価などを行い、また、SCRM実行時のSDPAの並列化と上位アルゴリズムであるSCRMの並列化のバランスの実験・検証も行った。

researchmap
plug&play並列クラスタ計算機による動的再構成可能で広範な並列処理の実現

研究課題/領域番号：12558025 2000年 - 2001年

日本学術振興会科学研究費助成事業基盤研究(B) 基盤研究(B)

松岡聡, 石川裕, 小川宏高, 合田憲人, 高木浩光

　詳細を見る

配分額：8100000円（直接経費：8100000円）

本年度はプラグアンドプレイクラスタの研究を更に進め、タラスタリングシステムの自己組織化による耐故障性、動的再構築性の研究を行った。プラグアンドプレイクラスタに必要な基盤研究として、故障ノードのホットスワップ機能、動作中クラスタのソフトウェア構成、パーティション構成までを含めた完全な再構成を高速に行う、LUCIEクラスタインストールコンフィグレーションツールをオープンソースソフトウェア開発し配布している(http://culuster-team.is.titech.ac.jp/lucie/)。LUCIEではインストール・管理操作がすべてネットワークを経由して行われ、かつ非対話的なバッチ処理的に実行されるため、数千台規模のクラスタ、及びGRID環境での組織間にまたがるクラスタ管理に適している。運用例として、当松岡研究室のPrestoクラスタ群、CBRCのmini PAPIAクラスタがLUCIEによる管理に移行しており、成果を挙げている。また、2002年度より運用開始のTITECH GRIDのインストール・管理ツールとしても運用予定。
耐故障性に関する取り組みにつき、大規模クラスタ環境では耐故障性が重要だが、従来障害状況への対策方法が不十分だった。本年度は実行時に起こりうる障害状況を分類し、その対処方法を提案し、耐故障機構をそれぞれについて実装を開始。また最頻発の計算時障害に関し、計算自体の再実行及びチェックポインティング・リスタートによる耐故障機構を実装し、再実行、チェックポインティングのオーバーヘッドを評価した。その結果、再実行を行う場合のコスト、チェックポインティング・リスタートを行う場合のコストバランスが重要であることを示し、コスト相関関係評価用のモデルを作成し、実環境において当モデルの妥当性を確認した。
また、これらの研究に共通する基盤ソフトウェアとして、大規模クラスタ環境における効率的なデータの配布、高速なプロセス起動、グループ通信といった機能を目指す、信頼性の高い高効率グループ通信ライブラリの研究開発を行っている。本ライブラリの実装には耐故障性のための階層化リング構造と、SSLをベースにした認証を用いており、大規模クラスタで必要となるスケーラビリティ、GRID上で必要となるセキュリティ、高信頼性を達成している。

researchmap
超広域高性能計算環境の基礎的研究

1998年 - 2001年

科学技術振興事業団戦略的創造研究推進事業(さきがけ)

　詳細を見る

担当区分：研究代表者資金種別：競争的資金

researchmap
次世代モービルインターフェースにおける対話的ソフトウェア構成法

研究課題/領域番号：10480055 1998年 - 1999年

日本学術振興会科学研究費助成事業基盤研究(B) 基盤研究(B)

松岡聡, 米澤明憲, 高橋伸, 柴山悦哉

　詳細を見る

配分額：10400000円（直接経費：10400000円）

昨年提案した、処理をバックエンド計算機で処理し、位置情報やユーザのプレファレンスでフィルタした情報のみを提示する携帯端末のインターフェースWebPadのアーキテクチャをさらに発展させた。ユーザが積極的に空間情報をWebのデータと連携させポストできる機能、複数のユーザの嗜好を反映させるため、協調フィルタリングを行うためのアルゴリズムと機能、および情報のカテゴリに応じてWebから自動的に情報を摂取・整形・格納するバックエンドでの情報収集エージェントをユーザが簡便に構築するソフトウェアフレームワーク、を実現した。これにより、ユーザは携帯端末で、Web上の莫大な情報を1,2ステップで取得可能となった。ペン描画インターフェースでは、従来の二次元予測描画インターフェースを発展させ、二次元平面上でユーザが描画した三次元物体の外形線から形状予測・補間を行い、ユーザに容易に三次元形状の描画を可能とするアルゴリズムおよびインタラクション法と、それを実現したTeddyを開発した。描画の対象は直方体などのCAD流の幾何形状ではなく、動物などのソフトで複雑な形状である。ユーザはフリーハンドで外形線、および簡便なジェスチャーの描画二次元の描画面にシステムに対話的に提示し、システムは形状や操作を推定し、描画を行う(ACM SIGGRAPHにおいてIMPACT PAPER賞を受賞)。さらに、携帯デバイスで対話の速度と効率を改善するために、複数のポインティングデバイスを用いたインターフェースのテストベッドの構築と、ユーザを用いた検証も行った。通常のインターフェースはマウス・ペンなど、単一の点を操作対象としてポインティングするが、五指を用いたりその他の手法により、複数の操作点の同時操作が可能となる。本システム上のテストアプリケーションにおいて、その有効性を示した。

researchmap
メモリ/ロジック混載技術に基づく大規模集積回路システム・アーキテクチャの研究開発

研究課題/領域番号：09358005 1997年 - 1999年

日本学術振興会科学研究費助成事業基盤研究(A) 基盤研究(A)

村上和彰, 宮崎明雄, 谷口秀夫, 安浦寛人, 澤田直, 岩井原瑞穂, 松岡聡

　詳細を見る

配分額：28600000円（直接経費：28600000円）

本研究は,メモリ(特にDRAM)/ロジック混載LSI技術,並列/分散処理技術,および,LSI間高速通信インタフェース技術に立脚したシステムLSIアーキテクチャおよびコンピュータ/電子機器システム・アーキテクチャ(PPRAM:Parallel Processing RAM)を開発することを主目的に,主として以下の研究を実施した。
1.システムLSI間高速標準通信インタフェース規格PPRAM-Linkの開発;物理層,論理層,APIから成るプロトコル・スタックを定義し,それぞれを実際に実装し動作を検証した。
2.リファレンスPPRAM,および,PPRAM向きキャッシュ・アーキテチャの開発:レジスタ共有型チップマルチプロセッサ,可変ラインサイズ・キャッシュ,ウェイ予測型セット・アソシアティブ・キャッシュの各方式を開発し,その効果を評価した。
3.DRAM/ロジック混載システムLSI向きDRAMリフレッシュ・アーキテクチャの研究:ロジック混載により劣化するDRAMリフレッシュ特性を補償するリフレッシュ方式を開発し,その効果を評価した。
4.組み込みシステムのためのハードウェア/ソフトウェア協調設計手法の研究:ソフトコアプロセッサとValen-C言語をベースとした組み込みシステムのためのハードウェア/ソフトウェア協調設計手法を構築し,その有効性を実証した。
5.プログラムによる電力制御アーキテクチャと低消費電力化の研究:システム負荷に応じて電源電圧と動作周波数を調整制御する方式を提案し,その有効性を証明した。
6.システムLSIのためのテスト手法の研究:BISTと外部テストを組合せたテスト手法を提案した。
7.非経験的分子軌道計算専用並列サーバMOEの開発:整数プロセッサ,浮動小数点プロセッサ,1MbSRAM,PPRAM-Linkインタフェースを混載した分子軌道計算専用PPRAMチップを0.35μmCMOS技術を用いて開発し,同チップを6個搭載したプリント基板,ならびに,同基板を4枚実装した非経験的分子軌道計算専用並列サーバMOEを開発した。
8.動画像向け実時間電子透かし埋め込み/検出サーバの開発:FPGAを用いてPPRAM-Linkインタフェース,PCIバス・インタフェース,ウェーブレット変換ハードウェアを実装し,これを用いて動画像用電子透かし埋め込み/検出システムを開発した。

researchmap
並列ビジュアルプログラムのパターン指向構成法とその支援環境に関する研究

研究課題/領域番号：09680328 1997年 - 1999年

日本学術振興会科学研究費助成事業基盤研究(C) 基盤研究(C)

柴山悦哉, 高橋伸, 松岡聡

　詳細を見る

配分額：3100000円（直接経費：3100000円）

1.並列オブジェクト指向プログラミングを行う際に必要な抽出を表記するためのビジュアルな構文を提案した.レイアウトの自由度が大きなビジュアル言語方式を採用することにより,パターンやアーキテクチャのような概念を表現できるようになった.
2.ビジュアルなパターンの概念とビジュアルなパターンに基づくソフトウェア構成法を提案した.また,ビジュアルなパターンの利用・再利用を支援するインタラクティブな方式を考案した.
3.1,2の提案を実現するビジュアル言語環境KLIEGシステムの試作を行った.KLIEGシステムは以下のような特徴を有する.
(1)設計,コーディング,デバック時の実行モニタリングの各過程で利用可能な単一の表記法を採用.
(2)オブジェクトの組み合わせ方に関する情報をビジュアルなパターンとして定義・(再)利用するための簡便なインターフェースを提供.
(3)ソフトウェアのアーキテクチャを階層的なパターンで表現し,階層の各レベルのパターンを容易に取り替え可能とするインタフェースを提供.
(4)ソフトウェアに修正を加える時に,修正すべき箇所(置きかえるべきオブジェクト)を強調表示する機能.
(5)パターンのホールに対し,複数の選択肢をあらかじめ埋め込み,のちほどソフトウェア設計者が置換する機能.
(6)実行の自動化可視化に基づく挙動の理解支援機能を提供している.

researchmap
同期チャネルとオブジェクトを持つ並列言語の分散共有記憶型並列計算機上の高効率実現

研究課題/領域番号：08408008 1996年 - 1998年

日本学術振興会科学研究費助成事業基盤研究(A) 基盤研究(A)

米澤明憲, 増原英彦, 小林直樹, 松岡聡, 田浦健次朗

　詳細を見る

配分額：34600000円（直接経費：34600000円）

並列計算のための実行時基盤ソフトウェアである、(1)細粒度スレッドライブラリ\stackthreadsおよび(2)共有・分散ヒープ用の保守的ゴミ集めライブラリ、を研究開発した。\stackthreadsは既存のスレッドライブラリ(Solarisスレッドなど)の上に多数の細粒度スレッドを実行時に生成し、実行することのできるライブラリであり、Cの関数呼び出し$+$10命令程度のオーバーヘッドでスレッドを生成する。共有ヒープ用保守的ゴミ集めライブラリは、複数のメモリ割り当て要求の並行処理により並列アプリケーションに十分なメモリ割り当て性能を提供し、並列マーク\&スイープによって、高速なゴミ集めを達成する。現在、Ultra Enterprise 10000上で64プロセッサ使用時に最大30倍程度の台数効果を達成している。分散ヒープ用ゴミ集めは、マーク\&スイープと遠隔参照カウントの両方式を実装し、興味深い性能評価結果を得ている。どのライブラリとも、無変更のgcc+コンパイラから利用可能であり、その意味で新しい「並列言語」ではない。そのため、既存のC/C++でかかれたプログラムに容易に組み込むことが可能である。また、高級言語処理系の実行時システムとして利用することで、処理系構築の手間が軽減されるとともに、こうして作られた複数の言語間に自然に相互運用性を提供する。

researchmap
複数例示による先進的インターフェース構築法の研究

研究課題/領域番号：06452388 1994年 - 1996年

日本学術振興会科学研究費助成事業基盤研究(B) 基盤研究(B)

松岡聡, 高橋伸, 米澤明憲, 萩谷昌巳

　詳細を見る

配分額：7700000円（直接経費：7700000円）

(1)複数例示による対話的GUIプログラミングのインターフェースとその一般的構築法:我々は、(i)ユーザの高度なデータ抽象化の宣言を可能にし、アプリケーション内部のデータの複雑な意味的性質をシステムが推論に利用でき、(ii)システムがその時点での推論の結果を例を通じてユーザーに示し,その例を修正することによってユーザーは新しい例をシステムに示すようにする「例示の修正によるGUIプログラミング」の枠組みを提唱した。
(2)宣言的アニメーションインターフェース:我々は、「絵・抽象的データ間の宣言的双方向変換の枠組」を時系列方向に拡張したモデルを提案し、宣言的記述でアプリケーション内のデータの動的挙動をアニメーション化する枠組みを確立した。具体的には(i)従来のアニメーションで用いられている動画表示の技法を宣言的に指定し、システムが自動生成する技術を開発し、さらに(ii)3次元のアニメーション表示が可能なTRIP3Dを構築した。
(3)成約解消系における一般化局所伝播法(Generalized Local Propagation)の理論:我々は、階層的成約解消系における動的な制約の連立が可能な一般化局所伝播法を提案し、その理論を体系的に確立した。まず、A.Borningらによる階層制約系の再定義をより精密におこなった。次に、解消系の局所的な単調性大局的準単調性などの重要な性質を調べ、局所伝播法で解の正当性に関する必要十分条件を得、従来の様々な提案された階層制約における制約解消系のクラス分けをこの理論に基づき行った。さらに、制約解消系Detailの開発を行い、ユーザインターフェースシステムへの適合性を調べた。
(4)ペンによる描画システムの新しいインターフェースとその構築法:局所的な構造の相互のインタラクションと、そのパラメタの学習により認識を行う「Link Model」を提唱した。さらに人間の一般的な計算機を用いた描画時の操作に関する認知的なモデルを提唱し、その有効性を検証する実験を行った。さらにその実験に基づき、描画時の認知的な負荷を本質的に減らす描画インタラクションを装備した描画システムPegasusを開発した。システムは高速な制約解消系を用いることにより、ユーザの描画操作に対し複数の解釈可能な解を導出し、それをユーザが簡便でかつ自然な操作で選択することによって、描画動作を高速化する。
(5)3-Dアニメーションインターフェースにおける半影の利用によるインタラクション:3-D空間の物体間の相互関係をユーザに対してより積極的にかつ自然に提示する手法として、Interactive Penumbraeと呼ばれる、一種の(現実にはない)半影を用いる手法を提案し、その高速な描画アルゴリズムを開発した。
これらの成果は、複数の海外の国際会議で発表され、特に(2)の研究成果はIEEE Visual Laguage Symposium '94のベストペ-パ-賞を受賞した。また、研究代表者の松岡は、国際学会のプログラム委員としても活躍し、我が国のこの分野の発展に貢献した。

researchmap
並列計算機上の関数プログラミングシステムの構築に関する研究

研究課題/領域番号：06558039 1994年 - 1996年

日本学術振興会科学研究費助成事業基盤研究(A) 基盤研究(A)

武市正人, 田中哲朗, 松岡聡, 岩崎英哉, 米澤明憲

　詳細を見る

配分額：15800000円（直接経費：15800000円）

本研究は、並列計算機上に関数プログラミングシステムを構築して、あらたな規範に基づく並列プログラミングの支援環境を与えようとするものである。
一昨年度より開発を進めてきた並列計算機AP1000上の関数プログラミングシステムParallel Goferを用いてさまざまな並列アルゴリズムを実現したプログラムを用意し、評価しつつコンパイラの最適化を進めてきた。
この研究を進めてゆく過程で、関数プログラミングシステムにおけるデータのUnbox化の重要性が明らかになってきた。データを動的に生成するという関数プログラムの実行においては、生成するデータの効率のよい取扱いがきわめて重要になってくる。ここでは、データのUnbox化に関して、動的にヒ-プ上に生成するとされるデータのうちで、実際にはそうする必要のないものを検出する方法を提案して実現し、評価した。本年度には、このようなデータのUnbox化とともに、構成的アルゴリズムに基づくHylomorphismによるプログラムの変換システムを構築し、有効性を確認した。これらは、並列関数プログラムに固有のものではなく、広く関数プログラミングシステムに適用できる手法である。
以上の研究成果は、主として、国際学会で発表しているが、これらをもとにして実現した並列関数プログラミングシステムはネットワークでアクセスできる形で公開する予定である。

researchmap
線形論理に基づく並列計算の枠組み及びプログラミング言語の設計・実装に関する研究

研究課題/領域番号：06452389 1994年 - 1995年

日本学術振興会科学研究費助成事業一般研究(B) 一般研究(B)

米澤明憲, 小林直樹, 松岡聡

　詳細を見る

配分額：6000000円（直接経費：6000000円）

本研究は、線形論理に基づいて並列プログラミング言語の理論的基礎づけを与え、それをもとにプログラム解析、言語設計、実装技法についての統一的な議論を行なうことを目指した。
(1)平行線形論理プログラミングの枠組ACL/Higher-order ACLの提案…線形論理の論理式をプロセス、論理式の証明過程をプロセスの実行とみなすことにより、非同期通信に基づく並列計算が表現できることに着目し、線形論理の証明規則とプログラムの操作的意味の対応等の基本的性質を示した。さらに高階の線形論理を用いることにより、型システム・高階プロセス等の重要な機能が自然に導入できることを示した。
(2)型つき高階並行プログラミング言語HACLの設計、実装…上記並行線形論理プログラミングの枠組に基づき、並列プログラミング言語HACLのコンパイラ処理系をワークステーション上に作成し、高階プロセスを使ったプログラミングの実験等を通して言語の有用性を検証した。さらに分散環境用処理系のコンパイラのプロトタイプも作成した。
(3)HACL上の並列オブジェクトの機能の実現…HACLを核言語として、インヘリタンス、メソッドのアクセス制御等、さまざまな高機能をもった型つき並列オブジェクト指向言語が柔軟にかつ比較的効率良く構成できることを示した。この結果により、既存の並列オブジェクト指向言語に関する型システム・プログラム解析等の議論もHACLを通して統一的に行なえることがいえた。
(4)並列プログラムの解析技法の考案…HACLを通して、並列プログラムにおけるプロセス間通信に関する解析手法を考案し、それが並列プログラムの最適化および安全性の向上に役立つことを示した。

researchmap
並列オブジェクト指向言語処理系の汎用MIMP型並列計算機上での高効率な実現

研究課題/領域番号：05558026 1993年 - 1995年

日本学術振興会科学研究費助成事業試験研究(B) 試験研究(B)

米澤明憲, 小林直樹, 松岡聡, 加藤和彦

　詳細を見る

配分額：20500000円（直接経費：20500000円）

本研究は、MIMD型の汎用並列計算機上に並列オブジェクト指向言語の極めて効率の良い言語処理系、すなわちコンパイラと実行時系を実現し、並列オブジェクト指向に基づくプログラム実行を実用に供することを、目的としたものである。我々の3年間の研究開発により、基本的にこの目的は十分達成され、さらに、実際のプログラミグに欠かせないマルチスレッドプログラムのデバッグ方式の考案にも、大きな成果をあげた。以下、具体的成果を述べる。
(1)並列オブジェクト指向言語ABCL/fを新たに設計し、記述実験を行ない、言語設計を完成させた。この言語では、並列プロセスの生成はFuture Objectの生成をともなう関数・メッソドの呼び出しとして、またプロセスの同期はFuture objectを介する値の受信として、表現される。さらに、状態が更新されるデータ構造は基本的に並列オブジェクトとして表現され、これへのアクセスはそのオブジェクトに定義される、互いに排他的なメソッドの起動によってのみ可能となる。また、この言語は型付きで、ML流の型多相が許される。「論文7」
(2)ABCL/fより簡素化することにより、Schematicと呼ぶ言語も新たに設計した。この言語は、LISP系の言語として広く流布しているScheme言語の、並列オブジェクト指向への拡張と見ることが出来る。「論文14」
(3)ABCL/言語を含む、比較的一般的は並列言語の並列計算機上での実現において、メッソドの呼び出しや終了にともなうコンテクストの切替えを効率良くおこなうために、核となる抽象マシンStack Threadの設計をおこなった。更にStack Threadの効率の良い実装方式を考案した。「論文1、2、8」
(4)Stack Threadとその実装に基づき、ABCL/f言語の処理系を実現し、ノード間及びノード内のオブジェクト同士のメッセージ送信にかかる時間を計測し、目標とする数値を上回る良い性能を得た。
(5)実時間ガ-ベジコレクション方式を考案し、その性能を評価するとともに、(4)で実現した、言語処理系に組み込んだ。「論文10、11」
(6)デバッグ方式の研究として、多数のスレッドが同時に走る環境で極めて少ない量のログ情報で実現される再演およびレース条件判定の方式を考案・実装した。「論文15」
(7)(a)RNA2次構造予測プログラム及び(b)有限要素法と多体問題解法のプログラムをABCL/f言語で開発し、完成したABCL/f処理系を用いて実行することにより、実用上極めて強力な性能評価値を得た。「論文9、12、13」

researchmap
直接操作インターフェースのための高速制約解消系の実現

研究課題/領域番号：05780227 1993年

日本学術振興会科学研究費助成事業奨励研究(A) 奨励研究(A)

松岡聡

　詳細を見る

配分額：900000円（直接経費：900000円）

グラフィカルユーザインターフェース(以下、GUI)では、計算機内の情報の視覚化と、その視覚化に対する直接操作の実現のためのプログラム開発コストが大きい。その解決法の1つとして、幾何的制約を用いて図の構造を表現し、制約を解くことによって図を校正し、制約の動的変更により直接操作を実現する手法が注目され、盛んに研究されている。しかし、これまでに提案された制約解消法は、高速化のために、制約の連立や非線形な制約を禁ずるなど、制約系のクラスを大幅に制限していたため、これを採用したGUIシステムでは実用上必要な図を表現することが難しかった。そこで本研究では、制約の連立や非線形な制約も扱うことができる高速な制約解消法を開発した。これは以下のような分析と考察に基づいている。GUIで使われる一般的な制約系では、制約の連立は局所的に現れていて、大部分では制約を単独に解くことが可能である。また、単独であれば非線形な制約でも高速に解くことができ、連立する部分が小さければ全体的な速度低下への影響も少ない。そこで開発した制約解消法では、制約系を分析して連立する必要のある最小限の部分を求め、それ以外の制約を単独で解ける部分と合わせて、統一的に扱うようにした。これに基づいて制約解消系を作成し、その性能評価を行ったところ、制約系のクラスを大幅に制限した制約解消系と比べても、それほど大きな速度低下を生じていないことがわかった。さらに、この制約解消系を使用して、複数の視覚的例による直接操作インターフェイスの対話的実現を行うシステムImageを作成した。このシステムでは、制約を連立する機能を大いに活用している。また、現在開発中の宣言的記述に基づくアルゴリズムアニメーション作成システムにも採用する予定である。

researchmap
視覚的例による宣言的グラフィカルユーザインターフェースのプログラミング

研究課題/領域番号：04780025 1992年

日本学術振興会科学研究費助成事業奨励研究(A) 奨励研究(A)

松岡聡

　詳細を見る

配分額：900000円（直接経費：900000円）

researchmap
グラフィカルユーザインターフェースにおける新しい抽象データの視覚化及び操作の手法

研究課題/領域番号：03780021 1991年

日本学術振興会科学研究費助成事業奨励研究(A) 奨励研究(A)

松岡聡

　詳細を見る

配分額：900000円（直接経費：900000円）

researchmap
並列オブジェクト指向計算におけるReflectionとその応用

研究課題/領域番号：01420045 1989年 - 1991年

日本学術振興会科学研究費助成事業一般研究(A) 一般研究(A)

米澤明憲, 渡部卓雄, 松岡聡

　詳細を見る

配分額：11800000円（直接経費：11800000円）

1.リフレクティヴ計算が表現可能となる並列オブジェクト指向言語ABCL/Rを設計し、その簡単な処理系を実装した(論文1)。
2.並列オブジェクトのグル-プ全体にわたるリフレクション機能という新しい概念を定義しこれGroupーWide Reflectionという名称をあたかえ(論文4、5、9)。
3.並列オブジェクト指向計算モデルの1つであるアクタ-モデルに基づくGroupーWide Reflection機能をつ計算モデルとその記述言語ACT/Rを考案・設計した(論文4、5、9)。
4.GroupーWide Reflectionに関して考察を加え、モデルの正当性やその応用などについて様々な結果を得た(論文4、5、9)。
5.ACT/Rの処理系のプロトタイプを作成した。
6.1で設計したABCL/Rに対して3によるGroupーWide Reflectionの成果をとりいれた新しいリフレクションの概念であるHybrid Group Reflectionを定義し、この概念に基づいたABCL/R2を提案した(論文6、13、14)。
7.上述の成果により、従来はプログラミング言語の中からは場あたり的にしか扱えなかった並列計算の諸側面、例えばスケジュ-リングなどが、リフレクションによりオブジェクトの計算資源の共有の協調動作としてモデル化できることを示し、複雑な離散事象シミュレ-ションなどの制御などが応用プログラムから同じ言語の枠組で簡潔に表現できることを実証した(論文13、14、11)。
8.並列オブジェクト指向リフレクションを離散事象シミュレ-ションのアルゴリズムの制御に応用することが可能なABCL/R2の処理系をOMRON社のLuna88k並列マシン上に作成し、その有効性を検証した。
9.並列オブジェクト指向言語の大きな問題であるInheritance Anomaly(継承時の異常性)に対して、リフレクションを用いた有効な解決方法があること幾つかの例題を用いて示した(論文6)。
10.並列オブジェクト指向言語の実行時カ-ネルには、中間コ-ドインタ-プリタ、メソッドヂスパッチ機構、ガ-ベ-ジコレクタなどの他にスケジュ-リングおよびノ-ド間通信を支援機能がある。しかし、アプリケ-ションの性質やハ-ドウエアのア-キテクチャ、実行環境の変化に応じて実行時カ-ネルの振舞いの変更の必要が生じる場合がある。特に分散環境ではその多様な複雑さから、そのような状況が多く発生する。そこで、実行時ル-チンをユ-ザが定義したものと動的に置き換え可能で、なおかつ高い記述性を持つ実用的リフレクティブア-クテクチャシステムRbClを構築した(論文8、11)。
その他:「国際ワ-クショップの開催」
研究分担者の松岡・渡部はACMが後援するリフレクションに関する国際ワ-クショップの組織者として,
(1)ECOOP/OOPSLA'90 Workshop on Reflection and Metalevel Architecture in ObjiectーOriented Programmingを、1990年10月21日カナダのOttwa市で、
(2)OOPSLA'91 Workshop on Reflection and Metalevel Architectures in ObjectーOriented Programmingを、1991年10月7日に米国Phoenic市で開催した。

researchmap

▼全件表示