f90a71ab81ebd09a0b185919f2a29f8f.ppt
- Количество слайдов: 51
高性能计算和高性能存储最新动态简介 邓锡银 华算信息科技有限公司 China HPC Technology Co. , Ltd.
高性能计算和高性能存储最新动态简介 l 议程 F高性能计算最新动态 Ø高性能存储最新动态 ØSDSC Gordon项目简介 2
高性能计算最新动态 l. GPU l共享内存 l. MPP大规模并行处理 3
高性能计算最新动态 FGPU Ø 硬件 Ø 软件 具 l共享内存 l. MPP大规模并行处理 4
高性能计算最新动态:GPU NEW! • 支持IEEE 754 -2008双精度浮点标准 • ECC(纠错代码) • 多级缓存分层结构(1级、2级) • 支持C++编程语言 L 2 DRAM I/F DRAM I/F Giga Thread HOST I/F DRAM I/F Tesla 20系列GPU特性: 5 • 内存容量最多可达 1 TB、同时内核执 行、快速上下文切换、原子指令 10倍速 度提升、64位虚拟地址空间、系统调用 以及递归函数等等
高性能计算最新动态:GPU 16组x 32核=512核 6
高性能计算最新动态:GPU Tesla 20系列-GPU产品包括: Tesla C 2050以及C 2070 GPU计算处理器 • 面向 作站配置的单块GPU PCI-Express Gen-2卡 • 最多 3 GB以及6 GB(各自的容量)板载GDDR 5存储器[i] • 双精度性能范围为 520 GFlops - 630 GFlops Tesla S 2050以及S 2070 GPU计算系统 • 1 U系统外形中集成了四颗Tesla GPU,面向集群以及数据中心的部署需求 • 系统内存总容量为最多 12 GB以及24 GB(各自的容量)板载GDDR 5存储器[ii] • 双精度性能范围为 2. 1 TFlops - 2. 5 TFlops [i] 启用ECC,用户可用内存容量为 2. 625 GB(C 2050)以及5. 25 GB(C 2070) [ii]启用ECC,用户可用内存容量为 10. 5 GB(S 2050)以及21 GB(S 2070) 7
高性能计算最新动态:GPU 8
高性能计算最新动态:GPU 9
高性能计算最新动态:GPU 10
高性能计算最新动态:GPU NEW! 11
高性能计算最新动态 l. GPU F共享内存 Ø NUMA Ø Virtual SMP l. MPP大规模并行处理 12
共享内存计算:SGI Altix UV NEW! NUMAlink 5+Pro. Pack Xeon+Compiler 13
共享内存计算:SGI Altix UV Boxboro IOH CSI Beckt on 8 C Optional I/O Connect Beckt on 8 C Quick. Path (8) DIMMs per socket Quick. Path (2) Directory FB-DIMMs UV HUB RLDRAM (Snoop Acceleration) (4) NUMAlink 5 SGI® NUMAlink™ 5 = 9. 14 to 11. 43 GB/s aggregate (5. 00 Gb/s to 6. 25 Gb/s depending on cable length) Intel Quick. Path = 25. 6 GB/s aggregate (6. 4 GT/s) DIMM = 6. 4 GB/s Read + 3. 2 GB/s Write (800 MHz DIMMs) x 4 channels = 25. 6 GB/s Read / Socket 14
共享内存计算:SGI Altix UV MPI Offload Engine (MOE) 15
共享内存计算:SGI Altix UV N+1 (5+1) 2. 8 KW PS 4 blade IRU for 19” rack NOT POR 4 C or 8 C 128 GB Compute Node or 128 GB Memoryonly Node (8 GB DIMM) 18 U 1+1 48 V PS For 220 mm Blowers 24” IRU Topology (8) NUMAlink 5 Ports per Router Cabled to Network (8) NUMAlink 5 Fan-In Ports per Router 10 U 16 blade IRU for 24” rack Paired Nodes (Dual NUMAlink 5 Cross. Linked) 16
共享内存计算:Scale. MP 17
共享内存计算: 3 Leaf NEW! 18
高性能计算最新动态 l. GPU l共享内存 FMPP大规模并行处理 19
高性能计算最新动态:MPP FMPP (Massively parallel processing) Ø 大规模并行 Ø 采用专有连接设备(区别于普通集群) Ø 连接设备高带宽、低延迟 Ø 高性能的并行环境 Ø 高可靠性 Ø 内存不共享(区别于共享内存系统) 20
高性能计算最新动态:MPP 21
高性能计算最新动态:MPP 22
高性能计算最新动态:MPP l XT 5,XT 6 NEW! Ø 采用AMD处理器、Linux操作系统 Ø 采用Cray Sea. Star 2+专有连接设备组成的3维环网结构 Ø 面向高端市场:大规模、超大规模并行处理(6000至 240000 处理器核)的领域如气象、天文等 l XT 5 m,XT 6 m NEW! Ø 采用AMD处理器、Linux操作系统 Ø 采用Cray Sea. Star 2+专有连接设备组成的2维环网结构 Ø 面向中端市场:中等规模、大规模并行处理(600至 6000处理 器核)的领域如气象、天文等 23
高性能计算最新动态:Cray Sea. Star 24
高性能计算最新动态: Cray Sea. Star 25
高性能计算最新动态: Cray XT 5 m 26
高性能计算最新动态: Cray XT 5 27
高性能计算和高性能存储最新动态简介 l 议程 l 高性能计算最新动态 F高性能存储最新动态 ØSDSC Gordon项目简介 28
高性能存储最新动态:高性能存储 F固态盘 l固态盘RAID缓存 l固态盘SAN缓存 29
高性能存储最新动态:固态盘特点 ü低延迟 ü高带宽 ü低功耗 ü低故障 1米光纤延迟: 4納秒(ns) 内存延迟: 15納秒(ns) 左右 RAM固态盘延迟: 1~15微秒(µs)左右 闪存固态盘延迟: 15~200微秒(µs)左右 硬盘延迟: 2~10毫秒(ms) 1秒(s)=1000 毫秒(ms) 1毫秒(ms)=1000微秒(µs) 1微秒(µs)=1000納秒(ns) 30
高性能存储最新动态:固态盘分类 ØRAM固态盘 ü低延迟 ü非常高的读写性能 Ø闪存固态盘 ü非常高的读性能(SLC) ü较高的写性能(SLC) 31
高性能存储最新动态:闪存固态盘 MLC SLC (多层式储存) (单层式储存) 单颗芯片容量 高 低 单位容量价格 低 高 功耗 高 低 读写速度 低 高 可靠性 低 高 1万次的写入 10万次的写入 使用寿命 32
高性能存储最新动态:PCIe卡式闪存固态盘 33
高性能存储最新动态:SATA接口闪存固态盘 34
高性能存储最新动态:闪存固态盘阵列 35
高性能存储最新动态:PCIe卡式RAM固态盘 36
高性能存储最新动态:RAM固态盘阵列 37
高性能存储最新动态 l固态盘 F固态盘RAID缓存 l固态盘SAN缓存 38
高性能存储最新动态:固态盘RAID缓存 NEW! 39
高性能存储最新动态 l固态盘RAID缓存 F固态盘SAN缓存 40
高性能存储最新动态:固态盘SAN缓存 NEW! 41
高性能计算和高性能存储最新动态简介 l 议程 Ø高性能计算最新动态 Ø高性能存储最新动态 FSDSC Gordon项目简介 42
Gordon项目 Nov. 04, 2009 The San Diego Supercomputer Center (SDSC) at UC San Diego has been awarded a five-year, $20 million grant from the National Science Foundation (NSF) to build and operate a powerful supercomputer dedicated to solving critical science and societal problems now overwhelmed by the avalanche of data generated by the digital devices of our era. 43
Gordon项目 SDSC Storage Challenge team members (L to R) Jiahua He, Michael Norman, Arun Jagatheesan, and Allan Snavely. SDSC, along with LBNL and UC San Diego researchers, won the Storage Challenge competition, announced Nov. 20 at SC 09 in Portland, Oregon. 44
Gordon项目 Gordon 系统配置: • 245 Tflops • 64 TB 内存 • 256 TB 闪存固态盘阵列 • 4 PB 磁盘阵列 45
Gordon项目 Gordon 系统组成: l 32 个超级节点(虚拟共享内存节点): Ø Intel 最新处理器(2011年) Ø Infini. Band互连 Ø每个超级节点包括: u 32个计算节点 ü 240 Gflops ü 64 GB内存 u 2个I/O节点 ü分别配置 4 TB闪存固态盘阵列 u. Scale. MP虚拟共享内存软件 u 7. 68 Tflops u 10 TB 共享存储 ü 2 TB 共享内存 ü 8 TB 共享闪存固态盘阵列 46
Gordon项目 Gordon “…… included incorporating a large (750 GB) RAMFS (randomaccess memory file system) with 1 TB (terabyte) of flash SSD file system to dramatically accelerate scientific database searches such as those used in the Palomar Transient Factory database, a fully automated, widefield survey aimed at a systematic exploration of the optical transient sky using a new 8. 1 square degree camera installed on the 48 -inch Samuel Oschin telescope at the Palomar Observatory in southern California. ” 47
华算公司简介 § 华算信息科技有限公司 China HPC Technology Co. , Ltd. § 专注于提供 HPC 解决方案 – High Portability Computing – High Productivity Computing – High Performance Computing – High Power-efficiency Computing 48
关于HPC High Portability Computing High Productivity Computing High Performance Computing High Power-efficiency Computing 49
华算公司合作伙伴 50
51
f90a71ab81ebd09a0b185919f2a29f8f.ppt