Rumah Berpikir ke depan Superkomputer 15: perubahan lebih besar di cakrawala

Superkomputer 15: perubahan lebih besar di cakrawala

2024

Video: Ini Dia 8 DAFTAR SUPERKOMPUTER Tercepat di Dunia 😎👍 (Desember 2024)

Ketika saya melihat pengumuman dan proses konferensi Supercomputing 15 (SC15) bulan lalu di Austin, tampak bahwa sementara komputasi kinerja tinggi mungkin sedikit jeda, itu adalah pasar yang siap untuk beberapa perubahan besar di tahun ini untuk. datang.

Jika Anda melihat para pemimpin dalam daftar 500 teratas, daftar dua kali setahun komputer tercepat di dunia, pemimpin untuk keenam kalinya berturut-turut adalah Tianhe-2, superkomputer yang dibangun oleh Universitas Nasional Teknologi Pertahanan China. Menurut daftar top500, mesin ini menghasilkan 33, 86 petaflop / s (quadrillions kalkulasi per detik) dari kinerja yang berkelanjutan pada benchmark Linpack dan 54, 9 petaflop / s dari kinerja puncak teoritis. Ini didasarkan pada prosesor Intel Xeon dan Xeon Phi.

Tempat kedua berlanjut ke Titan, sistem Cray XK7 berbasis pada CPU AMD Opteron dan GPU Nvidia K20x yang dipasang di Laboratorium Nasional Ridge Ridge milik DOE, pada kecepatan 17, 59 petaflop / d dari kinerja yang berkelanjutan pada benchmark Linpack.

Dua mesin baru masuk 10 besar. Komputer Trinity di Lawrence Livermore National Laboratory (LLNL) berada di urutan keenam dengan 8, 1 petaflop / dtk, sementara sistem Hazel-Hen di Höchstleistungsrechenzentrum Stuttgart (HLRS) Jerman berada di urutan kedelapan dengan 5, 6 petaflop / dt. Keduanya adalah mesin Cray XC, berdasarkan prosesor Intel Xeon dengan interkoneksi Aries.

Perubahan yang lebih besar terjadi lebih jauh ke bawah daftar, terutama dengan peningkatan besar dalam jumlah sistem Cina, yang tumbuh menjadi 109, dibandingkan dengan hanya 37 dalam daftar sebelumnya. Sebagian, ini tampaknya berasal dari lebih banyak sistem Cina yang menjalankan tolok ukur dan mengirimkan hasil untuk daftar. Akibatnya, jumlah sistem AS turun dari 231 menjadi 200, yang merupakan angka terendah sejak daftar dimulai pada tahun 1993; dan jumlah sistem Eropa turun dari 141 menjadi 108.

Salah satu tren besar adalah peningkatan jumlah sistem yang menggunakan akselerator atau coprocessor, yang naik menjadi 104 sistem pada daftar saat ini, naik dari 90 pada bulan Juli. Sebagian besar sistem tersebut menggunakan GPU Nvidia Tesla, diikuti oleh prosesor Intel Xeon Phi, dengan beberapa menggunakan kombinasi. Nvidia menunjukkan bahwa itu ada di 70 dari sistem ini, termasuk 23 dari 24 sistem baru dalam daftar.

Di acara itu, Nvidia menyoroti pertumbuhan akselerator, dan terutama jumlah aplikasi yang sekarang tersedia dioptimalkan untuk arsitektur CUDA perusahaan. Perusahaan mengatakan 90 persen dari 10 aplikasi komputasi kinerja tinggi teratas dan 70 persen dari 50 aplikasi teratas sekarang dipercepat. Salah satu penggunaan yang menarik adalah untuk sistem yang menjalankan simulasi cuaca, aplikasi utama untuk komputasi berkinerja tinggi, karena prakiraan cuaca diproduksi oleh semua jenis pemerintahan. Cray sebelumnya menunjuk pada penggunaan akselerator semacam itu di Kantor Meteorologi Swiss (MeteoSwiss) dan telah berbicara tentang cara kerjanya dengan para peneliti di Swiss dalam menulis ulang banyak aplikasinya. Nvidia sekarang menunjuk ke penggunaan akselerator oleh Administrasi Kelautan dan Atmosfer Nasional (NOAA) untuk beberapa peramalan cuacanya juga.

Di antara aplikasi lain, Cray memuji aplikasi minyak dan gas, seperti menggunakan 3D geofisika untuk mensimulasikan reservoir, serta layanan keuangan, seperti penilaian risiko. Aplikasi seperti itu jarang merupakan sistem tercepat di dunia, tetapi merupakan indikasi bahwa komputasi berkinerja tinggi mengambil peran yang lebih luas dalam aplikasi perusahaan yang lebih banyak. Cray telah berbicara tentang perkembangan mantap untuk menjalankan model yang lebih besar dan lebih rinci di semua disiplin ilmu dan teknik, dan menggabungkan beban kerja tradisional dengan analitik.

Saya juga tertarik pada pengumuman oleh Linux Foundation tentang upaya baru yang disebut OpenHPC, yang dirancang untuk menciptakan standar yang lebih terbuka di dunia HPC. Itu ide yang menarik, dan sepertinya punya banyak pemain besar yang mendaftar.

Ada sejumlah sistem baru yang sedang dikerjakan. IBM sedang membangun mesin baru yang disebut Summit di Oak Ridge National Laboratories (ORNL) dan yang lain bernama Sierra di Lawrence Livermore National Laboratory (LLNL), keduanya berdasarkan pada arsitektur IBM Power arsitektur, Nvidia Tesla GPU, dan interkoneksi Mellanox. Summit diharapkan memberikan 150 hingga 300 puncak petaflop / s, dan Sierra lebih dari 100 petaflop / s.

Selain itu, Intel dan Cray sedang membangun mesin baru yang disebut Aurora, berdasarkan prosesor Knights Hill Intel Xeon Phi yang akan datang untuk The Argonne Leadership Computing Facility (bagian dari Argonne National Labs), yang bertujuan untuk 150 petaflops pada 2018. Semua ini adalah bagian dari program Departemen Energi yang dikenal sebagai Kolaborasi laboratorium Oak Ridge, Argonne, dan Lawrence Livermore (CORAL), yang bertujuan mempercepat pengembangan komputasi berkinerja tinggi, dan khususnya proyek FastForward 2.

Namun, kami masih memiliki jalan panjang menuju "komputasi exascale."

Sementara itu, ada beberapa pengumuman prosesor yang bisa menjadi pertanda baik untuk masa depan. Nvidia secara khusus mendorong penggunaan superkomputer untuk aplikasi web hyperscale, khususnya pembelajaran mesin. Ini mengumumkan beberapa produk yang agak lebih rendah: papan Tesla M40 dengan 3072 core CUDA, yang katanya mampu melakukan hingga 7 teraflop presisi tunggal, yang utamanya ditujukan untuk pelatihan "pembelajaran dalam", dan M4, papan daya yang lebih rendah dengan 1024 core dan 2.2 teraflop presisi tunggal / s, yang dapat digunakan untuk inferensi pembelajaran yang mendalam serta hal-hal seperti pemrosesan gambar dan video. Selain itu, perusahaan mengumumkan "suite hyperscale" baru dengan aplikasi yang ditujukan untuk situs komputasi terbesar. Kedua produk perangkat keras baru didasarkan pada teknologi proses 28nm dan arsitektur Maxwell perusahaan.

Perusahaan telah mengumumkan dua arsitektur lanjutan, yang dikenal sebagai Pascal, yang akan jatuh tempo tahun depan, dan Volta, yang akan mengikutinya. Intel berfokus pada bagaimana HPC memengaruhi sains, dan saya tertarik dengan deskripsinya tentang cara menggunakan superkomputernya sendiri - yang saat ini berada di peringkat 99 dalam daftar 500 teratas - untuk membantu merancang prosesornya sendiri. Secara khusus perusahaan mengatakan menggunakan sejuta jam CPU hanya untuk merancang fotoma untuk prosesor generasi berikutnya.

Sebagian besar aktivitas Intel difokuskan pada Knights Landing, versi berikutnya dari chip Xeon Phi-nya, yang dapat digunakan sebagai akselerator tetapi juga di-boot; dan kain Omni-Path-nya. Meskipun Intel sekarang mengatakan ketersediaan umum akan terjadi pada semester pertama 2016, beberapa pelanggan memiliki akses awal ke Knights Landing. Saat ini, Cray sedang menguji sistem Pendaratan Ksatria besar dalam persiapan untuk memberikan superkomputer baru yang disebut Cori untuk Pusat Komputasi Ilmiah Penelitian Energi Nasional (NERSC), dan Laboratorium Nasional Los Alamos dan Laboratorium Nasional Sandia, tahun depan. Bull, sebuah unit integrator sistem Prancis Atos, juga telah menerima versi awal Knights Landing untuk mempersiapkan sistem Tera 1000 yang sedang dibangunnya untuk Komisi Energi Alternatif Prancis dan Komisi Energi Atom. Argonne Leadership Computing Facility sedang mengerjakan sistem yang disebut Theta, yang akan dikirimkan tahun depan, dan Sandia National Laboratories bekerja dengan Penguin Computing untuk meningkatkan beberapa sistem yang menggunakan generasi sebelumnya co-prosesor Xeon Phi.

Intel telah mengatakan sebelumnya bahwa akan ada tiga versi berbeda dari Knights Landing: prosesor host base-line (mampu melakukan booting sendiri), prosesor host dengan fabric Omni-Path yang terintegrasi, dan kartu akselerator PCIe. Chip itu sendiri akan terdiri dari 36 ubin masing-masing dengan dua core CPU (total 72 core), empat unit pemrosesan vektor (dua per core), 1MB cache L2 bersama, dan sebuah agen caching untuk menjaga koherensi; dan Intel telah mengatakan harus memberikan sekitar tiga kali kinerja skalar dari CPU Knights Corner, dengan 3 teraflop / s presisi ganda dan 6 puncak teraflop / s kinerja puncak presisi tunggal. Ini juga menggunakan sistem memori baru yang disebut MCDRAM, memori paket dengan lebih dari 3x bandwidth yang tersedia dibandingkan dengan keluar ke DDR4 yang tampaknya menjadi varian pada arsitektur Memory Memory Cube yang telah dibicarakan oleh Intel dan Micron tentang hal itu. Di acara itu, Cray memiliki sistem prototipe yang menampilkan Knights Landing yang dapat di-boot, dan sejumlah vendor lain menunjukkan sistem yang dirancang untuk Knights Landing. Versi Xeon Phi ini dijadwalkan akan diikuti oleh versi yang disebut Knights Hill, yang akan dibangun pada proses 10nm yang akan datang.

Selain itu, Fujitsu berbicara lebih banyak tentang proyek Flagship 2020-nya, berdasarkan chip baru yang dikenal sebagai FX100 dengan 32 core. Ini diperkirakan akan melipatgandakan kinerja floating-point dibandingkan FX10 saat ini, dan seperti Knights Landing, FX100 Fujitsu juga akan menggunakan versi arsitektur Memory Cube. Selain itu, NEC memiliki proyek dengan nama kode Aurora (tidak terkait dengan proyek CORAL), berdasarkan tindak lanjutnya terhadap chip SX-ACE tetapi dengan bandwidth memori yang lebih besar. Ini ditargetkan untuk 2017.