Rumah Berpikir ke depan Akankah arsitektur alternatif memerintah superkomputer?

Akankah arsitektur alternatif memerintah superkomputer?

2024

Video: Using A Supercomputer (Desember 2024)

Dalam beberapa tahun terakhir kami telah melihat beberapa pendekatan baru yang menarik untuk komputasi berkinerja tinggi, khususnya pergeseran dari prosesor besar tradisional dan menuju kelompok CPU x86 dengan akselerator atau koprosesor untuk mempercepat jenis perhitungan tertentu. Keluar dari pertunjukan Supercomputing minggu lalu, kami melihat Intel mendorong untuk mengintegrasikan koprosesor Xeon Phi dengan prosesor server tradisional Xeon untuk membuat pemrograman lebih mudah; Nvidia memperkenalkan versi baru akselerator Tesla GPU-nya; dan Micron mendukung jenis prosesor yang sangat berbeda untuk komputasi yang lebih terspesialisasi. Dan semua ini terjadi pada saat akselerator dan coprocessor mendominasi daftar 500 komputer tercepat di dunia, membuat beberapa pakar menyarankan benchmark yang ada memberi terlalu banyak bobot pada prosesor ini.

Nvidia menggembar-gemborkan kesuksesannya dengan papan akselerator Tesla, kelompok besar GPU yang terhubung ke prosesor utama baik dari Intel maupun AMD. Chip tersebut digunakan dalam berbagai sistem, termasuk sistem Titan di Oak Ridge National Laboratory dan sistem Piz Daint baru di Pusat Komputasi Supercomputing Nasional Swiss. Lebih menariknya, perusahaan mengatakan papan Tesla berada di semua 10 sistem teratas dalam daftar Green 500 terbaru dari superkomputer paling hemat energi di dunia. Semua sistem ini juga menggunakan Intel Xeon dengan pengecualian Titan yang berbasis AMD Opteron, yang merupakan sistem tercepat kedua di dunia pada Top 500 tetapi peringkatnya jauh lebih rendah pada daftar Green 500.

Selain itu, Nvidia mengumumkan kemitraan dengan IBM untuk menawarkan akselerator Tesla dalam sistem yang didasarkan pada arsitektur IBM Power. IBM telah lama memuji kinerja serialnya, dan sistem BlueGene / Q berdasarkan prosesor Power menjalankan sistem Sequoia di Lawrence Livermore National Laboratory dan sistem Mira di Argonne National Laboratory antara lain. Adanya IBM dan Nvidia bekerja bersama akan menghasilkan beberapa sistem yang menarik di masa depan.

Di acara itu, perusahaan mengumumkan Tesla K40, generasi berikutnya dari papan akselerator GPU-nya. Perusahaan mengatakan akan menawarkan 1, 4 teraflops kinerja presisi ganda, memori 12GB (bandwidth 288GBps), dan fitur GPU Boost, yang memungkinkannya berjalan pada kecepatan clock yang lebih cepat dalam beberapa situasi. Ini adalah peningkatan dari seri Tesla K20 yang ada, menggunakan desain GPU dasar yang sama yang diproduksi pada teknologi 28nm.

Inisiatif lain termasuk cara membuat pemrograman GPU lebih mudah, termasuk CUDA 6, yang sekarang mendukung memori terpadu, membiarkan pengembang mendekati memori sebagai satu kumpulan, meskipun CPU dan memori GPU tetap terpisah. Perusahaan juga mendukung OpenACC, kumpulan standar arahan penyusun yang memberi tahu sistem bagian program mana (ditulis dalam C / C ++ dan Fortran) yang dapat diturunkan dari CPU ke akselerator untuk meningkatkan kinerja.

Pendekatan Intel, yang disebut arsitektur Many Integrated Core (MIC), sangat berbeda. Ini menggabungkan beberapa core x86 kecil menjadi satu chip yang disebut Xeon Phi. Selama beberapa tahun terakhir, Intel telah menggembar-gemborkan fakta bahwa itu semua x86s sehingga membuatnya lebih mudah diprogram, meskipun jelas pengembang masih harus menargetkan arsitektur secara langsung. Versi terbaru dari Xeon Phi, yang disebut Knights Corner, dirancang untuk digunakan sebagai akselerator bersama dengan chip server Xeon E yang lebih tradisional, dan digunakan oleh berbagai sistem teratas, termasuk China Tianhe-2 (saat ini sistem tercepat di dunia) dan sistem Stampede di Advanced Computing Center di University of Texas.

Di acara itu, Intel mengumumkan versi baru dengan nama kode Knights Landing, yang juga akan beroperasi sebagai CPU mandiri yang dapat masuk ke arsitektur rak standar dan menjalankan sistem operasi secara langsung, tanpa memerlukan CPU host (seperti Xeon E). Ini bisa sangat penting dalam memperluas daya tarik Xeon Phi, khususnya di pasar workstation. Sekali lagi, ini dirancang untuk memudahkan pengembang perangkat lunak untuk melihatnya sebagai CPU tunggal. Knights Landing akan tersedia baik sebagai CPU mandiri dan sebagai papan PCI Express yang cocok dengan sistem yang ada sebagai peningkatan dari Knights Corner.

Ada perubahan signifikan lainnya pada Knights Landing, termasuk menambahkan "memori dekat, " secara efektif DRAM yang ditawarkan pada paket dengan CPU dan dengan demikian dapat memberikan bandwidth yang jauh lebih tinggi daripada memori DDR tradisional, yang dibatasi oleh kecepatan bus. (Itu semakin cepat juga, tapi tidak sebanyak itu.) Ini bukan langkah pertama ke arah ini; IBM telah menggembar-gemborkan DRAM tertanam dalam arsitektur Power-nya selama bertahun-tahun dan Intel sendiri menempatkan DRAM tertanam untuk grafik dalam versi Iris Pro dari keluarga Haswell Core-nya. Namun, tebakan saya adalah kita akan melihat lebih banyak upaya ke arah ini di tahun-tahun mendatang.

Sementara itu, salah satu pendekatan baru yang paling menarik datang dari Micron, yang mengumumkan akselerator baru yang disebut Prosesor Automata yang dirancang terutama untuk mengatasi masalah data yang tidak terstruktur yang kompleks.

Micron menggambarkan ini sebagai menawarkan kain yang terdiri dari puluhan ribu hingga jutaan elemen pemrosesan yang terhubung untuk menyelesaikan tugas tertentu. Perusahaan, salah satu pembuat memori DRAM dan NAND terbesar, mengatakan ini akan menggunakan pemrosesan berbasis memori untuk menyelesaikan tantangan komputasi yang kompleks di berbagai bidang seperti keamanan jaringan, bioinformatika, pemrosesan gambar, dan analitik. Micron awalnya akan mendistribusikan Prosesor Automata pada papan PCI-Express untuk membuat pengembang bekerja dengannya, tetapi perusahaan berencana untuk menjual prosesor pada modul memori standar, yang dikenal sebagai DIMM, atau sebagai chip individu untuk sistem tertanam. Dalam beberapa hal, ini terdengar mirip dengan field-programmable gate array (FPGAs), yang disetel untuk menyelesaikan aplikasi tertentu yang melibatkan pencocokan pola.

Perusahaan itu mengatakan sedang bekerja dengan Georgia Tech, University of Missouri, dan University of Virginia untuk mengembangkan aplikasi baru untuk Automata. Meskipun perusahaan belum mengumumkan tanggal untuk produk akhir, kit pengembangan perangkat lunak akan keluar tahun depan, bersama dengan alat simulasi.

Automata terdengar seperti pekerjaan yang sedang berjalan dan mungkin terlalu dini untuk mengetahui seberapa luas aplikasi tersebut, tetapi ini merupakan pendekatan yang menarik.

Secara keseluruhan, kami melihat evolusi komputasi berkinerja tinggi. Tidak terlalu lama, komputer tercepat kebanyakan hanya prosesor server standar dalam jumlah besar. Memang sistem IBM Blue Gene dan yang berbasis Sparc (seperti komputer K di RIKEN Advanced Institute for Computational Science di Jepang, yang menggunakan prosesor Fujitsu Sparc) masih menyumbang sebagian besar pasar, termasuk lima dari 10 tercepat. sistem di dunia. Tetapi dalam beberapa tahun terakhir, momentum telah berayun ke arah coprocessor, dengan sistem menggunakan Tesla dan baru-baru ini akselerator Xeon Phi membuat lebih dari sistem yang lebih baru. Dengan perbaikan dalam sistem tersebut, kemitraan baru, perangkat lunak yang lebih baik, dan beberapa pendekatan baru, pasar komputer super mungkin sangat berbeda di masa depan.