Video: Inilah Super Komputer Tercepat dan Terbesar di Dunia! Kecepatannya 1 Juta Miliar Flops per Detik! (Desember 2024)
Berita kemarin bahwa superkomputer Tianhe-2 China sekarang menjadi yang tercepat di dunia tidak terlalu mengejutkan. Bagaimanapun, versi sebelumnya berada di atas daftar superkomputer pada tahun 2010.
Yang sedikit lebih mengejutkan adalah arsitektur di belakang Tianhe-2 (juga dikenal sebagai Bima Sakti-2). Ini didasarkan pada arsitektur Xeon Phi baru Intel, yang menggabungkan sejumlah besar inti x86 ke dalam satu chip; superkomputer kemudian menggabungkan chip-chip itu ke dalam satu arsitektur. Sistem ini tidak diharapkan untuk digunakan selama beberapa tahun lagi, jadi saya terkejut melihat sistem berbasis Xeon Phi menjadi yang teratas dalam daftar. Apa yang saya anggap paling menarik di sini adalah persaingan dengan sistem yang sebagian besar berbasis pada komputasi GPU. Memang, sebuah sistem berbasiskan pada core GPU CUDA Nvidia, yang berada di puncak daftar terakhir kali, sekarang berada di posisi kedua.
Daftar 500 komputer tercepat di dunia biasanya keluar dua kali setahun: sekali bersama dengan Konferensi Supercomputing Internasional (ISC) yang terjadi sekarang di Jerman dan lagi di Konferensi Supercomputing (SC 13) pada musim gugur.
Tianhe-2, yang berbasis di Universitas Nasional Teknologi Pertahanan di Changsha, Cina, menunjukkan kinerja berkelanjutan lebih dari 33, 8 petaflops (lebih dari 17, 500 triliun operasi floating point per detik) dan kinerja puncak 54, 9 petaflops pada patokan LINPACK. Ini membuatnya sekitar dua kali lebih cepat dari pemimpin sebelumnya, sistem Titan yang berbasis di Laboratorium Nasional Oak Ridge, Departemen Energi AS (ORNL). Tianhe-2 memiliki 16.000 node, masing-masing dengan dua prosesor Intel Xeon E5-2692 (prosesor 12-inti, menggunakan Ivy Bridge) dan tiga prosesor Xeon Phi untuk total gabungan 3.120.000 inti komputasi. Inti Xeon didasarkan pada versi 12-inti mendatang dari keluarga Xeon # 5-2600, berdasarkan arsitektur Jembatan Ivy 22nm. Total sistem menarik 17.8MW, yang paling dari semua sistem teratas di daftar 500 teratas, tetapi karena angka kinerja sangat tinggi, itu masih dianggap relatif hemat daya. Daftar superkomputer paling efisien di bulan Juni, Green500, akan segera diluncurkan.
Sistem Titan ORNL, yang berada di puncak daftar sebelumnya, kini berada di posisi kedua. Ini didasarkan pada sistem Cray XK7 dengan 18.688 node, masing-masing berisi 16-core AMD Opteron 6274 dan akselerator unit pemrosesan grafis (GPU) Nvidia Tesla K20x. Sistem ini menunjukkan kinerja berkelanjutan 17, 5 petaflops (lebih dari 17.500 triliun operasi floating point per detik) dan kinerja puncak lebih dari 27 petaflops pada patokan LINPACK. Sistem Sequoia di Lawrence Livermore National Laboratory, berdasarkan pada sistem BlueGene / Q IBM dan Power CPU-nya, berada di urutan kedua dalam daftar Top500 setahun yang lalu tetapi telah merosot ke posisi ketiga. Sistem tempat keempat tetap menjadi "komputer K" di RIKEN Advanced Institute for Computational Science Jepang berdasarkan pada prosesor Fujitsu SPARC64.
Empat sistem teratas menunjukkan empat arsitektur yang sangat berbeda. Sistem besi besar tradisional, seperti yang didasarkan pada IBM BlueGene (Power) dan arsitektur SPARC Fujitsu, masih sangat banyak dalam menjalankan tetapi sebagian besar perhatian akan arsitektur Intel Xeon Phi baru dan arsitektur CUDA Nvidia. Sementara itu, terus ada cerita bahwa China bekerja untuk menciptakan prosesor sendiri untuk superkomputer.
Secara lebih rinci, Nvidia mengumumkan kemarin bahwa para peneliti di Stanford University menggunakan GPU untuk menciptakan jaringan saraf tiruan terbesar di dunia yang dirancang untuk memodelkan bagaimana otak manusia belajar. Juga terungkap bahwa toolkit CUDA-nya sekarang akan mendukung platform berbasis ARM.
Sebagai bagian dari konferensi superkomputer, Intel juga memperkenalkan versi baru dari keluarga koprosesor Xeon Phi-nya, termasuk 7100 dengan 61 core clock 1.23GHz, dukungan kapasitas memori 16GB, dan lebih dari 1.2TFlops kinerja presisi ganda; keluarga Xeon Phi 3100 dengan 57 core clock pada 1.1GHz dan 1TFlops kinerja presisi ganda; dan 5100D baru, dirancang sedemikian rupa sehingga soket dapat dipasang ke papan-mini untuk digunakan dalam faktor bentuk blade. Intel mengatakan generasi berikutnya, yang dikenal sebagai "Knights Landing" dan berdasarkan pada teknologi proses 14nm yang akan datang, akan bekerja tidak hanya sebagai coprocessor, tetapi juga sebagai prosesor utama, sehingga menghilangkan kompleksitas data yang dipindahkan ke kumpulan memori yang berbeda. Ini akan mengintegrasikan memori pada paket untuk mempercepat kinerja.
Intel menyebut kombinasi prosesor Xeon dan Xeon Phi tradisional "arsitektur neo-heterogen." Arsitektur perangkat keras memiliki beberapa kelas kemampuan komputasi yang diakses oleh model pemrograman umum. Perusahaan menekankan bahwa karena itu semua x86 yang dapat merampingkan pengembangan dan optimasi dengan cara yang akan lebih sulit ketika menggunakan kombinasi CPU dan akselerator GPU. Nvidia dan perusahaan lain yang mendorong komputasi GPU tidak akan setuju dengan penilaian itu.
Intel juga berbicara tentang penggunaan komputasi berkinerja tinggi tidak hanya untuk penggunaan tradisional seperti penelitian pemerintah dan militer dan aplikasi komersial canggih seperti simulasi minyak dan gas, tetapi juga untuk aplikasi seperti data besar. Tujuannya adalah menjadikan superkomputer lebih utama.
Lihat daftar superkomputer Top500 lengkap di sini.