Rumah Berpikir ke depan Peringkat komputer super sebagian besar tidak berubah, tetapi duduklah dengan erat

Peringkat komputer super sebagian besar tidak berubah, tetapi duduklah dengan erat

Video: Sync Planner // Kebiasaan yang Menurunkan Produktivitas (Oktober 2024)

Video: Sync Planner // Kebiasaan yang Menurunkan Produktivitas (Oktober 2024)
Anonim

Daftar superkomputer tercepat di dunia terbaru tidak banyak berubah, tetapi acara Supercomputing tahunan (SC14) menampilkan banyak diskusi tentang sistem baru dalam daftar, serta beberapa pengumuman komputasi berkinerja tinggi, seperti akselerator baru dari Intel dan Nvidia.

Superkomputer Tianhe-2 China, yang menggunakan CPU Intel Xeon dan akselerator Xeon Phi, tetap berada di tempat pertama dalam daftar Top500 dengan kinerja puncak 54, 9 petaflops (quadrillions operasi floating point per detik). Tahun ini, pada kenyataannya, sembilan sistem teratas identik dengan tambahan baru di tempat ke-10 - mesin sistem pemerintah AS yang tidak ditentukan yang merupakan Cray CS-Storm yang ditenagai oleh CPU Intel Xeon E5-2660 v2 dan GPU Nvidia K40, terhubung melalui Infiniband.

Lebih jauh ke bawah daftar, ada 78 sistem baru, meskipun bahkan ini adalah rekor terendah baru. Dan secara keseluruhan, tampaknya kita melihat perlambatan dalam tingkat pertumbuhan daya agregat dari 500 sistem.

Pemeringkatan sistem ini didasarkan pada tolok ukur LINPACK, meskipun sekarang ada sejumlah upaya untuk menciptakan tolok ukur baru yang ditujukan untuk berbagai jenis komputasi. Saya menemukan hal yang menarik bahwa dalam sebuah pidato di acara itu, Horst Simon, editor daftar Top500, mengatakan bahwa terlepas dari tujuan mencapai komputer exascale - 1 exaflops per detik (kira-kira 1.000 petaflops) -pada tahun 2020, ia percaya kemungkinan akan terjadi bawa kami hingga akhir tahun 2024. Sebagian karena kami akan membutuhkan lebih banyak teknik hemat daya - seperti silikon fotonik dan integrasi dan pengemasan 3D - untuk menjaga daya yang dibutuhkan untuk sistem exascale hingga 20 megawatt. Ini adalah sistem besar.

Meskipun tidak ada perubahan besar di bagian atas, kami memang mendengar beberapa pengumuman baru - terutama dari Intel dan Nvidia, yang dapat menunjukkan jalan menuju mesin yang lebih cepat.

Nvidia, yang bahasa pemrograman GPU dan CUDA-nya benar-benar memulai gerakan menuju akselerator dan coprocessor dalam komputasi kinerja tinggi, hadir di seluruh acara dengan banyak sistem. Saat ini menawarkan akselerator K40 dan pada acara itu mengumumkan versi berikutnya, Tesla K80, yang menggunakan pendekatan dual-GPU untuk menawarkan apa yang dikatakan perusahaan itu kinerja hampir dua kali lebih tinggi dan menggandakan bandwidth memori pendahulunya.

Nvidia mengatakan K80 menawarkan 4.992 core CUDA dan 24 megabyte RAM dan memiliki kapasitas puncak 2, 91 teraflops per board. Sangat menarik bahwa K80 tersedia sekarang dan bahwa banyak pembuat sistem sudah menawarkan sistem dengan papan. Misalnya, Dell memamerkan server PowerEdge C4130 yang baru, yang memungkinkan Anda memuat hingga empat papan akselerator Nvidia (atau akselerator Intel Xeon Phi) dalam server 1U, dengan versi K80 menawarkan hingga 7, 2 teraflops di setiap kotak. Itu hanya sejumlah besar daya komputasi dalam rak (meskipun yang akan menggunakan banyak energi dan membutuhkan banyak pendinginan).

Sementara itu, Intel mengumumkan bahwa versi berikutnya dari chip Xeon Phi-nya - versi yang dikenal sebagai Knight's Landing di mana sistem komersial pertama akan mulai dikirimkan tahun depan - sekarang memiliki lebih dari 50 pelanggan yang berencana menggunakan versi prosesor baru dari bagian tersebut (di mana Xeon Phi bertindak sebagai prosesor sistem) pada superkomputer baru. Masih banyak lagi sistem yang menggunakan versi kartu produk coprocessor PCIe.

Di antara pelanggan untuk Knights Landing adalah superkomputer Trinity, upaya bersama antara Los Alamos dan Sandia National Laboratories, dan superkomputer Cori, yang diumumkan oleh Pusat Penelitian Ilmu Pengetahuan Komputasi Energi Nasional (DOE) Departemen Energi AS (NERSC). Knight's Landing seharusnya menawarkan sekitar 3 teraflop kinerja, dan akan mengintegrasikan teknologi silikon Omni-Path Fabric berbasis fotonics dari Intel, yang menurut perusahaan akan menawarkan kecepatan garis 100 Gbps dan latensi fabric switch hingga 56 persen lebih rendah daripada alternatif InfiniBand. (Perhatikan bahwa penyedia InfiniBand sekarang berbicara tentang versi baru juga.)

Intel mengatakan tindak lanjutnya, yang dikenal sebagai Knight's Hill, akan dibangun menggunakan teknologi proses 10nm Intel dan menggunakan generasi berikutnya dari Omni-Path fabric. Itu akan mengikuti Knight's Landing, tetapi waktu yang tepat tidak diungkapkan.

Yang tidak ketinggalan adalah AMD, yang mengumumkan dan menunjukkan kartu CPU-tunggal FirePro S9150, yang dikatakan dapat menawarkan kinerja 2, 53 teraflops. Sistem ini, yang diprogram menggunakan OpenCL, sudah dikirim.

Bahkan, superkomputer baru bernama L-CSC dari GSI Helmholtz Center, berdasarkan pada GPU S9150 dan CPU 10-core Intel Xeon 2690v2 10-core menduduki puncak versi baru dari daftar Green500, yang mendaftar superkomputer dalam urutan daya pemrosesan per watt. Ini menandai pertama kalinya suatu sistem mampu melampaui 5 gigaflops / watt (milyaran operasi per detik per watt). Perhatikan pada daftar itu, sistem tempat kedua adalah Suiren, ditenagai oleh akselerator inti-banyak PEZY-SC dan CPU Xeon; sedangkan sisanya dari 10 besar menggunakan GPU Nvidia Tesla, menunjukkan kisaran sistem tersebut.

Ada pilihan lain yang lebih tidak biasa. Micron menunjukkan chip Automata, pada dasarnya chip tujuan khusus yang dirancang untuk pencocokan pola, untuk digunakan dalam hal-hal seperti keamanan jaringan dan pencarian genomik. Ini sedang dikembangkan menjadi papan PCIe 3 dengan 32 chip dan dijadwalkan untuk diluncurkan pada kuartal pertama 2015, awalnya dalam volume rendah. (Perusahaan ini juga berada di belakang Hybrid Memory Cube-nya untuk memori generasi mendatang untuk sistem semacam itu.) IBM memiliki prosesor TrueNorth, yang diharapkannya menunjukkan jalan menuju lebih banyak "komputasi seperti otak". NEC bekerja pada generasi berikutnya dari prosesor vektor SX-ACE, yang dikatakan lebih mudah diprogram daripada GPU. Dan, tentu saja, ARM sedang mencoba masuk ke pasar server juga dengan Applied Micro's X-Gene1 digunakan sebagai prosesor yang menghubungkan ke berbagai kartu akselerator.

Sejumlah vendor menunjukkan sistem baru. Selain sistem Dell yang saya sebutkan sebelumnya, Lenovo menunjukkan sistem dual-prosesor berpendingin air yang berbasiskan prosesor Intel Xeon E5-2798A khusus (dengan 16 core berjalan hingga 3, 2 GHz), yang dikatakan mampu mengirimkan 1, 083 teraflop. Dan dikatakan bahwa prosesor Knights Landing Xeon Phi tahun depan akan mengaktifkan sistem "peta-cube" yang memberikan lebih dari satu petaflop hanya dalam dua rak standar 42U.

Server One Stop menunjukkan Akselerator Komputasi Kepadatan Tinggi, yang menggunakan PCIe Gen3 untuk mendukung hingga 16 papan akselerator kelas atas dari satu atau beberapa server, dengan perusahaan itu mengatakan ia menyediakan hingga 89, 6 teraflop menggunakan papan Tesla K80. Ini dapat bekerja dengan prosesor Power8 IBM. Huawei menunjukkan ketersediaan Server Data Center X6800-nya di AS dan versi server blade FusionServer 9000 yang didinginkan dengan cairan.

Untuk menghubungkan sistem bersama, Obsidian Technologies meluncurkan inisiatif InfiniCortex, yang dirancang untuk mengambil koneksi InfiniBand 100 Gigabit jarak jauh. Perusahaan mengumumkan dukungan dari Badan Sains, Teknologi, dan Penelitian Singapura (A * STAR). Dan Mellanox menunjukkan 100 Gigabit Infiniband bekerja lebih dari 100 meter melalui serat dan 8 meter melalui tembaga.

Untuk membuat superkomputer terbesar, organisasi biasanya beralih ke perusahaan seperti IBM dan Cray untuk menyatukan sistem, meskipun ini sering membutuhkan waktu bertahun-tahun untuk dibangun. Pengumuman terbesar Cray dari jenis itu di acara itu adalah sistem $ 80 juta yang dikenal sebagai Shaheen II di Universitas Sains dan Teknologi Raja Abdullah di Arab Saudi untuk Cray XC40, termasuk alat analisis grafik Urika-GD.

Dan, tentu saja, sesaat sebelum pertunjukan, DOE memberi IBM (dan vendor komponen Nvidia dan Mellanox) kontrak besar untuk apa yang akan menjadi dua superkomputer terbesar di negara itu, masing-masing dengan lebih dari 100 petaflops.

Catatan Editor: Posting ini diperbarui pada 11/26. Tianhe-2 memiliki kinerja puncak 54, 9 petaflops, bukan teraflops.

Peringkat komputer super sebagian besar tidak berubah, tetapi duduklah dengan erat