Video: Pemodelan struktur 3D, Optimasi geometri dan perhitungan energi dengan Gaussian (Desember 2024)
Banyak diskusi prosesor yang menarik akhir-akhir ini berkisar menggunakan berbagai jenis chip dan core, yang bertentangan dengan core komputasi tujuan umum yang umum di CPU konvensional. Kami telah melihat berbagai macam kombinasi chip yang digunakan untuk tugas komputasi tertentu, termasuk CPU, GPU, DSP, ASICS khusus, dan field-diprogram gate array (FPGs), dan semakin banyak kita melihat aplikasi yang menggabungkan aspek-aspek dari semua ini, kadang-kadang dalam suatu sistem dan kadang-kadang dalam satu chip.
Bahkan Intel - yang lama menjadi pendukung core komputasi tujuan umum yang berlipat ganda dalam kecepatan setiap dua tahun - telah terlibat dengan pembelian Altera, salah satu produsen FPGA terkemuka. Baru-baru ini, saya mendapat kesempatan untuk berbicara dengan Dan McNamara, general manager dari Programmeable Solutions Group (PSG) Intel - yang dulu dikenal sebagai Altera - yang memberi penerangan tentang rencana Intel di bidang ini dan memberikan rincian lebih lanjut tentang rencana perusahaan untuk menghubungkan berbagai jenis core dan berbeda mati bersama dalam paket chip berkecepatan tinggi.
"Dunia menjadi heterogen, " kata McNamara, mencatat bahwa sekarang ada kesadaran umum bahwa Anda tidak dapat menyelesaikan semua masalah dengan inti penggunaan umum. Custom ASICs - seperti Tensor Processing Unit atau TPU Google dapat mempercepat jenis fungsi tertentu jauh melampaui CPUS atau GPU tradisional, tetapi ini membutuhkan waktu lama untuk dibuat. Sebaliknya, katanya, FPGA memungkinkan untuk kode yang dapat disesuaikan yang memberikan banyak manfaat kinerja ASIC tanpa menunggu dua tahun untuk desain dan manufaktur chip. Pengembang dapat mengubah algoritme dalam FPGA dengan segera, sementara CPU, GPU, atau chip khusus berfungsi dengan benar.
McNamara juga mengatakan FPGA sangat laten rendah dan bisa sangat paralel, dengan berbagai bagian chip yang bekerja secara bersamaan pada aplikasi seperti pemrosesan gambar atau komunikasi.
Intel sekarang mengirimkan Arria 10 FPGA, diproduksi dengan proses 20nm TSMC, dan menawarkan paket yang menggabungkan prosesor Xeon (Broadwell) dan Arria 10. Ini digunakan dalam aplikasi seperti pencarian skala web dan analitik. McNamara mengatakan FPGA dapat mempercepat pencarian hingga 10 kali dan mencatat bahwa Microsoft telah menjadi publik tentang penggunaan FPGA tersebut untuk mempercepat pencarian.
Salah satu bidang besar peningkatan akhir-akhir ini adalah menciptakan paket multi-chip yang lebih cepat yang dapat menggabungkan chip yang dibuat pada proses yang berbeda dan mungkin dari pembuat yang berbeda. Ini termasuk paket yang berisi CPU dan FPGA, seperti kombinasi Xeon / Arria; sebuah FPGA dengan transceiver yang berbeda, seperti pada Intel Stratix 10 FPGA; atau bahkan bagian yang berbeda dari CPU penuh, seperti yang dijelaskan Intel dalam teknologi dan hari manufaktur terbarunya.
Intel telah menciptakan teknologi baru yang disebut jembatan multi-chip interkoneksi tertanam (EMIB) untuk melakukan ini, yang memulai debutnya di Stratix 10. Dalam EMIB, inti mati dibuat pada proses 14nm Intel dan transceiver pada proses 16nm TSMC.
Secara keseluruhan, McNamara mengatakan bahwa beberapa area bergerak ke arah mengadopsi lebih banyak FPGA menggunakan kemasan tersebut. Dia berbicara tentang situs web skala-besar, yang melihat permintaan berubah dengan cepat dan di mana kombinasi FPGA / CPU dapat bekerja dengan baik di bidang-bidang seperti pencarian, analisis, dan streaming video, serta transformasi jaringan, di mana tren seperti jaringan yang ditentukan oleh perangkat lunak dan fungsi-fungsi jaringan virtualisasi mendorong kebutuhan untuk pemrosesan paket yang lebih banyak. Area fokus lainnya termasuk aplikasi 5G dan nirkabel, mengemudi otonom, dan aplikasi kecerdasan buatan (AI). Di AI, McNamara mengatakan ASIC yang dioptimalkan dan daya komputer yang mentah mungkin yang terbaik untuk pelatihan (Intel telah membeli Nervana), tetapi mengatakan FPGA sering paling baik dalam kesimpulan, karena fleksibilitas dan latensi rendahnya, dan mencatat bahwa ZTE menggunakan Arria 10 untuk menunjukkan skor pengenalan gambar yang sangat mengesankan.
Secara pribadi, saya ingin tahu apakah CPU di masa depan benar-benar akan mengambil komponen yang berbeda dan mencampur dan mencocokkannya menggunakan EMIB atau teknologi serupa untuk mengubah apa yang kita pikirkan sebagai chip prosesor. Saya tertarik dengan gagasan bahwa sistem masa depan dapat menggunakan banyak inti yang berbeda - beberapa dapat diprogram (FPGA) dan beberapa tetap (campuran ASIC khusus dan CPU tradisional dan GPU) untuk melakukan hal-hal bersama yang meningkatkan apa yang ada di satu teknologi dapat melakukannya sendiri.