Video: Mannheim Steamroller Joy To The World (Desember 2024)
Sementara vendor chip umumnya tidak memperkenalkan chip baru di Konferensi Sirkuit Solid State International (ISSCC) tahunan, mereka sering memberikan rincian lebih lanjut tentang cara kerja produk yang sudah diumumkan. Berikut adalah beberapa hal yang menurut saya menarik di pertunjukan minggu ini.
Arsitektur Server Ivytown Intel
Intel membahas versi terbaru dari keluarga prosesor Xeon E7, sebuah chip dengan hingga 15 core dan 30 thread, yang dikenal sebagai Ivytown. Ini didasarkan pada arsitektur Ivy Bridge EP yang digunakan dalam Xeon E5 2600 V2. Prosesor ini dibangun menggunakan teknologi proses 22nm dari Intel dengan transistor Tri-Gate (siripnya setinggi 34nm dan lebar 8nm) dan akan menggantikan Xeon E7 yang berbasis Westmere EX saat ini. Sebagai perbandingan, Xeon E7 saat ini, yang diproduksi pada prosesor HKMG planar 32nm, memiliki 10 core dan 20 thread, dan memiliki 30MB L3 cache dibandingkan dengan 37, 5MB dalam versi Ivytown.
Salah satu fitur yang lebih menarik dari keluarga prosesor baru ini adalah arsitektur modularnya. Denah lantai terdiri dari tiga kolom dengan lima inti, masing-masing dengan irisan L3 cache sendiri, bus cincin tertanam, dan IO khusus di bagian atas dan bawah kolom (tautan QPI di bagian atas dan pengontrol memori di bagian bawah). Intel berencana untuk membuat versi 10-inti dengan menghapus kolom kanan; dan untuk membuat versi 6-inti dengan menghapus dua baris lebih lanjut.
Versi 15-core memiliki 4, 31 miliar transistor - yang dikatakan Intel adalah yang paling banyak untuk mikroprosesor mana pun - dan berukuran 541 milimeter persegi. Versi 10-core memiliki 2, 89 miliar transistor dan berukuran 341 milimeter persegi. Varian 6-inti memiliki 1, 86 miliar transistor dan ukuran 257 milimeter persegi. Frekuensi operasi berkisar dari 1, 4GHz hingga 3, 8GHz dengan TDP mulai dari 40W hingga 150W.
Aspek menarik lain dari Ivytown adalah arsitektur buffer memori. Die yang sama mendukung memori DDR3 empat saluran standar yang berjalan hingga 1867MT / dtk dan antarmuka empat-mode baru Voltage-Mode Single-ended (VMSE) ke buffer ekstensi memori yang berjalan pada 2667 MT / dtk. Secara keseluruhan ia dapat mendukung hingga 12TB memori di server 8-socket - tiga kali kapasitas memori Westmere EX. Versi 15-inti akan tersedia dalam dua paket berbeda: satu yang kompatibel dengan platform Romley yang ada (Socket-R) untuk peningkatan yang mudah dan yang lain memungkinkan platform baru menggunakan buffer memori.
Lebih Banyak Rincian Haswell
Intel juga memberikan sejumlah detail pada arsitektur Haswell, yang digunakan dalam keluarga Core saat ini. Ini juga menggunakan transistor Tri-Gate 22nm. Intel mengatakan Haswell mengintegrasikan beberapa teknologi baru, termasuk regulator tegangan terintegrasi penuh atau FIVR (mengkonsolidasikan platform dari lima regulator tegangan ke satu), cache DRAM tertanam untuk kinerja grafis yang lebih baik, keadaan daya lebih rendah, IO yang dioptimalkan, instruksi AVX2, dan unit integer SIMD yang lebih luas.
Ada tiga variasi dasar Haswell: Pertama, ada quad-core yang berkomunikasi dengan PCH (Platform Controller Hub) terpisah dengan grafik yang lebih cepat (dua hingga empat inti). Kedua, ada platform ultrabook yang menggabungkan Haswell dual-core dengan PCH dalam satu paket multi-chip. Prosesor mendukung kondisi daya yang lebih rendah, PCH dimodifikasi untuk daya yang lebih rendah, dan keduanya berkomunikasi melalui bus berdaya rendah, yang semuanya mengurangi daya siaga hingga 95 persen. Akhirnya ada versi dengan grafis Iris Pro dan 128MB eDRAM cache dalam paket yang sama. Paket multi-chip menggunakan IO pada paket yang menyediakan bandwidth tinggi dengan daya rendah antara CPU dan PCH dan eDRAM.
Tergantung pada jumlah inti CPU dan grafik (GT2 atau GT3), Haswell memiliki 960 juta hingga 1, 7 miliar transistor dan ukuran die 130 hingga 260 milimeter persegi. Ini dirancang untuk beroperasi pada 0, 7 hingga 1, 1 volt dengan rentang frekuensi lebar 1, 1 hingga 3, 8 GHz.
EDRAM 128GB die berukuran 77 milimeter persegi, dan menyediakan bandwidth puncak 102GBps. Intel mengatakan bahwa dibandingkan dengan sistem yang sama tanpa eDRAM, cache tambahan memberikan keuntungan kinerja hingga 75 persen, meskipun kinerja keseluruhan meningkat 30 hingga 40 persen.
AMD Steamroller Powers Kaveri
AMD, yang cenderung menempatkan lebih banyak grafik pada apa yang disebutnya sebagai unit pemrosesan dipercepat (APU, atau prosesor yang menggabungkan CPU dan grafik) yang berfokus pada inti CPU baru, yang dikenal sebagai Steamroller, yang digunakan dalam serangkaian prosesor baru perusahaan Kaveri. Inti Steamroller, diproduksi dalam proses CMOS massal 28nm, memiliki 236 juta transistor di area seluas 29, 47 milimeter persegi. Ini termasuk dua core integer, dua unit decode instruksi, dan beberapa elemen bersama, termasuk pengambilan instruksi, unit floating-point, dan 2MB cache L2. AMD biasanya menggunakan salah satu modul Steamroller ini dalam chip "dual-core" (mencerminkan 2 core integer); dan dua chip "quad-core".
Dibandingkan dengan core Piledriver sebelumnya, yang diproduksi pada proses SOI 32nm, Steamroller menambahkan unit decode instruksi kedua, cache instruksi bersama 96KB yang lebih besar, dan perangkat tambahan lainnya. AMD mengatakan ini menyebabkan hingga 14, 5 persen lebih banyak instruksi per siklus, yang menghasilkan kinerja 9 persen lebih baik pada aplikasi single-threaded dan kinerja 18 persen lebih baik pada aplikasi dual-threaded. Itu juga dapat berjalan pada frekuensi 500MHz lebih besar pada daya yang sama, atau memberikan kinerja yang hampir sama dengan pengurangan daya 38 persen. Inti Steamroller dirancang untuk beroperasi pada kisaran 0, 7 hingga 1, 45 volt.
Prosesor Seluler dari MediaTek, Renesas, dan Qualcomm
Sejumlah perusahaan memberikan presentasi tentang prosesor berbasis ARM mereka.
MediaTek berbicara tentang prosesor multi-core heterogen (HMP) 28nm heterogen dengan CPU quad-core dan GPU ganda. Chip MediaTek memiliki dua core Cortex A15, berjalan pada 1.8GHz, dan dua core Cortex A7, berjalan pada 1.4GHz, dikombinasikan dengan Imagination G6200 400MHz dual-core GPU. Ini juga memiliki codec video perangkat keras HD penuh dan prosesor sensor gambar 13 megapiksel.
MediaTek juga berbicara tentang teknologi PTP (Performance, Thermal, dan Power) yang memantau chip dan mengontrol daya. Dalam hal ini, perusahaan mengatakan PTP memungkinkan peningkatan kecepatan clock 23 persen atau penghematan daya hingga 41 persen.
Chip ini menggunakan pemrosesan HMP ARM yang sebenarnya, yang berarti bahwa kombinasi inti besar dan kecil dari satu hingga empat dapat berjalan tergantung pada beban kerja. MediaTek mengatakan bahwa dengan menggunakan HMP sejati, chip dapat memberikan kinerja 33-51 persen lebih baik pada beban kerja yang berat atau 2-5x efisiensi energi yang lebih baik pada beban kerja ringan, sementara manajemen termal adaptif memberikan peningkatan kinerja 10 persen lainnya.
Renesas menghadirkan prosesor heterogen delapan inti HPM 28nm "yang diusulkan" yang dirancang untuk perangkat seluler dan sistem infotainmen mobil. Chip ini menggunakan empat core Cortex A15 2GHz dan empat core Cortex A7 1GHz. Ini mampu mengoperasikan semua 8 core secara bersamaan untuk kinerja tertinggi, tetapi juga menggunakan arsitektur heterogen dan teknik manajemen daya untuk mengoptimalkan kinerja untuk beban kerja atau amplop daya tertentu.
Qualcomm menggambarkan prosesor sinyal digital Hexagon, yang digunakan dalam SoC mobile untuk berbagai aplikasi multimedia dan modem. Versi saat ini diproduksi dalam proses CMOS massal HKMG 28mm. Desain ini menargetkan instruksi tinggi per jam dibandingkan dengan frekuensi operasi yang tinggi.
Di sisi server ARM, Applied Micro berbicara tentang prosesor ARMv8 64-bit generasi pertama perusahaan, pertama kali diumumkan pada KTT Open Compute baru-baru ini. Ini didasarkan pada modul prosesor "Potenza" (PMD), yang mencakup dua core berbagi 256KB cache L2. Potenza dibuat dalam CMOS massal 40nm dan setiap PMD mengandung 84 juta transistor dan menggunakan 14, 8 milimeter persegi area cetakan. Ini dapat beroperasi hingga 3GHz pada 0, 9 volt, tetapi rata-rata 4, 5W di bawah beban kerja yang khas. Platform server X-Gene 3 mencakup empat PMD (delapan core), cache L3 8MB bersama, dan empat kanal memori DRAM di sekitar sakelar pusat. Ini juga mengintegrasikan 10GB Ethernet, SATA 2/3, PCIe Gen. 3, dan USB 3.0.
Generasi Selanjutnya dari Teknologi Proses Chip
Ada juga beberapa presentasi tentang generasi berikutnya dari teknologi proses chip, karena hampir semua pembuat chip utama memiliki rencana untuk pindah ke produksi 3D atau FinFET, pada simpul 14 atau 16nm (mengikuti Intel, yang sudah mengirimkan chip 22nm dengan teknologi seperti itu).
Samsung berbicara tentang proses FinFET 14nm yang akan datang, menunjukkan 128Mb 6T SRAM array dan chip uji. Samsung mengatakan bahwa FinFET adalah solusi yang baik untuk SoC seluler berdaya rendah karena mereka memberikan penskalaan yang baik, kebocoran tinggi saat ini dan rendah, dan memiliki kontrol saluran pendek yang baik.
Ini juga menimbulkan beberapa tantangan bagi SRAM, karena tegangan suplai SRAM belum mengalami penskalaan. SRAM sekarang memakan 20-30 persen area die dari SoC, tetapi menggunakan sekitar 40-50 persen daya. Untuk mengatasi masalah ini, Samsung mengusulkan beberapa teknik baru untuk mengoperasikan SRAM menggunakan transistor FinFET pada tegangan pasokan yang lebih rendah.
TSMC membahas masalah serupa, memamerkan chip SRAM 16nm 128Mb. TSMC mengatakan FinFET telah menjadi teknologi utama untuk produksi di luar 20 nm, tetapi mengatakan ukuran lebar dan panjang saluran dengan FinFET adalah tantangan untuk penskalaan 6T-SRAM konvensional dan tegangan suplai. TSMC mengusulkan dua teknik bantu tulis untuk mengatasi masalah ini.
Ini adalah masalah yang cukup teknis, tetapi menyelesaikan masalah sangat penting jika kita ingin mendapatkan chip yang lebih padat dan lebih hemat daya di masa depan.