Rumah Berpikir ke depan KTT komputasi terbuka menunjukkan inovasi perangkat keras yang luar biasa

KTT komputasi terbuka menunjukkan inovasi perangkat keras yang luar biasa

Video: Kushagra Vaid of Microsoft - Reimagining Open Hardware Innovation at Cloud Speed (Oktober 2024)

Video: Kushagra Vaid of Microsoft - Reimagining Open Hardware Innovation at Cloud Speed (Oktober 2024)
Anonim

Mungkin tren yang paling menarik dalam perangkat keras komputer saat ini adalah Open Compute Project, dan upaya yang dilakukan untuk beralih ke standar yang umum dan efisien untuk peralatan pusat data, daripada perangkat keras dan lunak yang kami miliki saat ini. Ketika kami pertama kali mendengar tentang Open Compute, sepertinya cara yang baik bagi perusahaan Web berskala besar untuk merancang server yang lebih hemat energi dan lebih mudah dirawat. Namun sejak itu, Open Compute telah berkembang untuk mencakup banyak bentuk perangkat keras lainnya - dari penyimpanan hingga jaringan - dan menjadi berlaku untuk komputasi perusahaan, bukan hanya perusahaan perangkat lunak cloud.

Semua ini cukup jelas pada KTT Open Compute Project minggu lalu, di mana berbagai perusahaan memperkenalkan perangkat keras baru yang dirancang untuk bekerja dengan perangkat keras dan spesifikasi Open Compute, dari server ke jaringan.

"Pada tahun 2011 kami menanam beberapa benih, " kata Frank Frankovsky dari Facebook, yang mengetuai OCP Foundation, dalam membuka KTT. "Apa yang akan terjadi jika kita menerapkan prinsip-prinsip open source pada ruang perangkat keras? Pekerjaan yang kita lakukan bersama secara fundamental mengubah industri ini."

Chips dan Spesifikasi Baru Mendorong Server Berbasis ARM

Beberapa hal yang diumumkan selama seminggu menonjol. Sebagian besar server, di dunia nyata dan di Proyek Hitung Terbuka, didasarkan pada prosesor Xeon Intel dan arsitektur x86. Sementara itu tidak mungkin berubah dalam waktu dekat, pesaing seperti ARM dan AMD memiliki beberapa alternatif menarik.

AMD mengumumkan CPU server berbasis ARM 64-bit pertamanya, Seri Opteron A1100 28nm (nama kode Seattle), yang Andrew Feldman, manajer umum dan wakil presiden perusahaan, mengatakan akan mengambil sampel untuk pelanggan "dalam beberapa minggu, " meskipun diperkirakan tidak akan tersedia secara luas hingga mendekati akhir tahun. A1100 mencakup prosesor ARM Cortex-A57 4- atau 8-core, hingga 4MB L2 bersama dan 8MB cache L3 bersama, saluran memori DDR3 atau DDR4 ganda dengan ECC, ARM TrustZone untuk keamanan, dan co-prosesor untuk enkripsi dan data kompresi.

Feldman berbicara tentang Kit Pengembangan Seri A dengan prosesor A1100 dan mengatakan perusahaan telah bekerja sama dengan Linaro Enterprise Group dan vendor perangkat lunak untuk mengembangkan sistem operasi Linux yang kompatibel berdasarkan Red Hat's Fedora, tumpukan LAMP yang dioptimalkan, dukungan Java, dan lainnya. perangkat lunak termasuk aplikasi, hypervisor, kompiler, dan simulator. Feldman mengangkat desain server-mikro kecil, menggunakan AMD Opteron A-Series dan spesifikasi slot umum Open Compute Project untuk motherboard yang dikenal sebagai "Group Hug, " dan mengumumkan bahwa perusahaan berkontribusi untuk proyek sehingga perusahaan perangkat keras dapat mulai membangun server berdasarkan itu.

Sementara Feldman mengatakan bahwa AMD berkomitmen untuk x86 dan ARM, ia sangat menyarankan bahwa masa depan pusat data mengarah ke server berbasis ARM. "Dalam sejarah komputer, CPU yang lebih kecil, berbiaya lebih rendah, dan bervolume lebih tinggi selalu menang, " kata Feldman. "Tidak ada pengecualian untuk ini." Dia mencatat bahwa tahun lalu ada 8 miliar ARM CPU yang dikirim dibandingkan dengan 13 juta x86 CPU server. (Ini tampak seperti perbandingan konyol karena ini mencakup ARM CPU yang digunakan dalam semua jenis aplikasi non-pusat data tetapi tidak termasuk x86 yang digunakan dalam apa pun selain server.) Feldman memperkirakan bahwa pada 2019, ARM akan memerintahkan seperempat pasar server dan custom ARM SoCs akan menjadi norma untuk pusat data besar sementara CPU x86 yang lebih kecil dan lebih efisien akan mendominasi pasar server x86.

Juga di sisi chip, Applied Micro mengatakan X-Gene 2 akan mengambil sampel musim semi ini dengan apa yang dikatakan perusahaan akan menjadi implementasi ARMv8 pertama yang dirancang untuk server. Feldman juga mengatakan ini akan diikuti tahun depan oleh X-Gene 3 dengan 16 atau lebih core ARM yang dibuat pada prosesor FinFET.

Satu kekhawatiran yang dimiliki beberapa orang tentang server berbasis ARM adalah fragmentasi. Untuk mengatasi ini, Ian Drew, wakil presiden eksekutif pengembangan bisnis dan kepala pemasaran ARM, mengumumkan Arsitektur Sistem Basis Server yang baru. Idenya adalah untuk memiliki satu spesifikasi perangkat keras dasar untuk pengembang OS dan firmware dan satu gambar OS tunggal untuk semua server berbasis ARMv8-A. "Ini adalah spesifikasi perangkat keras yang ditulis oleh orang-orang perangkat keras dan perangkat lunak bersama-sama, " kata Drew. Dia mencatat bahwa ini bukan standarisasi di mana setiap orang akan menjadi monolitik tetapi sebaliknya dirancang sehingga diferensiasi terjadi pada lapisan yang tepat pada waktu yang tepat.

Drew mengatakan ARM ingin memastikan semua orang setuju, jadi itu tersedia untuk umum di situs web ARM. Ini memiliki dukungan dari OEM dan sejumlah mitra semikonduktor, termasuk AMD, Applied Micro, Broadcom, dan Cavium.

Microsoft Bergabung dengan OCP

Microsoft mengatakan akan bergabung dengan OCP dan menyumbang serangkaian spesifikasi lengkap untuk server yang mendukung Office 365, Windows Azure, dan Bing. Wakil Presiden Perusahaan Bill Laing mengatakan perusahaan ingin mendorong inovasi di pusat data cloud. Desain awal ini sangat berbeda dari rak 21-inci standar yang awalnya disumbangkan oleh Facebook yang telah mendefinisikan banyak server Open Compute hingga saat ini. Alih-alih itu adalah sasis 12U yang cocok di rak standar dengan blade komputasi, blade penyimpanan, backplane bersama, daya dan pendinginan bersama, dan simpul manajemen.

Laing mengatakan desain ini dapat dirakit sebelumnya dan memiliki integrasi di tempat minimum, karena baki lengkap dapat dilepas dan diganti. Dibandingkan dengan server perusahaan tradisional, ia mengatakan desain ini memberikan penghematan biaya hingga 40 persen, keuntungan efisiensi daya hingga 15 persen, dan peningkatan waktu penyebaran dan layanan sebesar 50 persen. Idenya adalah untuk memungkinkan pelanggan mendapatkan manfaat yang sama dan "mendorong komputasi awan seperti kami mengubah komputasi pusat data perusahaan."

Microsoft mengoperasikan lebih dari 200 layanan cloud secara global, melayani lebih dari 1 miliar pelanggan dan lebih dari 20 juta bisnis di lebih dari 90 pasar dan saat ini menyebarkan lebih dari 1 juta server di pusat data, kata Laing.

Buka Hitung Tambah Jaringan

Satu proyek baru adalah jaringan, yang secara resmi diluncurkan Mei lalu. "Agak aneh bahwa open source memiliki dampak positif yang luar biasa pada perangkat lunak dan server dan pusat data dan penyimpanan dan kami memiliki pulau-pulau dengan teknologi sumber terbuka yang dibuat dengan penuh kasih, tetapi apa yang menghubungkan pulau-pulau itu bersama-sama masih merupakan kotak hitam milik, " Kata Frankovsky. "Jadi kami memutuskan untuk membuka kotak hitam itu dan memberikan pelanggan fleksibilitas dan pilihan dalam jaringan dan transparansi mereka. Hal yang sama yang menarik orang untuk perangkat lunak open source adalah apa yang menarik kami untuk membuka perangkat keras sumber. Ini merupakan keingintahuan manusia yang alami tentang bagaimana caranya. pekerjaan ini dan bagaimana cara kerjanya secara berbeda jika saya memisahkannya dan menyatukannya kembali seperti yang saya inginkan untuk memasangnya kembali?"

Dalam beberapa bulan, katanya, OCP telah menerima kontribusi dari Broadcom, Intel, Mellanox, Big Switch, dan Cumulus Networks.

Sementara sejumlah perusahaan telah berbicara tentang sakelar rak non-eksklusif, saya tertarik melihat Dell mengumumkan kesepakatan dengan Cumulus Networks di mana perusahaan perangkat keras tersebut akan menjual kembali perangkat lunak jaringan berbasis Linux Cumulus di atas jaringan yang sesuai dengan OCP perangkat keras.

Berita perangkat keras menarik lainnya di acara tersebut termasuk pengumuman Seagate bahwa ia berkontribusi pada platform penyimpanan Kinetic untuk OCP, yang memungkinkan aplikasi untuk terhubung ke penyimpanan secara langsung melalui Ethernet daripada melalui server penyimpanan tradisional.

Optimasi Infrastruktur Full-Stack Facebook

Mengingat peran kunci dalam meluncurkan Open Compute, tidak mengherankan bahwa Facebook adalah salah satu pemimpin dalam mengadopsi sebagian besar teknologi. Jay Parikh, wakil presiden infrastruktur Facebook, memberikan presentasi tentang "mengapa semua hal yang dilakukan Facebook dengan infrastruktur benar-benar penting." Pada awalnya, tim infrastruktur Facebook hanya fokus pada menjaga hal-hal berjalan, kata Parikh. Tetapi karena terus tumbuh, tim dengan cepat mencapai batas perangkat keras dan perangkat lunak. Mereka mengalami beberapa "kegagalan spektakuler, " katanya, tetapi dalam proses itu belajar satu hal mendasar: Pada skala, semua masalah Anda diperbesar.

Sepanjang jalan mereka menciptakan desain server baru yang lebih hemat biaya dan hemat energi dan membuatnya lebih mudah untuk mengelola dan memperbaiki server. Hari ini Facebook memiliki pusat data khusus dengan rak khusus, server komputasi dan penyimpanan, serta jaringan.

"Seiring waktu kami terpaksa mengambil alih kendali setiap bagian tumpukan karena kami harus mengikuti pertumbuhan, " kata Parikh. Dia berbicara tentang konsep "optimisasi infrastruktur stack penuh, " termasuk perangkat lunak, jaringan, server, dan penyimpanan. Sekarang perusahaan hanya menggunakan perangkat keras Open Compute Project. "Kami sebenarnya menyimpan banyak uang, " katanya. Selama tiga tahun terakhir, optimasi tumpukan penuh telah menghemat Facebook lebih dari $ 1, 2 miliar.

Parikh kemudian memberikan pembaruan pada cold storage Facebook. Dia mengatakan bahwa fasilitas cold storage baru pertama perusahaan, dengan kapasitas 30 petabyte, telah beroperasi dan yang kedua akan segera online, sehingga total kapasitas penyimpanan menjadi "lebih dari 100 petabytes" dalam beberapa bulan ke depan. Setiap fasilitas dirancang untuk menyimpan maksimal tiga exabytes sehingga ada banyak ruang untuk pertumbuhan.

Untuk pertama kalinya Parikh menunjukkan prototipe server penyimpanan Facebook menggunakan cakram Blu-ray (sebuah ide yang dibicarakan perusahaan pada KTT tahun lalu). Server kabinet menyimpan 10.000 cakram Blu-ray dengan total penyimpanan 1 petabyte, dan Facebook berencana untuk akhirnya meningkatkan kepadatan hingga 5 petabyte per rak. Dibandingkan dengan sistem cold storage berbasis hard drive saat ini, server Blu-ray dapat memangkas biaya menjadi dua dan mengurangi penggunaan energi hingga 80 persen, kata Parikh. Facebook berencana untuk menguji sistem produksi akhir tahun ini dan akan menggunakan server Blu-ray untuk penyimpanan foto dan video pengguna yang jarang diakses.

Buka Hitung dan Perusahaan Kecil

Salah satu hal yang paling menggelitik saya dari KTT ini adalah indikasi bahwa bukan hanya perusahaan skala cloud seperti Facebook, Rackspace, dan Microsoft yang merangkul konsep ini. Sebaliknya, Frankovsky menunjuk pelanggan perusahaan besar seperti Bloomberg, Fidelity, dan Goldman Sachs sebagai dalam proses penggelaran Open Compute.

Sangat menarik bahwa sekarang ada lebih banyak cara menggunakan komponen rak 19 inci standar dengan wadah Rak Terbuka 21 inci, dan sebaliknya. Misalnya, Frankovsky menunjukkan bahwa Fidelity datang dengan Open Bridge Rack ke rak EIA standar ke Open Rack. Hyve Solutions mengambil beberapa papan sistem Open Compute dan mengemasnya kembali ke baki standar 19 inci, dan menyumbangkan desain kembali ke yayasan.

Dalam diskusi panel, Marc Andreessen, co-founder dan mitra umum di Andreessen Horowitz, dan Andy Bechtolsheim, pendiri, chief development officer, dan ketua Arista Networks, berbicara tentang bagaimana tren menuju pusat data yang lebih murah mengubah bisnis.

Andreessen mengatakan sekarang ada peluang radikal untuk menggabungkan perangkat lunak sumber terbuka dan perangkat keras sumber terbuka pada volume tinggi untuk secara signifikan mengurangi biaya sistem dan memberikan layanan berbasis cloud di berbagai bidang seperti perawatan kesehatan dan pendidikan. Perusahaan-perusahaan baru dapat berjalan hampir seluruhnya di cloud, jadi sebagai konsekuensinya, $ 500.000 sekarang membeli sebuah landasan pacu selama dua tahun untuk meluncurkan suatu produk. Sementara Facebook (Andreessen ada di papan) sekarang memiliki anggaran modal besar sekarang, katanya, jika sudah ada pada tahun 1999, itu akan membutuhkan anggaran modal 50 hingga 100 kali lebih besar dari sekarang, mungkin menghabiskan $ 100 miliar per tahun untuk modal peralatan, yang tidak mungkin. Pengembangan perangkat keras berbiaya lebih rendah dan bervolume lebih tinggi memungkinkan layanan seperti Facebook atau Google. Jika Anda memproyeksikan ke depan 10 tahun lagi, katanya, layanan yang akan mungkin akan berubah pikiran.

"Semua pertumbuhan berada di awan, " kata Bechtolsheim, dengan belanja TI tradisional datar atau menurun. Arista Networks sedang mengembangkan peralatan jaringan yang memenuhi kebutuhan pusat data berskala cloud ini. Dia mengatakan itu masuk akal untuk membakukan perangkat keras jaringan. Sampai Proyek Open Compute datang, Bechtolsheim mengatakan, industri tidak pernah memiliki forum untuk inovasi perangkat keras terbuka, kolaboratif. Sekarang meskipun masih ada beberapa perusahaan membuat chip mereka sendiri, dan dia percaya itu adalah model warisan. Hal tentang jaringan adalah bahwa Anda memerlukan tumpukan perangkat lunak yang benar-benar berfungsi. Perangkat keras itu mudah, perangkat lunak itu sulit, katanya, itulah sebabnya Arista memiliki tim perangkat lunak yang jauh lebih besar.

Bechtolsheim mengatakan kedatangan komputasi 64-bit dan ARM SoCs dengan frekuensi yang lebih tinggi (setidaknya 2GHz) adalah apa yang akan membuat ARM layak di pusat data. Ini kemungkinan terjadi ketika itu masuk akal, katanya. Dia juga mengatakan "dalam pertahanan Intel" telah melakukan pekerjaan yang luar biasa memanfaatkan teknologi prosesnya untuk menghasilkan prosesor yang lebih hemat energi dan lebih murah. Intel adalah pesaing yang tangguh di sini dan Anda membutuhkan kompetisi untuk terus berinovasi, katanya. Pada tingkat kemajuan saat ini, pusat data yang menelan biaya $ 1 miliar saat ini hanya akan menelan biaya $ 10.000 dalam satu dekade. Itu akan memungkinkan aplikasi generasi berikutnya.

Untuk membantu menjadikan produk Open Compute diterima secara lebih luas, Frankovsky mengumumkan jenis lisensi teknologi yang berbeda seperti GPL sehingga setiap karya turunan akan diberikan kembali ke yayasan, serta sertifikasi perangkat keras Open Compute menggunakan laboratorium baru di Taiwan dan di Universitas Texas di San Antonio.

KTT komputasi terbuka menunjukkan inovasi perangkat keras yang luar biasa