Rumah Ulasan Bagaimana bisnis dapat memahami pasar data besar

Bagaimana bisnis dapat memahami pasar data besar

Video: BAGAIMANA BISNIS ANDA BISA BESAR? - COACH HENDRA HILMAN (Oktober 2024)

Video: BAGAIMANA BISNIS ANDA BISA BESAR? - COACH HENDRA HILMAN (Oktober 2024)
Anonim

Bisnis tidak mendapatkan poin untuk seberapa efisien infrastruktur mereka berjalan atau seberapa tinggi mereka dapat menumpuk semua Data Besar yang mereka kumpulkan. Yang penting adalah kualitas analitik dan kecerdasan yang dihasilkan data.

Selama beberapa tahun terakhir, Hadoop adalah kata yang paling identik dengan menelan, memproses, dan mengubah data. Kerangka kerja open-source untuk penyimpanan dan pemrosesan data terdistribusi ini telah melahirkan ruang perusahaan sendiri dan mengintegrasikan jalannya ke semua platform cloud utama. Hadoop jauh dari satu-satunya teknologi Big Data yang layak dibicarakan, tetapi itu menjadi satu di mana banyak lainnya dibangun.

Masalah untuk bisnis adalah ruang Hadoop penuh dengan opsi distribusi dan perkakas, dan seperti yang dijelaskan oleh Direktur Riset Gartner, Nick Heudecker, banyak dari mereka terlihat sama. Heudecker, yang penelitiannya mencakup manajemen informasi termasuk Big Data dan ruang NoSQL, mengatakan jika Anda melihat opsi pemrosesan data umum, banyak vendor menawarkan fitur yang sangat mirip.

Menghancurkan Pasar

Ada tiga start-up Hadoop murni murni - Cloudera, Hortonworks, dan MapR - dan mereka semua tumbuh dengan mantap pada tahun 2015. Menurut Gartner, masing-masing memiliki sekitar 700 pelanggan, memberi atau menerima 10 persen, menempatkan pasar global di antara 2.100-2.400 pelanggan Hadoop di seluruh dunia. Ketiga menawarkan tier gratis dan tier perusahaan dari distribusi Hadoop mereka, dan masing-masing memberikan kontribusi open-source yang signifikan untuk proyek-proyek di bawah spanduk Apache Software Foundation (ASF).

"Data kami menunjukkan bahwa 44 persen penggunaan Hadoop saat ini tidak dibayar, " kata Heudecker. "Apakah ada pemimpin yang jelas? Saya kira tidak. Mereka semua merebut pangsa pasar karena ini adalah ruang yang sangat baru."

Dalam beberapa bulan terakhir, sebagian besar persaingan antara ketiganya adalah kompetisi atas kemampuan analitik data dan cara-cara kreatif untuk mengintegrasikan Apache Spark, sebuah mesin pengolah data Big-source terbuka dengan kasus-kasus penggunaan dari aliran data real-time ke pembelajaran mesin.. MapR baru-baru ini mengumumkan MapR Streams sebagai bagian dari "platform data terkonvergensi" yang mengintegrasikan Hadoop, pemrosesan aliran berbasis Spark, dan analitik. Hortonworks meluncurkan pembaruan ke Platform Data Hortonworks (HDP) dengan analitik Spark dalam memori, dan Cloudera menawarkan berbagai integrasi sumber terbuka Spark melalui One Platform Initiative, bersama dengan menawarkan kelas pelatihan Spark.

"Ada banyak hal yang terjadi dalam manajemen informasi dan ruang infrastruktur informasi, dan itu tidak semua Hadoop, " Heudecker menjelaskan. "Ada momentum luar biasa di balik model pemrosesan data kecepatan dan memori-sentris Spark, meskipun pengembangan Spark masih dalam tahap awal. Spark akan menjadi lingua franca lain dalam pemrosesan data, seperti SQL saat ini, dan jelas menunjukkan tanda-tanda bahwa ia memiliki beberapa kaki karena semakin banyak perusahaan berinvestasi di dalamnya."

Heudecker juga menyoroti pentingnya pemain cloud dalam Big Data; raksasa teknologi yang telah mengintegrasikan Hadoop dan teknologi Big Data lainnya ke dalam penawaran Infrastruktur sebagai Layanan (IaaS) yang ada.

Amazon Web Services (AWS) menggunakan layanan Amazon Elastic MapReduce (EMR) untuk orkestrasi Hadoop berbasis cloud. Microsoft menawarkan sejumlah besar layanan Big Data dalam platform cloud Azure-nya, bermitra dengan Hortonworks pada layanan HDInsight untuk mengelola Apache Hadoop, Spark, HBase, dan Storm, bersama dengan Azure Data Lake dan Azure Data Analytics berbasis SQL. IBM memiliki tawaran IBM Open Platform di-tempat untuk Hadoop dan IBM BigInsights, sebuah paket analisis untuk dijalankan di atasnya, bersama dengan layanan Hadoop dan Apache Spark-as-a-service di cloud Bluemix. Daftar berjalan, dan bisnis menemukan kasus penggunaan yang lebih berlaku di cloud.

"Kami memperkirakan bahwa AWS sendiri memiliki sekitar 5.000 pelanggan, jadi itu lebih dari dua kali basis pelanggan dari drama murni, " kata Heudecker. "Salah satu keuntungan dari pindah ke cloud adalah Anda mendapatkan ekosistem. Anda bisa mendapatkan distribusi Hadoop murni pada setiap tawaran IaaS. MapR tersedia di semua cloud yang dapat Anda pikirkan, selain dari IBM; sama untuk Cloudera dan Hortonworks. Kami belum melihat ketersediaan cloud menjadi terlalu banyak faktor ketika memilih antara satu vendor dan lainnya."

Memilih Strategi Data Perusahaan

Untuk bisnis kecil hingga menengah (UKM) dan bisnis perusahaan yang sedang berkembang, ketika berinvestasi dalam pengolahan data dan solusi analitik, Heudecker mengatakan faktor penentu adalah platform mana yang dapat memberikan tingkat layanan tertinggi. Tantangan terbesar bagi bisnis, menurut Gartner, adalah kesenjangan keterampilan - mencari tahu siapa yang akan mengelola platform begitu terinstal dan digunakan.

"Jika perusahaan mencari mitra platform data, siapa yang akan membantu mereka dengan konsumsi data? Siapa yang akan membantu mereka membangun aplikasi analitik? Sejauh tiga Hadoop murni, kriteria evaluasi cenderung berada di sekitar kematangan alat manajemen dan konsol, alat tata kelola data, dan kinerja."

Aspek menarik lainnya dari memilih platform Hadoop adalah kurangnya loyalitas. Perusahaan mengevaluasi ulang platform Hadoop mereka sesering setiap 6-12 bulan untuk melihat apakah komponen pemrosesan data masih pas, karena seberapa cepat ruang berubah dan betapa sedikit pemain besar telah membedakan diri. Heudecker mengatakan 20 persen dari perusahaan yang dia ajak bicara memiliki beberapa distribusi Hadoop yang berjalan di pusat data atau cloud mereka, baik membiarkan tim yang berbeda memilih platform pilihan mereka atau melakukan diversifikasi dengan sengaja untuk menghindari terjebak hanya dengan satu distribusi Hadoop.

Portofolio platform yang terdiversifikasi semacam ini dimasukkan ke dalam apa yang oleh Frank Buytendijk, seorang Wakil Presiden Riset Gartner dan Analis Terhormat yang berfokus pada strategi digital, menyebut "informasi sebagai aset." Seperti Anda tidak dapat menjalankan bisnis tanpa modal, tenaga kerja, bahan, dan fasilitas fisik atau virtual, Buytendijk mengatakan Anda tidak dapat menjalankan bisnis tanpa informasi.

"Kami dulu melihat bisnis dalam tiga aliran: aliran primer adalah barang, aliran sekunder adalah uang, dan aliran tersier adalah informasi untuk memastikan barang dan uang disejajarkan. Sekarang di sebagian besar bisnis, sebaliknya Aliran utama adalah informasi, mulai dari identifikasi dan konfigurasi hingga pemasaran konten, dll. Apakah Anda menyebutnya Big Data atau tidak, tidak masalah."

"Data Besar" Sudah Kedaluwarsa

Buytendjik mengatakan dia tidak melihat Big Data sebagai teknologi terpisah untuk bisnis, tetapi sebagai satu tema atau pola pikir dalam keseluruhan strategi digital Anda.

"Saya tidak percaya memiliki strategi Big Data, " kata Buytendjik. "Hampir tidak ada strategi bisnis lagi tanpa komponen digital, jadi saya percaya memiliki strategi digital di mana semua jenis teknologi memberikan kemampuan kritis. Ini termasuk ponsel, sosial, cloud, IoT, mesin pintar, dan Big Data."

Heudecker percaya kita akan mulai berbicara tentang "Big Data" semakin sedikit, karena sekarang ini hanya data. Begitulah cara bisnis dilakukan. Volume besar dan kecepatan tinggi data tidak lagi menakutkan.

"Big Data menjadi digolongkan sekali lagi oleh informasi dan analitik, " kata Heudecker. "Kategori Big Data sejujurnya tidak membedakan. Kami selalu ditanyai ukuran pasar Big Data, tetapi apa artinya itu? Big Data bukan benar-benar pasar, itu konsep. Untuk bisnis, memikirkan Big Data sebagai sesuatu yang unik dan istimewa yang sangat berbeda dari apa yang Anda lakukan sebelumnya adalah kesalahan. Pada titik ini, data hanya normal."

Bagaimana bisnis dapat memahami pasar data besar