Rumah Pendapat Data besar hanyalah penipuan besar | john c. dvorak

Data besar hanyalah penipuan besar | john c. dvorak

Video: Dimana dan Bagaimanakah Seluruh data Internet Dunia Disimpan? (Oktober 2024)

Video: Dimana dan Bagaimanakah Seluruh data Internet Dunia Disimpan? (Oktober 2024)
Anonim

Meme "big data" yang baru muncul belum pernah didefinisikan dengan cara yang bermakna dan pasti. Ini istilah buzz baru yang paling tidak berbentuk yang pernah saya lihat selama satu dekade. Itu adalah salah satu istilah "mata yang melihat" yang digunakan untuk menghidupkan seminar dan akhirnya merendam investor.

Mari kita mulai dengan menanyakan apa arti big data? Banyak data? Lebih banyak data daripada yang bisa Anda tangani? Data tidak berbentuk? Data di luar kendali? Data yang berguna untuk analisis? Data tidak berguna? Informasi terlalu banyak?

Jika Anda cukup membaca tentang data besar, itu semua di atas dan banyak lagi. Kuncinya bukanlah data, tetapi tantangan bagaimana menangani data dan apa yang harus dilakukan dengan data itu sendiri.

Dengan kata lain, bagaimana kita bisa membuat tumpukan data yang sangat besar ini, yang telah berhasil kita kumpulkan, berguna dengan cara-cara baru dan menguntungkan? Kumpulan data dapat datang dari mana saja melalui berbagai mekanisme komputasi seperti posting Facebook, log NSA, milis, pelanggan, dll.

Saya berpendapat bahwa sebagian besar pembaca kolom ini adalah repositori data besar. Saya baru saja membeli drive 3 Terabyte untuk cadangan. Saya punya banyak data untuk dicadangkan! Data besar!

Alat yang berguna yang dapat saya bayangkan akan menjadi alat analisis data besar yang dapat digunakan polisi untuk mendapati Anda bersalah atas beberapa kejahatan acak dengan memeriksa file Anda. Atau setidaknya menemukan sesuatu yang akan membuat Anda malu. Data besar!

Ini semua mengingatkan kembali pada komentar yang dibuat oleh mantan CEO American Express, yang mengatakan kepada audiensi bahwa jika perusahaan ingin (dan ini berlaku untuk semua perusahaan kartu kredit) itu dapat menggunakan kebiasaan pembelian pribadi Anda dan kecenderungan untuk mengumpulkan secara lengkap dokumen dan jelas tahu apakah Anda berselingkuh atau tidak. Data besar!

Dari apa yang bisa saya katakan, inilah yang data terbaik melakukan yang terbaik, memata-matai individu.

Komentar populer oleh industri adalah entah bagaimana database besar yang berisi informasi tentang Anda akan digunakan untuk keuntungan Anda. Ya, Anda tahu, jadi Anda akan mendapatkan untuk hal-hal yang Anda benar-benar tertarik. Periklanan bertarget. Ini menguntungkan semua orang!

Inilah cara kerjanya. Saya tertarik membeli kamera baru dan mendengar tentang Bogus One yang baru. Saya membaca sebuah artikel di PCMag.com tentang kamera, kemudian saya pergi ke Amazon dan memeriksa harga dan ulasan pengguna. Tampaknya tidak ada yang menyukai kamera. Itu omong kosong yang jelas. Para pengulas semua menghindari kamera. Pembeli membenci kamera. Ini bukan kamera yang saya inginkan. Tetapi perangkat lunak analisis data besar memutuskan untuk memberi saya ratusan iklan, pada setiap halaman web yang saya kunjungi, semua menunjukkan kamera Bogus One. Data besar!

Lebih buruk dari itu. Jika semuanya berjalan ke arah lain dan saya memutuskan saya suka dan menginginkan kamera dan benar-benar membeli kamera saya masih akan mendapatkan iklan yang mendorong saya untuk membeli kamera. Data besar!

Periklanan "big data" yang ditargetkan adalah beban terbesar dari yang pernah ada.

OK, jadi mari kita lupakan kegagalan itu dan beralih menggunakan data besar untuk tren. Data besar mungkin menemukan berbagai jarum di berbagai tumpukan jerami. Jadi Anda akan mendapatkan sesuatu seperti ini: Empat puluh persen dari semua pembeli Subaru adalah vegetarian / vegan dan 80 persen dari mereka adalah Demokrat. Tetapi jumlah itu meningkat menjadi 60 persen dan 90 persen, masing-masing, jika kita berbicara tentang Subaru Outback. Selain itu, meningkat menjadi 99 persen vegetarian / vegan dan 99 persen Demokrat jika mobil dicat hijau.

Para ahli teori data besar akan mengadakan hari lapangan di seminar dengan informasi ini. Tapi itu mengabaikan semua variabel yang bisa mengubah perhitungan dan tren, yang tidak ada habisnya. Berapa lama data besar ini akan bertahan jika CEO Subaru melakukan pertemuan di Outback hijau dan menyatakan bahwa "Semua paus harus dimusnahkan!"?

Bahkan tidak butuh banyak untuk mengubah dinamika kesimpulan big data. Terlepas dari apa yang dikatakan pria American Express itu, data sebenarnya buta. Itu sebabnya Anda mendapatkan iklan untuk produk yang sudah Anda beli.

Data besar akan membuat Anda melompat ke kesimpulan.

Jika seseorang membeli sepuluh buku tentang cara membuat bom, apakah itu berarti dia ingin meledakkan Gedung Federal? Bagaimana jika dia adalah seorang ahli pembuangan bom dan itu tidak termasuk dalam jabatannya sebagai konsultan polisi? Data besar belum bisa mengetahui segalanya. Tidak bisa tahu apa yang Anda pikirkan. Saya berpikir, misalnya, bahwa kamera Bogus One menyebalkan. Data besar tidak dapat mengetahuinya kecuali saya diinterogasi. Dan saya mungkin berbohong tentang hal itu.

Semua ini kedengarannya bagus atau sehat untuk masyarakat. Melompat ke kesimpulan, membuat asumsi, bertindak berdasarkan asumsi yang salah. Memburu-buru publik dengan s tidak berguna.

Data besar sebagai konsep tinggi tidak akan pernah sepenuhnya mendefinisikan dirinya sendiri dan mati secara menyedihkan. Saya harap.

Data besar hanyalah penipuan besar | john c. dvorak