Rumah Appscout Cara menerapkan data besar ke dunia nyata

Cara menerapkan data besar ke dunia nyata

Video: Big Data - КЛЮЧ К ПРАВДЕ (Oktober 2024)

Video: Big Data - КЛЮЧ К ПРАВДЕ (Oktober 2024)
Anonim

Pada Fast Forward edisi ini, saya berbicara dengan Hicham Oudghiri, CEO dan salah satu pendiri Enigma, sebuah perusahaan yang berspesialisasi dalam mengumpulkan dan memahami set data yang besar. Enigma adalah perusahaan manajemen data operasional dan intelijen untuk klien swasta, tetapi mungkin terkenal dengan Enigma Public, kumpulan set data yang dapat dicari dan dapat diakses publik yang mencakup segala sesuatu mulai dari gaji staf Gedung Putih hingga inspeksi restoran New York City. Kami berbicara tentang kekuatan data besar, batasan privasi konsumen, dan masa depan dunia yang didorong oleh data kami.

Mengapa Anda tidak menjelaskan kepada saya sedikit tentang apa artinya menjadi perusahaan data terbuka hari ini?

Benar. Kami mulai mengumpulkan data publik dalam jumlah sangat besar di mana saja kami dapat menemukannya, dengan misi untuk mencoba menghubungkan fakta yang sangat berbeda tentang dunia. Kami menyadari, dalam prosesnya, bahwa sebanyak akses ke data yang mendasarinya ini terputus, pola ini bergema untuk data orang sendiri, untuk skema pelaporan data publik-swasta seperti di lingkungan peraturan. Sungguh, yang kami bawa adalah gagasan tentang data terbuka sebagai model operasional ke mana pun kami pergi.

Sweet spot kami hari ini mengolah repositori aset besar-besaran dari data publik dan membawanya ke lingkungan masalah aktual yang sering berada di belakang firewall untuk perusahaan. Meskipun kami mengumpulkan dan mendistribusikan sejumlah besar data, kami telah menemukan bahwa mengambil langkah selanjutnya untuk benar-benar menafsirkan data itu dan menghubungkannya dengan data pribadi benar-benar membantu mengukur dampak dari beberapa masalah yang ingin kami selesaikan.

Orang mendengar tentang set data terbuka, set data publik, set data pribadi. Set data apa yang kita bicarakan di sini?

Kita berbicara tentang data sumber, data resmi, hal-hal yang akan diterbitkan oleh lembaga pemerintah, hal-hal yang akan diterbitkan oleh lembaga internasional, segala sesuatu yang berbeda, dari catatan pendaftaran perusahaan dan penilaian properti hingga visa H-1B atau pengiriman kontainer barang. Jelas tidak membicarakan hal-hal seperti data LinkedIn, yang telah menjadi topik perdebatan besar baru-baru ini, apakah itu set data publik atau tidak. Ada gugatan dengan banyak pertengkaran baru-baru ini.

Tetapi kita berbicara sebagian besar tentang data sumber resmi, di mana ada mandat dan semacam persetujuan hukum formal untuk memasukkan ini ke dalam domain publik, sebagian besar untuk meningkatkan transparansi dalam sistem ekonomi dan perdagangan. Sangat penting bagi kita untuk mengetahui, misalnya, dari sudut pandang akuntabilitas, apa yang dibelanjakan pemerintah kita dengan berbagai perusahaan swasta, atau, dari sudut pandang akuntabilitas, apa yang terjadi dengan distribusi visa di antara perusahaan. Data itu, sering dikumpulkan oleh pemerintah untuk tujuan alternatif seperti pelaporan, perencanaan, alokasi sumber daya, dan kemudian diberikan kembali kepada publik untuk manfaat sekunder dan sering tersier ini. Contoh paling populer adalah data cuaca saja, bukan?

Semua data cuaca yang kami kumpulkan berasal dari sumber resmi, atau GPS sebagai teknologi.

Jadi, Anda mengambil semua set data publik dan kemudian Anda dapat menggabungkannya dengan set data pribadi yang akan diberikan perusahaan secara spesifik dan benar-benar melihat wawasan antara menggabungkan keduanya?

Ya, sangat sering. Pikirkan tentang kasus penggunaan kanonik di mana Anda mencoba melakukan sesuatu seperti mencari tahu apakah perusahaan itu nyata. Jika ini adalah perusahaan kecil, ambil, katakanlah, sebuah restoran atau bisnis kecil. Sangat sering, jenis profil yang akan mereka miliki sangat tipis. Tetapi jika Anda melihat hal-hal seperti lisensi minuman keras mereka atau bahkan inspeksi Departemen Tenaga Kerja atau inspeksi catatan kesehatan, Anda mendapatkan gambaran yang jauh lebih jelas tentang siapa mereka.

Seringkali, itu membantu perusahaan-perusahaan semacam ini instantiate bahwa mereka bahkan nyata untuk mendapatkan akses mereka ke kredit, untuk diasuransikan, hal-hal semacam ini. Beranjak dari, "Ini aplikasi 18 halaman Anda, " dan proses yang sangat menjengkelkan melalui tujuh set kepatuhan yang berbeda, ke sesuatu yang dapat terjadi online dengan cara otomatis dan cara yang tidak terlalu berisiko secara umum.

Jadi, alih-alih hanya mengetiknya di Google untuk melihat apakah mereka memiliki situs web dan apakah itu asli, Anda dapat memiliki semua rangkaian data lainnya yang divalidasi bahkan untuk barang-barang dasar?

Benar.

Kami berbicara, sebelum kami tayang, tentang Ozark , jadi pertunjukan favorit Anda, pertunjukan favorit baru saya, dan gagasan untuk menggunakan set data ini untuk kepatuhan dan untuk pelaporan keuangan dan bahkan untuk memburu pencuci uang.

Ya. Pertama-tama, salah satu pertunjukan terbaik di luar sana. Plug besar ke Netflix, telah menjadi studio Hollywood kelas satu.

Mereka sudah membayarnya. Mereka membeli jalan mereka ke pasar itu.

Tentu saja mereka punya. Tapi acaranya adalah tentang karakter Jason Bateman ini yang menemukan dirinya sebagai pencuci uang untuk kartel narkoba ini. Tangkapannya adalah bahwa ia menyelamatkan hidupnya dengan mengatakan bahwa ia akan pergi ke Ozarks dan menemukan saluran baru untuk mencuci uang. Dia mulai membeli ke bisnis yang lebih mengantuk ini dan kemudian melewati berbagai biaya.

Masalah pencucian uang adalah masalah teoritis besar dalam hal itu, jujur, Anda sedang melihat pola aktivitas di antara pedagang atau konsumen jasa keuangan yang berbeda dan juga hubungan di antara mereka. Jadi, Anda akan menyukai agen terdaftar, jelas, seseorang seperti Jason Bateman, yang berkeliling dan melakukan ini untuk beberapa bisnis. Dia membeli secara pribadi kepada mereka dan mulai mendapatkan namanya di berbagai bentuk yang berbeda, dan Anda akan melihat pola kegiatan itu. Ini adalah sesuatu yang bank harus perjuangkan, tentu saja, karena itu merugikan sistem dan mereka berada di ujung tanduk untuk melakukan ini.

Kejahatan telah menjadi digital dan terdesentralisasi seperti halnya musik. Ini masalah yang jauh lebih besar. Tidak ada satu pun keluarga besar yang bisa dikintai pemerintah selama berbulan-bulan dan membuatnya bergaya Capone. Ini adalah pengejaran habis-habisan di banyak bidang. Kami telah membantu dan berupaya membawa data publik untuk mengatasi masalah itu, tetapi juga membawa teknologi kami yang telah kami gunakan untuk mengumpulkan semua data publik ini untuk mengatasi masalah itu, hanya karena bank memiliki banyak teknologi yang meningkat untuk lakukan untuk menggabungkan set data mereka sendiri menjadi petunjuk yang kuat dan kontekstual untuk simpatisan yang mereka miliki pada staf.

Saya merasa seperti kita pada titik sekarang di mana kita mendapatkan semua data publik ini dibuat oleh lembaga pemerintah. Kami memiliki semua set data pribadi ini. Setiap perusahaan memiliki banyak kumpulan data dan banyak format berbeda, seringkali, di dalam perusahaan yang sama. Namun, tidak ada banyak standardisasi, dan membuat mereka bekerja bersama sebenarnya adalah tantangan utama.

Ini adalah tantangan besar, dan mungkin salah satu tesis terbesar yang kami miliki di Enigma adalah kesenjangan besar. Salah satu investor saya menyebutnya begini - ada dunia di mana data diinstrumentasi dalam bit dan ada dunia di mana itu diinstrumentasi dalam atom. Perusahaan teknologi, Google, Facebook, Amazon, mereka semua telah melakukan pekerjaan luar biasa dengan mengambil data yang mereka dapatkan dari aktivitas Anda menjelajahi web dan menciptakan layanan baru ini seperti pencarian dan pengalaman e-commerce yang lebih baik. Tetapi semua data itu ada. Ini asli secara digital. Itu hanya mendengarkan Anda di web. Web adalah protokol, dan protokol itu dirancang untuk saling berbicara.

Tetapi ketika Anda memiliki data ini yang diinstrumentasi dalam atom, atau dunia nyata, seperti seseorang pergi ke bank di Ozarks dan meminta pinjaman kecil, yang terlihat berbeda dari orang lain yang berjalan ke cabang bank yang berbeda, atau wadah kargo kapal yang datang meminta nama perusahaan yang melakukan pengiriman. Semua data ini dirancang - atau tidak dirancang - untuk berbicara satu sama lain sehingga ada masalah besar dalam menyatukan data ini. Saya pikir ini akan memakan waktu lebih sedikit, industri teknologi murni lebih lama untuk menuai manfaat dari apa yang Anda lihat dalam teknologi dengan data besar. Tetapi ketika mereka melakukannya, saya pikir itu akan mengubah banyak cara kita hidup sehari-hari dengan cara yang sangat berdampak.

Saya juga merasakan bahwa, ketika ada motif finansial untuk menyatukan set data ini dan menciptakan wawasan ini, bisnis menemukan cara untuk membayarnya dan mereka menemukan cara untuk menyelesaikannya. Perusahaan kartu kredit adalah salah satu perusahaan pertama yang dapat mengidentifikasi pola dan mengidentifikasi penipuan. Saya merasa sektor publik tertinggal jauh dalam hal menciptakan wawasan dari jumlah data ini. Apakah itu penilaian yang adil?

Sektor swasta selalu, dalam beberapa hal, memiliki keunggulan dalam mengoperasikan teknologi. Insentif finansial sangat besar dan juga gaya operasi unit yang lebih kecil. Pemerintah AS sebenarnya hanyalah salah satu organisasi terbesar di dunia, dan menyelesaikan apa pun sebenarnya adalah masalah rakyat. Pastikan insentif selaras, memastikan orang mengambil jumlah risiko yang tepat.

Tetapi kami telah melihat pemerintah melakukan beberapa hal yang sangat inovatif. Kami bekerja sama dengan Kota New Orleans, saya pikir itu seperti dua tahun yang lalu, untuk membantu mereka pada dasarnya memperkirakan di mana tuan tanah kumuh berada, kebanyakan untuk memasang detektor asap di rumah-rumah ini. Post-Katrina, Anda memiliki sejumlah besar hawar ini. Banyak pemilik yang pergi dengan meninggalkan orang-orang dengan kondisi buruk. Jujur, detektor asap melakukan pekerjaan yang bagus untuk mencegah kematian akibat kebakaran. Alih-alih mengirim petugas pemadam kebakaran ke rumah yang acak, bagaimana jika Anda menggunakan faktor-faktor seperti demografi dan berapa usia bangunan itu dan terakhir kali ada semacam instalasi semacam infrastruktur seperti infrastruktur telekomunikasi?

Anda menggunakan semua fakta ini dan Anda mendapatkan tingkat hit dari pintu yang Anda ketuk itu jauh lebih tinggi. Kami telah melihat banyak permainan uang semacam ini untuk hal-hal pemerintah daerah bermain sangat kuat. Jelas, ada sejumlah besar penggunaan data di komunitas intelijen, seperti yang dapat Anda bayangkan. Kami menemukan bahwa ada kantong inovasi. Sekali lagi, ini semua tentang bagaimana Anda mengoperasionalkannya.

Anda memiliki semua titik data tersebut tetapi kemudian Anda harus menanyakannya dengan cara yang sesuai, cari polanya. Anda hampir harus mencari korelasinya, dan itu serangkaian pertanyaan dan jawaban. Itu membangun hubungan dengan data itu, saya pikir kita baru mulai mencari tahu bagaimana itu bekerja.

Iya. Kami mulai mencari tahu cara kerjanya dari perspektif skillet. Dan, ada seperti pergeseran pikiran dalam hal pemikiran statistik versus pemikiran statistik. Ada pepatah ini: "Semua model salah tetapi beberapa berguna, " - jadi ini benar-benar tentang apakah Anda dapat, tanpa data, tanpa algoritma, mengontekstualisasikan sedikit, parameter pemikiran statistik Anda. Saya mungkin tidak mendapatkan ini dengan benar, seperti dalam kasus kebakaran, kami mungkin tidak mendapatkan ini dengan benar tetapi kami dapat meningkatkan peluang kami untuk memperbaikinya atau kami dapat mengurangi area permukaan risiko kami atau apa yang harus kami cari. Membawa sikap menyelesaikan masalah, itulah keahlian nomor satu dalam hal kemampuan berpikir secara statistik. Beberapa orang terkunci, "Satu-satunya cara kita dapat memastikan adalah jika kita memiliki X, Y, dan Z."

Saya akan memberi Anda sebuah kasus dalam contoh pribadi. Sangat sering di bank, karena alasan penipuan dan kepatuhan historis, cara mereka memverifikasi apakah seseorang itu nyata sebelum mereka mengeluarkan kartu kredit memastikan nomor telepon dan alamat mereka cocok dengan apa pun yang mereka miliki pada aplikasi. Tidak semua perusahaan menggunakan telepon rumah yang sebenarnya sekarang. Tidak semua perusahaan menggunakan alamat utama mereka sebagai alamat yang benar-benar mereka operasikan. Ada semacam realitas ketinggalan zaman dari orang-orang yang bekerja di WeWork sekarang dan orang-orang yang menggunakan voice over IP. Menjadi nyaman dengan mengidentifikasi orang-orang melalui kehadiran sosial mereka atau melalui beberapa set data yang kami bawa di Enigma yang memberikan poin-poin bukti tambahan ini. Melihat dan menjalankan secara historis statistik untuk melihat apakah kemungkinan itu nyata adalah kuat, versus jaminan yang akan Anda dapatkan dari cara alternatif ini sebelumnya.

Saya pikir itu poin yang menarik juga, asumsi bahwa semua model akan salah, baik sebagian besar salah atau salah dengan cara yang lebih kecil, tetapi tidak apa-apa karena itu masih dapat membantu Anda membuat keputusan yang baik. Apakah itu keterampilan yang kami lakukan dengan baik dalam mengajar anak-anak kami, dan dari mana mereka akan mendapatkan pelatihan itu? Maksudku, itu tidak harus dalam matematika. Itu tidak akan di Studi Sosial. Dari mana mereka mendapatkan kepekaan itu?

Statistik sudah sering sub-kelas, seperti pendidikan matematika pada umumnya, tetapi Anda melihatnya di tempat lain. Anda melihatnya muncul bahkan dalam umpan ESPN Anda hari ini. Orang-orang jauh lebih nyaman dengan prediksi yang menjadi bagian dari kehidupan mereka. Jujur, aku suka saat-saat angsa hitam ini di mana semua itu terbang di wajah kita. Ambil pemilihan terakhir. Anda telah memenangkan Hilary, dan Anda memiliki ilmuwan data terbaik dunia di beberapa lembaga terbaik menyebutnya salah.

Menang, tetapi menang tidak memiliki kemungkinan 70 persen untuk menang karena itu masih berarti bahwa, satu dari tiga kali, Donald Trump menang. Dan coba tebak? Ini adalah salah satu dari tiga kali itu.

Benar. Dan kemudian ada pendidikan yang kita lihat pola-pola ini membuat orang lebih nyaman. Di kelas, saya pikir salah satu masalah terbesar yang kita miliki hanyalah pembelajaran terapan. Sepertinya, saya tidak tahu mengapa mereka tidak mengajarkan keuangan pribadi di kelas. Maksudku, aku idiot dengan uangku pada usia 18 tahun dan pengaruhnya terhadap hutang dan semua itu. Saya masih kagum bahwa mereka tidak melakukan itu, jadi saya merasa seperti kita bergerak di dunia di mana pendidikan akan semakin banyak tentang hal-hal yang diterapkan dan lebih sedikit tentang hal-hal teoritis. Tetapi kemudian saya khawatir jika kita kehilangan beberapa bagian dari pembelajaran budaya. Ini semua adalah trade-off.

Saya akan melangkah lebih jauh ke jalan itu dan berbicara tentang kecerdasan buatan.

Kecerdasan buatan, teknologi yang sangat transformasional. Tampak bagi saya bahwa ada peran kecerdasan buatan dalam membantu kita memahami dunia data yang meluap-luap ini dan menemukan pola-pola itu untuk kita. Apakah Anda optimis tentang AI membantu kami memahami hal itu atau apakah itu akan menjadi sesuatu yang benar-benar terpisah dari sisa pengalaman manusiawi kami?

Tidak. Maksud saya, saya optimis dalam arti bahwa saya optimis tentang kemanusiaan pada umumnya. Saya merasa itu adalah gen flip gen yang terjadi pada orang-orang pada suatu periode waktu tertentu. Salah satu hal yang paling saya sukai tentang janji kecerdasan buatan adalah bahwa itu benar-benar akan membantu teknologi hilang karena saat ini, fokusnya adalah pada teknologi dan data yang hadir. Namun dalam kenyataannya, pekerjaan data sangat intensif. Ada alasan mereka menyebutnya penggalian data saat Anda mencari hal-hal dalam kumpulan data. Ini sangat jahat. Kumpulan data tidak bersih. Agak kasar dalam arti tertentu.

Apa yang saya sukai dari AI adalah menciptakan umpan balik dari pengalaman yang diamati. Meskipun Anda mengumpulkan semua data ini dari semua tempat ini, Anda tidak benar-benar tahu bagaimana itu akan datang bersama sehingga Anda mulai mempelajari hasilnya. Pembelajaran dengan mesin membantu kita menjadi sedikit lebih berorientasi pada hasil dalam cara kita berpikir secara statistik. Saya pikir itu akan membantu kita menghilangkan sebagian dari nastiness pekerjaan itu dan menjadi sedikit lebih berorientasi pada hasil dalam cara kita mendekatinya. Sekarang, itu pasti akan menakutkan dalam hal dampak pada otomatisasi di beberapa daerah di mana, terus terang, saya pikir AI harus dibiarkan sendiri, seperti mengganti juri. Akankah kita mendapatkan kualitas kecerdasan emosional itu? Saya tidak tahu

Dan Anda harus memilih dan mengatakan Anda menginginkan kualitas emosional dalam juri yang bertentangan dengan kemungkinan murni bahwa orang ini bersalah atau tidak bersalah?

Iya. Bagi saya, kemanusiaan yang mendasarinya, saya pikir sangat penting. Terus terang, hanya dalam bisnis dan melihat seberapa besar sentuhan manusia itu penting bahkan untuk meyakinkan orang untuk mulai berpikir secara statistik, saya optimis bahwa kita tidak akan kehilangan itu dengan munculnya AI dalam skala besar.

Kami menyentuh sedikit tentang apakah LinkedIn adalah kumpulan data publik. Banyak orang, mereka merasa bahwa mereka hidup di dunia ini di mana segala sesuatu tentang mereka tersedia secara online, dari pola pembelian mereka hingga usia mereka hingga sejarah medis mereka. Itu membuat orang tidak nyaman. Itu membuat orang khawatir bahwa pemerintah memiliki terlalu banyak informasi. Saya pribadi lebih khawatir bahwa perusahaan swasta memiliki terlalu banyak informasi dan mereka jauh lebih tidak teratur.

Iya.

Apakah kita memerlukan undang-undang untuk melindungi informasi pribadi kita? Haruskah informasi pribadi diperlakukan secara terpisah dari catatan pemerintah Anda?

Benar. Kami memiliki sedikit perlindungan terhadap hukum yang mengatur cara kami memberikan data kami. Pikirkan tentang itu dalam profesi tertentu. Dalam profesi medis, ini terkunci. Tetapi untuk beberapa alasan, itu tidak selalu terkunci di industri lain. Alasannya, saat itu, tidak banyak yang dapat Anda lakukan dengan informasi pribadi Anda. Hari ini, mereka memiliki perasaan yang sangat baik tentang bagaimana membuat Anda bertobat atau kemungkinan Anda akan berada di suatu tempat. Untuk semua maksud dan tujuan, itu sebenarnya sebagian besar bermanfaat bagi kami, menurut pendapat saya.

Tetapi pada saat yang sama, data kami masih layak mendapatkan jumlah kesucian seperti itu dalam penanganannya. Eropa telah keluar dengan hukum yang sangat kuat. Ada hukum yang keluar yang disebut GDPR. Ini diatur untuk diberlakukan pada tahun 2018, dan itu membawa segalanya dari memastikan perusahaan melacak garis keturunan data pribadi mereka, siapa yang memilikinya, bagaimana akses diberikan kepadanya di dalam perusahaan, tindakan yang harus dilupakan. Ketika Anda berkata, "Hapus data saya, " apakah Anda benar-benar menghapusnya atau Anda menyimpannya untuk informasi lain? Jadi selalu ada pertukaran antara konsumen dan layanan tempat mereka bekerja. Banyak dari layanan ini gratis dan kami menyukainya, bukan?

Saya akan memberikan sebagian dari diri saya untuk akses YouTube, bukan? Saya sangat senang tentang hal itu.

Dan mungkin, sudah.

Dan mungkin saya punya. Tetapi itu tidak berarti bahwa bagian yang saya berikan tidak boleh dimasukkan ke dalam kotak yang aman dan saya tahu bahwa kotak itu berada di bawah bunker dan semua hal baik itu.

Juga, gagasan berakhirnya data, yang, di dunia digital saat ini, adalah konsep yang relatif baru. Dulu ada ketidakjelasan tertentu. Jika sesuatu terjadi 30 tahun yang lalu, akan sulit untuk menemukan catatan dan mendapatkan profil dari saat itu. Tapi ada anak-anak hari ini yang telah online sepanjang hidup mereka, dan apa yang mereka lakukan dan diposting ketika mereka berumur 13 akan ada di sana ketika mereka berusia 63 tahun.

Iya.

Kami tidak memiliki infrastruktur hukum yang dapat mengatasinya dengan cara apa pun yang berarti.

Tidak, kami tidak melakukannya dan itu adalah area yang berbulu. Ini adalah area berbulu dalam hukum ketenagakerjaan. Ini area berbulu untuk berkencan, kan?

Jika Anda melihat profil Facebook seseorang - saya pikir budaya itu akan beradaptasi dengan itu, dengan keberadaan online seseorang yang bersifat publik. Tapi ini hampir seperti teater. Sepertinya kehadiran publik Anda bukanlah diri Anda yang sebenarnya. Apa itu film Jim Carey? Kita semua mengenakan topeng, secara metaforis. Jadi saya pikir kehadiran online Anda akan lebih seperti galeri ini atau karya seni yang menggambarkan Anda dan kemudian ada Anda yang sebenarnya. Tetapi masih ada Anda melakukan suntikan tubuh atau sesuatu seperti… Itu, Anda tidak ingin menjadi publik. Ada pertanyaan nyata apakah orang-orang yang cukup muda memiliki kemampuan untuk memutuskan apakah pintar untuk menempatkan itu online atau tidak. Menakutkan, pasti.

Berbicara tentang menempatkan hal-hal bodoh secara online, mari kita bicara tentang administrasi Trump. Saya telah mendengar di berbagai bidang… Anda jelas bekerja dengan banyak set data publik. Anda harus pergi dan meminta izin untuk mendapatkan informasi ini berkali-kali, atau mencari cara untuk menelannya. Apakah sekarang lebih mudah? Bagaimana akses ke set data publik berubah sejak pemerintahan Trump menjabat?

Iya. Peringatan pertama saya ketika saya berbicara tentang hal ini adalah, perbedaan besar antara administrasi Trump dan pemerintah AS. Pemerintah AS sejauh ini merupakan salah satu lembaga paling transparan yang pernah saya temui di dunia. Kami sangat transparan relatif terhadap rekan-rekan kami untuk jumlah data yang kami keluarkan, untuk berapa banyak kami mendanai hal-hal semacam ini, jadi peringatan nomor satu.

Ketika berbicara tentang Trump, maksud saya, sudah sangat jelas bagi saya bahwa setiap orang harus sangat cemas tentang sikap pemerintahan ini dengan transparansi dan berbagi informasi. Pertama-tama, ada hal-hal yang sangat eksplisit seperti mencatat daftar pengunjung ke Gedung Putih, yang merupakan praktik yang diterapkan Obama dan saya pikir salah satu sistem akuntansi pemerintah yang paling sentral. Sudah ada data EPA, ada data iklim, dan umumnya, bahkan ada perdebatan tentang beberapa data sensus yang dipengaruhi oleh ini. Anda harus ingat, ini bukan usaha kecil. Saya pikir sensus AS adalah investasi lebih dari $ 4 miliar setiap kali itu terjadi, dengan melibatkan lebih dari 300.000 sukarelawan.

Beberapa dari hal-hal ini, kita akan melihat dampaknya dalam empat tahun, hanya mengingat siklus pendanaan bagaimana hal itu terjadi. Meskipun administrasi ini tentu saja tidak ramah, saya pikir tulang punggung transparansi di negara ini cukup kuat. Anehnya, itu datang dari kiri dan kanan. Cukup kuat untuk memastikan bahwa gerakan menuju keterbukaan informasi ini tetap ada.

Dan ada banyak yang mengendarai set data ini.

Iya. Begitulah cara kami memutuskan di mana harus menempatkan rumah sakit. Begitulah cara kami memutuskan bagaimana mengarahkan ambulan. Begitulah cara kami memutuskan begitu banyak layanan dasar, seperti pengelolaan limbah bergantung pada hal-hal semacam ini.

Beri tahu orang-orang yang melihat kumpulan data publik Enigma, yang telah saya kunjungi beberapa kali… super, super keren. Apa yang seharusnya orang harapkan ketika mereka pergi ke sana? Apa yang bisa mereka dapatkan darinya?

Salah satu komitmen kami adalah terus jujur ​​tentang misi mengumpulkan semua data, tetapi memberikannya sebanyak yang kami bisa kepada orang-orang. Ini sepenuhnya gratis untuk digunakan untuk tujuan non-komersial, keperluan jurnalistik. Kami ingin memastikan bahwa setiap orang memiliki akses ke data ini. Anda bahkan tidak perlu masuk atau perlu memberi kami informasi apa pun untuk melanjutkan dan mengaksesnya. Ketika kami mendirikan perusahaan, ada premis besar tentang akses.

Seperti yang telah kita pelajari lebih banyak selama bertahun-tahun, akses dan desain antarmuka serta pencarian dan kredibilitas menjadi sangat penting. Yang lainnya adalah kurasi dan itu adalah fokus besar Enigma Public, yang kami luncurkan kembali musim panas ini, adalah gagasan bahwa orang perlu tahu bagaimana data ini digunakan. Orang-orang perlu tahu tidak hanya praktik terbaik untuk bagaimana bekerja dengan data tetapi set data mana yang bagus untuk apa. Apa yang baru, yang menarik? Saya pikir pendidikan semacam itu adalah sesuatu yang kami sangat senang menjadi bagian darinya dan sesuatu yang kami harap orang-orang akan dapatkan saat mereka mendarat di situs tersebut.

Pasti patut dicoba. Saya pikir, sekali lagi, bisnis melihat data itu dan mereka tahu bahwa mereka dapat membangun bisnis di atasnya. Saya pikir untuk jurnalis dan warga negara, ada lebih banyak pendidikan yang diperlukan.

Tentu saja, lebih banyak pendidikan dan, semoga, seluruh lapisan layanan di atasnya memberikan hal-hal kepada orang-orang seperti saya dan Anda ketika kita tidak bergaul, untuk berbicara.

Izinkan saya mengajukan pertanyaan yang saya ajukan kepada semua orang yang datang di acara itu. Tren teknologi apa yang paling Anda perhatikan? Apakah ada sesuatu yang membuat Anda terjaga di malam hari?

Tren yang paling memprihatinkan saya atau hal yang saya pikir, di cakrawala, yang harus paling kita perhatikan adalah gagasan tentang pemrograman biologis, sehingga sejauh mana kita semakin jauh lebih baik secara terprogram membuat untaian kehidupan biologis organisme Itu memiliki dampak besar untuk kebaikan, tetapi juga memiliki dampak besar bagi kemampuan untuk menciptakan skala kecil, pada dasarnya penyimpangan melalui hal ini. Di mana pun teknologi dan bio bertemu, saya selalu sedikit khawatir tentang bagaimana hal itu ditangani. Ini seperti gelombang berikutnya bagi saya, pasca-nuklir, benar-benar kemampuan kami untuk melakukan hal-hal seperti urutan hal-hal yang terprogram di laboratorium skala kecil dan mendistribusikannya.

Tantangannya adalah bahwa meskipun kita mengeluarkan undang-undang di sini di Amerika Serikat, itu tidak berarti bahwa seseorang tidak dapat melakukan penelitian yang sama di Cina atau di Rusia.

Benar-benar - dan bahkan dari perspektif keselamatan, bukan? Jadi kita benar-benar mulai memiliki sarana sekarang bagi siapa saja untuk DIY program perang biologis mereka sendiri. Jadi, bagi saya, adalah hal yang paling mengkhawatirkan saya. Tetapi flipside mencakup hal-hal seperti obat pribadi, fakta bahwa Anda benar-benar dapat memahami tubuh saya, Anda hampir dapat membuat versi biologis dari program perangkat lunak yang dirancang untuk menyembuhkan penyakit apa pun yang saya miliki. Sama prihatinnya dengan saya, saya juga bersemangat untuk itu.

Saya pikir kekurangannya adalah kita membutuhkan semacam struktur etika untuk menerapkan teknologi baru ini. Kita melakukannya dengan senjata nuklir dan tenaga nuklir, hampir tidak, tetapi kita melakukannya di sana dan saya pikir kita akan perlu mengembangkan sesuatu serupa. Pada tingkat pribadi, adakah teknologi yang Anda gunakan setiap hari yang baru saja mengubah hidup Anda, yang membuat Anda kagum?

Ini agak aneh, tetapi hanya FaceTime. Atau obrolan video. Saya memiliki beberapa anggota keluarga di luar negeri dan saya sering bepergian untuk bekerja. Perbedaan antara panggilan telepon dan obrolan video cukup baik di telepon, itu benar-benar membuat saya merasakan seluruh janji bahwa internet telah menghubungkan semua orang. Mampu, dalam hitungan 15 detik. Saya berasal dari Maroko, jadi melihat seseorang di seluruh dunia dan berkata, "Hei, apa yang Anda lakukan?", melihat seperti apa cuaca di lingkungan mereka dan bagaimana mereka berpakaian dan sikap mereka, yang benar-benar mengubah perasaan saya terhubung dengan orang-orang di sekitar saya dan membuat saya merasa seperti kita semua tinggal di desa besar ini sedikit lebih, dan saya seperti perasaan itu.

Ada sesuatu yang menarik juga, saya menyaksikan ledakan konferensi video meningkat. Itu akan menjadi hal berikutnya. Tidak ada yang akan melakukan panggilan telepon lagi. Konferensi video tidak pernah benar-benar lepas landas tetapi obrolan video, lebih pribadi, sangat berbeda dan tidak dalam lingkungan kerja, sesuatu yang hampir lebih biasa daripada panggilan telepon. Seperti itu bisa menjadi hal yang instan.

Saya memiliki seorang anak perempuan berusia 3 tahun dan dia benar-benar mengerti. Dia video chat sebelum dia menelepon. Dia tidak tahu apa itu panggilan telepon. Anda meletakkan telepon pengeras suara dan Anda memintanya untuk mengobrol dengan seseorang dan dia sama sekali tidak tertarik. Anda menempatkannya di depan kakeknya di FaceTime dan dia bisa berada di sana selama 20 menit.

Ini akan menjadi aneh baginya seperti telepon rotary yang anak-anak hari ini tidak tahu cara menggunakannya. Hicham, bagaimana orang bisa mengikuti Anda secara online, mencari tahu apa yang Anda lakukan, dan mengikuti Enigma?

Pergi ke enigma.com. Lihat Enigma Publik untuk memastikan, itu public.enigma.com. Lihatlah situs web kami. Kami memiliki akun Twitter yang cukup aktif, belum ada Instagram untuk kami.

Jangan pernah bilang tidak akan pernah.

Jangan pernah bilang tidak akan pernah. Tapi-

Anda dapat melakukan hal-hal hebat dengan infografis.

Ya itu benar. Kami benar-benar penggemar data yang hebat. Kami memiliki bagian keren dari situs kami ini, labs.enigma.com, tempat semua eksperimen kami dan beberapa proyek pro bono kami seperti yang saya sebutkan dengan New Orleans, jadi saya akan memeriksanya juga.

Sangat keren. Terima kasih banyak sudah datang.

Luar biasa. Terima kasih banyak sudah memilikinya.

Cara menerapkan data besar ke dunia nyata