Rumah Bisnis Google menyederhanakan pembelajaran mesin dengan sql

Google menyederhanakan pembelajaran mesin dengan sql

Daftar Isi:

Video: SQL 01 | Seleksi Kolom dengan SELECT | Belajar MySQL | MariaDB | Belajar Database (Desember 2024)

Video: SQL 01 | Seleksi Kolom dengan SELECT | Belajar MySQL | MariaDB | Belajar Database (Desember 2024)
Anonim

Google sekarang telah menambahkan kemampuan machine learning (ML) ke Google BigQuery, yang menawarkan database cloud skala petabyte (PB) perusahaan. Sekarang dijuluki BigQuery ML, versi baru memungkinkan Anda menggunakan pernyataan Structured Query Language (SQL) sederhana untuk membangun dan menggunakan model ML untuk analisis prediktif.

Itu bukan hanya kabar baik bagi para ilmuwan data yang menggunakan Google. Ini juga baik untuk pelaku bisnis yang tertarik untuk meningkatkan kemampuan analisis data mereka karena itu menambah satu pesaing yang lebih efektif ke daftar vendor yang agak kecil yang mampu memberikan tingkat kecanggihan melalui cloud. Dua nama lain yang paling terkenal adalah Layanan Database Relasional Amazon dan Microsoft Azure SQL, dan Anda dapat menemukan lebih banyak dalam pengumpulan layanan basis data cloud terbaru kami.

Kutukan dari semua vendor dan pembeli produk data selalu menjadi kesenjangan keterampilan. Itu terutama berlaku bagi mereka yang tertarik pada ML dan analitik prediktif, karena disiplin ilmu ini sering membutuhkan pengetahuan tentang teknologi baru dan bahasa query.

"Untuk setiap satu ilmuwan data, ada ratusan analis yang bekerja dengan data, dan sebagian besar menggunakan SQL, " Sudhir Hasbe, Direktur Manajemen Produk di Google Cloud, mengatakan pada PCMag. Sesuatu harus diberikan jika kekuatan pasukan analis data harus dibuka dari kemacetan yang disebabkan oleh terlalu sedikit dan terlalu banyak ilmuwan data yang bekerja terlalu keras.

Jawaban Google atas dilema ini tidak kalah luar biasa. Sementara ML adalah tren panas dan muncul dalam produk dari semua jenis di mana-mana, itu masih wilayah data ilmuwan tegas. Banyak vendor telah membuat kemajuan dalam menyederhanakan teknologi, tetapi kebenaran yang buruk adalah, Anda dapat menyederhanakannya dengan banyak dan itu masih terlalu sulit untuk digunakan oleh lebih dari 99 persen populasi manusia. Namun, kita harus dapat menggunakannya karena ML dapat melakukan lebih banyak, dan melakukannya lebih cepat daripada kelompok manusia super pintar.

Google menanam ML di dalam Google BigQuery sehingga lebih dekat dengan data. Aplikasi ini akan membawa kemampuan ML lebih cepat daripada model ML tradisional sebagian karena analisis data dapat dilakukan pada sumbernya. Sekarang dalam versi beta, BigQuery ML memungkinkan analis (dan ilmuwan data) menjalankan analitik prediktif seperti meramalkan penjualan dan membuat segmen pelanggan tepat di atas data tempat data itu disimpan. Itu saja merupakan peningkatan yang terhormat dan penting.

Namun, Google melangkah lebih jauh dari itu dengan menambahkan kemampuan yang memungkinkan analis data untuk menggunakan pernyataan SQL sederhana untuk membangun dan menggunakan model ML. Saat ini, pilihannya adalah regresi linier dan model regresi logistik untuk analisis prediktif karena keduanya adalah dua model yang paling umum digunakan.

Berikut adalah ilustrasi yang diberikan Google untuk menunjukkan bagaimana analis data akan menggunakan kemampuan ini:

Google berencana untuk menambahkan lebih banyak opsi ML untuk kemampuan ini seiring waktu, menurut Hasbe. "Kami perlu mendengar dari pelanggan kami tentang model mana yang mereka ingin kami tambahkan sehingga kami menyediakan yang paling berguna terlebih dahulu, " katanya.

Peningkatan Google BigQuery Tambahan

Topping daftar peningkatan substansial setelah ML adalah kemampuan pengelompokan, BigQuery Sistem Informasi Geografis (BigQuery GIS), konektor data Google Sheets baru, dan konektor data Google Sheets baru.

Clustering juga dalam versi beta, dan memungkinkan pembuatan tabel berkerumun dalam langkah pengoptimalan data yang mengelompokkan baris dengan kunci kluster yang sama secara bersamaan. Ini mengurangi biaya karena meningkatkan kinerja dan memungkinkan Google BigQuery untuk menagih pengguna hanya untuk data yang dipindai daripada seluruh tabel atau partisi.

GIS BigQuery saat ini dalam alpha, dan digunakan untuk analisis data geospasial. Sementara tim Google Cloud bermitra dengan Google Earth Engine untuk membangun BigQuery GIS, Anda harus membawa data geospasial Anda sendiri ke tabel. Itu bukan masalah di dalam dan di beberapa industri, termasuk sistem mobil yang terhubung, Internet of Things (IoT), manufaktur, ritel, kota pintar, dan telematika. Belum lagi lembaga pemerintah mulai dari Badan Perlindungan Lingkungan (EPA) dan Badan Geospasial-Intelijen Nasional hingga Administrasi Kelautan dan Atmosfer Nasional (NOAA) dan semua cabang militer, tentu saja.

GIS BigQuery menggunakan perpustakaan S2, yang sekarang memiliki lebih dari satu miliar pengguna melalui berbagai produk seperti Google Earth Engine dan Google Maps. Jika Anda membutuhkan lebih banyak data geospasial, maka pemerintah federal membagikannya dalam jumlah besar di GeoPlatform.

Konektor data Google Sheets baru cenderung memuaskan banyak analis data hanya karena sangat praktis untuk penggunaan sehari-hari. Anda dapat mengakses Google BigQuery dari Google Sheets (program spreadsheet) dan menggunakan alat Google Sheets seperti Explore, yang merupakan kolaborasi gabungan, visualisasi data, dan alat query bahasa alami.

Google BigQuery sekarang memiliki antarmuka pengguna baru (UI) dalam versi beta juga. Salah satu elemen yang lebih menarik adalah fungsi visualisasi sekali klik, yang didukung oleh Google Data Studio. Semua mengatakan, ini adalah putaran upgrade untuk layanan yang sudah elegan. Pemutakhiran ini akan diuji pada putaran selanjutnya dari tinjauan solusi Database-as-a-Service (DBaaS) PCMag, setelah bug diselesaikan, dan produk telah bergerak melampaui status alfa dan beta masing-masing.

PCMag EIC Dan Costa membahas masa depan data:
Google menyederhanakan pembelajaran mesin dengan sql