Daftar Isi:
Video: Простая и дешёвая бизнес-аналитика на базе Google BigQuery / Алексей Паршуков (DocDoc) (November 2024)
Google BigQuery, yang gratis untuk 10 gigabyte (GB) per bulan, adalah gudang data skala besar ginormous, petabyte (PB) untuk analitik. Ini tingkat perusahaan, produk SQL, dan Big Data ada dalam DNA Google. Semua alat dan layanan perusahaan adalah buktinya. Singkatnya, jika Anda ingin melakukan apa saja dengan data, maka Anda dapat bertaruh Google memiliki alat untuk mewujudkannya. Jika Anda memiliki kumpulan data besar atau Anda mengumpulkan data dengan memadukannya dengan kumpulan data publik atau komersial, maka Google BigQuery mungkin merupakan pilihan yang solid. Ini dirancang untuk memindai terabyte (TB) dalam hitungan detik dan PB dalam beberapa menit. Permintaan terbesar hingga saat ini adalah 2, 1 PB dan Google BigQuery menanganinya tanpa masalah. Terlepas dari kemampuan ini, analitik Big Data menantang dan, jika Anda bekerja dengan set data yang lebih kecil, maka itu mungkin berlebihan. Namun, Google BigQuery adalah pilihan yang tepat yang berada tepat di belakang Microsoft Azure SQL Database dan MongoDB Atlas, pilihan-pilihan Pilihan Editor dalam kumpulan solusi review DBaaS kami.
Model Harga
Google BigQuery adalah model analisis data tanpa server. Pemisahan penyimpanan dan komputasi memberi Anda kontrol harga yang lebih baik, yang cenderung lebih menarik bagi orang yang menjalankan proyek yang sangat besar. Penyimpanan diberi harga dengan tarif tetap dan menghitung tingkat penggunaan. 10 GB penyimpanan pertama gratis setiap bulan dan biaya mulai dari 2 sen per GB per bulan setelah itu. Misalnya, jika Anda menyimpan 1 terabyte (TB) selama sebulan, maka biayanya adalah $ 20. Sisipan data streaming mulai dari 1 sen per 200 megabita (MB). Kueri 1 TB pertama gratis, dengan analisis tambahan sebesar $ 5 per TB sesudahnya. Operasi data meta gratis.
Anda juga memiliki opsi untuk membayar saat bepergian atau biaya tetap bulanan. Beberapa pengembang lebih suka biaya tetap untuk pengurangan kecemasan anggaran. Karena penyimpanan sudah pada biaya tetap, opsi ini hanya berarti bahwa penghitungan juga pada pengaturan biaya bulanan, rata. Tetapi sebelum Anda terlalu bersemangat mendaftar untuk harga flat-rate, perlu diketahui bahwa hanya akun dengan $ 40.000 + dalam pengeluaran analisis bulanan yang memenuhi syarat untuk opsi ini.
Tingkatan gratis Google BigQuery menyediakan hingga 1TB data yang dianalisis setiap bulan dan 10GB penyimpanan data, tetapi serius, jika Anda jauh di bawah tanda itu, maka ada alat lain yang lebih cocok untuk tugas tersebut, seperti Microsoft Azure SQL Database, IBM Db2 di Cloud, atau Google Cloud dengan Google Analytics 360.
Selangkah demi selangkah
Anda akan memerlukan akun Google, jadi setel jika Anda belum memilikinya. Anda harus mendaftar untuk akun Google Cloud Platform, yang juga akan memerlukan kartu kredit untuk menggunakan uji coba gratis. Tetapi jangan khawatir karena Anda tidak akan secara otomatis ditingkatkan dan ditagih pada akhir periode uji coba. Anda harus memutakhirkan secara manual untuk apa pun yang akan dibebankan ke kartu kredit Anda.
Dari antarmuka pengguna Google Cloud (UI), pergi ke BigQuery. UI BigQuery agak sederhana-Jane, tetapi keputusannya membuatnya mudah digunakan juga. Google memberi tahu saya bahwa ini sedang bekerja pada UI baru sekarang. Dengan UI saat ini, jika Anda hanya ingin menjelajahi, lalu klik pada Compose Query, dan pilih salah satu set data publik di halaman selamat datang. Tulis kueri SQL standar di kotak kueri dengan menggunakan Editor Kueri atau Editor Fungsi Buatan Pengguna (UDF), dan pergilah.
Panduan Quickstart berguna dalam mentransfer data atau memutar basis data Anda sendiri di Cloud Bigtable, Cloud Spanner, Cloud SQL, atau Cloud Datastore (database NoSQL). BigQuery menggunakan American National Standards Institute (ANSI) yang sesuai SQL serta Open Database Connectivity (ODBC) dan Java Database Connectivity (JDBC) driver untuk berintegrasi dengan data dalam produk Cloud lainnya dan jenis aplikasi tambahan. Implementasi SQL unik yang dirancang untuk memuluskan kueri berarti ada beberapa dialek SQL, yang dapat membingungkan. Saya memang memperhatikan bahwa sementara defaultnya adalah "Legacy SQL, " saya bisa menghapus centang pada kotak dialek SQL untuk kembali ke SQL standar yang sebenarnya.
Google BigQuery juga memiliki mesin konsumsi streaming untuk pengambilan dan analisis data waktu nyata. Gunakan tab Buat Kumpulan Data di bawah menu pull-down My First Project untuk membuat kumpulan data. Masukkan ID himpunan Data, pilih lokasi data (AS, Uni Eropa, atau Asia-Timur Laut), dan atur kedaluwarsa data. Google BigQuery dapat secara otomatis mendeteksi skema. Setelah kumpulan data diatur, Anda siap menjalankan kueri.
Kotak Alat
Ada konektor untuk sebagian besar alat intelijen bisnis (BI). Tetapi Anda mungkin ingin menggunakan Data Studio, yang merupakan alat visualisasi BI Google, dan gratis. Daftar alat Google yang dapat Anda gunakan panjang. Saya sarankan Anda mulai dengan meninjau daftar tingkatan gratis Google Cloud Platform.
Google Cloud Platform memiliki 15 wilayah, 45 zona, lebih dari 100 titik keberadaan, dan jaringan global yang dipersiapkan dengan baik dengan 100.000+ mil kabel serat optik. Anda mendapatkan harga yang lebih baik menggunakan layanan global, tetapi Anda bebas menentukan wilayah yang Anda inginkan.
Pencadangan dan perjanjian tingkat layanan (SLA) berada di bawah naungan Google SQL Cloud. SLA lengkap ada di sini. Cloud SQL menyimpan tujuh cadangan otomatis untuk setiap instance. Cadangan generasi pertama (gen) menangkap semuanya dan termasuk dalam biaya instan Anda (pada model per penggunaan). Ruang penyimpanannya tidak termasuk ruang penyimpanan yang Anda alokasikan. Cadangan generasi kedua hanya menangkap data yang telah berubah dan penyimpanannya dibebankan pada tingkat yang dikurangi.
Secara keseluruhan, Google BigQuery dirancang dengan sangat baik. Ini lebih cocok untuk kumpulan data besar dan mereka yang terampil dalam bekerja dengan mereka. Jika Anda menyukai aplikasi pembelajaran mesin tulis (ML) atau mendesain data pelatihan ML, maka Anda terutama akan menyukai produk ini. Hal yang sama berlaku bagi pengembang yang bekerja pada aplikasi Internet of Things (IoT) atau pengembangan apa pun yang membutuhkan konsumsi data yang fleksibel dan analisis data yang masif.