Rumah Bisnis 7 Tips untuk keberhasilan pembelajaran mesin

7 Tips untuk keberhasilan pembelajaran mesin

Daftar Isi:

Video: 10 Skill yang wajib dimiliki untuk sukses di era Revolusi Industri 4.0 | Salva Yurivan Saragih (Desember 2024)

Video: 10 Skill yang wajib dimiliki untuk sukses di era Revolusi Industri 4.0 | Salva Yurivan Saragih (Desember 2024)
Anonim

Bagian pertama dari Panduan Bisnis untuk Pembelajaran Mesin (ML) kami merinci bagaimana konsep payung ML jauh lebih bernuansa dalam lingkungan bisnis. Strategi yang paling efektif melihat ML dalam arti praktis, menggunakan baik pembelajaran mendalam yang kompleks dan teknik "pembelajaran murah" yang kurang intensif untuk mengoptimalkan proses perusahaan dan mendapatkan wawasan kecerdasan bisnis nyata (BI).

Tujuan penerapan ML dalam aplikasi bisnis Anda adalah untuk meningkatkan laba atau menekan keunggulan kompetitif perusahaan Anda. Tetapi dalam skema yang lebih besar dari organisasi Anda, membuat sebagian besar waktu dan sumber daya yang Anda investasikan dalam proses ini jauh melampaui algoritma. Para pembuat keputusan TI dalam bisnis Anda perlu memastikan segala sesuatu menjadi faktor dalam penerapan ML Anda - mulai dari data dan logistik hingga cara Anda terlibat dengan pengguna - bekerja bersama secara terpadu untuk memaksimalkan efektivitas.

Ted Dunning, Ph.D., adalah Kepala Arsitek Aplikasi di MapR, sebuah perusahaan perangkat lunak perusahaan yang menawarkan berbagai distribusi Big Data dan alat manajemen data. Dunning juga ikut menulis dua buku tentang apa yang ia sebut sebagai "Pembelajaran Mesin Praktis" dan mengembangkan teknologi ML untuk sejumlah perusahaan selama bertahun-tahun, termasuk sistem deteksi penipuan ID Analytics (dibeli oleh LifeLock) dan perangkat lunak Musicmatch Jukebox, yang kemudian menjadi Yahoo Music. Dia juga saat ini menjabat sebagai Wakil Presiden Inkubasi untuk Yayasan Perangkat Lunak Apache.

Dunning telah menyaksikan ruang ML berkembang selama beberapa dekade, dan belajar banyak tentang apa yang berhasil dan apa yang tidak dalam lingkungan bisnis yang praktis. Di bawah, Dunning menjabarkan tujuh praktik terbaik yang harus diikuti ketika mengembangkan solusi bisnis yang berakar pada ML.

1. Jangan Lupa Logistik

ML yang sukses bukan hanya tentang memilih alat atau algoritma yang tepat. Dunning mengatakan Anda juga perlu mencari tahu pendekatan apa yang cocok dan rancang untuk situasi tertentu yang sedang Anda tangani. Sebagai contoh, Dunning berbicara tentang ML dalam kampanye pemasaran online sebagai lawan dari skenario yang jauh lebih rumit seperti algoritma yang memandu mobil otonom. Membelanjakan sumber daya Anda untuk peningkatan algoritma tambahan sepadan dengan masalah mobil, tetapi dalam skenario pemasaran, Anda akan melihat pengembalian yang jauh lebih baik dari mengoptimalkan semua logistik di sekitarnya.

"Seringkali, untuk bisnis, logistik, bukan pembelajaran, yang memberi Anda nilai. Itulah bagian yang harus Anda habiskan waktu dan sumber daya, " kata Dunning. "Menyesuaikan algoritme akan memberi Anda sedikit peningkatan. Tetapi menyesuaikan data itu, GUI, dan bagaimana Anda mendengarkan dan terlibat dengan pengguna Anda dapat dengan mudah memberikan peningkatan 100 persen. Menghabiskan waktu untuk mengubah algoritme bernilai sebagian kecil karena banyak bisnis seperti mendengarkan pengguna Anda."

Untuk menggambarkan hal ini, Dunning menjelaskan bagaimana ia pernah membangun sebuah model untuk mengidentifikasi penipuan aplikasi (membuka akun palsu dengan identitas yang dicuri) di basis data pelanggan perusahaan. Model yang ia bangun mendapatkan hasil yang bagus, tetapi Dunning memerhatikan bahwa jenis kelamin pelamarnya sangat berat.

Ternyata logistiknya padam. Cara proses aplikasi bekerja, pemohon hanya mengisi jenis kelamin mereka setelah mereka sudah menjadi pelanggan dan telah melewati sejumlah langkah penyaringan untuk menyaring penipu. Jadi dengan menggunakan bidang gender, model ML menipu logistik dari seluruh proses penipuan. Itu tidak ada hubungannya dengan algoritma, dan semuanya berkaitan dengan bagaimana perusahaan mendapatkan datanya di tempat pertama.

2. Pikirkan Data Anda

Dunning penuh dengan informasi menarik yang menarik. Setelah memulai dengan "itu logistik, bukan pembelajaran, " katanya, setengah dari gagasan itu adalah "itu data, bukan algoritma." Sebagian besar memastikan algoritma ML Anda memberikan wawasan yang berharga adalah memastikan Anda memberi mereka data yang benar. Dunning berkata, jika Anda tidak mendapatkan hasil yang Anda cari, maka itu lebih sering karena Anda tidak menggunakan data yang benar.

"Orang-orang mendapatkan semua terikat dan ego terikat pada algoritma tertentu, tetapi saat ini, karena alat di luar sana, semua orang dan ibu mereka dapat dan akan datang dengan segala macam algoritma baru, " kata Dunning. "Data jauh lebih penting, dan akan memberi Anda lebih banyak dorongan daripada mengutak-atik algoritme Anda tanpa henti. Jika Anda mengerjakan masalah sulit seperti pengenalan suara atau visi komputer, itu satu hal. Tapi ini adalah bidang yang digerakkan oleh data. Dalam sebagian besar skenario, Anda akan mendapat manfaat lebih banyak dari menyesuaikan data apa yang Anda dapatkan dan mengubah pertanyaan."

Itulah yang dilakukan Dunning pada pertengahan 2000-an ketika membangun mesin rekomendasi video di sebuah perusahaan bernama Veoh Networks. Tim sedang bekerja untuk mengidentifikasi pasangan video yang dibuat pengguna yang diklik lebih dari yang diharapkan orang, tetapi algoritme tidak berfungsi. Mereka berpikir dalam hal musik, di mana pengguna tahu nama artis dan lagu favorit mereka. Jadi mereka mengubah pertanyaan dengan mengutak-atik antarmuka pengguna tanpa menyentuh algoritme itu sendiri.

"Dalam video yang dibuat pengguna, tidak ada yang tahu artis dan banyak video benar-benar memiliki judul spam untuk mendapatkan lebih banyak tampilan. Bersepeda dengan algoritma tweak tidak akan pernah memberi kami hasil yang baik, " kata Dunning. "Apa yang kami lakukan adalah mengubah antarmuka pengguna untuk memancarkan sinyal suar setiap 10 detik. Kami menemukan bahwa jika kami menggunakan suar alih-alih klik untuk data mentah pemberi rekomendasi, kami mendapat hasil yang luar biasa. Lift untuk perubahan satu ini adalah beberapa peningkatan seratus persen dalam keterlibatan karena rekomendasi, tanpa perubahan algoritmik."

3. Algoritma Bukan Peluru Ajaib

Implementasi ML berkembang pada percobaan dan kesalahan terus menerus. Tidak peduli sebagus apa pun algoritme Anda, jika sistem Anda berinteraksi dengan manusia, maka perlu disesuaikan dari waktu ke waktu. Dunning menekankan bahwa bisnis harus secara konstan mengukur efektivitas keseluruhan implementasi mereka, dan mengidentifikasi perubahan dan variabel yang menjadikannya lebih baik dan membuatnya lebih buruk. Ini mungkin terdengar seperti omong kosong, tetapi Dunning berkata, meskipun terdengar jelas, sangat sedikit orang yang melakukan ini atau melakukannya dengan baik.

"Banyak orang ingin menggunakan sistem atau mengambil tindakan, dan mereka ingin algoritma mereka berjalan sempurna selamanya, " kata Dunning. "Tidak ada algoritma yang akan menjadi peluru ajaib. Tidak ada desain antarmuka pengguna yang akan bertahan selamanya. Tidak ada metode pengumpulan data yang tidak akan pernah tergantikan. Semua ini dapat dan akan terjadi, dan bisnis perlu secara cermat mengukur, mengevaluasi, dan mengevaluasi kembali bagaimana mereka sistem bekerja."

4. Gunakan Beragam Toolset

Ada puluhan alat ML yang tersedia, banyak di antaranya dapat Anda gunakan secara gratis. Anda memiliki perpustakaan kerangka kerja open-source yang populer seperti Caffe, H20, Shogun, TensorFlow, dan Torch, dan perpustakaan ML di sejumlah proyek Apache Software Foundation (ASF) termasuk proyek Mahout, Singa, dan Spark. Lalu ada opsi berbasis langganan termasuk Amazon Machine Learning, BigML, dan Microsoft Azure Machine Learning Studio. Microsoft juga memiliki Cognitive Toolkit gratis.

Ada banyak sumber daya yang tersedia. Dunning telah berbicara dengan banyak bisnis, ilmuwan data, dan praktisi ML, dan selalu bertanya kepada mereka berapa banyak kerangka kerja dan alat yang mereka gunakan. Rata-rata, Dunning mengatakan sebagian besar mengatakan mereka menggunakan minimal 5-7 alat dan seringkali jauh lebih banyak.

"Anda tidak dapat terpaku pada satu alat. Anda harus menggunakan beberapa alat, dan dengan demikian, Anda sebaiknya membangun sistem Anda dengan cara yang agnostik, " kata Dunning. "Siapa pun yang mencoba meyakinkan Anda bahwa alat ini adalah satu-satunya yang Anda perlukan adalah menjual barang kepada Anda.

"Sesuatu mungkin terjadi minggu depan yang mengganggu gerobak apel, dan pada tingkat inovasi yang kita lihat, itu akan terus terjadi setidaknya lima hingga 10 tahun lagi, " lanjut Dunning. "Lihatlah contoh pembelajaran murah di mana mungkin Anda menggunakan kembali pengelompokan gambar yang ada untuk menganalisis gambar dalam katalog. Itu pembelajaran mendalam dengan visi komputer dilemparkan. Tapi ada alat di luar sana yang telah mengemas semuanya. Anda perlu untuk mengukur, mengevaluasi, dan bimbang antara berbagai alat, dan infrastruktur Anda perlu menyambutnya."

5. Eksperimen Dengan Pembelajaran Hibrid

Dunning mengatakan Anda juga bisa memadukan pembelajaran yang murah dan mendalam menjadi sesuatu yang hibrida. Misalnya, jika Anda mengambil model visi komputer yang ada dan membangun kembali beberapa lapisan teratas tempat pengambilan keputusan, maka Anda dapat mengkooptasi kerangka kerja yang ada untuk kasus penggunaan yang sama sekali baru. Dunning menunjuk ke sebuah kompetisi Kaggle di mana para kontestan melakukan hal itu; mereka mengambil kumpulan data dan menulis algoritma baru di atas untuk membantu komputer membedakan kucing dari anjing.

"Membedakan kucing dan anjing adalah hal yang sangat halus untuk algoritma ML. Pikirkan logika: Kucing memiliki telinga yang runcing tetapi begitu juga Gembala Jerman. Anjing tidak memiliki bintik, kecuali Dalmatians, dll. Itu bisa sangat sulit untuk dikenali di dan dari dirinya sendiri, "kata Dunning. "Orang yang menang mengembangkan sistem yang melakukan ini dengan akurasi 99 persen. Tapi saya lebih terkesan dengan orang yang berada di urutan ketiga. Alih-alih membangun dari awal, dia mengambil program pengenalan gambar yang ada dari tugas yang berbeda, melepas lapisan atas, dan letakkan penggolong sederhana di sana. Dia memberikan beberapa contoh, dan segera, itu 98 persen akurat dalam membedakan kucing dari anjing. Seluruh proses memakan waktu tiga jam."

6. Murah Tidak Berarti Buruk

Meskipun konotasi jelas, Dunning mengatakan belajar murah tidak berarti belajar buruk. Jumlah waktu yang Anda habiskan untuk implementasi ML tidak secara langsung berkorelasi dengan nilai bisnisnya. Kualitas yang lebih penting, katanya, adalah memastikan prosesnya dapat diulang dan dapat diandalkan. Jika bisnis dapat mencapai itu tanpa menginvestasikan jumlah sumber daya yang tidak semestinya, maka itu semua lebih baik.

"Murah tidak berarti buruk. Jika itu berhasil, itu bekerja. Jika murah dan itu berfungsi, itu bagus. Tapi upaya yang Anda lakukan untuk membangunnya tidak menentukan nilainya. Itu adalah kesalahan jumlah-biaya, " kata Dunning. "Yang menentukan nilainya adalah bagaimana cara meningkatkan bisnis. Jika meningkatkan laba atau mengurangi biaya atau meningkatkan situasi kompetitif Anda. Itu efeknya, bukan upaya."

7. Jangan Menyebutnya AI

Dunning menekankan bahwa, ketika berbicara tentang teknik-teknik ini, bisnis harus menggunakan terminologi yang tepat: ML, visi komputer, atau pembelajaran mendalam. Semua ini cenderung jatuh di bawah payung istilah "kecerdasan buatan" tetapi, bagi Dunning, definisi AI hanyalah "hal-hal yang belum berfungsi."

"Definisi terbaik yang pernah saya dengar untuk AI adalah hal-hal yang belum dapat kami jelaskan. Hal-hal yang belum kami temukan, " kata Dunning. "Setiap kali kita mendapatkan sesuatu untuk bekerja, orang-orang berkata 'Oh, itu bukan AI, itu hanya perangkat lunak. Ini hanya mesin aturan. Ini benar-benar hanya regresi logistik.' Sebelum kita menemukan sesuatu, kita menyebutnya AI. Setelah itu, kita selalu menyebutnya sesuatu yang lain. Dalam banyak hal, AI lebih baik digunakan sebagai kata untuk perbatasan berikutnya, dan dalam AI, akan selalu ada perbatasan berikutnya. AI adalah ke mana kita pergi, bukan ke tempat yang sudah kita capai."

7 Tips untuk keberhasilan pembelajaran mesin