Rumah Pendapat Ai (juga) adalah kekuatan untuk kebaikan | ben dickson

Ai (juga) adalah kekuatan untuk kebaikan | ben dickson

Daftar Isi:

Video: Eksperimen Pikiran tentang Batas Kecerdasan Buatan (AI) (Oktober 2024)

Video: Eksperimen Pikiran tentang Batas Kecerdasan Buatan (AI) (Oktober 2024)
Anonim

Pada 2017, Amyotrophic Lateral Sclerosis (ALS), gangguan neurologis yang menghancurkan, merampok Pat Quinn, pendiri Ice Bucket Challenge yang terkenal, karena kemampuannya untuk berbicara.

Pada 2018, kecerdasan buatan membantunya mendapatkannya kembali.

Berkat kemajuan dalam pembelajaran mesin dan pembelajaran yang mendalam, algoritma kecerdasan buatan telah menjadi sangat baik dalam meniru manusia. Tetapi sementara banyak perkembangan terkemuka di ruang telah negatif, kekuatan imitasi AI adalah kekuatan perubahan positif untuk Quinn.

"Kebanyakan orang yang hidup dengan ALS (juga dikenal sebagai penyakit neuron motorik) akhirnya lumpuh dan tidak dapat berkomunikasi dengan apa pun selain suara 'komputer' buatan, " kata Oskar Westerdal, salah seorang pendiri Project Revoice, sebuah inisiatif yang bertujuan untuk membantu pasien ALS seperti Quinn.

Untuk membuat ulang suara Quinn, Project Revoice berkolaborasi dengan Lyrebird, salah satu dari segelintir perusahaan yang menggunakan AI untuk mengkloning suara seseorang - grup yang juga menyertakan Google WaveNet dan Voicery, startup yang didukung oleh Y Combinator yang menggunakan AI untuk membuat rekaman suara yang disintesis.

Bagaimana Deep Learning Menghasilkan Suara Manusia

Di belakang aplikasi ini adalah algoritma pembelajaran mendalam, cabang AI populer yang meneliti sekumpulan besar data untuk wawasan dan pola yang tidak dapat ditangkap dengan perangkat lunak tradisional berbasis aturan. Ketika Anda melatih synthesizer suara pembelajaran mendalam dengan rekaman suara yang cukup, itu menciptakan model digital yang mewakili suara orang dan dapat menghasilkan sampel suara baru.

Sebelum munculnya teknologi sintesis suara AI, pasien ALS harus menggunakan suara digital umum yang bukan milik mereka. Teknologi lain dapat menyatukan kalimat yang sudah direkam sebelumnya dengan suara pasien, tetapi hasilnya terlalu artifisial dan membutuhkan puluhan jam rekaman suara agar penggunaannya minimal.

Aplikasi deep-learning, di sisi lain, membutuhkan lebih sedikit data dan memberikan hasil yang lebih baik. "Apa yang dapat dicapai Lyrebird hanya dengan beberapa jam audio luar biasa - memberi orang klon suara digital yang lengkap, sehingga mereka dapat mengatakan apa pun yang mereka inginkan, " kata Westerdal.

Menciptakan Suara Orang yang Tidak Bersuara

Salah satu batasan aplikasi pembelajaran mendalam adalah ketergantungan mereka pada sampel data berkualitas tinggi untuk melatih jaringan saraf mereka. Masalah dengan pasien ALS adalah bahwa begitu mereka kehilangan suara, merekam sampel suara tidak mungkin. Untungnya, Quinn memiliki jam keynotes dan wawancara yang direkam.

"Tantangan terbesar adalah kualitas. Teknologi ini sepenuhnya bergantung pada memiliki rekaman yang konsisten dan berkualitas tinggi yang juga mengikuti skrip yang tepat - jadi kami harus bekerja dengan studio suara untuk 'remaster' secara manual dan menyalin setiap dialog yang dapat kami temukan Pat, "kata Westerdal.

"Kami agak takut bahwa kami tidak akan dapat memberikan kualitas yang hebat untuk menciptakan suara Pat, " kata Jose Sotelo, salah seorang pendiri Lyrebird. "Karena kita tidak bisa mendapatkan rekaman yang bersih, kualitas akhir dari suara buatan itu tidak sempurna. Kami pikir kami bisa melakukan pekerjaan yang lebih baik dengan rekaman yang bersih."

Hasilnya masih terdengar agak tidak alami dan sintetis. Tetapi bagi Quinn, yang telah menggunakan suara generik untuk berkomunikasi, perbedaannya sangat dramatis. "Setelah mendengar suara saya melalui teknologi baru ini, saya terpesona! Agar para pasien tahu bahwa mereka dapat memiliki suara mereka sendiri setelah ALS mengambilnya, itu akan mengubah cara orang hidup dengan ALS, " katanya.

Quinn merekomendasikan agar pasien ALS merekam suara mereka sebelum terlambat. "Setelah mendengar suara saya sendiri lagi, saya perlu pasien ALS untuk tahu merekam suara mereka sangat penting, " katanya.

Menyeimbangkan Penggunaan Negatif dari Synthesizer AI

Awal tahun ini, FakeApp, aplikasi bertukar muka yang didukung oleh AI, memicu gempuran video porno palsu yang menampilkan selebritas dan politisi. Ada kekhawatiran bahwa aplikasi seperti FakeApp dan Lyrebird akan mengantarkan era baru berita palsu, penipuan, dan pemalsuan.

Halaman etika di situs web Lyrebird sebelumnya mengakui bahwa teknologi itu "berpotensi memiliki konsekuensi berbahaya seperti diplomat yang menyesatkan, penipuan, dan lebih umum masalah apa pun yang disebabkan oleh pencurian identitas orang lain."

Untuk mengatasinya, situs web perusahaan menampilkan beberapa rekaman disintesis yang dibuat dengan suara Donald Trump dan Barack Obama.

@realDonaldTrump https://t.co/N6DRPdEGPT pic.twitter.com/G30DvmQNdk

- Lyrebird AI (@LyrebirdAi) 4 September 2017

Cerita Quinn mungkin membantu menjelaskan aspek-aspek positif dari suatu industri yang telah mengambil risiko untuk penggunaan aplikasi yang berpotensi menyeramkan dan tidak etis. "Sangat penting bagi orang untuk menyadari sisi positif dari teknologi ini, " Sotelo mengingatkan Lyrebird.

Selain dari penggunaan medis, aplikasi AI synthesizer dapat melayani tujuan produktif lainnya. Voicery menyediakan merek dengan suara digital khusus yang didukung oleh algoritma AI. Google juga bereksperimen dengan WaveNet untuk memberikan pengalaman yang lebih alami kepada pengguna perangkat yang didukung Google Assistant. Area lain di mana teknologi ini berguna termasuk mengotomatisasi buku audio atau membuat sulih suara dalam film menjadi lebih mudah.

Rintangan etika dan hukum tidak diragukan lagi akan muncul dan perdebatan akan terus berlanjut. Tapi bagi Quinn, AI adalah kekuatan untuk kebaikan. "Aku tidak ingin terdengar seperti komputer, " katanya. "Aku ingin terdengar seperti aku."

Ai (juga) adalah kekuatan untuk kebaikan | ben dickson