Video: The 2020 Voice Assistant Battle. (Desember 2024)
Melihat keynote dari Apple Worldwide Developer Conference minggu ini, dan dari konferensi I / O Google dua minggu lalu, yang paling menonjol bagi saya adalah upaya yang dilakukan oleh kedua perusahaan - juga Microsoft - untuk menciptakan sistem cerdas yang tahu sebisa mungkin tentang Anda.
Sistem seperti itu tahu siapa Anda, di mana Anda berada, dan semua informasi di layar Anda, umumnya dengan tujuan bertindak sebagai "asisten pribadi" yang mengantisipasi kebutuhan Anda. Ini adalah tujuan yang sangat ambisius yang tampaknya dipahami oleh salah satu dari perusahaan ini mungkin merupakan langkah besar berikutnya dalam komputasi.
Dalam kasus Apple dan Google, penawaran lain yang diumumkan pada ceramah mereka mungkin mendapatkan lebih banyak perhatian, atau mungkin memiliki dampak jangka pendek yang lebih terlihat. Foto Google mendapat banyak perhatian; baik Apple Pay dan Android Pay tampaknya berada di ambang semakin umum, dan peningkatan Android Wear dan WatchOS mungkin pertanda curahan aplikasi untuk produk yang dapat dikenakan. Tetapi pergerakan ke sistem total yang lebih cerdas dan lebih komprehensif mungkin ternyata memiliki dampak jangka panjang terbesar.
Apple, Google, dan Microsoft semuanya datang dari sudut yang berbeda. Tetapi mereka tampaknya berkumpul pada sistem yang memiliki front-end seluler yang dapat dikontrol dengan mengetik atau suara, didukung dengan serangkaian layanan dan proses berbasis Internet yang berisi sejumlah besar data tentang Anda, dan membuat kesimpulan berdasarkan data itu dan apa yang Anda lakukan.
Jalan menuju konvergensi ini telah diaspal oleh sejumlah perkenalan dalam beberapa tahun terakhir. Banyak yang telah mengerjakan asisten pribadi selama bertahun-tahun, dan Siri pada awalnya dikembangkan sebagai aplikasi mandiri oleh spin-off dari SRI International. Pada tahun 2011, Apple memperkenalkan Siri sebagai "asisten virtual" dengan iPhone 4s, sebagian besar bertindak sebagai ujung depan untuk hal-hal seperti pencarian Web, cuaca lokal, dan tampilan restoran. Pada 2012, Google memperkenalkan Google Now sebagai bagian dari Android 4.1 Jelly Bean, menyampaikan informasi tentang serangkaian "kartu" yang menjawab pertanyaan. Seiring waktu, ini tumbuh untuk memberikan lebih banyak informasi dan mencakup lebih banyak domain.
Pada awalnya, saya pikir keduanya menarik, tetapi kontrol suara sepertinya lebih dari "trik ruang tamu" daripada aplikasi yang berguna.
Tetapi selama beberapa tahun terakhir, keduanya telah meningkat dengan cepat. Sebagian memiliki lebih banyak pengguna memberi kedua perusahaan lebih banyak data untuk dikerjakan. Ini, dikombinasikan dengan algoritma yang lebih cerdas dan banyak pekerjaan pada pemrosesan server, menghasilkan sistem yang sekarang jauh lebih akurat dalam memahami apa yang Anda minta daripada saat diluncurkan. Keduanya sekarang dapat menjawab pertanyaan di lebih banyak domain. Dan Google Now dapat menyimpulkan informasi seperti di mana rumah dan kantor Anda didasarkan pada lokasi khas Anda.
Microsoft memperkenalkan Cortana tahun lalu sebagai bagian dari rilis Windows Phone 8.1, menggambarkannya sebagai "asisten digital" pertama yang benar-benar pribadi karena ia lebih memahami apa yang Anda lakukan dalam aplikasi lain selain pencarian Web. Itu bisa melakukan hal-hal seperti mengatur pengingat dan memahami siapa yang penting bagi Anda dan siapa yang tidak, dan sementara tidak ada banyak pengguna, itu juga tampaknya telah meningkat selama beberapa tahun terakhir. Cortana sekarang akan menjadi bagian dari Windows 10 di desktop dan laptop juga.
Ini membawa kita ke pengumuman yang lebih baru, di mana ketiga vendor tampaknya meminjam fitur dari yang lain, dan benar-benar berusaha untuk meningkatkan penawaran mereka.
Google Now On Tap
Di Google I / O beberapa minggu yang lalu, Wakil Presiden Senior Google Sundar Pichai berbicara tentang bagaimana perusahaan terus fokus pada pencarian. Tetapi ketika datang ke fitur di Android versi terbaru, yang menarik perhatian saya adalah set fitur baru untuk asisten pribadi Google Now yang disebut "Now on Tap."
Pichai berbicara tentang investasi Google dalam pembelajaran mendalam dan pembelajaran mesin, dengan mengatakan hal itu telah membantu Google mengurangi tingkat kesalahan kata dalam pengakuan pidatonya dari 23 persen menjadi 8 persen pada tahun lalu.
Google Now sudah memiliki beberapa fitur kontekstual - misalnya, ia tahu di mana Anda berada, sehingga dapat memperkirakan waktu yang dibutuhkan untuk pulang, dan dapat menampilkan ini di berbagai "kartu" yang digunakannya untuk menampilkan informasi atau dalam pemberitahuan.
Tetapi Aparna Chennapragada, Direktur Google Now, mengatakan, "Kami bertanya pada diri sendiri bagaimana kami bisa mendapatkan jawaban cepat untuk pertanyaan cepat tanpa meninggalkan konteks, Bagaimana kami dapat membantu Anda menyelesaikan pekerjaan dalam langkah sesedikit mungkin?" Hasilnya, katanya, adalah layanan baru untuk membantu Anda "pada saat" tidak peduli apa yang Anda lakukan di telepon. Ini Now On Tap, dan dia mengatakan ini menggabungkan Grafik Pengetahuan Google - pemahamannya terhadap lebih dari 1 miliar entitas (seperti tim baseball dan pompa bensin) -dengan konteks dan koneksi dengan aplikasi lain untuk memberi Anda informasi secara proaktif.
Dalam demonstrasi yang ditunjukkannya, dia mendapat pesan di dalam aplikasi yang menyarankan restoran untuk makan malam dan memintanya untuk mengambil dry cleaning. Menekan dan menahan tombol home memunculkan kartu Google Now, dan fitur Now on Tap menarik informasi dasar tentang restoran, termasuk tautan ke peta navigasi, Yelp, dan OpenTable; itu juga mengatur pengingat tentang dry cleaning. Mengetuk tautan OpenTable membuka aplikasi, tetapi lebih mengesankan membukanya langsung ke halaman restoran itu.
Idenya adalah bahwa OS sekarang memahami konteks di mana Anda berada dan apa yang telah Anda lakukan pada perangkat lainnya. Contoh lain adalah bahwa jika Anda mendengarkan musik, Anda bisa menahan tombol home dan mengajukan pertanyaan tentang lagu tersebut. Google Now akan tahu lagu apa yang sedang diputar, dan kemudian dapat menjawab pertanyaan tentangnya.
"Anda bisa mendapatkan informasi secara instan, " kata Chennapragada. "Dalam semua contoh ini - artikel yang Anda baca, musik yang Anda dengarkan, pesan yang Anda balas - kuncinya adalah memahami konteks saat itu. Setelah Sekarang memiliki pemahaman itu, ia dapat memberi Anda jawaban cepat untuk pertanyaan cepat, membantu Anda menyelesaikan sesuatu di mana pun Anda berada di telepon."
Apple Menekan Kecerdasan
Pada intinya WWDC pada hari Senin, Apple membahas sejumlah perubahan yang datang di iOS 9, tetapi memimpin dengan konsep "intelijen."
Craig Federighi, wakil presiden senior Apple untuk rekayasa perangkat lunak, berbicara tentang menjadikan Siri sebagai "asisten proaktif" yang dapat melakukan hal-hal seperti mengingatkan Anda tentang tugas tertentu atau tautan khusus di peramban pada waktu tertentu atau ketika Anda tiba di lokasi tertentu. Misalnya, jika Anda menerima pesan teks tentang acara yang akan datang, Anda dapat memberi tahu Siri untuk "mengingatkan saya tentang ini" dan itu akan memahami bahwa Anda merujuk ke acara tersebut dan mengatur pengingat. Itu dapat melakukan hal-hal seperti secara otomatis menambahkan undangan dalam pesan teks ke kalender Anda.
Ia dapat mengingat aplikasi yang cenderung Anda gunakan pada waktu tertentu, dan menyajikannya kepada Anda dalam ikon sederhana, dan sekarang menambahkan "kartu deskriptif" yang memberi Anda lebih banyak informasi tentang hasil pencarian (yang terlihat mirip dalam konsep ke kartu di Google Now).
Dan umumnya sepertinya sudah membaik. Federighi mengatakan Apple telah melihat penurunan 40 persen dalam tingkat kesalahan kata selama tahun lalu menjadi 5 persen. Dan lebih pintar tentang berurusan dengan hal-hal dalam sistem itu sendiri, sekarang dapat menanggapi pertanyaan bahasa alami seperti "tunjukkan foto dari Utah Agustus lalu."
Yang paling menarik, ia menawarkan API untuk pencarian, sehingga dapat menemukan konten di aplikasi. Misalnya, ia berbicara tentang dapat menghubungkan jauh ke dalam aplikasi Airbnb untuk menemukan persewaan yang tersedia di area tertentu; atau mencari informasi tentang resep di aplikasi lain.
Dalam sebuah demo, ia memamerkan layar pencarian baru yang Anda dapat dengan menggesek langsung dari layar beranda, dan bagaimana sistem itu sendiri membuat saran tentang siapa yang ingin Anda hubungi, berdasarkan kontak yang paling sering Anda kunjungi dan pada acara mendatang. Dia menunjukkan bagaimana itu kemudian dapat "tautan dalam" ke aplikasi spesifik untuk membawa Anda lebih banyak informasi. Fitur serupa tersedia di Siri.
Satu hal yang ditekankan Apple adalah privasi, dengan Federighi mengatakan, "Kami dapat menghadirkan kecerdasan sepanjang pengalaman di iOS 9, tetapi kami melakukannya dengan cara yang tidak mengganggu privasi Anda." Dalam apa yang terdengar seperti penggalian pada model berbasis iklan Google, ia mengatakan Apple tidak menambang foto, email, foto, atau informasi cloud Anda. Dia mengatakan semua informasi dilakukan pada perangkat dan tetap pada perangkat di bawah kendali Anda, dan ketika sistem harus mengirim informasi ke cloud untuk melakukan pencarian atau mencari lalu lintas, ia melakukannya secara anonim tanpa informasi yang dibagikan kepada pihak ketiga. "Kamu memegang kendali, " katanya.
Platform Cortana Going Cross
Anda dapat berargumen bahwa Microsoft memiliki keunggulan dalam menyediakan banyak fitur asisten pribadi dengan asisten Cortana untuk Windows Phone. Itu adalah yang pertama dari tiga asisten telepon besar yang mencoba bertindak seperti asisten nyata, dalam hal penjadwalan pengingat dan mengintegrasikan lebih dalam dengan beberapa aplikasi telepon.
Cortana adalah bagian dari Windows 10 pada desktop dan notebook juga. Baru-baru ini, Microsoft mengumumkan bahwa versi Cortana akan datang ke ponsel iOS dan Android bersama dengan aplikasi "Phone Companion" yang menghubungkan PC Anda ke Cortana, sehingga Anda dapat memulai tugas di satu perangkat dan menyelesaikannya di yang lain.
Seperti yang dijelaskan oleh Joe Belfiore dari Microsoft, "Anda dapat meminta Cortana mengingatkan Anda untuk mengambil susu saat berikutnya Anda berada di toko kelontong, dan kemudian ponsel Anda akan bangun dan sibuk dengan pengingatnya. Anda akan dapat melacak penerbangan menggunakan Cortana di ponsel dan PC Anda, dan dapatkan pembaruan di perangkat tempat Anda berada sehingga Anda tidak ketinggalan apa pun."
Kesimpulan
Dalam banyak hal, kami mendengar ketiga perusahaan bergerak bersama, khususnya dalam upaya "proaktif". Google dan Apple mengatakan alat mereka akan lebih "proaktif, " menggunakan istilah untuk menggambarkan bagaimana mereka ingin asisten pribadi mereka setidaknya muncul seolah-olah mereka dapat mengantisipasi apa yang akan Anda cari.
Ketiganya berfokus pada koneksi yang lebih baik dengan aplikasi lain di sistem Anda, dengan Apple dan Google mengumumkan fokus pada "tautan dalam". Secara khusus, mereka ingin menautkan ke hal-hal dalam aplikasi, seperti pergi ke layar yang benar di OpenTable untuk memesan tabel. Di I / O, wakil presiden teknik untuk Android Dave Burke menunjukkan bagaimana Android M sekarang memiliki cara yang lebih baik untuk tautan dari tautan di email atau situs web ke tempat yang tepat dalam suatu aplikasi, tanpa layar "disambiguasi" saat ini.
Hasil dari semua ini adalah pengaburan garis antara sistem operasi dan aplikasi yang berjalan di atasnya, untuk memberikan pengalaman yang lebih mulus dan sistem yang benar-benar tahu lebih banyak tentang Anda.
Semua itu seharusnya cukup bermanfaat. Tetapi karena berbagai alasan, semua ini bisa menakutkan juga. Terlalu mudah untuk membayangkan kemungkinan penyalahgunaan data, apakah hanya untuk pemasaran yang terlalu bersemangat atau untuk pelanggaran privasi yang nyata. Saya ingin tahu bagaimana masing-masing perusahaan akan mengatasi ini. Saya ingin tahu apakah salah satu alasan Google belum menyebut layanannya sebagai "asisten pribadi" adalah karena kedengarannya agak mengecewakan dari sebuah perusahaan yang model bisnis utamanya berorientasi pada pengumpulan data tentang orang-orang dan menggunakannya untuk target yang lebih baik.
Ini juga mudah untuk melebih-lebihkan kemampuan sistem ini. Konsep mesin yang serba tahu dan serba bisa menakutkan, tapi saya tidak khawatir tentang sistem ini yang mengembangkan "AI kuat" dalam arti The Terminator 's Skynet atau 2001: A Space Odyssey 's HAL kapan saja dalam waktu dekat. Seperti yang dikatakan oleh salah satu peserta di panel baru-baru ini saya hadir mengatakan, "Pikirkan Jarvis, bukan HAL" - berbicara tentang intelijen yang membantu yang dikenakan dalam film Iron Man, yang bertentangan dengan mesin pembunuh dari tahun 2001. Selama beberapa tahun ke depan, pertanyaannya bukan apakah sistem ini terlalu cerdas, tetapi apakah mereka akan cukup pintar untuk benar-benar berguna atau kita akan mendapati diri kita menggunakannya hanya sebagai ujung-depan untuk pencarian Web.
Tentu saja, iblis ada dalam perinciannya, dan kita tidak akan benar-benar tahu seberapa baik sistem mana pun bekerja sampai versi baru dikirimkan. Sementara pengenalan suara membaik, memperluas ini ke domain baru menyebabkan lebih banyak tantangan. Dan saya tidak jelas tentang seberapa baik pekerjaan yang akan dilakukan sistem dengan membiarkan Anda memilih layanan yang ingin Anda gunakan sebagai lawan default ke Apple atau layanan Google sendiri.
Tetapi konsep keseluruhannya jelas dan utilitasnya bisa luar biasa. Jika digunakan dengan benar, layanan seperti itu seharusnya membuat perangkat kami terasa lebih mudah digunakan, lebih cerdas, dan lebih personal. Mereka akan memiliki tantangan dan akan menimbulkan beberapa kekhawatiran, tetapi saya duga mereka akan melakukan lebih banyak untuk mengubah cara kita berinteraksi dengan perangkat kita daripada apa pun sejak layar sentuh.