Rumah Berpikir ke depan Asisten yang cerdas: apa yang muncul setelah siri?

Asisten yang cerdas: apa yang muncul setelah siri?

Video: Secanggih Apa SIRI di iPhone ? | Berasa Punya Asisten Pribadi (Desember 2024)

Video: Secanggih Apa SIRI di iPhone ? | Berasa Punya Asisten Pribadi (Desember 2024)
Anonim

Asisten Cerdas - Siri, Google Now, Cortana dan sejenisnya - telah beralih dari keingintahuan dan trik salon beberapa tahun yang lalu ke alat-alat penting yang digunakan banyak orang dalam kehidupan sehari-hari mereka. Pekan lalu, saya turun oleh Intelligent Assistants Conference di New York, yang disajikan oleh Opus Research, dan terkesan dengan kemajuan yang dibuat perangkat lunak di berbagai industri, termasuk kemajuan keuangan, asuransi, dan perusahaan medis dalam membangun agen khusus.

Pendiri Opus Research Dan Miller menjelaskan bahwa banyak teknologi inti, seperti pengenalan ucapan, telah ada selama lebih dari 20 tahun. Meskipun baru-baru ini dia melihat beberapa peningkatan besar, alih-alih revolusi, dia berkata "kita berada di jalur evolusi, " dengan banyak produk dalam rangkaian dengan kemampuan berbeda. Dia mencatat bahwa ada ratusan asisten cerdas perusahaan yang dapat digunakan untuk percakapan sederhana berbasis teks dalam bahasa Inggris menggunakan seperangkat data tetap, dan untuk hal-hal seperti menavigasi situs web atau FAQ. Di ujung lain dari spektrum, mungkin hanya ada beberapa lusin "aplikasi yang dinamis, perasaan manusia" yang lebih percakapan dan sadar konteks.

Miller menunjuk ke aplikasi yang memenangkan penghargaan di konferensi. Julie Amtrak dimulai sebagai agen layanan telepon respons suara interaktif bertahun-tahun yang lalu, tetapi sekarang telah berkembang menjadi agen yang berfungsi di situs web untuk memandu wisatawan melalui Amtrak.com, berdasarkan agen dari Next IT. Telefonica Mexico memiliki agen bernama Nico yang memiliki avatar dan juga menyediakan dukungan melalui Twitter dan Facebook, berdasarkan platform AgentBot. ING Netherlands memiliki Inge, sebuah aplikasi yang memungkinkan Anda memeriksa saldo rekening bank Anda atau mentransfer uang melalui suara, menggunakan teknologi biometrik suara dari Nuance, untuk mengautentikasi identitas Anda.

Sebutan yang terhormat mencakup aplikasi perawatan kesehatan, seperti aplikasi yang membantu Anda memilih paket perawatan kesehatan. Aplikasi lain yang saya dengar di acara itu termasuk Domino's Pizza, yang memiliki aplikasi bernama Dom yang memungkinkan Anda menggunakan suara untuk memesan pizza; dan BMW, yang memiliki agen virtual sebagai bagian dari lengan pembiayaan otomatis Up2drive-nya.

Brett Beraneck dari Nuance berbicara tentang bagaimana kemajuan dalam jaringan saraf pembelajaran yang mendalam telah meningkatkan hal-hal seperti pemahaman bahasa alami serta pengenalan suara, dan bagaimana ini sekarang disatukan untuk memungkinkan lebih banyak minat di bidang ini. Asisten Nina Nuance adalah contoh awal, dan sejak itu telah berkembang ke banyak aplikasi spesifik, mulai dari sistem respons suara interaktif di perusahaan asuransi hingga aplikasi belanja. Masing-masing aplikasi ini memiliki kepribadian yang berbeda, tergantung pada apa yang ia coba bantu Anda lakukan.

Salah satu fitur baru yang ia diskusikan adalah biometrik suara, di mana suara Anda menggantikan kata sandi. Dia berbicara tentang bagaimana perusahaan seperti ING di Eropa mengembangkan agen yang tidak hanya menggunakan pengenalan suara dan pemrosesan bahasa alami, tetapi juga mulai menggunakan suara untuk mengenali orang yang menelepon. Dia mengatakan ini lebih aman dan lebih alami daripada kata sandi tradisional.

Sementara studi baru-baru ini khawatir bahwa rekaman suara dapat menipu sistem seperti itu, Nuance mencatat bahwa teknologi saat ini mencakup fitur yang bertujuan untuk mengambil anomali dari suara yang direkam dan menunjuk ke studi lain yang mengambil sudut pandang yang berbeda. Selain itu, katanya, desainer dapat menggunakan berbagai tingkat biometrik suara untuk fungsi yang berbeda, seperti menggunakan pengakuan sederhana untuk memeriksa saldo akun, atau meminta Anda mengulangi urutan kata acak untuk transfer uang yang signifikan.

Biometrik suara tampaknya agak mendapat daya tarik. Pada Simposium Gartner pekan lalu, sesi tentang "kasus pelanggan keren" dalam layanan keuangan termasuk aplikasi Citibank yang menggunakan fitur ini.

MyWave memiliki asisten bernama Frank yang dimaksudkan untuk diaktifkan oleh banyak bisnis agar Anda dapat berinteraksi dengan mereka dengan cara yang lebih banyak bicara, daripada meminta masing-masing bisnis mengembangkan sendiri. Penggunaan pertama termasuk bank Selandia Baru dan aplikasi bernama Saveawatt yang dirancang untuk membantu Anda memilih penyedia listrik Anda.

CEO Geraldine McBride menjelaskan bahwa perusahaan sedang mencoba untuk membuat asisten yang menjembatani kesenjangan antara pelanggan dan aplikasi layanan, dengan apa yang disebutnya "hubungan yang dikelola pelanggan" atau CMR, putaran pada aplikasi CRM tradisional. Satu perbedaan besar, katanya, adalah bahwa pelanggan bertanggung jawab atas semua datanya, bukan bisnis.

Perusahaan lain yang relatif baru, Expect Labs memiliki produk bernama MindMeld yang berfungsi sebagai pendukung sejumlah perusahaan yang ingin menawarkan antarmuka suara untuk menggantikan antarmuka tradisional dan menangani pertanyaan dan jawaban. Ini dapat digunakan untuk berbagai aplikasi, seperti menonton acara TV hanya dengan menanyakan nama dan memiliki sistem yang menanyakan beberapa sistem. (Fire TV Amazon memiliki beberapa fitur ini, tetapi tidak terintegrasi dengan set-top box kabel Anda, sementara salah satu investor di Expect Labs adalah perusahaan kabel Liberty Global.)

CEO Tim Tuttle menjelaskan bahwa MindMeld cenderung menggunakan pengenalan ucapan yang sudah tersedia di sebagian besar perangkat dan sebaliknya berfokus pada pemahaman bahasa alami dan membangun grafik pengetahuan dari informasi yang tersedia. Dia mengatakan perusahaan berusaha untuk skala sistem untuk memasukkan lebih banyak informasi dari berbagai sumber, dan untuk memecah hierarki kategori informasi yang berbeda yang merupakan bagian dari sebagian besar sistem tersebut. Benar-benar memahami pertanyaan berarti mampu memahami maksud di berbagai kategori, katanya.

Satu hal yang saya dengar dari sejumlah peserta adalah statistik menunjukkan bahwa sekitar 10 persen dari semua pencarian Web sekarang dilakukan melalui agen intelijen. (Pelopor AI Andrew Ng mengatakan ini benar untuk pencarian suara di Baidu tahun lalu dan beberapa orang mengatakan ini juga berlaku di Google, tetapi saya belum pernah mendengar konfirmasi langsung dari siapa pun.)

Ke depan, Miller dari Opus Research mengatakan masih banyak pekerjaan yang harus dilakukan. Keakuratan dasar sistem memiliki banyak ruang untuk perbaikan, terutama dalam bergerak dari apa yang Anda katakan ke apa yang Anda maksudkan dengan apa yang harus dilakukan sebagai hasilnya. Dia menyebutkan pembicaraan dari CEO Xerox PARC Stephen Hoover di konferensi, yang mengatakan bahwa sistem saat ini hingga 90 persen akurat dalam memahami apa yang kita maksudkan, tetapi 10 persen masih menjadi masalah karena itulah yang kebanyakan orang ingat ketika berhadapan dengan sebuah sistem. Dan Miller mengatakan ada ruang untuk personalisasi yang lebih baik, karena jika sistem tahu dengan siapa ia berbicara, itu dapat memberikan hasil yang lebih baik. Misalnya, ia mencatat bahwa Facebook tahu siapa yang menggunakan sistem karena Anda masuk; dan mengatakan bahwa melakukan hal ini secara mulus dengan lebih banyak agen akan menjadi lebih penting.

Ini tentu saja kategori yang menarik, dan saya berharap kita semua akan menghabiskan lebih banyak waktu berbicara dengan ponsel dan komputer kita, dan berinteraksi dengan agen yang bukan manusia. Saya menemukan ini salah satu tren paling menarik dalam komputasi hari ini.

Asisten yang cerdas: apa yang muncul setelah siri?