Ravi Sarayogi ikut mendirikan Unifor Software Systems dengan apa yang ia anggap sebagai “masalah terdepan bagi dunia” – menjembatani kesenjangan antara manusia dan mesin melalui suara dan AI.
Unifor adalah pemimpin dalam AI percakapan dan produknya digunakan oleh lebih dari 1.500 pelanggan dan klien di lebih dari 20 negara. Ini adalah salah satu perusahaan asli AI terbesar di dunia dan disebutkan dalam Deloitte Technology Fast 500, peringkat perusahaan teknologi dan telekomunikasi dengan pertumbuhan tercepat di Amerika Utara. Produk mereka menggabungkan AI generatif, AI pengetahuan, AI emosi, dan otomatisasi alur kerja untuk memandu perusahaan dalam menangani pelanggannya. Mereka menghadirkan kemampuan mereka untuk menangkap dan menganalisis data suara, video, dan teks, dan produk mereka dapat melacak dan memantau percakapan melalui analisis niat, sentimen, emosi, dan nada untuk membantu organisasi memanfaatkan data dari percakapan.
Emotion AI Unifor tidak hanya melacak interaksi satu lawan satu, tetapi juga melacak emosi sekelompok besar peserta, seperti di ruang konferensi. Selain analisis wajah, teknologi mereka menganalisis bahasa tubuh, sentimen, saluran belakang dan pembicaraan, temperamen dan nada suara.
Sarogi berbicara kepada indianexpress.com tentang tantangan dan peluang AI percakapan dalam konteks India, bagaimana industri ini berkembang, dan bagaimana AI dapat efektif di lingkungan India. Abstrak yang diedit:
Venkatesh Kannaiah: Bisakah Anda memberi tahu kami secara lebih luas bagaimana AI percakapan digunakan untuk memengaruhi hasil pendidikan dan kesehatan di India?
{dinding pembayaran di sini}
Ravi Sarogi: Anda perlu memahami bahwa AI dalam bentuknya saat ini akan memberikan dampak yang jauh lebih besar terhadap masyarakat dibandingkan inovasi internet, cloud, dan seluler sebelumnya. Apakah hal ini akan berdampak positif atau negatif tergantung pada aturan dan regulasi yang dibuat oleh pemerintah dan masyarakat untuk memantau, mengaudit, dan mengelolanya.
AI Percakapan adalah lapisan di atas AI. Anda harus menyadari bahwa mesin menjadi semakin mampu, dengan jumlah data yang kita masukkan ke dalamnya dan dengan semakin banyaknya data yang siap untuk AI, mesin akan menjadi lebih mampu. Kita manusia perlu berinteraksi dengan mesin ini dan mereka perlu memahami cara kita berinteraksi. Percakapan memiliki tiga bagian, yang pertama adalah masukan, suara atau teks, yang kedua adalah emosi dan makna di balik interaksi yang muncul saat kita menekankan kata-kata yang berbeda. Lapisan berikutnya adalah ekspresi manusia, yang berasal dari video, dan jika kami dapat menangkap semua itu, kami menangkap seluruh nuansa percakapan. Mesin kini telah siap dan mampu memahami komunikasi dalam tiga aspek: bahasa, suara, dan video.
Kami sekarang dapat melacak nada suara, menangkap maksud panggilan atau percakapan pelanggan, menilai keseluruhan emosi penelepon melalui analisis suara, dan jika video tersedia, memantau ekspresi wajah dan mengambil kesimpulan tentang perasaan atau keadaan emosional penelepon. Tambahkan ke data interaksi pelanggan sebelumnya, kami memiliki gambaran lengkap tentang keseluruhan percakapan.
Sekarang, inilah yang dapat dilakukan Unifor secara normal untuk pelanggan perusahaan. Teknologi jenis ini memiliki potensi yang sangat besar di bidang pendidikan dan kesehatan serta dalam menyelesaikan permasalahan sosial lainnya.
Penerapan yang umum adalah selama kelas online, kita dapat memantau perilaku, niat, dan tingkat konsentrasi atau perhatian siswa secara real-time, dan guru dapat lebih fokus pada siswa yang kinerjanya buruk atau mereka yang tidak mengerti. merasa Kita dapat membekali guru dengan pertanyaan dan tanggapan potensial berdasarkan interaksi yang sedang berlangsung, dan bahkan tanpa keterlibatan guru, aplikasi AI dapat memahami pertanyaan dan menjawabnya untuk siswa.
Saat ini dalam telemedis banyak digunakan mesin penerjemah. Ketika seorang pasien mengajukan pertanyaan dalam bahasa ibunya, akan ada terjemahan real-time untuk dokter, yang menjawab dalam bahasanya sendiri dan diberikan kepada pasien. Dengan asumsi kita memiliki sejumlah besar data tentang ekspresi wajah dan sampel suara pasien yang kesakitan atau menderita, kita dapat memuatnya ke dalam aplikasi AI dan dokter akan mendapat informasi lebih baik dan ini akan menjadi alat pendukung pengambilan keputusan utama bagi dokter. Yang kita perlukan adalah sejumlah besar data, baik suara maupun video, untuk dijadikan input. Ini bukanlah skenario yang futuristik, teknologi berkembang pesat dan dalam tiga hingga lima tahun ke depan, mungkin terdapat banyak penerapan.
Venkatesh Kannaiah: Seberapa relevankah teknologi AI percakapan dalam konteks bahasa India?
Ravi Sarogi: Karena bahasa Inggris adalah bahasa yang digunakan untuk membuat sebagian besar aplikasi dan memiliki fokus global, AI percakapan dalam bahasa Inggris sangatlah canggih. Kami menangkap berbagai variasi ucapan dan kami beroperasi di semua pasar berbahasa Inggris. Di antara bahasa-bahasa India, teknologinya sudah matang dalam bahasa Hindi dan Tamil, dan berkembang pesat dalam bahasa-bahasa utama lainnya.
Tantangan bahasa India adalah dialek berubah setiap 100 kilometer dan bahkan dalam dialek yang sama terdapat variasi ekspresi yang luas. Namun ketika kita sampai pada analisis emosional terhadap suara atau ekspresi wajah, kita sedikit tertinggal dari bahasa Inggris, karena pola suara memiliki variasi yang luas dalam situasi kehidupan nyata. Mungkin ada suara yang kurang jelas atau kebisingan latar belakang dan banyak hal lainnya. Namun, semakin banyak data yang kami peroleh dan masukkan, semakin cepat mesin belajar dan semakin baik dari hari ke hari. Ilmu bicara sangat kompleks sehingga kita dapat mempelajarinya selamanya.
Venkatesh Kannaiah: Bisakah Anda memberi tahu kami tentang Emotion AI dan bagaimana hal itu dapat digunakan untuk memberikan dampak? Apa skenario potensial penerapannya di India?
Ravi Sarogi: Model yang kami gunakan merangkum emosi manusia ke dalam enam kategori utama – ketakutan, kemarahan, kebahagiaan, kesedihan, rasa jijik dan kejutan – dan 200 emosi sekunder. Kami melatih AI emosi kami pada model seperti itu untuk menemukan emosi mentah. Dan kami mengeksplorasi seberapa dalam emosi itu mengalir.
Saat ini, bank dan maskapai penerbangan menggunakan beberapa fitur AI emosi. Bagi mereka, ada dua masalah yang perlu dipantau. Hal ini juga digunakan untuk mengetahui seberapa gelisah atau marahnya pelanggan terhadap masalah tertentu dan mengambil tindakan perbaikan dan kedua, untuk memantau bagaimana agen call center berinteraksi dengan pelanggan. Apakah nada, isi dan komunikasi pesan sesuai dan sesuai dengan konteksnya? Inilah yang dicari oleh organisasi.
Namun dalam konteks India, teknologi ini memiliki penerapan yang menarik. Hal ini dapat digunakan untuk memantau interaksi pasien-dokter selama konsultasi pertama untuk menentukan seberapa responsif dokter atau, dalam kasus interaksi siswa-guru, untuk menentukan seberapa tertarik atau responsif siswa dalam memperoleh pengetahuan. Pertanyaan guru kepada siswa. Pada akhirnya, mesin perlu memahami emosi manusia dengan cara yang benar untuk menganalisis dan membantu kita, dan kita perlu mengajarkan hal yang sama.
Venkatesh Kannaiah: Bisakah Anda memberi tahu kami tentang Knowledge AI dan implikasinya dalam konteks Govertech India?
Ravi Sarogi: Pemerintah sangat pandai dalam membangun platform besar bagi warganya. Jika Anda melihat pemerintah sebagai sebuah perusahaan, pemerintah mempunyai banyak sekali data seperti data Aadhaar atau pendidikan, kesehatan, lalu lintas, dan pemetaan. Teknologi ini dapat mengatur infrastruktur pemrosesan inti, menyelaraskan seluruh tumpukan data yang ada, mengaktifkan AI pengetahuan di atasnya, menyiapkan AI data, dan membukanya bagi universitas dan startup untuk membangun aplikasi dan model bahasa besar. Dengan kemampuan AI generatif. Hal ini dapat membantu menciptakan aplikasi yang berhubungan dengan masyarakat dengan cara yang lebih terkalibrasi, baik itu data lalu lintas, perencanaan kota, atau membantu menghubungkan pasien dan dokter dengan cara yang lebih mendukung AI. Aplikasi semacam itu dapat membantu berbagai pemangku kepentingan seperti petani, pelajar, dan pasien.
Venkatesh Kannaiah: Apakah Anda bekerja dengan pemerintah di India?
Ravi Sarogi: Bekerja sama dengan IIT Madras, kami bekerja sama dengan Pemerintah Tamil Nadu untuk mengembangkan aplikasi guna memberikan informasi kepada petani mengenai praktik pertanian, bencana alam, harga, ketersediaan peralatan pertanian, dan harga benih serta input pertanian. Program ini telah menjangkau sekitar 40 lakh petani. Kami telah bekerja sama dengan Komisi Pemilihan Tamil Nadu untuk memberikan informasi kepada pemilih.
Venkatesh Kannaiah: Apa yang Benar dan Apa yang Salah dalam Ekosistem AI India?
Ravi Sarogi: Pemerintah pusat dan negara bagian bersifat proaktif. India telah menyusun pedoman tentang penggunaan AI. Mereka banyak berinvestasi dan memandang AI dengan cara positif dan pikiran terbuka. Mereka juga berharap hal ini akan membantu memecahkan masalah sosial yang lebih besar. Ada juga fokus pada inkubator dan akselerator. Jadi secara keseluruhan, ini merupakan pertanda positif bagi startup dan pengusaha berbasis AI.