
Paten yang baru-baru ini diajukan oleh Google menguraikan bagaimana asisten AI dapat menggunakan setidaknya lima sinyal kontekstual dunia nyata, termasuk mengidentifikasi maksud terkait, untuk memengaruhi jawaban dan menghasilkan dialog alami. Ini adalah contoh bagaimana pencarian yang dibantu AI memodifikasi respons untuk melibatkan pengguna dengan pertanyaan dan dialog yang relevan secara kontekstual, yang berkembang melampaui sistem berbasis kata kunci.
Paten tersebut menjelaskan sistem yang menghasilkan dialog dan jawaban yang relevan menggunakan sinyal seperti konteks lingkungan, maksud dialog, data pengguna, dan riwayat percakapan. Faktor-faktor ini melampaui penggunaan data semantik dalam kueri pengguna dan menunjukkan bagaimana pencarian yang dibantu AI bergerak menuju interaksi yang lebih alami dan mirip manusia.
Secara umum, tujuan pengajuan paten adalah untuk memperoleh perlindungan hukum dan eksklusivitas atas suatu penemuan dan tindakan pengajuan tidak menunjukkan bahwa Google benar-benar menggunakannya.
Paten tersebut menggunakan contoh dialog lisan tetapi juga menyatakan bahwa penemuan tersebut tidak terbatas pada masukan audio:
“Yang perlu diperhatikan, selama sesi dialog tertentu, pengguna dapat berinteraksi dengan asisten otomatis menggunakan berbagai modalitas masukan, termasuk, namun tidak terbatas pada, masukan lisan, masukan ketik, dan/atau masukan sentuh.”
Nama patennya adalah, Menggunakan Model Bahasa Besar dalam Menghasilkan Respons Asisten Otomatis . Paten ini berlaku untuk berbagai asisten AI yang menerima masukan melalui konteks ketikan, sentuhan, dan ucapan.
Ada lima faktor yang mempengaruhi respons LLM yang dimodifikasi:
- Waktu, Lokasi, dan Konteks Lingkungan
- Konteks Spesifik Pengguna
- Maksud Dialog & Interaksi Sebelumnya
- Input (teks, sentuhan, dan ucapan)
- Konteks Sistem & Perangkat
Empat faktor pertama memengaruhi jawaban yang diberikan asisten otomatis dan faktor kelima menentukan apakah akan mematikan bagian bantuan LLM dan kembali ke jawaban AI standar.
Waktu, Lokasi, Dan Lingkungan
Ada tiga faktor kontekstual: waktu, lokasi, dan lingkungan yang menyediakan konteks yang tidak ada dalam kata kunci dan memengaruhi cara asisten AI merespons. Meskipun faktor kontekstual ini, seperti yang dijelaskan dalam paten, tidak sepenuhnya terkait dengan Ringkasan AI atau Mode AI, faktor-faktor tersebut menunjukkan bagaimana interaksi yang dibantu AI dengan data dapat berubah.
Paten tersebut menggunakan contoh seseorang yang memberi tahu asistennya bahwa mereka akan berselancar. Respons AI standar akan berupa komentar standar untuk bersenang-senang atau menikmati hari. Respons berbantuan LLM yang dijelaskan dalam paten tersebut akan menghasilkan respons berdasarkan lokasi geografis dan waktu untuk menghasilkan komentar tentang cuaca seperti potensi hujan. Ini disebut keluaran asisten yang dimodifikasi.
Paten tersebut menggambarkannya seperti ini:
“…output asisten yang disertakan dalam rangkaian output asisten yang dimodifikasi mencakup output asisten yang menjalankan sesi dialog dengan cara yang lebih melibatkan pengguna perangkat klien dalam sesi dialog dengan mengajukan pertanyaan yang relevan secara kontekstual (misalnya, “sudah berapa lama Anda berselancar?”), yang menyediakan informasi yang relevan secara kontekstual (misalnya, “tetapi jika Anda akan ke Pantai Example lagi, bersiaplah untuk hujan gerimis”), dan/atau yang beresonansi dengan pengguna perangkat klien dalam konteks sesi dialog.”
Konteks Spesifik Pengguna
Paten ini menjelaskan beberapa konteks khusus pengguna yang dapat digunakan LLM untuk menghasilkan keluaran yang dimodifikasi:
- Data profil pengguna, seperti preferensi (seperti makanan atau jenis aktivitas).
- Data aplikasi perangkat lunak (seperti aplikasi yang sedang atau baru-baru ini digunakan).
- Riwayat dialog sesi asisten yang sedang berlangsung dan/atau sebelumnya.
Berikut cuplikan yang membahas berbagai sinyal kontekstual terkait profil pengguna:
“Selain itu, konteks sesi dialog dapat ditentukan berdasarkan satu atau beberapa sinyal kontekstual yang mencakup, misalnya, kebisingan sekitar yang terdeteksi di lingkungan perangkat klien, data profil pengguna, data aplikasi perangkat lunak, ….riwayat dialog sesi dialog antara pengguna dan asisten otomatis, dan/atau sinyal kontekstual lainnya.”
Maksud Terkait
Bagian menarik dari paten tersebut menjelaskan bagaimana preferensi makanan pengguna dapat digunakan untuk menentukan maksud terkait suatu pertanyaan.
“Misalnya, …satu atau beberapa LLM dapat menentukan maksud yang terkait dengan kueri asisten yang diberikan… Lebih jauh, satu atau beberapa LLM dapat mengidentifikasi, berdasarkan maksud yang terkait dengan kueri asisten yang diberikan, setidaknya satu maksud terkait yang terkait dengan maksud yang terkait dengan kueri asisten yang diberikan… Lebih jauh lagi, satu atau beberapa LLM dapat menghasilkan kueri asisten tambahan berdasarkan setidaknya satu maksud terkait. “
Paten tersebut mengilustrasikan hal ini dengan contoh pengguna yang mengatakan bahwa mereka lapar. LLM kemudian akan mengidentifikasi konteks terkait seperti jenis masakan yang disukai pengguna dan keinginan makan di restoran.
Paten tersebut menjelaskan:
“Dalam contoh ini, kueri asisten tambahan dapat sesuai dengan, misalnya, “jenis masakan apa yang pengguna tunjukkan sebagai kesukaannya?” (misalnya, mencerminkan maksud jenis masakan terkait yang dikaitkan dengan maksud pengguna yang menunjukkan bahwa ia ingin makan), “restoran apa saja yang buka di sekitar sini?” (misalnya, mencerminkan maksud pencarian restoran terkait yang dikaitkan dengan maksud pengguna yang menunjukkan bahwa ia ingin makan)… Dalam implementasi ini, keluaran asisten tambahan dapat ditentukan berdasarkan pemrosesan kueri asisten tambahan.”
Konteks Sistem & Perangkat
Bagian konteks sistem dan perangkat dari paten ini menarik karena memungkinkan AI mendeteksi jika konteks perangkat adalah baterai hampir habis, dan jika demikian, AI akan menonaktifkan respons yang dimodifikasi LLM. Ada faktor lain seperti apakah pengguna akan meninggalkan perangkat, biaya komputasi, dll.
Hal-hal yang perlu dibawa pulang
- Respons Pertanyaan AI Menggunakan Sinyal Kontekstual
Paten Google menjelaskan bagaimana asisten otomatis dapat menggunakan konteks dunia nyata untuk menghasilkan jawaban dan dialog yang lebih relevan dan mirip manusia. - Faktor Kontekstual Mempengaruhi Respons
Ini termasuk waktu/lokasi/lingkungan, data khusus pengguna, riwayat dan maksud dialog, kondisi sistem/perangkat, dan jenis input (teks, ucapan, atau sentuhan). - Respons yang Dimodifikasi LLM Meningkatkan Keterlibatan
Model bahasa besar (LLM) menggunakan konteks ini untuk membuat respons yang dipersonalisasi atau pertanyaan lanjutan, seperti merujuk pada cuaca atau interaksi masa lalu. - Contoh Menunjukkan
Skenario Dampak Praktis seperti merekomendasikan makanan berdasarkan preferensi pengguna atau mengomentari cuaca setempat selama rencana luar ruangan menunjukkan bagaimana konteks dunia nyata dapat memengaruhi bagaimana AI merespons pertanyaan pengguna.
Paten ini penting karena jutaan orang semakin terlibat dengan asisten AI, sehingga relevan bagi penerbit, toko e-commerce, bisnis lokal, dan SEO.
Dokumen ini menguraikan bagaimana sistem Google yang dibantu AI dapat menghasilkan respons yang dipersonalisasi dan sesuai konteks dengan menggunakan sinyal dunia nyata. Hal ini memungkinkan asisten untuk memberikan jawaban yang lebih dari sekadar jawaban berdasarkan kata kunci dan memberikan respons dengan informasi yang relevan atau pertanyaan lanjutan, seperti menyarankan restoran yang mungkin disukai pengguna atau mengomentari kondisi cuaca sebelum aktivitas yang direncanakan.