Mengukur Ketika Asisten AI dan Mesin Pencari Tidak Sepakat

Sebelum memulai, penting untuk memperhatikan peringatan ini: Ada matematika di depan! Jika mengerjakan matematika dan mempelajari persamaan membuat Anda pusing, atau membuat Anda ingin duduk dan makan kue utuh, bersiaplah (atau ambil kuenya). Tapi jika Anda suka matematika, jika Anda menikmati persamaan, dan Anda benar-benar percaya bahwa k=N (dasar sadis!), oh, artikel ini akan membuat Anda bersemangat saat kita menjelajahi pencarian hibrida lebih dalam.

Selama bertahun-tahun (puluhan tahun), SEO berada dalam satu siklus umpan balik. Kami mengoptimalkan, memberi peringkat, dan melacak. Semuanya masuk akal karena Google memberi kami papan skor. (Saya terlalu menyederhanakannya, tetapi Anda mengerti maksudnya.)

Kini, asisten AI berada di atas lapisan tersebut. Mereka merangkum, mengutip, dan menjawab pertanyaan sebelum klik terjadi. Konten Anda dapat ditampilkan, diparafrasekan, atau diabaikan, dan semua itu tidak ditampilkan dalam analitik.

Hal itu tidak membuat SEO menjadi usang. Justru sebaliknya, ada jenis visibilitas baru yang berjalan seiring dengannya. Artikel ini menunjukkan ide-ide tentang cara mengukur visibilitas tersebut tanpa kode, akses khusus, atau pengembang, dan cara untuk tetap berpegang teguh pada apa yang sebenarnya kita ketahui.

Mengapa Hal Ini Penting

Mesin pencari masih mengendalikan hampir semua lalu lintas yang terukur. Google sendiri menangani hampir 4 miliar pencarian per hari. Sebagai perbandingan, total volume pencarian tahunan Perplexity yang dilaporkan sekitar 10 miliar.

Jadi ya, asisten memang masih kecil jika dibandingkan. Namun, mereka membentuk bagaimana informasi ditafsirkan. Anda sudah bisa melihatnya ketika ChatGPT Search atau Perplexity menjawab pertanyaan dan menautkan ke sumbernya. Kutipan tersebut mengungkapkan blok konten (potongan) dan domain mana yang saat ini dipercaya oleh model.

Tantangannya adalah pemasar tidak memiliki dasbor bawaan untuk menunjukkan seberapa sering hal itu terjadi. Google baru-baru ini menambahkan data performa Mode AI ke Search Console . Menurut dokumentasi Google , tayangan, klik, dan posisi Mode AI kini termasuk dalam jenis penelusuran “Web” secara keseluruhan.

Penyertaan itu penting, tetapi sudah terintegrasi. Saat ini belum ada cara untuk mengisolasi lalu lintas Mode AI. Datanya ada, hanya dimasukkan ke dalam bucket yang lebih besar. Tidak ada pembagian persentase. Tidak ada garis tren. Belum ada.

Sampai visibilitas itu membaik, saya sarankan kita dapat menggunakan uji proksi untuk memahami di mana asisten dan pencarian selaras dan di mana perbedaannya.

Dua Sistem Pencarian, Dua Cara untuk Ditemukan

Mesin pencari tradisional menggunakan pengambilan leksikal, yang mencocokkan kata dan frasa secara langsung. Algoritma dominan, BM25, telah mendukung solusi seperti Elasticsearch dan sistem serupa selama bertahun-tahun. Algoritma ini juga digunakan di mesin pencari umum saat ini.

Asisten AI mengandalkan pengambilan semantik. Alih-alih kata-kata persis, mereka memetakan makna melalui embedding , sidik jari matematis teks. Hal ini memungkinkan mereka menemukan bagian-bagian yang terkait secara konseptual meskipun kata-katanya berbeda.

Setiap sistem membuat kesalahan yang berbeda. Pengambilan leksikal melewatkan sinonim. Pengambilan semantik dapat menghubungkan ide-ide yang tidak berhubungan. Namun, ketika digabungkan, keduanya menghasilkan hasil yang lebih baik.

Pada sebagian besar sistem pengambilan data hibrida, kedua metode digabungkan menggunakan aturan yang disebut Fusi Peringkat Resiprokal (RRF). Anda tidak harus bisa menjalankannya, tetapi memahami konsepnya akan membantu Anda menginterpretasikan apa yang akan Anda ukur nanti.

RRF Dalam Bahasa Inggris Sederhana

Pengambilan hibrida menggabungkan beberapa daftar berperingkat menjadi satu daftar seimbang. Matematika di balik penggabungan ini adalah RRF.

Rumusnya sederhana: skor sama dengan satu dibagi k ditambah peringkat. Rumus ini ditulis sebagai 1 ÷ (k + peringkat). Jika suatu item muncul di beberapa daftar, jumlahkan skor-skor tersebut.

Di sini, “peringkat” berarti posisi item dalam daftar tersebut, dimulai dengan 1 sebagai yang teratas. “k” adalah konstanta yang menghaluskan perbedaan antara item peringkat teratas dan menengah. Kebanyakan sistem biasanya menggunakan angka mendekati 60, tetapi masing-masing sistem mungkin menyetelnya secara berbeda.

Perlu diingat bahwa model vektor tidak memeringkat hasil dengan menghitung kecocokan kata. Model ini mengukur seberapa dekat penempatan setiap dokumen dengan penempatan kueri dalam ruang multidimensi. Sistem kemudian mengurutkan skor kesamaan tersebut dari tertinggi ke terendah, sehingga menghasilkan daftar peringkat. Model ini terlihat seperti pemeringkatan mesin pencari, tetapi didasarkan pada perhitungan jarak , bukan frekuensi istilah .

Mari kita buat ini nyata dengan angka-angka kecil dan dua daftar peringkat. Satu dari BM25 (relevansi kata kunci) dan satu lagi dari model vektor (relevansi semantik). Kita akan menggunakan k = 10 untuk kejelasan.

Dokumen A berada di peringkat 1 dalam BM25 dan peringkat 3 dalam daftar vektor.
Dari BM25: 1 ÷ (10 + 1) = 1 ÷ 11 = 0,0909.
Dari daftar vektor: 1 ÷ (10 + 3) = 1 ÷ 13 = 0,0769.
Jumlahkan keduanya: 0,0909 + 0,0769 = 0,1678 .

Dokumen B berada di peringkat ke-2 dalam BM25 dan peringkat ke-1 dalam daftar vektor.
Dari BM25: 1 ÷ (10 + 2) = 1 ÷ 12 = 0,0833.
Dari daftar vektor: 1 ÷ (10 + 1) = 1 ÷ 11 = 0,0909.
Jumlahkan keduanya: 0,0833 + 0,0909 = 0,1742 .

Dokumen C berada di peringkat ke-3 dalam BM25 dan ke-2 dalam daftar vektor.
Dari BM25: 1 ÷ (10 + 3) = 1 ÷ 13 = 0,0769.
Dari daftar vektor: 1 ÷ (10 + 2) = 1 ÷ 12 = 0,0833.
Jumlahkan keduanya: 0,0769 + 0,0833 = 0,1602 .

Dokumen B menang di sini karena peringkatnya tinggi di kedua daftar. Jika Anda menaikkan nilai k menjadi 60, perbedaannya akan mengecil, menghasilkan campuran yang lebih halus dan tidak terlalu berat di bagian atas.

Contoh ini murni ilustrasi. Setiap platform menyesuaikan parameter secara berbeda, dan tidak ada dokumentasi publik yang mengonfirmasi nilai k yang digunakan setiap mesin. Anggap saja ini sebagai analogi tentang bagaimana beberapa sinyal dirata-ratakan bersama-sama.

Di Mana Sebenarnya Matematika Ini Berada

Anda tidak perlu lagi mengodekannya sendiri karena RRF sudah menjadi bagian dari tumpukan pencarian modern. Berikut adalah contoh sistem jenis ini dari penyedia dasarnya. Jika Anda membaca semua ini, Anda akan memiliki pemahaman yang lebih mendalam tentang bagaimana platform seperti Perplexity melakukan tugasnya:

Semuanya mengikuti proses dasar yang sama: Ambil dengan BM25, ambil dengan vektor, skor dengan RRF, dan gabungkan. Perhitungan di atas menjelaskan konsepnya, bukan rumus literal di dalam setiap produk.

Mengamati Pengambilan Hibrida di Alam Liar

Para pemasar tidak dapat melihat daftar internal tersebut, tetapi kita dapat mengamati bagaimana sistem berperilaku di permukaan. Kuncinya adalah membandingkan peringkat Google dengan kutipan asisten, lalu mengukur tumpang tindih, kebaruan, dan konsistensi. Perhitungan eksternal ini merupakan heuristik, proksi untuk visibilitas. Perhitungan ini berbeda dengan perhitungan internal platform.

Langkah 1. Kumpulkan Data

Pilih 10 pertanyaan yang penting bagi bisnis Anda.

Untuk setiap pertanyaan:

Jalankan di Google Search dan salin 10 URL organik teratas.
Jalankan di asisten yang menampilkan kutipan, seperti Perplexity atau ChatGPT Search, dan salin setiap URL atau domain yang dikutip.

Sekarang Anda memiliki dua daftar per kueri: Google Top 10 dan Assistant Citations.

(Perlu diketahui bahwa tidak semua asisten menampilkan kutipan lengkap, dan tidak semua kueri memicunya. Beberapa asisten mungkin meringkas tanpa mencantumkan sumber sama sekali. Jika itu terjadi, lewati kueri tersebut karena tidak dapat diukur dengan cara ini.)

Langkah 2. Hitung Tiga Benda

Intersection (I): berapa banyak URL atau domain yang muncul di kedua daftar.
Kebaruan (N): berapa banyak sitasi asisten yang tidak muncul di 10 teratas Google.
Jika asisten memiliki enam sitasi dan tiga tumpang tindih, N = 6 − 3 = 3.
Frekuensi (F): seberapa sering setiap domain muncul di semua 10 kueri.

Langkah 3. Ubah Hitungan Menjadi Metrik Cepat

Untuk setiap set kueri:

Rasio Visibilitas Bersama (SVR) = I ÷ 10.
Ini mengukur seberapa banyak dari 10 teratas Google juga muncul dalam kutipan asisten.

Tingkat Visibilitas Asisten Unik (UAVR) = N ÷ total sitasi asisten untuk kueri tersebut.
Ini menunjukkan seberapa banyak materi baru yang diperkenalkan oleh asisten tersebut.

Jumlah Sitasi Berulang (RCC) = (jumlah F untuk setiap domain) ÷ jumlah kueri.
Hal ini mencerminkan seberapa konsisten suatu domain dikutip di berbagai jawaban.

Contoh:

10 teratas Google = 10 URL. Sitasi asisten = 6. Tiga tumpang tindih.
I = 3, N = 3, F (misalnya.com) = 4 (muncul dalam empat jawaban asisten).
SVR = 3 ÷ 10 = 0,30.
UAVR = 3 ÷ 6 = 0,50.
RCC = 4 ÷ 10 = 0,40.

Kini Anda memiliki gambaran numerik tentang seberapa dekat asisten mencerminkan atau menyimpang dari pencarian.

Langkah 4. Interpretasi

Skor ini sama sekali bukan tolok ukur industri, melainkan hanya titik awal yang disarankan untuk Anda. Silakan sesuaikan jika diperlukan:

SVR tinggi (> 0,6) berarti konten Anda selaras dengan kedua sistem. Relevansi leksikal dan semantik selaras.
SVR sedang (0,3 – 0,6) dengan RCC tinggi menunjukkan halaman Anda tepercaya secara semantik tetapi memerlukan markup yang lebih jelas atau tautan yang lebih kuat.
SVR rendah (< 0,3) dengan UAVR tinggi menunjukkan asisten memercayai sumber lain. Hal ini sering kali menandakan masalah struktur atau kejelasan.
RCC yang tinggi untuk pesaing menunjukkan model tersebut berulang kali mengutip domain mereka, jadi ada baiknya mempelajari isyarat skema atau desain konten.

Langkah 5. Bertindak

Jika SVR rendah, tingkatkan judul, kejelasan, dan kemampuan perayapan. Jika RCC rendah untuk merek Anda, standarkan kolom penulis, skema, dan stempel waktu. Jika UAVR tinggi, lacak domain-domain baru tersebut karena domain-domain tersebut mungkin sudah memiliki kepercayaan semantik di niche Anda.

(Pendekatan ini tidak selalu berjalan persis seperti yang dijelaskan. Beberapa asisten membatasi jumlah kutipan atau memvariasikannya berdasarkan wilayah. Hasil dapat berbeda tergantung geografi dan jenis kueri. Anggap ini sebagai latihan observasi, bukan kerangka kerja yang kaku.)

Leave a Reply Cancel reply

Related Stories

Google Peringatkan Agar Tidak Bergantung pada Skor Alat Audit SEO

Cara Mengelola Pemangku Kepentingan Saat Pembaruan Algoritma Terjadi

Tanya SEO: Cara Mengelola Pemangku Kepentingan Saat Pembaruan Algoritma Terjadi