
Kesaksian seorang insinyur Google yang disunting dan diterbitkan daring oleh Departemen Kehakiman AS menawarkan gambaran tentang sistem pemeringkatan Google, memberikan gambaran tentang skor kualitas Google, dan memperkenalkan sinyal popularitas misterius yang menggunakan data Chrome.
Dokumen ini menawarkan pandangan tingkat tinggi dan sangat umum tentang sinyal pemeringkatan, memberikan gambaran tentang apa yang dilakukan algoritma tetapi tidak secara spesifik.
Sinyal Buatan Tangan
Misalnya, dimulai dengan bagian tentang “pembuatan sinyal secara manual” yang menjelaskan proses umum pengambilan data dari penilai kualitas, klik, dan sebagainya, serta penerapan rumus matematika dan statistik untuk menghasilkan skor peringkat dari tiga jenis sinyal. Pembuatan sinyal secara manual berarti algoritme berskala yang disetel oleh teknisi pencarian. Ini tidak berarti bahwa mereka memberi peringkat situs web secara manual.
Sinyal ABC Google
Dokumen DOJ mencantumkan tiga jenis sinyal yang disebut sebagai Sinyal ABC dan sesuai dengan yang berikut ini:
- A – Anchor (halaman yang terhubung ke halaman target),
- B – Body (istilah kueri pencarian dalam dokumen),
- C – Klik (waktu yang dihabiskan pengguna sebelum kembali ke SERP)
Pernyataan tentang sinyal ABC merupakan generalisasi dari satu bagian dari proses pemeringkatan. Pemeringkatan hasil penelusuran jauh lebih rumit dan melibatkan ratusan bahkan ribuan algoritme tambahan di setiap langkah proses pemeringkatan, mulai dari pengindeksan, analisis tautan, proses anti-spam, personalisasi, pemeringkatan ulang, dan proses lainnya. Misalnya, Liz Reid telah membahas Sistem Topikalitas Inti sebagai bagian dari algoritme pemeringkatan dan Martin Splitt telah membahas anotasi sebagai bagian dari pemahaman halaman web.
Berikut ini adalah apa yang dikatakan dokumen tentang sinyal ABC:
“Sinyal ABC adalah komponen utama aktualitas (atau skor dasar), yang merupakan penentuan Google tentang relevansi dokumen dengan kueri.
T* (Topikalitas) secara efektif menggabungkan (setidaknya) ketiga sinyal ini dengan cara yang relatif cermat. Google menggunakannya untuk menilai relevansi dokumen berdasarkan istilah kueri.
Dokumen ini menawarkan gambaran tentang kompleksitas pemeringkatan halaman web:
“Pengembangan peringkat (terutama aktualitas) melibatkan penyelesaian banyak masalah matematika yang rumit. Untuk aktualitas, mungkin ada tim insinyur yang bekerja terus-menerus pada masalah-masalah sulit ini dalam proyek tertentu.
Alasan mengapa sebagian besar sinyal dibuat secara manual adalah karena jika terjadi kerusakan, Google tahu apa yang harus diperbaiki. Google ingin sinyal mereka sepenuhnya transparan sehingga mereka dapat memecahkan masalah dan memperbaikinya.”
Dokumen tersebut membandingkan pendekatan buatan tangan mereka dengan pendekatan otomatis Microsoft, dengan mengatakan bahwa ketika sesuatu rusak di Bing, akan jauh lebih sulit untuk memecahkan masalah tersebut dibandingkan dengan pendekatan Google.
Interaksi Antara Kualitas Halaman dan Relevansi
Poin menarik yang diungkapkan oleh teknisi pencarian adalah bahwa kualitas halaman tidak bergantung pada kueri. Jika suatu halaman dianggap berkualitas tinggi dan tepercaya, halaman tersebut dianggap tepercaya di semua kueri terkait, yang dimaksud dengan kata statis, halaman tersebut tidak dihitung ulang secara dinamis untuk setiap kueri. Namun, ada sinyal terkait relevansi dalam kueri yang dapat digunakan untuk menghitung peringkat akhir, yang menunjukkan bagaimana relevansi memainkan peran penting dalam menentukan peringkat.
Inilah yang mereka katakan:
“KualitasUmumnya statis di beberapa kueri dan tidak terhubung ke kueri tertentu.
Namun, dalam beberapa kasus, sinyal Kualitas menyertakan informasi dari kueri sebagai tambahan terhadap sinyal statis. Misalnya, sebuah situs mungkin memiliki informasi umum namun berkualitas tinggi sehingga kueri yang ditafsirkan sebagai pencarian informasi yang sangat sempit/teknis dapat digunakan untuk mengarahkan ke situs berkualitas yang lebih teknis.
Q* (kualitas halaman (yaitu, gagasan tentang kepercayaan)) sangatlah penting. Jika pesaing melihat log, maka mereka memiliki gagasan tentang “otoritas” untuk situs tertentu.
Skor kualitas sangatlah penting bahkan hingga saat ini. Kualitas halaman adalah sesuatu yang paling banyak dikeluhkan orang…”
AI Menjadi Penyebab Keluhan Terhadap Google
Insinyur tersebut menyatakan bahwa orang-orang mengeluh tentang kualitas tetapi juga mengatakan bahwa AI memperburuk situasi dengan membuatnya lebih buruk.
Dia mengatakan tentang kualitas halaman:
“Saat ini, orang masih mengeluh tentang kualitas dan AI memperburuknya.
Ini adalah dan terus menjadi pekerjaan yang banyak tetapi dapat dengan mudah direkayasa ulang karena Q sebagian besar statis dan sebagian besar terkait dengan situs daripada kueri.”
eDeepRank – Cara Memahami Peringkat LLM
Googler mencantumkan sinyal pemeringkatan lainnya, termasuk yang disebut eDeepRank yang merupakan sistem berbasis LLM yang menggunakan BERT, yang merupakan model terkait bahasa.
Dia menjelaskan:
“eDeepRank adalah sistem LLM yang menggunakan BERT dan transformer. Pada dasarnya, eDeepRank mencoba mengambil sinyal berbasis LLM dan menguraikannya menjadi komponen-komponen untuk membuatnya lebih transparan.
Bagian tentang penguraian sinyal LLM menjadi komponen-komponen tampaknya menjadi referensi untuk membuat sinyal pemeringkatan berbasis LLM lebih transparan sehingga teknisi pencarian dapat memahami mengapa LLM memeringkat sesuatu.
PageRank Terkait dengan Algoritma Pemeringkatan Jarak
PageRank adalah inovasi pemeringkatan asli Google dan sejak itu telah diperbarui. Saya menulis tentang jenis algoritma ini enam tahun lalu. Algoritma jarak tautan menghitung jarak dari situs web yang memiliki reputasi baik untuk topik tertentu (disebut situs awal) ke situs web lain dalam topik yang sama. Algoritma ini dimulai dengan kumpulan situs awal yang memiliki reputasi baik dalam topik tertentu dan situs yang lebih jauh dari situs awal masing-masing dianggap kurang dapat dipercaya. Situs yang lebih dekat dengan kumpulan situs awal cenderung lebih memiliki reputasi baik dan dapat dipercaya.
Berikut ini adalah apa yang dikatakan Googler tentang PageRank:
“PageRank. Ini adalah sinyal tunggal yang berkaitan dengan jarak dari sumber yang dikenal baik, dan digunakan sebagai masukan untuk skor Kualitas.”
Sinyal Popularitas Berbasis Chrome yang Tersembunyi
Ada sinyal lain yang namanya disunting yang terkait dengan popularitas.
Berikut deskripsi samar-samarnya:
“[dihapus] (popularitas) sinyal yang menggunakan data Chrome.”
Klaim yang masuk akal dapat dibuat bahwa hal ini mengonfirmasi bahwa kebocoran API Chrome adalah tentang faktor pemeringkatan yang sebenarnya. Namun, banyak SEO, termasuk saya, percaya bahwa API tersebut adalah alat yang ditujukan untuk pengembang yang digunakan oleh Chrome untuk menunjukkan metrik kinerja seperti Core Web Vitals dalam antarmuka Chrome Dev Tools.
Saya menduga bahwa ini merujuk pada sinyal popularitas yang mungkin tidak kita ketahui.
Insinyur Google tersebut merujuk pada kebocoran dokumen lain yang merujuk pada “komponen sebenarnya dari sistem pemeringkatan Google” tetapi mereka tidak memiliki cukup informasi untuk merekayasa balik algoritmanya.
Mereka menjelaskan:
“Ada kebocoran dokumen Google yang menyebutkan komponen tertentu dari sistem pemeringkatan Google, tetapi dokumen tersebut tidak membahas secara spesifik kurva dan ambang batasnya.
MisalnyaDokumen saja tidak memberi Anda cukup detail untuk mengetahuinya, tetapi data kemungkinan bisa.”
Membawa pergi
Dokumen yang baru dirilis ini merangkum pernyataan Departemen Kehakiman AS terhadap seorang insinyur Google yang memberikan gambaran umum tentang bagian-bagian sistem pemeringkatan pencarian Google. Dokumen ini membahas desain sinyal yang dibuat dengan tangan, peran skor kualitas halaman statis, dan sinyal popularitas misterius yang diperoleh dari data Chrome.
Laporan ini memberikan pandangan langka mengenai bagaimana sinyal seperti aktualitas, kepercayaan, perilaku klik, dan transparansi berbasis LLM direkayasa dan menawarkan perspektif berbeda mengenai cara Google memberi peringkat situs web.