Bing: Remove Junk dari SERP dengan “Search Quality Insights”

Setelah beberapa waktu lalu Bing mendapat isu permasalahan pada sitemap-nya, Bing kali ini akan segera merealisasikan update terbaru dari hasil pencariannya dengan Search Quality Insights. Dengan Search Quality Insights, Bing diharapkan dapat mereduksi "junk" atau sampah dari SERP (Serp Engine Result Page) dari hasil pencarian sehingga bisa memiliki hasil pencarian yang lebih baik, demikian dijelaskan Dr. Richard Qian selaku Kepala bagian tim yang bertugas meneliti hasil SERP Bing melalui artikel miliknya yang ditulis pada Bing Search Blog.

Dengan Search Quality Insights, Bing senantiasa akan terus memperbaiki mutu SERP-nya dengan cara mengurangi "Junk", sehingga hasil pencarian akan lebih relevan dengan keyword pencarian. Melalui blognya, Dr. Richard menjelaskan bagaimana cara kerja Bing. Yang pertama-tama dilakukan adalah mengurangi Bad Links dan potongan hasil pencarian yang kosong (empty snippets).


Junk links tersebut meliputi:
Dead Links
Soft 404
Parked Domains

Sedangkan Junk atau empty snippets adalah sebagai berikut:
Junky Snippets
Empty Snippets

Contoh dari halaman yang dikategorikan Dead Links adalah halaman dengan kode 4xx atau 5xx. Halaman 4xx merupakan tampilan pesan galat 404 atau Not Found yang merupakan sebuah kode standar otomatis HTTP yang menunjukkan bahwa klien dapat berkomunikasi dengan server, namun server tidak dapat menemukan hal yang diminta klien. Sebuah galat 404 tidak sama dengan "server not found" atau pesan galat sejenis ketika koneksi ke server tujuan tidak dapat dilakukan sama sekali. Sebuah galat 404 menandakan bahwa sumber yang diminta akan tersedia pada masa mendatang. (sumber: wikipedia)

Ada beberapa kemungkinan algoritma yang akan dilakukan Bing saat menemukan pesan galat ini, yang pertama adalah crawler Bing (bing bot) akan melakukan crawl dengan cepat sehingga bisa mendeteksi dan menemukan keberadaan dead links (link yang tidak aktif) dengan lebih optimal. Algoritma kedua adalah Bing akan semakin intens melakukan re-crawl dan memprioritaskan hal ini agar bisa mengambil analisa sementara apakah pesan galat tersebut ini akan ditampilkan di hasil pencarian atau tidak.

Bing menganalisa jenis pesan galat 404 berdasarkan konten, kata kunci (keyword), judul halaman, body serta URL sebelum memutuskan untuk menghilangkan halaman galat ini dari hasil pencarian. Seperti halnya Google, Bing juga tidak menginginkan domain parkir (park domain) muncul dalam hasil pencarian. Dan jika Bing menemukan park domain, Bing kemudian akan mengidentifikasi dan menghapusnya dari hasil SERP.

Bing juga menggunakan berbagai teknik untuk meningkatkan klasifikasi pengkodean mereka seperti konverter dokumen, detektor sampah, dan parser HTML yang bisa mengurangi snippet (potongan) bermutu rendah untuk ditampilkan.