Pengenalan Search Engine

January 30, 2018
Search engine atau mesin pencari adalah suatu program yang digunakan oleh pengguna internet (netter) untuk mencari dokumen-dokumen didasarkan pada kata kunci atau key word dari sebuah informasi yang ingin diketahui, misalnya produk, jasa layanan, atau berita. Dengan berpedoman pada kata kunci yang digunakan maka akan ditampilkan halaman-halaman yang mengandung unsur kata kunci tersebut. Program tersebut di-kenal dengan sebutan Bots.

Search Engine


Secara umum, search engine bekerja dengan cara mengirimkan spider untuk mencari dokumen sebanyak mungkin. Ada sebuah program lain sejenis spider yang disebut indexer. Indexer bekerja dengan cara membaca dokumen-dokumen yang ditemukan, kemudian membuat index berdasarkan kata kunci yang ada di setiap dokumen tersebut. Setiap search engine menggunakan proprietary algorithm untuk menciptakan indeks-indeks yang ditampilkan dalam bentuk hasil pencarian. Kebalikan dari search engine adalah direktori.

Direktori membutuhkan jasa manusia untuk melakukan index situs-situs yang didaftarkan ke pihak mereka.

Sejarah internet menunjukkan bahwa mesin pencari pertama kali dibuat pada tahun 1980 dan disebut sebagai "Archie". Mesin pencari tersebut berfungsi untuk download file-file di server-server anonymous FTP dan menciptakan data base yang dapat dicari. Pada tahun 1981, Gopher dibuat dan berfungsi untuk melakukan index dokumen-dokumen teks sederhana. Sedang dalam WWW (World Wide Web), search engine pertama kali dikembangkan oleh Matthew Gray pada tahun 1993 yang disebut sebagai "Wandex".

Kamus Istilah


  • Program: Seperangkat instruksi yang terorganisir, saat dijalankan komputer akan bertindak sesuai dengan perintah yang sudah ditentukan sebelumnya. Lebih lanjut. suatu program berisi seperangkat variabel dan statement atau pernyataan yang mengatur komputer untuk menangani variabel-variabel yang dapat berupa data, teks, maupun gambar.
  • Spider: Suatu program yang secara otomatis "menangkap" halaman-halaman World Wide Web (WWW) kemudian memasukkannya ke search engine. Pemberian nama 'Spider' untuk program tersebut adalah karena program tersebut merangkak (crawls) di WWW sehingga juga sering disebut dengan web crawler. Spider dapat menangkap halaman dari mana saja karena hampir semua halaman WWW mempunyai link menuju ke halaman-halaman lain. Cara kerja spider cukup sederhana, ketika spider melihat ada link ke halaman lain maka spider akan mendatangi halaman tersebut. Pada umumnya search engine yang besar memiliki beberapa spider yang dapat bekerja secara pararel.
  • Kata kunci/Key word: Kata kunci adalah suatu kata yang digunakan oleh search engine untuk melakukan pencarian terhadap halaman-halaman WWW yang sesuai.
  • World Wide Web: World Wide Web (WWW) adalah suatu sistem server internet yang mendukung dokumen-dokumen dengan format khusus. Dokumen-dokumen tersebut diformat dengan menggunakan bahasa yang dimanipulasi atau secara teknis disebut markup language yang dikenal sebagai HTML (Hyper Text Markup Language). HTML mendukung link-link ke dokumen-dokumen lain, termasuk file-file gam-bar, audio, dan video. Ada perbedaan dasar antara WWW dan internet. Internet adalah infrastruktur jaringan global yang berfungsi menghubungkan komputer-komputer di seluruh dunia sehingga komputer-komputer tersebut dapat saling berkomunikasi. Sementara World Wide Web yang sering disebut secara singkat sebagai Web adalah suatu cara untuk mengakses informasi menggunakan media internet. Web adalah model pembagian informasi yang dibangun di atas internet.
  • Index: Digunakan dalam suatu database untuk menemukan record.
  • Proprietary algorithm: Algoritma yang dimiliki dan dikon-trol secara pribadi, misalnya suatu algoritma yang dimiliki oleh perusahaan tertentu. Selain proprietary algorithm, ada juga algoritma terbuka yang dapat dimiliki oleh siapa saja.
  • Query: Query adalah suatu permintaan informasi dari suatu data base. Ada tiga metode dalam membuat query, yaitu didasarkan pada parameter suatu menu, didasarkan pada query by example (QBE), dan didasarkan pada query language.
  • Spider trap: Suatu kondisi dari situs-situs di WWW yang bersifat dinamis di mana spider suatu search engine terpe-rangkap dalam suatu loop yang terus menerus karena ada sebuah kode yang berasal dari suatu halaman di server tertentu yang ditemukan atas permintaan server untuk men-dapatkan masukan informasi dari spider; sementara spider tidak dapat memberikan informasi ke server karena spider hanya mengumpulkan data untuk index search engine. Spider trap adalah hasil dari adanya scrupt CGI yang salah dan secara potensial dapat merusak server tertentu atau menghalangi spider kembali ke situs tersebut.
  • Meta Tag: Meta tag adalah tag HTML khusus yang menye-diakan informasi mengenai web site.
  • Boolean Search: Tipe pencarian yang memungkinkan peng-guna membuat kombinasi kata kunci dengan operator seperti AND, NOT, dan OR untuk mendapatkan hasil pencarian yang sesuai.

Fitur-Fitur Search Engine

Daftar search engine di bawah akan membantu para web master yang mempelajari search engine yang didasarkan pada robot (crawler-based search engine) melakukan index situs. Daftar tersebut menyediakan ringkasan faktor dan fitur-fitur penting yang dapat mempengaruhi situs-situs di index dan di ranking. Sementara search engine yang didasarkan pada manusia (human poweredsearch engine) seperti Open Directory tidak dimasukkan dalam daftar karena direktori tersebut tidak melakukan crawling web dalam melakukan index terhadap situs-situs yang didaftarkan ke pihak mereka, melainkan meng-gunakan jasa manusia.

Daftar Search Engine


Daftar Search Engine
Daftar Search Engine

Keterangan:

1. Deep Crawl
Semua crawler akan mencari halaman-halaman untuk ditambahkan ke index web site mereka sekalipun halaman-halaman tersebut tidak didaftarkan ke pihak mereka. Masing-masing crawler mempunyai karakteristik yang berbeda, begitu Pula kemampuan mereka dalam melakukan index halaman web. Dan tabel di atas dapat diketahui jenis search engine yang dapat melakukan index dengan baik (deep crawl) dan dapat mengumpulkan banyak halaman dari web site kita, meski kita belum pernah mendaftarkan halaman-halaman web tersebut. Secara umum, semakin besar index search engine, semakin banyak halaman yang didaftar per situsnya.
2. Frames Support
Frame support menunjukkan search engine yang dapat mengikuti link dalam frame. Frame sering menghambat search engine dalam melakukan index ke halaman-halaman web kita dan kadang menimbulkan masalah bagi crawler saat sedang memasuki halaman-halaman web.
3. Robots.txt
File robots.txt merupakan sarana bagi para webrhaster untuk mengeluarkan search engines dari situs-situs mereka. Fasilitas ini berfungsi untuk memblokir crawler agar tidak memasuki web kita.
4. Meta Robots Tag
Meta robot tag merupakan meta tag spesial yang memung-kinkan pemilik situs membuat spesifikasi halaman tertentu tidak diizinkan untuk di index oleh search engine.
5. Paid Inclusion
Paid inclusion adalah sebuah fasilitas search engine yang menawarkan suatu program di mana kita dapat membayar dengan jaminan halaman-halaman kita akan dimasukkan ke dalam index search engine tersebut. Fasilitas ini berbeda dengan paid placement yang memberikan garansi bahwa web kita akan masuk dalam rangking utama jika dicari oleh banyak orang di search engine tertentu, misalnya Google.
6. Full Body Text
Semua search engines besar melakukan index seluruh teks isi penuh satu halaman, meski beberapa search engine tidak akan melakukan index stop words. Google umumnya tidak melakukan index melebihi 101K pertama dari semua halaman-halaman HTML.
7. Stop Words
Search engine tertentu akan melewati kata-kata ini apabila sedang melakukan index suatu halaman atau tidak akan melakukan pencarian untuk kata-kata tersebut. Kata-kata penghenti (stop words) tidak akan diikutsertakan sebagai cara untuk menghemat ruang penyimpanan dan memak-simalkan kecepatan dalam proses pencarian.
8. Meta Description
Semua crawler milik search engine utama mendukung ada-nya meta description tag. Meta tag biasanya digunakan untuk menggambarkan isi web kita secara keseluruhan. Meta tag ini berfungsi sebagai sarana untuk mempermudah search engine melakukan index untuk kesesuaian antara isi dan judul. Dengan kata lain, meta tag berfungsi untuk mencerminkan deskripsi web.
9. Meta Keywords
Fasilitas ini menunjukkan bahwa search engine mendukung adanya meta keywords tags.
10. ALT Text/Comments
Menunjukkan bahwa search engine tersebut mendukung index ALT text yang berhubungan dengan gambar-gambar atau teks di comment tags.

Share this

Related Posts

Previous
Next Post »