Header Ads

AMAZING GOOGLE!! ..Di Balik www.google.com

semalem blogwalking dan menemukan blog nya mas pahlevi
artikel mengenai bagaimana cara kerja www.google.com.sangat-sangat menarik...dan mungkin belum banyak yang tau ada apa dibalik google.com yang terkenal itu diantara nya Google memiliki server 200 PetaByte!!!

ini artikel nya:
Dari jaman dulu, hingga jaman sekarang, Google gak pernah berniat sedikitpun merubah halaman depannya. Tanya kenapa? menurut google..semakin simple wajah suatu mesin pencari maka akan semakin mudah orang mencari apa yang mereka mau.tanpa terganggu dengan iklan atau gambar-gambar yang lain.Oke, yang penting itu bukan permasalahan kita kenapa Google tidak pernah merubah templatenya. Yang jelas, kita sekarang membahas bagaimana Google bekerja
Waktu Google terbuka. Terdapat 5 penting.

  1. Yakni satu teks search yang dinamai Queries (yang berfungsi untuk meminta data dari user tentang apa yang ingin dicari)

  2. Lalu ada tombol Google Search (yang akan melajukan search ke server Google dan menampilkan hasilnya dalam hitungan detik)

  3. Lalu I’m Feeling Lucky (yang otomatis mendorong user ke situs yang berada di top search (SERP))

  4. Option box “the web” (yang berfungsi untuk mencari queries di World Wide Web)

  5. dan option box “page from Indonesia” (yang spesial menampilkan search dari queries World Wide Web Indonesia)

Meluncurkan Queries ke Server Cluster di Manhattan

Begitu user telah mengentri data apa yang ingin di cari pada teks boks Queries. Sekarang User akan memilih Google Search. Click!
Nah, ketika di klik. Query yang di masukkan itu akan langsung terkirim ke pusat Cluster (pusat segala bahasa Google Search tepatnya), lalu mengecek, query yang di masukkan user ini berbahasa apa? Indonesia? English? Spanyol? Jepang? atau bahkan bahasa Jawa? Bahasa isiXhosa? isiZulu? semuanya ada databasenya!

Setelah server di query di temukan, maka server itu akan mengajukan banding ke server lanjutnya!
Mengintip sebentar teknologi Server Cluster di Manhattan

Server Cluster di Manhattan bukan main canggihnya.
Sebuah komputer kecil sekali, sebesar sebuah Hardrive. Atau biasanya di sebut MiniPC, di tata sedemikian rupa dalam sebuah rak.
Satu rak terdapat sekitar 80-komputer menurut data yang di terima. Dan setiap ruangan Server Cluster di Manhattan (ruangannya ada banyak: ruangan Indonesia, ruangan Inggris, ruangan Afrika, ruangan Jepang, jadi setiap negara punya satu ruangan), terdapat 250 rak.
Nah tinggal hitung, berapa jumlah komputer di setiap ruangan negara. 250 rak dikalikan dengan jumlah miniPC super canggih setiap raknya yang berisi 80 miniPC. Di total, sehingga 250 dikalikan dengan 80 terdapat 20.000 miniPC. Sehingga SETIAP ruangan memiliki 20.000 miniPC yang siap untuk men-database Query!
Hm… jangan coba-coba ngehack Google! Bakal kualat sendiri loh!
Pengolah data lebih lanjut di Server Google Santa Clara
Setelah itu, data Query yang telah di cek di server Cluster di Manhattan. Diteruskan ke server Search Google di St. Calara – Mountaint View (bagi pengguna AdSense yang pernah diberi surat oleh Google, pasti akan tahu Mountaint View) 

Google Bots (Robot Google)



Ini nih, orang yang tugasnya nge-Indeks situs kita di Google Search. Jadi Robot ini akan berjalan-jalan ke Dunia Maya yang bahkan, kalau ada planet dimana Dunia Maya itu berada, mungkin bisa sebesar Matahari atau Jupiter. Bahkan lebih besar lagi. Semisal!
Google Robot selalu mengunjungi situs-situs yang terdaftar di Database mereka tepatnya di server Cluster di Manhattan. Lalu setelah itu, dicek kepada sitem perangking Page Rank.

Page Rank

 

Page Rank, sistem ini ditemukan oleh Larry Page. Bagaimana Page Rank di cek?
Google Robot akan berjalan-jalan ke setiap situs di hasil Query (hipotesis) yang telah di rancang sebelumnya di server Cluster. Lalu mengecek, situs apa saja yang me-Link ke situs hipotesis tersebut?
Setiap situs yang banyak menerima Link, akan masuk di posisi Awal halaman SERP (Search Engine Resulting Page). Dan yang tidak pernah mendapat link, bisa-bisa paling buncit!
Setelah itu, Google tidak langsung menampilkan hasilnya. Namun Google mengcopy hasil Hipotesis ke server selanjutnya.

Server (Googlebytes) dengan hardisk Petabyte!

 

Mungkin, hardisk kita berukuran Gigabyte. Dan beberapa dari kita yang beruntung. Dapat memiliki Hardisk dengan ukuran TeraByte (1000 kalinya Gigabyte).
Kita tidak pernah membayangkan. Google memiliki server 200 PetaByte!!!
Wow… bayangkan saja. Jika kita memiliki iPod dengan ukuran 1 PetaByte ‘saja’. Maka kita bisa memutar lagu sebanyak 200 juta dalam satu iPod. Bahkan lagu-lagu itu bisa datang dari seluruh dunia, dan tidak akan terisi penuh (Setidaknya menyisahkan sekita 500 mb).
Dan satu PetaByte sama dengan 1000 kalinya TeraByte. Jika ada 200 PetaByte maka sama dengan 200.000 TeraByte. Dan satu TeraByte sama dengan 1000 kalinya GigaByte. Sehingga, 200.000 GigaByte sama dengan 200.000.000 TeraByte alias 200 juta GigaByte.
Jika kita memiliki hardisk dengan ukuran 200.000.000 GB, maka kita bisa mengkopi seluruh data yang kita punya. Kita bisa mengkopi seluruh data di Indonesia, Jepang, Cina, Korea, dan lain sebagainya. Bahkan data dari seluruh Dunia. Kalau perlu, data dari planet Mars. Hehe
Nah… pertanyaannya. Untuk apa Google memiliki server dengan ukuran PetaByte-PetaByte-an Gitu??
Gampang…  untuk Cache. Untuk Tembolok!
Jadi, setiap pengunjung mengunjungi situs dalam jangka Interval tertentu. Maka Google Bot akan langsung mengkopi situs itu dalam sebuah Server dengan ukuran 200 PetaByte itu!
Itulah mengapa ada fungsi Cache dan Tembolok. Dan dari mana fungsi itu berada. Jadi, meskipun semisal situs kita nanti telah Off. Alias kita sudah medelete situs kita tersebut, pengunjung masih bisa mengunjungi versi ‘kopi’ dari data tersebut. Dengan mudah!!!

Kerja sama yang pintar!

Data Hipotesis lalu di olah secara mendalam (dan Blogywalkie tidak bisa menjelaskan dengan detail) di masing-masing server. Server Web, Server Index, Server Document, Server Tata-Bahasa, Server Iklan, dan Server Halaman.
Jadi, data tersebut akan diolah ke Server Halaman, di deteksi, apakah terdapat Hack, Phising, dan Lain-lain yang berbahaya bagi User.
Lalu jika situs itu mengandung AdSense, maka Server Iklan (robot name: MediaPartner Google) akan berusaha mencari iklan yang sesuai dengan kriteria dari Server Halaman.
Lalu Server Tata-Bahasa melacak, situs ini berbahasa apa??
Setelah itu, server document mengecek, Document (seperti PDF, EXE, XLS) apa yang terkontain di situs tersebut.
Lalu Server Index, mengubah data Hipotesis menjadi data Pasti. Data Pasti sudah terolah dari mulai dunia Internet, pengecekan Pagerank, sampai penampilan pada Server Index.
Setelah itu, Server Index membawa data Pasti menuju Hasil Search.
Tapi sebelumnya di cek dulu. User memilih option mana: Search the Web, Search from indonesia, atau bahkan Search dari Jawa. Data Hipotesis yang lebih mendekati tata-bahasa akan di masukkan ke Posisi pertama dari halaman SERP.

Penampilan Hasil

Hasil di tampilkan menurut bahasa. Semisal Query kita: “Adam Pahlevi Baihaqi”
Ini dia hasil di Server Indonesia:
Lalu di Server US? Kalo kita pilih “the web”, maka halaman dengan bahasa Inggris yang pertama kali akan di tampilkan:

Berbeda bukan hasil yang diterima antara Server Indonesia dan Server US?

Hehehe
Semoga bermanfaat!!!

nb:artikel aku edit dan ada penambahan sedikit menyesuaikan dengan blog ini..sekali lagi makasih banyak buat mas adam pahlevi atas artikel nya yang sangat bermanfaat

 



 




GOOGLE BOTS (ROBOT GOO
 GOOGLE BOTS (ROBOT GOOGLE)
GOOGLE BOTS (ROBOT GOOGLE)  

4 comments:

  1. pantas aja halaman blogku yg udah terhapus masih bisa dibuka oleh mbah google..:-t

    ReplyDelete
  2. waw...keren sekali ternyata mbah google ini.....

    mantap info-nya....jadi tahu :)

    ReplyDelete

Powered by Blogger.