Количеството информация, съхранявана в Интернет, е огромно. Невъзможно е да намерите нещо ръчно сред тези данни. Търсачките са призовани да автоматизират процеса. Те са изчислителни системи, които организират данни и търсене по заявки.
Инструкции
Етап 1
Сървърите на търсачката постоянно изпълняват програми, наречени ботове. Бот е съкращение от робот. В поведението си те наистина приличат на роботи. Посещавайки периодично всеки сайт от списъка, съхраняван на сървъра, те привеждат локални копия на всички текстове в съответствие с текущите версии на същите текстове на уеб страниците. Ботовете следват всички връзки, които срещат, и ако намерят новосъздадена страница, те я добавят към списъка и също създават локално копие. Копията не се публикуват в Интернет - те са само неразделни части от процеса на получаване на списък със сайтове. Това означава, че не се стига до нарушаване на авторски права.
Стъпка 2
Опитайте се да въведете една и съща фраза няколко пъти в една и съща търсачка. Ще откриете, че резултатите се подреждат в същия ред всеки път. Рядко се променя, не по-често от веднъж на ден. Причината за това е проста - редът на резултатите от търсенето се определя от доста сложен алгоритъм. Изчислението отчита честотата на използване на определени думи на страниците, броя на връзките към тази страница, намиращи се на други сайтове, както и редица други фактори.
Стъпка 3
Собствениците на уебсайтове, стремейки се да изведат своите ресурси на върха на този списък, оптимизират текстовете, публикувани в тях. Тази оптимизация може да бъде „бяла“- пряко разрешена от правилата на „търсачките“, „сива“- не е разрешена, но не и забранена, както и „черна“- директно забранена. В последния случай сайтът може скоро да изчезне от списъка завинаги. Алгоритмите за оптимизация често са по-сложни от алгоритмите за сортиране на резултатите от търсенето.
Стъпка 4
След въвеждане на ключова дума или фраза, програмата на сървъра търси съвпадения във всички локални копия на текстовете. След това резултатите се сортират с помощта на горния сложен алгоритъм. След това системата за управление на съдържанието автоматично генерира страница, която се предава на браузъра. По искане на потребителя могат да се генерират следните страници от списъка: втора, трета и т.н.