Всякий раз, когда вы пытаетесь найти что-то в Google или любых других поисковых системах .. Они включают общее количество результатов поиска, которое всегда превышает простое / читаемое числовое значение.

Где, как факт, который вы могли (возможно) обнаружить, есть только несколько таких результатов, исключая все повторяющиеся ссылки ..

Действительно ли им необходимо лгать и делать ложную рекламу?

Я также хотел бы отметить еще один вопрос здесь ..
как избавиться от дубликатов ссылок в результатах поиска ..?

2 ответа2

7

Поисковые системы, такие как Google, на самом деле не оценивают запрос. Что они делают, так это оценивают первую часть запроса, то есть достаточно результатов, чтобы отобразить первую страницу результатов.

Это связано с тем, что Google работает в условиях ограниченного времени, и ему нужно дать результат в считанные секунды, в то время как для некоторых ключевых слов существуют наборы результатов, указывающие на миллионы (или более) проиндексированных страниц.

Общее количество, которое Google дает для результата, является только статистической оценкой. Он оценивается как функция количества найденных результатов и доли, которую отображаемый результат представляет от общего размера индексов, которые должны быть обработаны по всем ключевым словам. Другими словами, если предоставление первых 20 результатов потребовало обработки 20% наборов индексов, Google прекратит обработку и выдаст оценку для общего размера результата, равного 100.

Когда вы нажимаете на результат, вы можете не найти свое ключевое слово внутри. Это потому, что, в то время как Google переиндексирует все страницы, повторное сканирование более миллиардов веб-страниц занимает много времени. Поэтому, если страница изменилась, Google может опоздать на несколько месяцев, чтобы заметить это изменение.

3

Ниже приведено упрощение, но оно довольно близко:

Поскольку в Интернете так много страниц, невозможно даже сохранить их все на одном сервере. Чтобы обойти это, у Google есть много тысяч сканеров, которые сканируют Интернет и сохраняют свои результаты на серверах. Это означает, что страницы, возвращаемые по вашему запросу, разбросаны по тысячам серверов, и что (если несколько сканеров попадают на одну и ту же страницу) одна и та же страница будет на многих серверах.

Когда вы делаете запрос, Google запрашивает у своих серверов, сколько страниц у них совпадают. Но поскольку серверов так много, у него нет времени, чтобы посмотреть точные результаты каждого из них. Таким образом, он получает результаты первой десятки и заставляет их просто отослать число, сколько у них есть.

Это означает, что если сервер № 1 имеет страницу A, а сервер № 10 также имеет страницу A, Google сообщает об этом как два результата. Или, если 10000 серверов имеют страницу A, Google сообщает, что это 10000 результатов! Эти "поддельные" результаты уходят , когда вы нажимаете , чтобы увидеть больше результатов, потому что , когда он представляет десять подробных результатов к вам, Google действительно убедитесь , что нет никаких дубликатов.

Надеюсь, что это объяснение имеет смысл.

Я не уверен, что понимаю ваш второй вопрос. По умолчанию Google "дедуплицирует" ссылки, поэтому он не должен показывать одну и ту же ссылку дважды в одном и том же результате.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .