Я основатель IPinfo, поэтому могу определенно предложить некоторые детали по этому поводу ! Нет единственного метода, который мы используем, или единого источника данных, чтобы создать нашу собственную базу данных геолокации (или любой из наших других наборов данных, таких как IP для компании или IP для оператора). Это сочетание различных наборов данных, методов обработки данных и уроков, полученных в течение нескольких лет!
Некоторые источники данных и методы, которые не часто упоминаются, включают:
Прямые каналы от интернет-провайдеров. Наш сервис обрабатывает около 500 миллионов запросов API в день и используется на многих популярных сайтах высокого уровня. Поэтому интернет-провайдеры заинтересованы в предоставлении нам точных и актуальных геолокационных данных, чтобы их клиенты могли получить отличный опыт работы в Интернете. Мы работаем напрямую с большим и большим количеством интернет-провайдеров.
Данные о местоположении GPS. Можно собирать точную информацию о местоположении с помощью GPS на мобильных устройствах. Вы можете связать это с IP-адресом и некоторым логическим выводом топологии сети, чтобы определить местоположение для диапазонов IP-адресов с помощью всего лишь нескольких измерений.
Пользователь представил исправления. Когда мы получаем неправильное местоположение (или оно не было обновлено после изменения), мы часто быстро получаем отзывы от пользователей и можем вручную исправить местоположение или настроить наш алгоритм, чтобы убедиться, что оно правильно расположено при следующем запуске наш конвейер обработки данных.
Что касается нашего набора данных IP для компании, мы фактически очищаем каждое доменное имя каждый месяц и сопоставляем извлекаемые там данные с информацией о правах собственности на IP, записями rwhois и многим другим. Затем мы также используем данные о доменных именах, чтобы показать, какие домены размещены на каких IP-адресах, а также в нашем классификаторе типов IP, наряду со многими другими источниками данных, чтобы определить вероятность того, что IP-адрес будет в основном использоваться в качестве домашнего провайдера, бизнес или хостинг провайдер. Мы также анализируем структуру ссылок на этих страницах и показываем некоторые из этих данных на host.io.