VKSpider: получаем пару id-имя пользователей ВКонтакте

a_2fb391c3

Специально для поисковых систем сайт ВКонтакте создал каталог пользователей, доступный по адресу http://vkontakte.ru/catalog.php (или http://vk.com/catalog.php). В нем в трех уровнях вложенности находятся пары id-имя пользователя, а также ссылки на профили.

Пользуясь случаем, я решил написать веб-паука на C#, собирающего список пользователей ВКонтакте. Такая база имен и айдтшников – мертвый груз, но может оказаться полезной как наполнитель тестовой базы данных, например, при создании систем индексации БД. Для меня же это было интересной задачей, не более.

Немного теории и наблюдений
Как я уже сказал, каталог имеет три уровня вложенности. Например, адрес страницы, содержащей id пользователей в диапазоне 285901 – 286000, имеет вид http://vkontakte.ru/catalog.php?selection=0-28-59. 0 – миллионы, 28 – десятки тысяч, 59 – сотни. 2 и 3 число изменяются в пределах от 0 до 99, первое – 0 – 108 (в данный момент).

На странице по-идее должно содержаться 100 пользователей. На практике это не так: некоторые пользователи были удалены по тем или иным причинам, их id не заняты. Поэтому список может содержать не 100, а меньше пользователей.

Читайте так же:
Оставить комментарий

Последние публикации