Создаю веб-краулера, который автоматически собирает контактную информацию с заданного списка интернет-магазинов чтоб потом добовлять все в наш Интернет-магазин, работающий на DST Store. Контакты, как правило, находятся в шапке/подвале сайта или на странице контактной информации. С шапкой/подвалом (главная страница) все понятно, а вот как можно распознать страницу контактов? Нужно как-то переходить по всем страницам сайта, кроме карточек товаров, и через RegExp получать все Email, ссылки на телеграм, соцсети и т. д. Карточек может быть огромнейшее количество, поэтому их нужно как-то отфильтровать. Как это сделать?
Напишите нам прямо сейчас, наши специалисты расскажут об услугах и ответят на все Ваши вопросы.