Парсинг и автоматический импорт товаров в 1С-Битрикс: как наполнить интернет-магазин без рутины
Когда каталог интернет-магазина насчитывает тысячи позиций, ручное добавление карточек превращается в кошмар. Контент-менеджеры тратят недели на копирование описаний, загрузку картинок и перенос цен. К моменту, когда заполнен последний товар, у первых позиций уже меняется стоимость или они заканчиваются на складе поставщика.
Если у вас нет готовой базы в 1С, единственное разумное решение — автоматизация. В этой статье мы разберем, как настроить парсинг и импорт товаров в CMS Битрикс, какие стандартные инструменты для этого есть и когда нужна помощь разработчика для создания кастомного парсера.
Способ 1: Стандартный импорт через CSV / XML
1С-Битрикс «из коробки» поддерживает загрузку данных из текстовых файлов с разделителями (CSV). Если ваши поставщики предоставляют прайс-листы в формате Excel, их можно легко пересохранить в CSV и загрузить на сайт.
Чтобы запустить процесс, перейдите в административную панель:
Контент ➔ Инфоблоки ➔ Импорт ➔ CSV
Плюсы метода:
- Бесплатно и доступно на любой редакции Битрикса.
- Подходит для разового массового обновления цен или остатков.
Минусы:
- Файлы нужно готовить вручную: следить за кодировкой (должна быть UTF-8), правильно сопоставлять колонки со свойствами инфоблока.
- Сложно загружать множественные картинки и торговые предложения (SKU).
Способ 2: Автоматический импорт по расписанию (Cron)
Если поставщик готов отдавать данные по ссылке в формате XML, YML (формат Яндекс.Маркета) или JSON, процесс можно полностью автоматизировать. Для этого используются готовые модули из Маркетплейса Битрикса или кастомные PHP-скрипты.
Скрипт настраивается один раз: он обращается к ссылке поставщика, скачивает актуальный прайс, сравнивает артикулы и обновляет на вашем сайте только те данные, которые изменились (например, цену или количество). Запуск настраивается через планировщик задач Cron на хостинге — например, каждую ночь в 3:00.
Способ 3: Кастомный парсинг товаров (когда данных нет)
Бывают ситуации, когда поставщик не дает ни файлов, ни ссылок, а просто говорит: «Вся информация на нашем оптовом сайте, берите оттуда». В этом случае заказывается разработка кастомного парсера.
Парсер — это специальный программный скрипт, который имитирует действия реального человека: заходит на сайт-источник, обходит все категории, «вытаскивает» из кода страниц названия, описания, характеристики, скачивает оригинальные изображения и аккуратно раскладывает их по свойствам в инфоблок вашего Битрикса.
Важно: Парсинг — это технически сложная задача. Современные сайты защищаются от роботов (используют Cloudflare, капчи, блокируют частые запросы по IP). Чтобы обходить эти защиты, программисты настраивают прокси-серверы, имитацию задержки ввода и разбор JavaScript-кода «на лету».
Из практики AG Studio: Кейс по автоматизации наполнения
К нам обратился владелец магазина автозапчастей. Ему нужно было залить на сайт около 80 000 товаров от трех разных дилеров. Один давал остатки в Excel, второй — по API, третий не давал ничего, кроме доступа в личный кабинет на своем сайте.
Мы разработали комбинированную систему синхронизации и импорта данных. Написали парсер для третьего поставщика, создали скрипты обработки для первых двух и объединили все потоки в один инфоблок Битрикса. Теперь система автоматически обновляет остатки и цены каждые 2 часа. Бизнес работает без штата контент-менеджеров, а на сайте всегда актуальная информация.
Хотите автоматизировать наполнение сайта?
Не тратьте время на ручную рутину, которую можно поручить коду. Если вам нужно настроить сложный импорт, связать сайт с API поставщика или разработать надежный парсер, который не сломается при первом обновлении целевого сайта — обратитесь к профессионалам.
Команда AG Studio настроит парсинг и импорт товаров под ключ, оптимизирует нагрузку на базу данных и сделает так, чтобы ваш каталог обновлялся сам без вашего участия.