Jump to content
  • Настройка базы

    Работа с списком ссылок, исключениями, блэклистом
    1. 1

      В каком формате указывать сайты

      Есть важные особенности, которые вы должны знать. Вам необходимо указывать сайты с директорией, где находится cms. Например, возможны случаи, когда в корневой директории (http://site.com) HTML страница, без использования cms, а нужная cms находится в поддиректории (http://site.com/directory). Если вы укажите только http://site.com, программа не сможет определить cms, но если вы укажите сайт с поддиректорией http://site.com/directory, cms будет определена. При этом, необязательно приводить URL к идеальному виду, вы можете указать так http://site.com/directory/index.php?do=profile&name=mynic, URL будет обработан корректно, т.е. вы можете смело указывать ссылки на профили, темы на форуме, статьи и другие директории, не опасаясь, что программа определит cms некорректно. Если вы используете режим комментирования, чтобы оставить комментарий, в большинстве cms необходимо в настройках базы указывать полный URL на страницу, где вы хотите выполнить размещение. Тот же принцип, если вы используете режим «только ответы в темах», чтобы оставить ответ в теме на форуме, вам нужно указать полную ссылку на тему.
    2. 2

      Как сохранить и загрузить базу

      Данная функция предусмотрена исключительно для работы с базами, например вы можете загрузить необходимый вам проект с настройками, а затем перейдя в настройки базы, загрузить нужную базу. Логика проектов не взаимодействует с базами, это - отдельная функция. Укажите базу, скопировав её в текстовое поле «Список сайтов» или загрузите из файла. В дальнейшем вы можете указать название базы и сохранить её. Впоследствии вы можете работать с сохранёнными базами.
    3. 3

      Настройка исключений cms

      Возможны ситуации, когда на одном ресурсе установлено сразу 2 разных cms или нет признаков ни одной cms, но вы знаете, что на ресурсе установлена нужная вам cms. В этом случае вам помогут исключения. В самой первой вкладке вы можете настроить исключения для определения cms. В текстовое поле вам необходимо указать сайт с поддиректорией, если она есть. Затем выбрать нужную cms и нажать кнопку «Добавить исключения». В отличие от настроек базы, в исключениях нужно указывать путь до директории строго, без лишнего, правильный вариант: site.com/directory Или site.com/directory/ Неправильный вариант: site.com/directory/index.php?do=profile Если вы укажите неправильный вариант, директория будет определена неправильно и, следовательно, корректного выполнения не будет. Если в будущем вам потребуется изменить исключения, вы можете выбрать нужную вам cms и нажать кнопку «Редактировать», вы можете удалить лишние исключения.
    4. 4

      Исключения для страниц регистрации и авторизации

      В редких случаях вам может потребоваться настроить исключения для определения страницы регистрации и авторизации, бывают примеры, на которых меняют, уникализирован адрес страницы регистрации, именно в этом случае вам поможет эта функция. Откройте вкладку «Рег. и авторизация», укажите адрес сайта, полный адрес страницы регистрации и авторизации. Нажмите кнопку «Добавить исключения». Если вам нужно добавить только страницу регистрации, страница авторизации стандартная, несмотря на это, вам так же обязательно нужно указать страницу авторизации. В будущем используя кнопку «Редактировать исключения» вы можете изменить введённые данные.
    5. 5

      Чёрный список

      Чёрный список может помочь исключить лишние ресурсы из вашей новой базы, например, если вас не интересуют блоги на одной из web2.0 платформ, где множество ресурсов на поддоменах, например «blogspot». Вы можете настроить чёрный список, используя два параметра: Добавить список стоп слов, по которым будет выполнено удаление, для этого нужно выбрать в списке «Удалять домены по стоп слову». Добавить список URL, которые будут удалены из базы, для этого нужно выбрать в списке «Удалять домены по имени». Удаление ресурсов из базы будет происходить при запуске выполнения.
    6. 6

      Дополнительные настройки

      Вы можете настроить дополнительные параметры, отключить удаление дублей в указанных ссылках. Или включить, но удалять только по названию домена или по точному совпадению. Эти настройки будут полезны, например при включённом режиме комментирования. Дополнительно здесь можете отключить проверку cms, но в этом случае для каждого указанного ресурса необходимо указать конкретную cms. В ручную это делать - долго, как это автоматизировать, вы можете прочесть в другой статье, где мы будем рассказывать о работе утилиты «Чекер cms». Дополнительно вы можете посчитать, сколько ресурсов вы указали в базе, удалить дубли, используя кнопку «удалить дубли», данная опция удаляет дубликаты по имени домена.
    7. 7

      Фильтры для сортировки базы

      В настройках базы вы можете отфильтровать список сайтов по заданным критериям, оставив сайты в нужной доменной зоне, например только .com сайты или удалить адреса, содержащие определённые слова. Как удалить все русскоязычные сайты из базы? 1. Вставьте список сайтов в поле. 2. Кликните правой кнопкой мыши, как показано на скриншоте выше, в диалоговом окне выберите опцию "Отфильтровать список". 3. Выберите уже заготовленный список фильтров, как показано на скриншоте, выберите RU и загрузите. В результате будет погружен список русскоязычных доменов. 4. Оставьте опцию "Удалить записи соответствующие фильтрам". 5. Нажмите на кнопку: "Отфильтровать". По результатам вы получите список сайтов за вычетом тех, которые работают на русскоязычных доменах. Подобным образом можно оставить только сайты в доменных зонах .com, .net. Можно ввести нежелательные ключевые слова, которые могут содержаться в домене. Дополнительно Вы можете сохранять свои фильтры в отдельные проекты с нужным названием и в дальнейшем оперативно использовать.
    Sign in to follow this  
×
×
  • Create New...