Перевіряємо сайт на биті посилання

Методи пошуку неробочих посилань (онлайн і офлайн)

В продовження теми підвищення якості сайту, не можна не сказати кілька слів про, так звані, биті посилання, які, кажучи простою мовою, є неробочими, і приводять відвідувача на сторінку 404-ї помилки. Сьогодні я розповім про два доступні методи пошуку неробочих посилань в офлайні, та онлайні, використовуючи спеціальне програмне забезпечення і сервіси.

Якщо сказати, що биті посилання на сайті — це погано, значить нічого не сказати, бо в плані SEO-оптимізації — це просто жахливо і неприпустимо. Велика кількість битих посилань на веб-ресурсі може привести до накладення фільтра пошукової системи за неякісний контент. Адже якщо роботи, переходячи по внутрішніх чи зовнішніх посиланнях, частенько наштовхуються на сторінки з 404-ю помилкою, очевидно, що такий блог не містить корисної інформації для мешканців Землі. Внаслідок чого, сайт вилітає з пошукової видачі в тихе, затишне містечко — Місяць, чекаючи гостей з числа прибульців :).

Биті посилання на сайті розірваний ланцюг навколо Місяця

Звідки беруться биті посилання на сайті?

Основні причини виникнення

Причин виникнення битих посилань на сайті може бути багато, але я опишу лише кілька найпоширеніших. Перш за все, биті посилання на сайті — результат некоректного налаштування сервера, неправильної роботи двіжка або веб-майстра (контент-менеджера), який робить внутрішню перелінковку, посилається на якісь зовнішні джерела. Як бачимо, це не злобні хакери нам псують посилальний профіль сайту, а ми самі, своїми ж руками.

Переїзд сайту з HTTP на HTTPS

Трапляється, що після переїзду сайту зі старого HTTP протоколу на новий HTTPS протокол передачі даних, з'являється багато, або просто величезна кількість битих посилань на сайті. Це пов'язано з тим, що всі абсолютні посилання сайту в одну мить перестали відповідати новому протоколу, звідси й проблема адресації документів.

Заміна динамічних URL-ів на ЛЗУ (Людино-Зрозумілі Урли)

Якщо на веб-сайті застосувати технологію для створення дружніх пошуковим системам URL-адрес — SEF URL (Search Engines Friendly URL), всі старі адреси, які знаходяться в базі даних пошуковиків, стануть недоступні. В результаті, при зверненні пошукового бота або користувача до файлу, який закріплений за старою URL-адресою, призведе до виникнення 404-ї помилки відповіді сервера. Причина криється у відсутності або неправильному налаштуванні 301-го редиректу.

Зовнішні посилання містять неактуальний URL

Посилаючись в статтях на те чи інше джерело, веб-майстер встановлює зовнішнє посилання на той чи інший документ, який знаходиться на чужому веб-ресурсі. Якщо адмін сайту-акцептора змінить адресу сторінки, перемістить її або просто видалить, користувачі і пошукові павуки весь час будуть наштовхуватися на сумну 404-у сторінку. Чи є користь для бота і юзера твого сайту від такої сторінки? Ніякої користі, звісно ж, немає.

Наприклад, якщо сторінки твого блогу про заробіток в інтернеті посилаються на якусь дурню, вочевидь, рівень компетенції його автора бажає кращого (думки людини і пошуковика). А раз так, піду-но я пошукаю більш компетентного автора, у якого не вискакують якісь незрозумілі, страхітливі сторінки. Називається, фініта-ля-комедія, або приплили...

Чи є вихід з ситуації, що склалася? Що ми, як вебмайстри, можемо зробити для запобігання появи в браузерах наших шановних користувачів цих жахливих сторінок? Вихід є, і він простий до неподобства. Зараз розповім.

Чи можна запобігти появі битих посилань?

(Загальні рекомендації щодо посилального профілю веб-сайту)

Появі битих посилань в посилальному профілі веб-ресурсу можна запобігти, якщо:

  • Перевірити коректність роботи генерації URL-адрес після модифікації скриптів двіжка, або перед запуском проекту;

  • Не розміщувати зовнішні гіперпосилання на сторінках свого сайту;

  • Використовувати 301-й редирект при переїзді з HTTP на HTTPS, або при впровадженні ЛЗУ;

  • Всі внутрішні посилання робити відносними: URL без зазначення протоколу — (//mysite.com/publ/page.php), або не прописуючи в ньому домену — (/publ/page.php);

  • В усіх зовнішніх гіперпосиланнях прописувати URL-и, не вказуючи протокол — (//site.ua/katalog/statya.html). Це може бути корисно, коли чужий сайт в майбутньому перейде на протокол HTTPS або повернеться назад на HTTP;

  • Перевіряти внутрішні посилання на працездатність при перелінковці сторінок: поставили посиланнячко, і тієї ж миті перейшли по ньому;

  • Постійно моніторити всі зовнішні посилання на предмет їх працездатності, використовуючи онлайн або офлайн сервіси, про які піде мова далі.

Способи виявлення битих посилань

Онлайн і офлайн методи їх пошуку

Отже, ти вже знаєш, яким чином можна уникнути появи битих посилань в посилальному профілі веб-сайту. Тепер поговоримо про те, якими методами ми можемо скористатися для їх виявлення. Почну розповідь з офлайн методу, який для мене більш зручний. Ним я користуюсь щоразу, перед заливкою на сервер оновлених скриптів двіжка. Перед публікацією нової статті, вона також проходить обов'язкову перевірку на предмет битих посилань.

Xenu — потужний інструмент веб-розробника

Завантажити дане ПО можеш з офіційного веб-сайту розробника — (home.snafu.de/tilman/xenulink.html#Download). Я не буду зараз розповідати як встановити додаток «Xenu» на комп'ютер. Процес інсталяції вже описаний у попередній статті. В установці «Xenu» немає нічого складного (вимагається рівень знань енікейщика): увесь час б'єш по Enter-у, і через півхвилини софт успішно інстальований на твоїй машині.

Отже, на робочому столі, подвійним кліком миші по зеленій іконці, відкриваємо програму «Xenu». У меню програми натискаємо по першій іконці зліва (файлик) — «Check URL» (1). Потім, у вікні, яке щойно з'явилося, вводимо в поле доменне ім'я веб-ресурсу (2), встановлюємо галочку «Check external links» (3), натискаємо «OK» для підтвердження (4), і спокійно закриваємо вискочивший алерт, вибравши варіант «Ні» (5), див. скріншот нижче.

Відкриваємо програму Xenu і ставимо галочку Check external links

Програма завантажила в своє вікно усі посилання сайту, в тому числі й зовнішні (бо була встановлена галочка). Тепер, щоб відшукати всі биті посилання, потрібно один раз клікнути на кнопку сортувального фільтру — «Status» (6), див. скріншот нижче.

Натискаємо кнопку Status у програмі Xenu

І нарешті, щоб дізнатися, на якій сторінці знаходиться бите посилання, клікаємо правою кнопкою миші по будь-якій з червоних адрес (7). Потім натискаємо на останній пункт у випадаючому меню — «URL Properties» (8), і дивимося на результат. У самому нижньому полі вікна, що з'явилося (виділено синім кольором), — це і є та сама сторінка з битим посиланням, див. скріншот нижче.

Вікно Xenu URL Properties сторінка з битим посиланням знайдена

Щоб софт твого хостера випадково не вирішив, що на сервер почалася DDoS-атака, і той не почав блокувати твою IP-адресу або сайт, потрібно зробити коригування дефолтних налаштувань програми «Xenu». Щоб зменшити навантаження на сервер, при зверненні бота програми до документів, потрібно знизити частоту паралельних запитів. Це можна зробити за допомогою вертикального повзунка (10), див. скріншот нижче.

Налаштування програми Xenu частота паралельних запитів

Встановивши значення, наприклад, «5» або «10», навантаження на сервер буде незначним, і різке збільшення запитів з однієї IP-адреси не викличе підозр у системи захисту хостингової компанії. Займатись такими речами краще вночі, коли трафік на сайт низький, і, в разі чого, тимчасове блокування сайту пройде безболісно.

Онлайн сервіс пошуку битих посилань — Free Broken Link Checker

Якщо сайт невеликий, можна скористатися онлайн сервісом «Free Broken Link Checker» (brokenlinkcheck.com). Тут все просто як два на два. Вводиш в спеціальне поле URL свого сайту (1), тиснеш кнопку «Find broken links» (2). На новій сторінці вводиш в капчі код перевірки (3), ставиш галочку докладного звіту (4), тиснеш знайому кнопку «Find broken links now!» (5), і чекаєш деякий час на результат. Якщо бот сервісу знайде биті посилання на твоєму сайті, він це покаже по завершенню перевірки (в невеликому блоці), див. скріншот нижче.

Сервіс пошуку битих посилань Free Broken Link Checker завершив перевірку

Подібних сервісів існує в Мережі досить багато, з різним функціоналом та швидкістю обробки. Щоб їх знайти і випробувати в роботі, можеш заґуґлити запит «Broken Link Checker» або щось в цьому роді. Пошукова система видасть багато адрес онлайн сервісів для перевірки посилань. Власне, на цьому все. Підтримуй гігієну посилального профілю свого сайту на належному рівні, і все буде пучком. Удачі!

Щоб зрозуміти наскільки ти в темі, пройди тест 👇
  • 100 секунд на проходження тестуRealCase

    Тест
  • 5 питань по тематиці сайту
  • 4 варіанти відповідей на кожен
Готовий(-а) перевірити рівень своїх знань?

  •  Цей тест ще ніхто не проходив, ти будеш першим(-ою)

   
  
 
 
📚Не проґав!
💬Коментарі (Ще немає... твій буде першим)  
    • Ліміт 2000 символів
    • залишилось: