Покриття індексації в GSC: як виправити помилки та виключення

Ви написали 50 статей на блозі, але Google показує тільки 20 у пошуку. Де решта 30? Чому Google їх ігнорує? Google Search Console має розділ "Покриття" (тепер називається "Індексування"), який показує ТОЧНО, які сторінки Google бачить, а які — ні. І найголовніше — чому. У цій статті я розберу кожну можливу помилку індексації, що вона означає і як її виправити за 5-10 хвилин. Навіть якщо ви ніколи не лазили в код сайту.

⚡ Коротко

  • Індексація ≠ існування сторінки: Google вибірково індексує тільки якісні сторінки
  • 4 статуси сторінок: проіндексовано, з попередженнями, виключено, помилка
  • Топ-5 проблем: 404, noindex, дублі контенту, soft 404, блокування robots.txt
  • 🎯 Ви отримаєте: покрокові інструкції для виправлення кожної помилки
  • 👇 Детальніше читайте нижче — з реальними прикладами та чек-листами

Зміст статті:

🔍 Що таке індексація простими словами

Індексація — це процес, коли Google додає вашу сторінку в свою базу даних і може показувати її в пошуку. Якщо сторінка НЕ проіндексована — вона не існує для Google. Навіть якщо вона живе на вашому сайті.

📚 Аналогія з бібліотекою

Уявіть, що Google — це величезна бібліотека, а ваш сайт — це збірка книжок:

  • 📖 Проіндексована сторінка: книжка стоїть на полиці в каталозі. Люди можуть її знайти через пошук і взяти почитати.
  • 🚫 Непроіндексована сторінка: книжка лежить у вас вдома. Вона існує, але бібліотека про неї не знає. Ніхто не може її знайти через каталог бібліотеки.
  • 📋 Сторінка на розгляді: ви принесли книжку в бібліотеку, бібліотекар перевіряє — чи варто її додавати в каталог. Якщо книжка якісна — додадуть. Якщо ні — відмовлять.

🤔 Чому Google не індексує ВСІ сторінки?

Багато власників сайтів думають: "У мене 100 сторінок на сайті = Google має показувати всі 100 у пошуку". Але це не так.

Google вибірково індексує тільки:

  • ✅ Якісні сторінки з унікальним контентом
  • ✅ Сторінки, які корисні користувачам
  • ✅ Сторінки без технічних проблем
  • ✅ Сторінки, які НЕ заборонені до індексації

Google НЕ індексує:

  • ❌ Дублі контенту (скопійований текст)
  • ❌ Низькоякісні сторінки (мало тексту, немає цінності)
  • ❌ Технічні сторінки (кошик, форми оплати)
  • ❌ Сторінки з помилками (404, 500)
  • ❌ Сторінки, заблоковані власником (noindex, robots.txt)

👉 Життєвий приклад: у вас інтернет-магазин з 1000 товарів. Google проіндексував 400. Чому не всі? Можливо, 300 товарів — це дублі (однакові товари різних кольорів), 200 — закінчились на складі (порожні сторінки), 100 — заблоковані в robots.txt.

Швидкий висновок: індексація — це коли Google додає сторінку в свою базу і може показувати в пошуку. Не всі сторінки індексуються — Google вибирає тільки якісні та корисні. Якщо важлива сторінка не проіндексована — ви втрачаєте трафік.

Якщо ще не налаштували Google Search Console, читайте нашу покрокову інструкцію з налаштування GSC.

📊 4 статуси сторінок в GSC

У розділі "Індексування" → "Сторінки" Google Search Console показує 4 категорії сторінок.

СтатусЩо означаєЦе добре?Що робити
✅ ПроіндексованоСторінка в індексі Google, може з'явитись у пошуку✅ ТакНічого, все добре
⚠️ Проіндексовано з попередженнямиСторінка в індексі, але є невеликі проблеми⚠️ Так, але краще виправитиПеревірте попередження
❌ ВиключеноGoogle вирішив НЕ індексувати цю сторінку⚠️ Залежить від причиниПеревірте причину виключення
🔴 ПомилкаКритична проблема (404, 500, тощо)❌ Ні, треба виправлятиВиправте помилку ASAP

🎯 Як читати звіт

Крок 1: Відкрийте GSC

  1. Йдіть в Google Search Console
  2. Виберіть ваш сайт
  3. У лівому меню: "Індексування" → "Сторінки"

Крок 2: Проаналізуйте цифри

Ви побачите графік з двома лініями:

  • 🟢 Зелена лінія: проіндексовані сторінки (добре)
  • 🔴 Червона лінія: не проіндексовані (потенційна проблема)

Крок 3: Перевірте причини виключення

Прокрутіть вниз — побачите список причин, чому сторінки не проіндексовані:

  • ❌ Помилка 404 (50 сторінок)
  • 🚫 Виключено через noindex (30 сторінок)
  • 📄 Дублікат (20 сторінок)
  • ⚠️ Soft 404 (10 сторінок)

👉 Клікайте на кожну причину — побачите конкретні URL, які мають цю проблему.

🚨 Пріоритети: що виправляти першим

Не всі проблеми однаково критичні. Ось порядок важливості:

  1. 🔴 Помилки 404 на важливих сторінках: критично, виправляйте першим
  2. 🚫 Noindex на важливих сторінках: дуже погано, треба виправити
  3. ⚠️ Soft 404: середня важливість
  4. 📄 Дублі контенту: потрібно виправити, але не критично
  5. ⚙️ Noindex на технічних сторінках (кошик, вхід): це нормально, нічого робити не треба

Швидкий висновок: GSC показує 4 статуси сторінок. Зелена зона = добре, червона = треба виправляти. Найважливіше — перевірити, чи немає помилок 404 або noindex на важливих сторінках (товари, статті, послуги). Технічні сторінки (кошик, логін) можуть бути виключені — це нормально.

🚫 Помилка 404: сторінка не знайдена

Помилка 404 означає, що сервер не може знайти сторінку за цією адресою. Простими словами: Google приходить за вашою сторінкою, а її немає — двері замкнені, ніхто не відповідає.

🏚️ Аналогія з будинком

Уявіть, що Google — це поштар, який приносить листа:

  • 🏠 Норма: поштар приходить за адресою, дзвонить у двері, ви відкриваєте і отримуєте листа
  • 🚪 Помилка 404: поштар приходить за адресою, але будинку немає — тільки порожня земля. Він повертається назад з листом.

🤔 Чому виникають 404 помилки

Топ-5 причин:

  1. Видалили сторінку: ви видалили товар/статтю, але посилання на неї залишились на інших сторінках або в Google
  2. Змінили URL: перейменували сторінку з /old-page на /new-page, але не зробили редірект
  3. Друкарська помилка: десь на сайті посилання написано неправильно (/page замість /paage)
  4. Зламані посилання: посилання на зовнішній сайт, який закрився
  5. Проблеми з сервером: файл існує, але сервер його не віддає через помилку налаштувань

😤 Чому 404 — це погано

  • ❌ Google не може проіндексувати сторінку → сторінка не з'явиться в пошуку
  • ❌ Користувачі, які перейшли за посиланням, бачать білу сторінку з "404 Not Found" → йдуть до конкурентів
  • ❌ Багато 404 помилок = Google думає, що сайт погано підтримується → може знизити позиції
  • ❌ Погіршується user experience → падає конверсія

👉 Статистика: кожна 404 помилка на важливій сторінці = мінус 100% трафіку на цю сторінку. Якщо у вас 10 товарів з 404, і кожен міг приносити 100 відвідувачів на місяць — ви втрачаєте 1000 відвідувачів.

🔧 Як виправити 404: покрокова інструкція

Крок 1: Знайдіть всі 404 помилки

  1. GSC → "Індексування" → "Сторінки"
  2. Прокрутіть до розділу "Чому сторінки не індексовані"
  3. Знайдіть рядок "Помилка 404" або "Не знайдено (404)"
  4. Клікніть на неї → побачите список усіх URL з 404
  5. Експортуйте список (кнопка "Експорт")

Крок 2: Вирішіть для кожної сторінки

Для кожного URL є 3 варіанти дій:

Варіант А: Відновіть сторінку (якщо вона важлива)

  • 📄 Якщо це важливий товар/стаття, яку випадково видалили
  • ✅ Відновіть сторінку з резервної копії або створіть заново
  • ⏱️ Зачекайте 1-2 тижні — Google переіндексує

Варіант Б: Зробіть 301 редірект (найкращий варіант)

  • 🔀 Якщо сторінка була видалена, але є схожа альтернатива
  • 💡 Приклад: товар закінчився → редірект на категорію або схожий товар
  • ⚙️ Налаштуйте 301 редірект з /old-page на /new-page

Як зробити 301 редірект:

  • WordPress: плагін Redirection або Rank Math
  • Через .htaccess: Redirect 301 /old-page https://yoursite.com/new-page
  • Через хостинг: у панелі хостингу (cPanel) є розділ "Redirects"

Варіант В: Ігноруйте (якщо це непотрібна сторінка)

  • 🗑️ Якщо це старий тестовий URL, який ніколи не був важливим
  • ✅ Просто видаліть всі посилання на цю сторінку з сайту
  • ⏱️ Google через кілька місяців перестане перевіряти цей URL

Крок 3: Видаліть внутрішні посилання на 404

  • 🔍 Знайдіть всі місця на сайті, де є посилання на 404 URL
  • ❌ Видаліть ці посилання або замініть на робочі
  • 💡 Інструменти: Screaming Frog, Sitebulb, або вручну через пошук на сайті

Крок 4: Запросіть переіндексацію

  1. У GSC → клікніть на проблемний URL
  2. Натисніть "Перевірити URL"
  3. Після перевірки → "Запросити індексування"
  4. Google перевірить сторінку протягом 1-7 днів

Швидкий висновок: помилка 404 = сторінка не існує. Для важливих сторінок: відновіть або зробіть 301 редірект на схожу. Для непотрібних: видаліть посилання і ігноруйте. Завжди видаляйте внутрішні посилання на 404 сторінки — це погіршує UX і витрачає crawl budget Google.

🚫 Noindex: заборона індексації

Noindex — це спеціальний тег, який каже Google: "Не додавай цю сторінку в індекс". Це як табличка "Вхід заборонено" на дверях — Google бачить сторінку, але не додає її в пошук.

🚪 Аналогія з рестораном

  • 🍽️ Норма: ресторан відкритий, на дверях написано "Заходьте", люди можуть зайти і поїсти
  • 🚫 Noindex: ресторан працює, їжа готується, але на дверях табличка "Приватна вечірка, вхід тільки за запрошенням". Звичайні відвідувачі не можуть зайти.

🤔 Коли noindex — це нормально

Є сторінки, які МАЮТЬ бути з noindex:

  • Кошик: /cart/
  • Оформлення замовлення: /checkout/
  • Особистий кабінет: /account/, /profile/
  • Сторінки входу/реєстрації: /login/, /register/
  • Дякуємо за замовлення: /thank-you/
  • Пошук по сайту: /search?q=
  • Сторінки з параметрами (фільтри): /category/?color=red&size=xl

👉 Чому це нормально: ці сторінки не мають цінності для користувачів з Google. Вони потрібні тільки тим, хто вже на сайті.

😤 Коли noindex — це ПОГАНО

Сторінки, які НЕ повинні мати noindex:

  • Товари інтернет-магазину: /products/iphone-15/
  • Статті блогу: /blog/how-to-cook/
  • Послуги: /services/seo/
  • Категорії: /category/electronics/
  • Головна сторінка: / або /home/

👉 Якщо ці сторінки мають noindex — ви втрачаєте 100% трафіку з Google на них. Це серйозна проблема!

🔍 Як знайти сторінки з noindex

Спосіб 1: Через GSC

  1. GSC → "Індексування" → "Сторінки"
  2. Знайдіть рядок "Виключено через тег 'noindex'"
  3. Клікніть → побачите список усіх URL з noindex
  4. Перевірте, чи є там важливі сторінки

Спосіб 2: Перевірка конкретної сторінки

  1. Відкрийте сторінку в браузері
  2. Правою кнопкою миші → "Переглянути код"
  3. Ctrl+F → шукайте "noindex"
  4. Якщо знайшли <meta name="robots" content="noindex"> — ця сторінка має noindex

🔧 Як видалити noindex: покрокова інструкція

Для WordPress:

Варіант 1: Через SEO плагін (Yoast/Rank Math)

  1. Відкрийте проблемну сторінку в редакторі WordPress
  2. Прокрутіть вниз до блоку Yoast SEO або Rank Math
  3. Знайдіть вкладку "Розширені" (Advanced)
  4. Перевірте, чи НЕ встановлено "No index"
  5. Якщо встановлено → зніміть галочку
  6. Збережіть сторінку

Варіант 2: Глобальні налаштування

  1. WordPress → "Налаштування" → "Читання"
  2. Перевірте, чи НЕ встановлено галочку "Закрити сайт від пошукових систем"
  3. Якщо встановлено — ВЕСЬ сайт має noindex! Зніміть негайно

Для HTML-сайту:

  1. Відкрийте файл сторінки через FTP або файловий менеджер хостингу
  2. Знайдіть у секції <head> рядок:
  3. <meta name="robots" content="noindex">
  4. Видаліть цей рядок
  5. Збережіть файл

Після видалення noindex:

  1. Зачекайте 24 години
  2. GSC → "Перевірити URL"
  3. "Запросити індексування"
  4. Google переіндексує сторінку протягом 1-7 днів

Швидкий висновок: noindex = заборона індексації. Це нормально для технічних сторінок (кошик, логін), але ПОГАНО для товарів/статей/послуг. Перевірте GSC, чи немає noindex на важливих сторінках. Видаліть через WordPress admin або вручну з коду. Після видалення — запросіть переіндексацію.

📄 Дублі контенту: однаковий текст

Дублі контенту — це коли Google бачить однаковий текст на кількох URL вашого сайту. Google не любить дублі, бо не знає, яку сторінку показувати в пошуку. Тому він вибирає одну "канонічну" (головну), а решту ігнорує.

👯 Аналогія з близнюками

  • 👤 Норма: у вас є один син Петро. Всі знають, де він живе, як його знайти
  • 👥 Дублі: у вас є 5 синів-близнюків, всі виглядають однаково і всі називаються Петро. Хтось хоче знайти Петра — не знає, до якого з 5 йти. Вибирає випадкового.

🤔 Чому виникають дублі контенту

Топ-5 причин дублів:

  1. HTTP vs HTTPS: http://site.com і https://site.com — Google бачить як 2 різні сторінки
  2. WWW vs без WWW: www.site.com і site.com — теж 2 різні версії
  3. Слеш в кінці URL: /page і /page/ — різні адреси, однаковий контент
  4. Параметри в URL: /product?color=red і /product?color=blue — різні URL, той самий опис
  5. Варіації товару: окремі сторінки для кожного кольору з однаковим текстом

😤 Чому дублі — це погано

  • ❌ Google індексує тільки 1 версію, решту ігнорує
  • ❌ Розмивається "сила" сторінки між дублями
  • ❌ Витрачається crawl budget на сканування дублів

🔧 Як виправити дублі

Рішення 1: Canonical тег (найкращий)

Додайте в <head> кожного дубля:

<link rel="canonical" href="https://site.com/main-page/" />

Рішення 2: 301 редірект

Для повних дублів (HTTP→HTTPS, WWW→без WWW) налаштуйте редірект через .htaccess або WordPress плагін.

Швидкий висновок: дублі = однаковий контент на різних URL. Рішення: canonical тег або 301 редірект. Обов'язково виправте HTTP/HTTPS та WWW дублі.

Детальніше: як виправити канібалізацію.

⚠️ Soft 404: фальшива помилка

Soft 404 — це коли сервер повертає код 200 (ОК), але сторінка насправді порожня. Це як відкрити холодильник і побачити записку "Їжі немає" замість самої їжі.

🏪 Аналогія з магазином

  • Нормальна 404: магазин закритий, табличка "Закрито" — ви одразу розумієте
  • ⚠️ Soft 404: магазин відкритий, світло горить, але всередині порожньо. Тільки табличка "Все розпродано"

🤔 Чому виникає Soft 404

  1. Товар закінчився: сторінка існує, але тільки текст "Товар відсутній"
  2. Порожня категорія: 0 товарів, тільки "Товарів не знайдено"
  3. Видалений контент: статтю видалили, але показується головна з кодом 200

🔧 Як виправити Soft 404

Варіант А: Додайте контент

Для товару, що закінчився: залишіть повний опис + фото + кнопка "Повідомити про надходження". Мінімум 300 слів тексту.

Варіант Б: 301 редірект

Якщо товар більше не буде — редірект на категорію або схожий товар.

Варіант В: Справжня 404

Налаштуйте сервер повертати код 404 замість 200 для видалених сторінок.

Швидкий висновок: Soft 404 = сервер каже "ОК", але сторінка порожня. Додайте контент (300+ слів) або зробіть 301 редірект.

🤖 Блокування robots.txt

Robots.txt — це файл-інструкція для Google, які сторінки можна сканувати. Якщо випадково заблокували важливі сторінки — вони не проіндексуються.

🔍 Як перевірити robots.txt

Відкрийте https://yoursite.com/robots.txt в браузері.

Приклад ПОГАНОГО robots.txt:

User-agent: *

Disallow: /

👉 Це блокує ВЕСЬ сайт! Терміново виправляйте!

Приклад правильного:

User-agent: *

Disallow: /wp-admin/

Disallow: /cart/

Disallow: /checkout/

Sitemap: https://yoursite.com/sitemap.xml

🔧 Як виправити блокування

  1. GSC → "Індексування" → "Сторінки"
  2. Знайдіть "Заблоковано файлом robots.txt"
  3. Перевірте, чи це важливі сторінки (товари/статті)
  4. Відредагуйте robots.txt — видаліть рядки, що блокують важливі сторінки

Для WordPress: Yoast SEO → Інструменти → Редактор файлів → Robots.txt

Швидкий висновок: robots.txt каже Google, що не сканувати. Блокуйте ТІЛЬКИ технічні сторінки (admin, cart). НІКОЛИ не блокуйте товари, статті, послуги.

❓ Часті питання (FAQ)

🔍 Скільки часу Google індексує сторінку після виправлення?

1-7 днів, якщо запросили індексування через GSC. Без запиту — 2-4 тижні.

🔍 У мене 500 сторінок, проіндексовано 200. Це нормально?

Залежить від того, які 300 не проіндексовані. Якщо це кошик, фільтри, UTM — нормально. Якщо товари/статті — треба виправляти.

🔍 Чи можна запросити масову індексацію?

Тільки по одній сторінці через GSC. Для масової — додайте/оновіть sitemap.xml, Google автоматично переглянете всі URL за кілька днів.

🔍 Чи впливає кількість проіндексованих сторінок на ранжування?

Опосередковано — так. Більше якісних сторінок = більше можливостей ранжуватися. Але 100 якісних краще, ніж 1000 низькоякісних.

Детальніше про фактори ранжування Google.

🔍 Після видалення noindex сторінка не індексується вже місяць. Що робити?

1) Перевірте, що noindex дійсно видалено (код сторінки), 2) Запросіть індексування в GSC, 3) Додайте внутрішні посилання, 4) Покращте контент (додайте 300+ слів).

✅ Висновки

Підведемо підсумки про покриття індексації:

  • 🎯 Google індексує вибірково: тільки якісні сторінки без технічних проблем
  • 🎯 4 статуси в GSC: проіндексовано (добре), виключено (перевірте чому), помилка (виправляйте)
  • 🎯 Топ-5 проблем: 404, noindex, дублі, soft 404, robots.txt
  • 🎯 Для кожної є рішення: 404 → редірект, noindex → видалити тег, дублі → canonical
  • 💡 Пріоритет: спочатку важливі сторінки (товари, статті), технічні можуть бути виключені
  • 💡 Після виправлення: запросіть індексування в GSC, зачекайте 1-2 тижні

💯 Підсумок: розділ "Індексування" в GSC — це рентген вашого сайту. Якщо важлива сторінка не проіндексована — ви втрачаєте 100% трафіку на неї. Перевіряйте GSC раз на місяць, виправляйте критичні помилки — і трафік зросте на 20-50%!

Цю статтю підготував засновник компанії з 8-річним досвідом — Вадім Харов'юк.