Покриття індексації в GSC: як виправити помилки та виключення
Ви написали 50 статей на блозі, але Google показує тільки 20 у пошуку. Де решта 30? Чому Google їх ігнорує? Google Search Console має розділ "Покриття" (тепер називається "Індексування"), який показує ТОЧНО, які сторінки Google бачить, а які — ні. І найголовніше — чому. У цій статті я розберу кожну можливу помилку індексації, що вона означає і як її виправити за 5-10 хвилин. Навіть якщо ви ніколи не лазили в код сайту.
⚡ Коротко
- ✅ Індексація ≠ існування сторінки: Google вибірково індексує тільки якісні сторінки
- ✅ 4 статуси сторінок: проіндексовано, з попередженнями, виключено, помилка
- ✅ Топ-5 проблем: 404, noindex, дублі контенту, soft 404, блокування robots.txt
- 🎯 Ви отримаєте: покрокові інструкції для виправлення кожної помилки
- 👇 Детальніше читайте нижче — з реальними прикладами та чек-листами
Зміст статті:
- 📌 Що таке індексація простими словами
- 📌 4 статуси сторінок в GSC
- 📌 Помилка 404: сторінка не знайдена
- 📌 Noindex: заборона індексації
- 📌 Дублі контенту: однаковий текст
- 📌 Soft 404: фальшива помилка
- 📌 Блокування robots.txt
- 📌 Інші проблеми індексації
- ❓ Часті питання (FAQ)
- ✅ Висновки
⸻
🔍 Що таке індексація простими словами
Індексація — це процес, коли Google додає вашу сторінку в свою базу даних і може показувати її в пошуку. Якщо сторінка НЕ проіндексована — вона не існує для Google. Навіть якщо вона живе на вашому сайті.
📚 Аналогія з бібліотекою
Уявіть, що Google — це величезна бібліотека, а ваш сайт — це збірка книжок:
- 📖 Проіндексована сторінка: книжка стоїть на полиці в каталозі. Люди можуть її знайти через пошук і взяти почитати.
- 🚫 Непроіндексована сторінка: книжка лежить у вас вдома. Вона існує, але бібліотека про неї не знає. Ніхто не може її знайти через каталог бібліотеки.
- 📋 Сторінка на розгляді: ви принесли книжку в бібліотеку, бібліотекар перевіряє — чи варто її додавати в каталог. Якщо книжка якісна — додадуть. Якщо ні — відмовлять.
🤔 Чому Google не індексує ВСІ сторінки?
Багато власників сайтів думають: "У мене 100 сторінок на сайті = Google має показувати всі 100 у пошуку". Але це не так.
Google вибірково індексує тільки:
- ✅ Якісні сторінки з унікальним контентом
- ✅ Сторінки, які корисні користувачам
- ✅ Сторінки без технічних проблем
- ✅ Сторінки, які НЕ заборонені до індексації
Google НЕ індексує:
- ❌ Дублі контенту (скопійований текст)
- ❌ Низькоякісні сторінки (мало тексту, немає цінності)
- ❌ Технічні сторінки (кошик, форми оплати)
- ❌ Сторінки з помилками (404, 500)
- ❌ Сторінки, заблоковані власником (noindex, robots.txt)
👉 Життєвий приклад: у вас інтернет-магазин з 1000 товарів. Google проіндексував 400. Чому не всі? Можливо, 300 товарів — це дублі (однакові товари різних кольорів), 200 — закінчились на складі (порожні сторінки), 100 — заблоковані в robots.txt.
✅ Швидкий висновок: індексація — це коли Google додає сторінку в свою базу і може показувати в пошуку. Не всі сторінки індексуються — Google вибирає тільки якісні та корисні. Якщо важлива сторінка не проіндексована — ви втрачаєте трафік.
Якщо ще не налаштували Google Search Console, читайте нашу покрокову інструкцію з налаштування GSC.
⸻
📊 4 статуси сторінок в GSC
У розділі "Індексування" → "Сторінки" Google Search Console показує 4 категорії сторінок.
Статус | Що означає | Це добре? | Що робити |
---|---|---|---|
✅ Проіндексовано | Сторінка в індексі Google, може з'явитись у пошуку | ✅ Так | Нічого, все добре |
⚠️ Проіндексовано з попередженнями | Сторінка в індексі, але є невеликі проблеми | ⚠️ Так, але краще виправити | Перевірте попередження |
❌ Виключено | Google вирішив НЕ індексувати цю сторінку | ⚠️ Залежить від причини | Перевірте причину виключення |
🔴 Помилка | Критична проблема (404, 500, тощо) | ❌ Ні, треба виправляти | Виправте помилку ASAP |
🎯 Як читати звіт
Крок 1: Відкрийте GSC
- Йдіть в Google Search Console
- Виберіть ваш сайт
- У лівому меню: "Індексування" → "Сторінки"
Крок 2: Проаналізуйте цифри
Ви побачите графік з двома лініями:
- 🟢 Зелена лінія: проіндексовані сторінки (добре)
- 🔴 Червона лінія: не проіндексовані (потенційна проблема)
Крок 3: Перевірте причини виключення
Прокрутіть вниз — побачите список причин, чому сторінки не проіндексовані:
- ❌ Помилка 404 (50 сторінок)
- 🚫 Виключено через noindex (30 сторінок)
- 📄 Дублікат (20 сторінок)
- ⚠️ Soft 404 (10 сторінок)
👉 Клікайте на кожну причину — побачите конкретні URL, які мають цю проблему.
🚨 Пріоритети: що виправляти першим
Не всі проблеми однаково критичні. Ось порядок важливості:
- 🔴 Помилки 404 на важливих сторінках: критично, виправляйте першим
- 🚫 Noindex на важливих сторінках: дуже погано, треба виправити
- ⚠️ Soft 404: середня важливість
- 📄 Дублі контенту: потрібно виправити, але не критично
- ⚙️ Noindex на технічних сторінках (кошик, вхід): це нормально, нічого робити не треба
✅ Швидкий висновок: GSC показує 4 статуси сторінок. Зелена зона = добре, червона = треба виправляти. Найважливіше — перевірити, чи немає помилок 404 або noindex на важливих сторінках (товари, статті, послуги). Технічні сторінки (кошик, логін) можуть бути виключені — це нормально.
⸻
🚫 Помилка 404: сторінка не знайдена
Помилка 404 означає, що сервер не може знайти сторінку за цією адресою. Простими словами: Google приходить за вашою сторінкою, а її немає — двері замкнені, ніхто не відповідає.
🏚️ Аналогія з будинком
Уявіть, що Google — це поштар, який приносить листа:
- 🏠 Норма: поштар приходить за адресою, дзвонить у двері, ви відкриваєте і отримуєте листа
- 🚪 Помилка 404: поштар приходить за адресою, але будинку немає — тільки порожня земля. Він повертається назад з листом.
🤔 Чому виникають 404 помилки
Топ-5 причин:
- Видалили сторінку: ви видалили товар/статтю, але посилання на неї залишились на інших сторінках або в Google
- Змінили URL: перейменували сторінку з
/old-page
на/new-page
, але не зробили редірект - Друкарська помилка: десь на сайті посилання написано неправильно (
/page
замість/paage
) - Зламані посилання: посилання на зовнішній сайт, який закрився
- Проблеми з сервером: файл існує, але сервер його не віддає через помилку налаштувань
😤 Чому 404 — це погано
- ❌ Google не може проіндексувати сторінку → сторінка не з'явиться в пошуку
- ❌ Користувачі, які перейшли за посиланням, бачать білу сторінку з "404 Not Found" → йдуть до конкурентів
- ❌ Багато 404 помилок = Google думає, що сайт погано підтримується → може знизити позиції
- ❌ Погіршується user experience → падає конверсія
👉 Статистика: кожна 404 помилка на важливій сторінці = мінус 100% трафіку на цю сторінку. Якщо у вас 10 товарів з 404, і кожен міг приносити 100 відвідувачів на місяць — ви втрачаєте 1000 відвідувачів.
🔧 Як виправити 404: покрокова інструкція
Крок 1: Знайдіть всі 404 помилки
- GSC → "Індексування" → "Сторінки"
- Прокрутіть до розділу "Чому сторінки не індексовані"
- Знайдіть рядок "Помилка 404" або "Не знайдено (404)"
- Клікніть на неї → побачите список усіх URL з 404
- Експортуйте список (кнопка "Експорт")
Крок 2: Вирішіть для кожної сторінки
Для кожного URL є 3 варіанти дій:
Варіант А: Відновіть сторінку (якщо вона важлива)
- 📄 Якщо це важливий товар/стаття, яку випадково видалили
- ✅ Відновіть сторінку з резервної копії або створіть заново
- ⏱️ Зачекайте 1-2 тижні — Google переіндексує
Варіант Б: Зробіть 301 редірект (найкращий варіант)
- 🔀 Якщо сторінка була видалена, але є схожа альтернатива
- 💡 Приклад: товар закінчився → редірект на категорію або схожий товар
- ⚙️ Налаштуйте 301 редірект з
/old-page
на/new-page
Як зробити 301 редірект:
- WordPress: плагін Redirection або Rank Math
- Через .htaccess:
Redirect 301 /old-page https://yoursite.com/new-page
- Через хостинг: у панелі хостингу (cPanel) є розділ "Redirects"
Варіант В: Ігноруйте (якщо це непотрібна сторінка)
- 🗑️ Якщо це старий тестовий URL, який ніколи не був важливим
- ✅ Просто видаліть всі посилання на цю сторінку з сайту
- ⏱️ Google через кілька місяців перестане перевіряти цей URL
Крок 3: Видаліть внутрішні посилання на 404
- 🔍 Знайдіть всі місця на сайті, де є посилання на 404 URL
- ❌ Видаліть ці посилання або замініть на робочі
- 💡 Інструменти: Screaming Frog, Sitebulb, або вручну через пошук на сайті
Крок 4: Запросіть переіндексацію
- У GSC → клікніть на проблемний URL
- Натисніть "Перевірити URL"
- Після перевірки → "Запросити індексування"
- Google перевірить сторінку протягом 1-7 днів
✅ Швидкий висновок: помилка 404 = сторінка не існує. Для важливих сторінок: відновіть або зробіть 301 редірект на схожу. Для непотрібних: видаліть посилання і ігноруйте. Завжди видаляйте внутрішні посилання на 404 сторінки — це погіршує UX і витрачає crawl budget Google.
⸻
🚫 Noindex: заборона індексації
Noindex — це спеціальний тег, який каже Google: "Не додавай цю сторінку в індекс". Це як табличка "Вхід заборонено" на дверях — Google бачить сторінку, але не додає її в пошук.
🚪 Аналогія з рестораном
- 🍽️ Норма: ресторан відкритий, на дверях написано "Заходьте", люди можуть зайти і поїсти
- 🚫 Noindex: ресторан працює, їжа готується, але на дверях табличка "Приватна вечірка, вхід тільки за запрошенням". Звичайні відвідувачі не можуть зайти.
🤔 Коли noindex — це нормально
Є сторінки, які МАЮТЬ бути з noindex:
- ✅ Кошик:
/cart/
- ✅ Оформлення замовлення:
/checkout/
- ✅ Особистий кабінет:
/account/
,/profile/
- ✅ Сторінки входу/реєстрації:
/login/
,/register/
- ✅ Дякуємо за замовлення:
/thank-you/
- ✅ Пошук по сайту:
/search?q=
- ✅ Сторінки з параметрами (фільтри):
/category/?color=red&size=xl
👉 Чому це нормально: ці сторінки не мають цінності для користувачів з Google. Вони потрібні тільки тим, хто вже на сайті.
😤 Коли noindex — це ПОГАНО
Сторінки, які НЕ повинні мати noindex:
- ❌ Товари інтернет-магазину:
/products/iphone-15/
- ❌ Статті блогу:
/blog/how-to-cook/
- ❌ Послуги:
/services/seo/
- ❌ Категорії:
/category/electronics/
- ❌ Головна сторінка:
/
або/home/
👉 Якщо ці сторінки мають noindex — ви втрачаєте 100% трафіку з Google на них. Це серйозна проблема!
🔍 Як знайти сторінки з noindex
Спосіб 1: Через GSC
- GSC → "Індексування" → "Сторінки"
- Знайдіть рядок "Виключено через тег 'noindex'"
- Клікніть → побачите список усіх URL з noindex
- Перевірте, чи є там важливі сторінки
Спосіб 2: Перевірка конкретної сторінки
- Відкрийте сторінку в браузері
- Правою кнопкою миші → "Переглянути код"
- Ctrl+F → шукайте "noindex"
- Якщо знайшли
<meta name="robots" content="noindex">
— ця сторінка має noindex
🔧 Як видалити noindex: покрокова інструкція
Для WordPress:
Варіант 1: Через SEO плагін (Yoast/Rank Math)
- Відкрийте проблемну сторінку в редакторі WordPress
- Прокрутіть вниз до блоку Yoast SEO або Rank Math
- Знайдіть вкладку "Розширені" (Advanced)
- Перевірте, чи НЕ встановлено "No index"
- Якщо встановлено → зніміть галочку
- Збережіть сторінку
Варіант 2: Глобальні налаштування
- WordPress → "Налаштування" → "Читання"
- Перевірте, чи НЕ встановлено галочку "Закрити сайт від пошукових систем"
- Якщо встановлено — ВЕСЬ сайт має noindex! Зніміть негайно
Для HTML-сайту:
- Відкрийте файл сторінки через FTP або файловий менеджер хостингу
- Знайдіть у секції
<head>
рядок: <meta name="robots" content="noindex">
- Видаліть цей рядок
- Збережіть файл
Після видалення noindex:
- Зачекайте 24 години
- GSC → "Перевірити URL"
- "Запросити індексування"
- Google переіндексує сторінку протягом 1-7 днів
✅ Швидкий висновок: noindex = заборона індексації. Це нормально для технічних сторінок (кошик, логін), але ПОГАНО для товарів/статей/послуг. Перевірте GSC, чи немає noindex на важливих сторінках. Видаліть через WordPress admin або вручну з коду. Після видалення — запросіть переіндексацію.
⸻
📄 Дублі контенту: однаковий текст
Дублі контенту — це коли Google бачить однаковий текст на кількох URL вашого сайту. Google не любить дублі, бо не знає, яку сторінку показувати в пошуку. Тому він вибирає одну "канонічну" (головну), а решту ігнорує.
👯 Аналогія з близнюками
- 👤 Норма: у вас є один син Петро. Всі знають, де він живе, як його знайти
- 👥 Дублі: у вас є 5 синів-близнюків, всі виглядають однаково і всі називаються Петро. Хтось хоче знайти Петра — не знає, до якого з 5 йти. Вибирає випадкового.
🤔 Чому виникають дублі контенту
Топ-5 причин дублів:
- HTTP vs HTTPS:
http://site.com
іhttps://site.com
— Google бачить як 2 різні сторінки - WWW vs без WWW:
www.site.com
іsite.com
— теж 2 різні версії - Слеш в кінці URL:
/page
і/page/
— різні адреси, однаковий контент - Параметри в URL:
/product?color=red
і/product?color=blue
— різні URL, той самий опис - Варіації товару: окремі сторінки для кожного кольору з однаковим текстом
😤 Чому дублі — це погано
- ❌ Google індексує тільки 1 версію, решту ігнорує
- ❌ Розмивається "сила" сторінки між дублями
- ❌ Витрачається crawl budget на сканування дублів
🔧 Як виправити дублі
Рішення 1: Canonical тег (найкращий)
Додайте в <head>
кожного дубля:
<link rel="canonical" href="https://site.com/main-page/" />
Рішення 2: 301 редірект
Для повних дублів (HTTP→HTTPS, WWW→без WWW) налаштуйте редірект через .htaccess або WordPress плагін.
✅ Швидкий висновок: дублі = однаковий контент на різних URL. Рішення: canonical тег або 301 редірект. Обов'язково виправте HTTP/HTTPS та WWW дублі.
Детальніше: як виправити канібалізацію.
⸻
⚠️ Soft 404: фальшива помилка
Soft 404 — це коли сервер повертає код 200 (ОК), але сторінка насправді порожня. Це як відкрити холодильник і побачити записку "Їжі немає" замість самої їжі.
🏪 Аналогія з магазином
- ✅ Нормальна 404: магазин закритий, табличка "Закрито" — ви одразу розумієте
- ⚠️ Soft 404: магазин відкритий, світло горить, але всередині порожньо. Тільки табличка "Все розпродано"
🤔 Чому виникає Soft 404
- Товар закінчився: сторінка існує, але тільки текст "Товар відсутній"
- Порожня категорія: 0 товарів, тільки "Товарів не знайдено"
- Видалений контент: статтю видалили, але показується головна з кодом 200
🔧 Як виправити Soft 404
Варіант А: Додайте контент
Для товару, що закінчився: залишіть повний опис + фото + кнопка "Повідомити про надходження". Мінімум 300 слів тексту.
Варіант Б: 301 редірект
Якщо товар більше не буде — редірект на категорію або схожий товар.
Варіант В: Справжня 404
Налаштуйте сервер повертати код 404 замість 200 для видалених сторінок.
✅ Швидкий висновок: Soft 404 = сервер каже "ОК", але сторінка порожня. Додайте контент (300+ слів) або зробіть 301 редірект.
⸻
🤖 Блокування robots.txt
Robots.txt — це файл-інструкція для Google, які сторінки можна сканувати. Якщо випадково заблокували важливі сторінки — вони не проіндексуються.
🔍 Як перевірити robots.txt
Відкрийте https://yoursite.com/robots.txt
в браузері.
Приклад ПОГАНОГО robots.txt:
User-agent: *Disallow: /
👉 Це блокує ВЕСЬ сайт! Терміново виправляйте!
Приклад правильного:
User-agent: *Disallow: /wp-admin/
Disallow: /cart/
Disallow: /checkout/
Sitemap: https://yoursite.com/sitemap.xml
🔧 Як виправити блокування
- GSC → "Індексування" → "Сторінки"
- Знайдіть "Заблоковано файлом robots.txt"
- Перевірте, чи це важливі сторінки (товари/статті)
- Відредагуйте robots.txt — видаліть рядки, що блокують важливі сторінки
Для WordPress: Yoast SEO → Інструменти → Редактор файлів → Robots.txt
✅ Швидкий висновок: robots.txt каже Google, що не сканувати. Блокуйте ТІЛЬКИ технічні сторінки (admin, cart). НІКОЛИ не блокуйте товари, статті, послуги.
⸻
❓ Часті питання (FAQ)
🔍 Скільки часу Google індексує сторінку після виправлення?
1-7 днів, якщо запросили індексування через GSC. Без запиту — 2-4 тижні.
🔍 У мене 500 сторінок, проіндексовано 200. Це нормально?
Залежить від того, які 300 не проіндексовані. Якщо це кошик, фільтри, UTM — нормально. Якщо товари/статті — треба виправляти.
🔍 Чи можна запросити масову індексацію?
Тільки по одній сторінці через GSC. Для масової — додайте/оновіть sitemap.xml, Google автоматично переглянете всі URL за кілька днів.
🔍 Чи впливає кількість проіндексованих сторінок на ранжування?
Опосередковано — так. Більше якісних сторінок = більше можливостей ранжуватися. Але 100 якісних краще, ніж 1000 низькоякісних.
Детальніше про фактори ранжування Google.
🔍 Після видалення noindex сторінка не індексується вже місяць. Що робити?
1) Перевірте, що noindex дійсно видалено (код сторінки), 2) Запросіть індексування в GSC, 3) Додайте внутрішні посилання, 4) Покращте контент (додайте 300+ слів).
⸻
✅ Висновки
Підведемо підсумки про покриття індексації:
- 🎯 Google індексує вибірково: тільки якісні сторінки без технічних проблем
- 🎯 4 статуси в GSC: проіндексовано (добре), виключено (перевірте чому), помилка (виправляйте)
- 🎯 Топ-5 проблем: 404, noindex, дублі, soft 404, robots.txt
- 🎯 Для кожної є рішення: 404 → редірект, noindex → видалити тег, дублі → canonical
- 💡 Пріоритет: спочатку важливі сторінки (товари, статті), технічні можуть бути виключені
- 💡 Після виправлення: запросіть індексування в GSC, зачекайте 1-2 тижні
💯 Підсумок: розділ "Індексування" в GSC — це рентген вашого сайту. Якщо важлива сторінка не проіндексована — ви втрачаєте 100% трафіку на неї. Перевіряйте GSC раз на місяць, виправляйте критичні помилки — і трафік зросте на 20-50%!
Цю статтю підготував засновник компанії з 8-річним досвідом — Вадім Харов'юк.