Індексна дієта - що це приносить і як це працює GrowthUp
Більше не завжди краще - іноді доводиться розлучатися з речами. Тут ви можете дізнатися, що вам потрібно зробити, щоб додати до покажчика лише дійсно хороший та важливий вміст.
Цього можна очікувати у цій публікації
- Що таке індексна дієта?
- Яким вимогам потрібно відповідати?
- Як вам далі діяти?
Ця стаття була створена у співпраці з Ванессою Остнер та Майком Шиндлером.
Індексна дієта в даний час у всіх на вустах. І це не дивно - адже ажіотаж над вмістом створив стільки вмісту, що в якийсь момент він мав стати перенасиченим. Опубліковано (і все ще є) стільки вмісту, що не все може додати цінності для відвідувачів чи пошукових систем.
З чого починається?
Що стосується вмісту, він такий самий, як і у всіх інших ажіотажів. Те, що починається як розумне нововведення, зводиться до абсурду тим, що все більше і більше людей стрибають на ноги, а також хочуть шматок пирога. І тому вміст перетворився з царя на панацею - і якість часто падала на задній план. Навіть розрахунок того, що за допомогою цього вмісту знайдено всі можливі та неможливі пошукові терміни та комбінації, насправді спрацював лише в декількох випадках.
Тим більше, що Google також звернув увагу на якість контенту разом з Panda and Co., такий підхід насправді більше не рекомендується. Часто таке використання вмісту просто призводить до повільної смерті в результатах пошуку. Сторінки "багато що допомагає", які мають що сказати про все, є хорошим прикладом тут:

Рис. 1: Повільна загибель сайту з величезними проблемами з тонким вмістом та майже повторним вмістом.
Але що ви можете зробити, щоб увесь марний вміст - від дублікатів до 2-зіркових текстів Textbroker - не загрожував вашому успіху в SERP? Перш за все, слід переконатись, що до індексу включаються лише ті сторінки, які дійсно важливі для пошуку. Але якими вони були б?
В Інтернет-магазинах сторінками, що мають відношення до пошуку, є стартова сторінка, сторінки категорій, сторінки підкатегорій, сторінки товарів та, якщо застосовно, сторінки тем. Для сторінок видавців справді важливі початкова сторінка, категорії тем, підкатегорії, статті, медіа-вміст (наприклад, відео чи подкасти) та довгий вміст (як PDF-файли та технічні документи).
На відміну від цього, наступні сторінки в більшості випадків не є релевантними для пошуку:
- Сторінки результатів пошуку
- Фільтрувати сторінки, сортування та подібні типи сторінок
- Дублікати
- тонкий вміст
- порожні сторінки
- ...
Напевно, ви знаєте багато веб-сайтів, які розміщують сторінки результатів пошуку або дублікати в індексі. Це показує, чому індексна дієта стає все більш актуальною - і цей розвиток також відображається в програмах відповідних конференцій.
Рис. 2: Анонсована лекція від OTTO на SEO CAMPIXX 2018.
Коли слід починати індексну дієту?
В основному є дві основні проблеми, які виникають через багато поганого вмісту:
- Google (і будь-яка інша пошукова система теж) повинен просканувати всі існуючі документи, щоб їх індексувати.
- Google (а також будь-яка інша пошукова система) повинна проаналізувати проіндексовані документи на предмет їх відповідності, щоб мати можливість показувати їх у пошуку.
Отже, якщо ви пропонуєте багато "нікчемного" контенту, ви марно витрачаєте важливі ресурси. Зрештою, ви відволікаєте сканери від вашого справді хорошого вмісту. Їх може не просканувати та проіндексувати досить швидко. Також може трапитися так, що маса поганого вмісту розмиває актуальність вашого хорошого вмісту в індексі.
Ви пропонуєте статтю на тему “Очищення індексу”. Це має ранжуватися відповідно до ключового слова “коригування індексу”. На цю статтю посилаються різні сторінки тем і, отже, доступна через параметризовані URL-адреси:
- де/індекс очищення
- де/коригування індексу? source = company-page-a
- де/коригування індексу? джерело = сторінка компанії-b
- де/коригування індексу? джерело = сторінка компанії-c
- де/коригування індексу? джерело = сторінка компанії-d
Зараз постає питання: який із цих п’яти документів є правильним та важливим? Тому що насправді у вас є п’ять статей з однаковим змістом. Тепер, якщо Google не може визначитися з версією, машина вибере інший вміст. Було б набагато краще, якби у вас був справді сильний документ.
Як можна визначити “надлишок”?
То як ви можете визначити зайві сторінки? Ну, найкраще це робити в кілька етапів.
1-й крок: запит сайту
Для початкового огляду ви можете зробити запит сайту в Google. Або з "сайт: домен", або з "сайт: тема". Але будьте обережні: запит на веб-сайті є лише приблизним та не забезпечує 100% надійного уявлення про фактичну кількість проіндексованих сторінок.
Рис. 3: Запит веб-сайту німецької Вікіпедії висуває на перший план близько 4 мільйонів проіндексованих документів.
Рис. 4: Німецький запит на сайті Вікіпедії щодо «Ангели Меркель» повертає близько 31 проіндексованого документа.
Рис. 5: У пошуковому запиті Google "Ангела Меркель" Вікіпедія посідає дуже хороші місця.
Цей приклад, звичайно, трохи побудований на даний момент, оскільки Вікіпедія не тільки добре позиціонується через тип індексації. Сайт також має високий бонус довіри, серед іншого. Наступний приклад був би ближчим до реальності.
6: Conrad.de містить близько 421 000 документів в індексі.
Рис. 7: З них близько 258 займаються темою "Все в одному ПК", за умови, що всі назви добре підтримуються. Це сторінки продуктів, які можуть добре позиціонуватись за поєднанням торгової марки.
8: Три документи використовують множину. Крім усього іншого, це сторінка категорії, яка ідеально підходить для ранжування за більш загальними запитами.
Крок 2: Пильний погляд на продуктивність
Перш за все, ви повинні проаналізувати свою видимість. Не тільки для всього домену, але і на рівні каталогу. Аналізує проіндексовані URL-адреси на цьому рівні та порівнює їх із рейтинговими URL-адресами. Ви також можете переглянути дані про дорожній рух, щоб побачити, які сторінки регулярно відвідують.
3-й крок: виявлення класичних "жертв"
Тепер настав час заглибитися у ваш веб-сайт. Дозвольте повзати по сторінці та використовуйте інструменти SEO для пошуку таких показників, які вказують на відхилення:
- дубльовані назви сторінок
- дублікати описів
- дубльовані заголовки H1
- Дублювання рейтингу або коливання (ви можете знайти їх, наприклад, за допомогою Serplorer або за допомогою власного експорту Search Console)
- Чи існують URL-адреси, які чергуються для певного рейтингу? Вони однакові за змістом?
- Перевірте URL-адреси параметрів
- Перевірте пагінацію
- Перевірити фільтр (чи індексовано функції та чи потрібні вам сторінки в індексі?)
- Блоги (сторінки тегів, архівні сторінки, сторінки категорій та їх пагінація)
4-й крок: аналіз журналу файлів
Аналіз файлів журналів - справжня тема експерта. За часів до Google Analytics це був метод вибору для аналізу трафіку. Однак з часом це просто стало надто складним у порівнянні. Завдяки новим інструментам та потужному апаратному забезпеченню він вже деякий час знову в тренді. Зазвичай особливий інтерес представляє відповідь на наступні запитання для великих сторінок:
- На яких сторінках сканує бот Google?
- Як часто він сканує ці сторінки?
- Усі сторони важливі?
- Є там "трупи"?
- Бот "губиться" (наприклад, під пагінацією)?
Боротьба з надлишком
Якщо ви вже визначили сторінки, які ви хочете видалити з індексу, закономірно виникає питання, як ви можете це зробити. Перш за все, ви не повинні використовувати безглуздо тег noindex. Оскільки це лише усуває симптом, а не фактичну проблему.
Закріпити зміст
Консолідація вмісту є класичним методом для видавців та журналів. Завдяки внутрішньому тегуванню та аналізу заголовків та заголовків ви ідентифікуєте схожий і дуже схожий вміст і об’єднуєте їх - наприклад, на оглядовій сторінці. У найкращому випадку ви використовуєте можливість і переглядаєте вміст безпосередньо знову.
Як це можна проілюструвати на наведеному нижче прикладі:
Рис. 9: Gutefrage.net пропонує майже 50 000 документів на тему «Я вагітна».
10: Є лише близько 1390 результатів з тієї самої теми на Erdbeerlounge.de.
Рис. 11: У SERP результати Erdbeerlounge значно краще оцінюються на сторінці теми, ніж Gutefrage.net.
12: Для порівняння, полуничний зал набагато стабільніший.
Однак, коли ви консолідуєте свій вміст, ви ніколи не повинні забувати чотири основні точки SEO:
- Перенаправити оригінальні URL-адреси до резюме (переадресація 301)
- Налаштуйте внутрішні посилання
- налаштувати зовнішні посилання
- Очищення мап сайтів (переспрямовані URL-адреси, нові URL-адреси входять)
Канонізувати зміст
Однак іноді це нікуди не призведе до консолідації вмісту. І тоді, коли на вашому сайті є багато дублікатів 1: 1. Тоді (і лише тоді) варто канонізувати зміст. Це особливо актуально при індексуванні альтернативних варіантів вмісту, таких як версії для друку, мобільні версії або PDF-файли.
Це буде виглядати так:
- Ми маємо
- https://www.beispielseite.de/original-dokument
- https://www.beispielseite.de/original-dokument-print-version
- https://www.beispielseite.de/original-dokument-kurzversion
- https://mobil.beispielseite.de/original-dokument-mobilversion
- Канонізація у вихідному коді документів HTML:
- Ми маємо:
- https://www.beispielseite.de/original-dokument
- https://www.beispielseite.de/original-dokument-pdf-version.pdf
- Канонізація за допомогою заголовка:
- при доступі до https://www.beispielseite.de/original-dokument-pdf-version.pdf:
HTTP/1.1 200 OK
Дата: чт, 26 жовтня 2017 р., 10:44:59 GMT
Посилання:; rel = "канонічний"
X-SP-TE: 6151
X-Robots-Tag: індекс, слід, noarchive, noodp
Тип вмісту: text/html; charset = UTF-8
Виключіть вміст із сканування та індексування
Щоб просто виключити бажаний вміст із сканування та індексації, ви можете працювати з robots.txt:
На жаль, це не вирішує фундаментальної проблеми. Набагато краще використовувати гранований пошук з PRG Pattern. Таким чином ви уникаєте, щоб сканери могли "бачити" та сканувати запитувані URL-адреси. Потім сканер отримує лише відтворену "оригінальну сторінку" - і користувачі нічого з цього не помічають.
Однак із шаблоном PRG потрібно зауважити, що від рішення залежить, чи підтримується перегляд з вкладками. Ви також повинні виключити варіанти фільтру, що стосуються SEO, із PRG. Це, наприклад, поєднання кольорів продукту з великим обсягом пошуку.
Радикальне лікування: деіндексація вмісту
Однак у багатьох випадках жоден із цих варіантів насправді не допомагає. Наприклад, якщо у вас в індексі є невідповідний вміст з далекого минулого, немає сенсу його канонізувати чи консолідувати. З якою метою все ще повинні служити застарілі огляди товарів, сторінки профілю, сторінки продуктів, сторінки брендів, сторінки тем чи сторінки авторів?
Тож зробіть внутрішній тест і задайте собі три запитання:
- Сторінки вусика (все ще)?
- Чи є у них внутрішній та зовнішній трафік?
- Чи шукають та знаходять їх за допомогою внутрішнього пошуку?
Якщо ви тут тричі відповісте "ні", допоможе лише код стану 410. Щоб пришвидшити це видалення, ви можете помістити відповідні URL-адреси у зовнішню карту сайту. Потім дивіться, поки Google не буде повністю оброблений, а потім видаліть знову. Не слід недооцінювати останній пункт, адже якщо ви забудете його видалити, у Search Console буде багато помилок. 410 в основному не належать до мапи сайту.
І потім?
Тепер у вас є дорожня карта, за допомогою якої ви можете покращити або позбутися свого улюбленого вмісту. Але індексна дієта не є самоціллю! Все це мало корисно для вас, якщо ви не визначите стійкі цілі заздалегідь. Це включає
- об'єднання загального трафіку всіх окремих сторінок на одній сторінці,
- злиття рейтингу за однією URL-адресою,
- покращення рейтингу,
- отримання нових рейтингів,
- покращення повзання та
- підвищення ефективності індексів: скільки сторінок ранжирується, а скільки індексується? Сторінки, які не класифікуються, зазвичай також не потрібно індексувати.
Щоб переконатись, що ці цілі досягнуті, ви, звичайно, повинні відстежувати файли журналів і перевіряти наявність змін. Слід також стежити за рейтингом нових або інших сторінок та стежити за відвідуваністю відповідних URL-адрес. І щоб бути в безпеці, не може зашкодити регулярно перевіряти переадресацію.
Тоді ви зможете збільшити свою видимість просто так у наступних прикладах. Маркери показують дату, коли були видалені надлишки URL-адрес. Порівняльні значення в таблицях говорять самі за себе. Насолоджуйтесь копіюванням.
Рис. 13: 18 000 проіндексованих сторінок замість понад 380 000 - і успіх настає.
14: 10 000 замість 200 000 проіндексованих сторінок призводять до помітного збільшення видимості.