Sitemap.hml – карта на сайта?

Всички знаем, колко е трудно да намерим нова дестинация без карта, точно толкова трудно е и на Google да намери всички страници на даден уебсайта без карта на сайта. За щастие можете много бързо и лесно да създадете XML карта на сайта и да я изпратите на Google.

Какво е sitemap – карта на сайта?

Картата на сайта е XML файл, съдържащ цялото важно съдържание на вашия уеб сайт. Всяка страница или файл, които искате да се показват в търсещите машини, трябва да бъде поставен в тази картата на сайта. Имайте в предвид, че картите на сайта не могат да изброят повече от 50 000 URL адреса и не могат да бъдат с размер над 50 mb. Ако картата на сайта Ви надвишава една или повече от тези цифри, тогава ще трябва да създадете повече от една.

Как изглежда XML карта на сайта?

XML картите се правят за търсачки, а не за хора. Те могат да изглеждат малко плашещи, ако не сте виждали преди такъв файл.

?xml version=“1.0″ encoding=“UTF-8″?> <urlset xmlns=“http://www.sitemaps.org/schemas/sitemap/0.9″> <url> <loc>https://ahrefs.com/</loc> <lastmod>2019-08-21T16:12:20+03:00</lastmod> </url> <url> <loc>https://ahrefs.com.com/blog/</loc> <lastmod>2019-07-31T07:56:12+03:00</lastmod> </url> </urlset>

XML декларация

<?xml version="1.0" encoding="UTF-8"?>

Това казва на търсачките, че четат XML файл. Той също така посочва версията на XML и кодировка на знаци, използвани. За карти на сайта версията трябва да бъде 1.0 и кодирането трябва да бъде UTF-8.

Набор url адреси

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

Това е контейнер за всички URL адреси в картата на сайта. Той също така казва на роботите кой стандарт на протокола се използва. Повечето карти на сайтове определят стандарта „sitemap 0.90“, който се поддържа от Google, Yahoo и Microsoft, наред с други.

Url

<url>
<loc>https://postvai.com/</loc>
<lastmod>2019-08-21T16:12:20+03:00</lastmod>
</url>

Това е родителският маркер за всеки URL адрес. Трябва да зададете местоположението на URL адреса в вложен етикет. Изключително важно, те трябва да бъдат абсолютни, а не относителни, канонични URL адреси.<loc>

Въпреки че това е единственият необходим таг тук, има няколко допълнителни свойства:

  • <lastmod>: Задава датата, на която файлът е бил променен за последен път. Това трябва да бъде във формат W3C дата и час. Например ако сте актуализирали публикация на 25 септември 2019 г., атрибутът ще прочете 2019-09-25. Можете също да включите и часа, но това не е задължително.
  • <priority>Задава приоритета на URL адреса спрямо всички други URL адреси на сайта. Стойностите варират между 0,0 и 1,0. По-високо е по-важно.
  • <changefreq>Указва колко често страницата е вероятно да се промени. Неговата работа е да даде на търсачките някаква идея колко често те могат да искат да обхождат URL адреса. Валидните стойности тук са винагипочасовоежедневноседмичномесечногодишно, и никога .

Защо ми е необходима карта на сайта?

Google открива ново съдържание, чрез обхождане на мрежата. Когато обхождат страница, те обръщат внимание както на вътрешните, така и на външните връзки на страницата. Ако даден открит URL адрес не е в индекса за търсене, той може да анализира съдържанието му и да го индексира, когато е уместно. Картите на сайта казват на Google къде да намерите най-важните страници на уебсайта, за да могат да ги обхождат и индексират. Това е важно, защото търсачките не могат да класират съдържанието ви, без първо да го индексират.

Как да създадете карта на сайта?

Някои CMS генерират готова карта на сайта за вас. Те се актуализират автоматично, когато добавяте или премахвате страници и публикации от сайта си. Ако cms не прави това, тогава обикновено има плъгин, който го прави.

Въпреки че WordPress е най-разпространената CMS и с него са изградени повече от 35 % от уебсайтовете в интернет, той не генерира карта на сайта. За да създадете такъв, трябва да използвате някой плъгин, като Yoast SEO.

След като инсталирате и активирате този плъгин, вие ще получите най-различни възможности за оптимизиране на сайта си. За да направите sitemap от главното меню отидете на SEO > Общи > Функции. Уверете се, че превключвателят „XML sitemaps“ е включен.

xml sitemap yoast 3

Сега трябва да видите картата на сайта си (или индекса на картата на сайта) на yourdomain.com/sitemap.xml или yourdomain.com/sitemap_index.xml.

ahrefs sitemap 3

Ако инсталацията на WordPress се намира в поддомейн или поддомейн, то картата на сайта ви се намира под този път. Ако искате да включите или изключите конкретно определени типове съдържание (страници с маркери, страници с категории и т.н.) от картата на сайта, отидете в настройките „Облик на търсене“.

category pages exclude yoast 3

Можете също да изключите отделни публикации или страници от мета полето „Разширени“ на редактора.

yoast noindex post 3

ВАЖНО . Изключвайте само страници от картата на сайта, които не искате да се показват в резултатите от търсенето.

Създаване на карта на сайта без CMS

Ако мислите, че има по-малко от ~ 300 страници на вашия сайт, инсталиране на безплатната версия на Screaming Frog. След като инсталирате, отидете в Режим > Паяк. Поставете URL адреса на началната си страница в полето с надпис „Въведете URL адреса за паяк“. Натисни „Старт“. След като приключите обхождането, погледнете долния десен ъгъл. Ще каже нещо подобно:

sf total scrape 3

Ако номерът е 499 или по-долу, отидете на Карти на сайта > XML карта на сайта. Тъй като Google не обръща много внимание на тези подробности за дата и т.н. изключете от вашата карта на сайта следните тагове <lastmod><changefreq><priority>

screaming frog sitemap settings 3

Натиснете „Напред“ и запишете картата на сайта на компютъра си. Направи. Ако числото показва „500 от 500“, тогава няма смисъл да експортирате карта на сайта. Защо? Защото това означава, че сте натиснали ограничението за обхождане, преди да обходи всички страници на сайта Ви. В резултат на това стотици страници може да липсват от експортираната карта на сайта, което я прави по-скоро безполезен.

Един от начините да се реши това е да се търси безплатен създател на карта на сайта. Има много такива.

Как да изпратите карта на сайта на Google?

След като направите картата си и тя се вижда в главната директория на сайта от рода domain.com/sitemap.xml. Ако правите това ръчно, дайте име на картата на сайта си, като sitemap.xml, след което го качете в главната директория на уебсайта си. След това трябва да имате достъп до картата на сайта в domain.com/sitemap.xml.

Отидете в Google Search Console> Карти на сайта > поставяне в карта на сайта> посещение „Подаване“

sitemap search console 3

Също така е добра практика да добавите URL адреса(ите) на картата на сайта към файла robots.txt. Можете да намерите този файл в главната директория на вашия уеб сървър. Вижте всичко за Robots файл тук. За да добавите картата на сайта, отворете файла и поставете този ред:

Sitemap: https://www.yourdomain.com/sitemap.xml

Как да отстраняваме често срещани грешки в уеб сайта, които засягат картата на сайта Ви?

Google Search Console ви информира за повечето технически грешки, свързани със картата на сайта Ви, като изпраща имейл или може да погледнете в конзолата. Например, ето предупреждение, че един от подадените от нас URL адреси е блокиран от robots.txt:

submitted url blocked by robots 3

.

Един от най-често срещаните проблеми е наличието на безполезни страници с ниско качество в картата на сайта Ви. Всяка страница в картата на сайта ви трябва да бъде индексирана и канонична. За съжаление, това не означава, че всички тези страници са с високо качество. Ако имате много съдържание, някои страници с ниско качество вероятно са го направили в картата на сайта Ви.

Например, ако имате две страници почти еднакви страници , които не са ценни, но Google e индексирал и двете страници, трябва да направим следното. Да ги намерим вконзолата, като отидете на „Одит на сайт“ > Вътрешни страници > Качество на съдържанието. Потърсете клъстери от дублиращи се и почти дублиращи се страници без каноника. Това са оранжевите квадратчета. Щракнете върху една, за да видите всички страници в групата.

near duplicates site audit 3

Разгледайте страниците и вижте дали те имат някаква стойност. Наличието на страници с ниско качество в сайта Ви е лошо по три причини:

  • Те губят от Crawl бюджетакоето губи време и пари на Google, а това никак не се харесва на търсачката и е лош показател за сайта.
  • Те „крадат“ силата от ранга на по-важни страници. Има ясна корелация между авторитета на страниците и тяхното класиране.
  • Те водят до лошо потребителско изживяване. Нямат стойност за посетители, които попадат на тези страници.

Като цяло най-добрият ход на действие е да премахнете ниско качествените страници от уебсайта си и впоследствие да се сдобиете със силни. За да намерите некачествените страници в отчета „Качество на съдържанието“ намерете тези с най-нисък брой думи.

low word count pages 3

Страници, изключени случайно от картата на сайта Ви?

Ако сте използвали някой от препоръчаните по-горе методи за създаване на картата на сайта, страниците с noindex или canonical маркери (несаморефериране) няма да бъдат включени. За да проверите за грешки, отидете на отчета „Вътрешни страници“ в проверка на сайта и щракнете върху предупреждението „Noindex страница“. Това показва всички неиндексирани страници.

noindex pages 3

Повечето от тези вероятно ще бъдат умишлено неиндексирани, но си струва да се провери повторно. Ако виждате страници, които не трябва да бъдат noindexed, премахнете от страницата rogue noindex таг и го добавете към картата на сайта си. Ако използвате CMS или плъгин, това трябва да се случи автоматично.

Също така премахнете всички измамни каноникали и пренасочвания. З

Премахнете всички измамни канонии и пренасочвания след това добавете засегнатите страници към картата на сайта си.

Leave a Comment