WordPress har dårlig URL struktur
Skrevet af Grosen Friis | 16. marts 2007 |Placeret i Blog, Dublicate content, Søgemaskineoptimering (SEO), WordPress
WordPress har dårlig URL struktur:
WordPress er et super godt blogging værktøj, ingen tvivl om det og da det er open source, så kan man gå ind og pille i kildekoden. Det har jeg selv gjort for at få denne blog op at køre så jeg fik placeret elementer og tilpasset styles efter mine ønsker. Men jeg kan se at det skal jeg snart til igen, for jeg kan se at WordPress har en dårlig URL struktur, og hvad mener jeg så med det.
WordPress har flere URL eller “indgange” til samme indhold:
Problemet er, at WordPress har flere URL eller “indgange” til samme indhold og det betyder at mit indlæg om ‘Telefonsælgere – Så kom dog til sagen’ kan findes her:
http://www.gblog.dk/telefonsaelgere-kom-til-sagens-kerne.html
http://www.gblog.dk/category/personligt/
http://www.gblog.dk/2007/03/
3 forskellige URL til samme indhold! Det dur slet ikke set med søgemaskineoptimerings brillerne på, for så ryger man ind i problemer i forhold til bla. Google.
Google sorterer URL fra med identisk indhold
Google vil sortere de URL’er fra, hvor de finder identisk indhold, og placere disse URL’er i deres supplemental index og disse URL’er vil aldrig blive medtaget i en søgning. Derudover kan man ikke selv bestemme hvilken URL de vælger at “beholde”. Jeg vil fx helst have at de beholder:
http://www.gblog.dk/telefonsaelgere-kom-til-sagens-kerne.html
og smider de to andre nævnte URL’er:
http://www.gblog.dk/category/personligt/
http://www.gblog.dk/2007/03/
om i deres supplemental index, men det kan jeg altså ikke selv bestemme.
Derudover får din blog også en mindre “trust” hos Google hvis man ikke har styr på sine URL’er.
HUSK: Man må KUN have EN URL til hver side på sin blog eller sin hjemmeside!
Yderligere tilpasning af min WordPress baserede blog
Jeg må igang igen og tilpasse min WordPress blog yderligere så jeg får 100% styr på hvilken URL søgemaskinerne vælger at medtage i deres indeks. Jeg regner med at løse det teknisk via META tags, hvor jeg fortæller, at indholdet i bla. ‘/category/…’ folderen og i arkiverne (Fx ‘/2007/03/…’) ikke skal medtages i indekset og links herfra skal ikke tælle med. Det gøres ved at sætte følgende ind i headeren (Og kun på de sider hvor det er meningen de skal med naturligvis)
< META NAME=”robots” CONTENT=”noindex,nofollow” >
< META NAME=”robots” CONTENT=”noarchive”>
For at helgardere vil jeg også lave en robots.txt fil hvor jeg siger til søgemaskinerne at de ikke må gå ned i ‘/category’ folderen og arkiv folderne…
Den kommer til at se sådan ud:
User-agent: *
Disallow: /category/
Disallow: /2007/
Disallow: /2008/
Disallow: /2009/
Ved at fastsætte både 2008 og 2009 allerede nu, så har jeg fremtidssikret min blog i de næste 2½ år fra skrivende stund
Efterskrift:
At udelukke indhold fra at blive indekseret med robots.txt har sidenhen ændret sig for Googles vedkommende, og du vil kunne drage nytte af at læse dette indlæg her på bloogen: Google ignorerer generelle indstillinger i robots.txt
/Grosen Friis

4.365 svar til “WordPress har dårlig URL struktur”
1. kommentar til "WordPress har dårlig URL struktur"
Skrevet af Grosen Friis d. 24. marts 2007
Jeg kan se at WordPress lægger alle sider i en ‘/page/X/’ struktur og det er da meget godt til at struturere alle indlæg med, men det er ikke en optimal sitemap. Så nu har jeg kodet mit eget lille sitemap som kan ses i nedeerste højre hjørne, der:
- ikke bruger folderstrukturer
- undgår at samme indhold findes på flere URL’er
Det betyder at jeg kan udvide robots.txt yderligere, da jeg nu kan udelukke alt under ‘/page/’ folderen fra at bliver crawlet af søgemaskinerne. Desuden har jeg sikret mig at 3 andre WordPress foldere ikke bliver crawlet.
User-agent: *
Disallow: /wp-admin/
Disallow: /wp-content/
Disallow: /wp-includes/
Disallow: /category/
Disallow: /2007/
Disallow: /2008/
Disallow: /2009/
Disallow: /page/
/Grosen Friis
2. kommentar til "WordPress har dårlig URL struktur"
Skrevet af Grosen Friis d. 27. marts 2007
Nu tror jeg at min WordPress blog er ved at være helt tilpasset så der bliver kompenseret for den dårlige folderstruktur hvor der bla. er flere URL’er til samme indhold! Se hvor nydeligt siderne i skrivende stund er indekseret i fx Googles indeks.
I samme ombæring fik jeg lige fjernet < A HREF="..." ... REL="nofollow" > attributten på alle mine links, ikke mindst mine outbound links, så alle godkendte posts nu kan få den link-love, som jeg synes de fortjener!
/Grosen Friis
3. kommentar til "WordPress har dårlig URL struktur"
Skrevet af Marcel Fuursted d. 27. marts 2007
En anden måde det kan gøres på, er ved at gå mere op i at cutte indlæggene af. Der er i bund og grund ikke noget galt med dublicate content, HVIS siden hvor indlægget også er placeret linker til den oprindelige artikel. Og det er jo det der sker i dette tilfælde. Alternativt skal du også fjerne forsiden (eller page2, osv.), som også har indlægget. Lige så snart du skriver et nyt indlæg opstår den jo følgende steder (med udgangpunkt i dit eksempel):
http://www.gblog.dk
http://www.gblog.dk/telefonsaelgere-kom-til-sagens-kerne.html
http://www.gblog.dk/category/salg/
http://www.gblog.dk/2007/03/
Derudover også på overskrift.dk mm.
Anyways – min pointe er, at det er netop den interne linkstruktur fra WordPress, der er guf for søgemaskinerne, hvis du udnytter “read more” funktionen, som jeg personligt ikke har fået gjort ret meget ved, hverken på bloggen til det reklamebureau, jeg arbejder ved eller min personlige blog… Men dit indlæg er da en pretty well reminder til det… Så tak for det
4. kommentar til "WordPress har dårlig URL struktur"
Skrevet af Grosen Friis d. 27. marts 2007
Hej Marcel
Tak for Dine input!
Ja man kan godt undgå dublicate content til en hvis grad ved at klippe et afsnit over (Indsætte et “Læs resten af indlægget link”), så man ikke får al teksten med for et indlæg fx på forsiden, hvor de nye indlæg jo optræder.
Men det ændrer jo ikke på, at det, i min WordPress version i hvert fald, kun er muligt at vise et udsnit af et indlæg på forsiden, alle andre steder, bliver et indlæg vist i sin fulde længde, og min erfaringer peger i retning af, at hvis et indlæg i sin fulde længde ligger tilgængelig under flere URL’er, som Du selv fremhæver I dit eget indlæg, ja så er Google utrolig god til at spotte det, endda selvom der er 10-15 andre indlæg, der fx også ligger gemt under fx:
http://www.op.dk/category/personligt/
Så det er derfor jeg er gået så drastisk til værks, og har forment Google, og de andre store søgemaskiner, adgang til alle kategorierne, arkiverne og det “sidebaserede” sitemap (‘/page/X/…’) via robots.txt, og kun tillader inddeksering af hver enkelt indlæg under den URL, hvor jeg helt selv bestemmer hvad URL’en skal hedde, og hvilke nøgle-søgeord jeg gerne vil have med i URL’en.
Men det kræver så, at man får kodet sit eget sitemap, eller finder et plugin der kan det samme. Ellers kan søgemaskinerne jo ikke finde alle de indlæg man har skrevet på sin blog!
Jeg ved godt, at optimering af HTML’en kun vægter ca 30% på Google og ca. 50% på de andre store søgemaskiner (Fx Yahoo og Live.com), mens links fra andre hjemmesider udgør resten. Du kan få en Flash baseret hjemmeside til at ranke godt på et bestemet nøgle-søgeord pga. en god portion backlinks. MÆÆÆNNN HTML optimering er bare noget der interesserer mig utrolig meget, og derfor kommer jeg til at gå i så mange detaljer, at det er på grænsen til at overgøre det….. Men jeg har vist ikke overgjort det for OP.dk endnu
/Grosen Friis
5. kommentar til "WordPress har dårlig URL struktur"
Skrevet af Effektiv Markedsføring d. 4. juli 2007
Tak for en fyldig beskrivelse af problemstillingen, Grosen. Thumbs up ;o)
Venlig hilsen, Christian
6. kommentar til "WordPress har dårlig URL struktur"
Skrevet af Grosen Friis d. 4. juli 2007
Hej Christian
Tak, det glæder mig Du kan bruge indlægget!
/Grosen
7. kommentar til "WordPress har dårlig URL struktur"
Skrevet af Grosen Friis d. 4. juli 2007
Hej,
Jeg vil lige komme med en opdatering på dette indlæg. Jeg har nemlig erfaret, at man kan sætte ekstra filtre op i robots.txt som bla. Google understøtter, men som ikke er standard filtre. Jeg tænker på at Google accepterer * som wildcard, og det er rigtig godt, så man bla. kan få sorteret alle de forskellige links fra, der er til diverse post/comment feeds og trackback.
Så for øjeblikket ser min robots.txt for min WordPress blog således ud:
User-agent: googlebot
Disallow: /*/feed/
Disallow: /*/trackback/
User-agent: *
Disallow: /wp-login.php
Disallow: /wp-admin/
Disallow: /wp-content/
Disallow: /wp-includes/
Disallow: /category/
Disallow: /comments/
Disallow: /feed/
Disallow: /2007/
Disallow: /2008/
Disallow: /2009/
Disallow: /page/
/Grosen Friis
8. kommentar til "WordPress har dårlig URL struktur"
Skrevet af Anders d. 4. juli 2007
Grosen, tak for opdateringen!
Men hvis du både blokerer for category, arkivet (årene) og page, hvordan skal Google så finde de indlæg, som ikke er på din forside fordi den er fuld. De ældre indlæg er jo på http://www.gblog.dk/page/2/
Kan se, at du har et sitemap med direkte links til alle poster, men den liste kan jo godt gå hen og blive så lang, at du ikke vil have den på forsiden?
Er det mon ikke smartere (når man har en blog med en del indlæg) at gøre brug af din liste af disallows minus category. Desuden altid at benytte “Mere”-funktionen på indlæg, Og altid kun at tilknytte en kategori til en post?
Når man går i Category på min blog, er der direkte links til kategoriens posts – permalinks uden /category/, hvilket jo er helt fint, hvis alle posts er klippede på oversigtssiden og kun kan ses i dereshelhed et sted: permalinket.
Hilsen Anders
9. kommentar til "WordPress har dårlig URL struktur"
Skrevet af Grosen Friis d. 4. juli 2007
Hej Anders
Hemmeligheden er, som Du selv er inde på, at have et sitemap, som indeholder præcist de URL’er, som Du gerne vil have søgemaskinerne skal finde indeholdet på, og efterfølgende få det indekseret!
Du har ret i at den sitemap-liste, som jeg selv har kodet, kan gå hen og blive for lang, men der findes et godt alternativ, som er et sitemap plugin til WordPress (Se under overskriften ‘The Third WordPress Site Map Example’), som gør, at et sitemap kommer til at ligge på en dedikeret side!
/Grosen Friis
10. kommentar til "WordPress har dårlig URL struktur"
Skrevet af Søren fra Gratis Artikler d. 29. oktober 2007
Tak for den grundige behandling af problemet. Samtidig har jeg en bekymring vedr. ikke blot dublicate content, men det, at mange bruger samme web template.
Så vidt jeg har forstået på noget af den internationale debat om dublicate content – vel først og fremmest hvis der bruges samme tekster – så kan det have stor betydning, om disse websites bygger på den samme template.
Hvis dette virkeligt er et problem, er der så ikke netop ved den udbredte anvendelse af WordPress et lignende problem der?
Bedste hilsener
Søren Breiting
11. kommentar til "WordPress har dårlig URL struktur"
Skrevet af Grosen Friis d. 30. oktober 2007
Hej Søren Breiting
Tak for dit indlæg!
Det har ikke nogen SEO mæssig betydning om mange brugere(domæner) kører med samme WordPress template/skin.
Selvom et bestemt WordPress skin skulle blive brugt til massiv kunstig linkbulding, og dette blev opdaget af Google, så er det HTML mønster, som en template “efterlader” på Internetttet, ikke det eneste Google kigger på før de evt. vælger at blackliste nogle sites der bruges til kunstig linkbuilding. Google kigger også på:
- whois informationer for domænet
- den C-klasse som domænet befinder sig på
- hvordan der linkes ind og ud på domænet.
Så blog du bare løs på din nuværende WordPress template
Det eneste problem (Lille) jeg kan se, er, at mange af de populære gratis templates har indbygget links i selve templaten, som peger på designerens hjemmeside, og det uanset hvilken side på blog’en man befinder sig på.
Der er naturligvis ikke noget forkert i at linke til den person/virksomhed, der har lavet det pågældende template design, tværtimod, men der skal ikke være et link fra alle siderne på bloggen. I stedet bør man kun have en enkelt side om designeren og her placere et link til ham/hende.
Årsagen er, at der jo helst skal være indholdsmæssig sammenhæng imellem den side der linkes fra, og den side der linkes til. Det er der fra en enkelte side på blog’en, hvor man skriver om designeren. Det er der ikke fra alle de øvrige sider på bloggen.
Du gavner altså både dig selv og designeren SEO mæssigt ved kun at have ET link til designeren på din blog, og ved at placere linket på en dedikeret side hertil. Du øger jo derved din hjemmesides trust/troværdighed hos Google ved ikke bare at vise et link i flæng, men ved at lave et kvalitetslink.
/ Grosen Friis
12. kommentar til "WordPress har dårlig URL struktur"
Skrevet af Grosen Friis d. 13. december 2007
Hej igen,
Som jeg skriver i selve indlægget i denne tråd, så har jeg oprindeligt teknisk løst problemet med at indholdet i bla. ‘/category/…’ folderen og i arkiverne (Fx ‘/2007/03/…’) ikke skal medtages i Googles indekset, ved at indsætte følgende META tags i headeren:
< META NAME=”robots” CONTENT=”noindex,nofollow” >
< META NAME=”robots” CONTENT=”noarchive”>
< META NAME=”robots” CONTENT=”nosnippet”>
Jeg har selv kunne programmere mig mig til at opnå denne effekt, men det er jo ikke alle WordPress brugere der er programmører og dermed kan gøre-det-selv!
Men nu er der håb for alle, for der findes faktisk et super WordPress plugin hertil, der kan styre at der bliver sat ovennævnte META tags ind på de relevante sider.
Du kan læse mere om dette plugin på:
- WordPress’ website: All in One SEO Pack
- Plugin officel site (uberdose.com): All in One SEO Pack
Foruden at hjælpe med at forhindre at man får sider smidt i Google Supplemental Index, så kan dette plugin også bruges til at styre de informationer man har med i en sides titel, META description og META keywords, og det er jo slet ikke så ringe endda.
Det med småt….
Bemærk, det kan dog godt være du alligevel skal have lidt hjælp fra en programmør, hvis din WordPress header ikke er sat op til at understøtte ovennævnte plugin. Men det er stadigvæk en teknisk meget lettere løsning at få implementeret end at gøre-det-selv.
/Grosen Friis
13. kommentar til "WordPress har dårlig URL struktur"
Skrevet af Seo Optimering d. 1. juli 2011
Jeg har virkelig takket være dette indlæg, der har indledt en ret tilgang, som vi ser også, at når nogensinde en bruger ønsker at finde noget, han eller hun får en masse webadresser have dublerede data, i dette tilfælde at besøge alle urls og finde det samme indhold vil være irriterende job ….. der derfor ordet tryk skal være mere udvikles på en sådan måde, at det avoides duplicacy ..
tak Grosen Friis / / /