ساختار URLهای وبسایت
در این مقاله سعی دارم با بررسی فاکتورهایی مانند URL و BreadCrumb به استانداردی برای ساختار و معماری صفحات و بخشهای مختلف یک وبسایت برسم.
ابتدا به تعریفی از هر کدام از موارد میپردازم، سپس تجربیات و راهکارهایی که در سالهای مختلف به آن رسیدهام را با شما به اشتراک میگذارم.
منظور از URL چیست؟
URL مخفف عبارت Uniform Resource Locator است که به آن نشانی وب هم گفته میشود و به طور خلاصه به معنی آدرس کامل یک صفحه و یا یک فایل درون اینترنت است.
احتمالاً در بعضی از نرمافزارها مانند وردپرس شما با کلماتی مانند نامک، Permalinks و Slug نیز روبرو خواهید شد که تاحدودی به معنای آدرس یک صفحه است.
Breadcrumb چیست؟
اگر به بالای صفحات وبسایتهای معتبر و معروف با دقت نگاهی بیندازید متوجه خواهید شد که چند لینک از صفحات قبلی وبسایت در آنجا قرار دارد که به کاربر کمک میکند تا بتواند مسیر خود را در وبسایت پیدا کند.
Bread Crumb در لغت به معنای نان خشک است و تداعی کننده داستان هانسل و گرتل است که در آن نامادری دو کودک آنها را در جنگل رها میکند و آنها به کمک خوردههای نان راه خود را پیدا میکنند.
به گوگل بفهمونید چی به چیه؟
بیایید با هم یک داستان ساده را بخوانیم.
یک روز دکتری به تیمارستانی سر میزنه تا اوضاع اونجا رو بررسی کنه …
در بین دیوانهها مردی رو میبینه که به نظرش خیلی سالم و عادی میاد.
اونو پیش خودش صدا میکنه و ازش میپرسه:
شما رو برای چی آوردن تیمارستان؟مرد جواب میده:
آقای دکتر، من با خانمی ازدواج کردم یک یک دختر ۱۸ ساله داشت.
یک روز پدرم از این دختر خوشش میاد با اون ازدواج میکنه.
از اون روز دیگه زن من، میشه، مادر زن پدر شوهر خودش.
چند وقت بعد، دختر زن بنده که میشد زن پدرم، یک پسر به دنیا میآره.
این پسر از یک طرف میشد برادر من، چون پسر پدرم بوده و از طرف دیگه چون نوه زنم هم بوده، نوه من هم میشده.با این اوصاف من پدربزرگ برادر ناتنی خودم بودم.
چند وقت بعد، زن من هم یه پسر به دنیا میاره.
از اون روز، زن پدرم شد، خواهر ناتنی پسرم و مادربزرگ اون، در صورتیکه پسرم برادر مادربزرگ خودش و نوه اون هم بود.
از طرف دیگه چون مادر فعلی من، یعنی دختر زنم، میشده خواهر پسرم، بنده هم ظاهرا میشم خواهر زاده پسر خودم!در ضمن باید خدمتتون عرض کنم که من پدر مادرم و پدربزرگ خودم هم هستم و پسر پدرم هم برادر و هم نوه منه!
آقای دکتر، اگه شما جای من بودید، کارتون به تیمارستان نمیکشید؟
اگر خودتان را بجای گوگل بگذارید که وارد سایتهایی شده است که سر و ته صفحات و لینک سازی ها و محتوایی که ایجاد میکنند نامشخص است، احتمالاً این داستان برای شما خیلی آشنا خواهد بود.
یکی از چیزهایی که میتوانند گوگل را گیج کند، محتوای بینظم و بدون هدف و بدون ساختار است.
اجازه بدهید مثالی بزنم که بهتر متوجه شوید.
فرض کنید شما در وب سایت خود یک صفحه دارید که در مورد فردی به نام جمشید مینویسد، بعد از گذشت چند وقت گوگل از طریق لینکهای مختلفی که در صفحات مختلف وبسایت شما قرار دارد آن صفحه را پیدا میکند.
حال فرض میکنیم شما خواسته یا ناخواسته یک یا چند صفحه دیگر را هم برای اسم جمشید بهینهسازی میکنید. واکنش گوگل بعد از روبرو شدن با این موضوع چیست؟
جمشید دو تا شده! 🙂
خب منطقی است که گوگل گیج خواهد شد و در برخی موارد هم صفحهای که تمایل ندارید در رتبه بالاتر نتایج جستجو قرار خواهد گرفت که به اصطلاح به این موضوع کنیبالایزیشن گفته میشود.
URL استاندارد چه ویژگیهایی باید داشته باشد؟
در ابتدا به شما پیشنهاد میکنم در مورد اینکه میخواهید از URL فارسی استفاده کنید یا خیر تصمیمگیری کنید.
برای راهنمایی در این مورد پیشنهاد میکنم مقاله URL فارسی یا انگلیسی را مطالعه کنید.
اندازه یک URL استاندارد
یکی از مواردی که کارشناسهای سئو در ایران به شدت به آن اعتقاد دارند، تاثیر کوتاه بودن آدرس صفحات در نتایج جستو است.
ابتدا باید منظور از کوتاه بودن و بلند بودن را مشخص کنیم. کوتاه بودن یک عبارت و یا جمله کاملا یک موضوع نسبی است و ممکن است یک جمله از نظر فردی کوتاه و از نظر فردی دیگر بسیار بلند باشد.
اگر عبارت URL Structure را جستجو کنید یکی از مهمترین منابعی که مشاهده خواهید کرد صفحه راهنمای ساختار URL گوگل را مشاهده خواهید کرد.
https://developers.google.com/search/docs/advanced/guidelines/url-structure
تعداد کارکتر آدرس همین صفحه ای که در مقابل شماست ۷۵ عدد است.
البته پیشنهاد افزونه RankMath در نرمافزار وردپرس نیز حداکثر همین تعداد است.
حتی در صورتی که این موضوع درست باشد و برای گوگل کوتاه بودن آدرس صفحات یک نکته مثبت هر صفحه وب باشد این تعداد کارکتر ظاهراً از دید گوگل بلند نیست.
اگر دلیل کوتاه بودن URL برای شما این است که در نتایج گوگل URL صفحه مورد نظر شما خورد نشود و به طور کامل نمایش داده شود باید به ۲ نکته توجه کنید.
نکته اول اینکه مدتهاست دیگر گوگل URLهای صفحات مختلف را در نتایج خود به کاربران نمایش نمیدهد و بجای آن درصورتیکه وبسایت از BreadCrumb به صورت کدهای استراکچرد دیتا استفاده کرده باشد آن را نمایش میدهد.
درصورتی که وبسایت از کدهای استراکچرد دیتای Breadcrumb استفاده نکرده باشد URL صفحه را به صورت پوشه به پوشه مشابه مسیر راهنما یا همان Breadcrumb خورد میکند و در نتایج نمایش میدهد.
نکته دوم این است که درصورتیکه بخواهید URL مورد نظر شما برای گوگل طولانی به نظر نیاید نمیتوانید اندازه آن را براساس تعداد حروف محاسبه کنید.
این موضوع به این دلیل است که گوگل میزان اندازه عنوان، URL و توضیحاتی را که در نتایج خود نمایش میدهد براساس تعداد پیکسل مشخصی و براساس عرض صفحه محاسبه میکند.
معمولاً عنوان یا همان تایتل به اندازه ۶۰۰ پیکسل نمایش داده میشود، تگ توضیحات یا متادسکریپشن به اندازه ۹۲۰ پیکسل معمولاً نمایش داده میشود و URL هم معمولاً به همان اندازه Title فضا برای نمایش داده شدن دارد.
توسط نرمافزار Screaming Frog SEO Spider میتوانید اندازه عنوان، توضیحات و URL تعداد زیادی از صفحات وبسایت خود را به صورت کارکتر و یا پیکسل بدست آورید.
پیشنهادهای گوگل برای ساختار URL استاندارد
تا جای ممکن ساده باشد
با مطالعه راهنمای ساختار URL گوگل متوجه خواهید شد که ساده بودن آدرس ها و نظم ساختاری آدرس ها برای گوگل نسبت به کوتاه بودن آدرس صفحات از اهمیت بیشتری برخوردار است.
(هرچند من چیزی در مورد کوتاه بودن آدرسها مشاهده نکردم)
تا جای ممکن منظم و منطقی باشد.
استفاده از پارمترهای عدد و آدرسهای کدشده و بیمعنی باعث میشود کاربران کمتری تصمیم به کلیک بر روی آن URL بگیرند.
به طور مثال این دو آدرس را مشاهده کنید:
http://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1
در مقابل
http://en.wikipedia.org/wiki/Aviation
خود شما کدام یک را انتخاب میکنید؟
برای نظم بخشیدن و ساختار دادن به آدرسها و صفحات وبسایت میتوانید مواردی را که در ادامه به آنها اشاره خواهم کرد انجام دهید:
میتوانید آدرس صفحات را به صورت پوشه در پوشه و زیرمجموعهای به صورتی قراردهید که کاملاً مشخص باشد هر صفحه زیرمجموعه چه موضوع یا موضوعاتی است.
این کار هنگام آنالیز وبسایت توسط ابزارهایی مانند گوگل سرچ کنسول و گوگل انالیتیکس به شما تواناییهای زیادی میدهد. مخصوصا اگر بخواهید کلمات کلیدی وبسایت را از نظر سرچ اینتنت جدا کنید.
همچنین میتوانید از کد استراکچرد دیتای BreadCrumb نیز استفاده کنید تا گوگل بتواند وبسایت شما را به صورت یک درختواره مشاهده کند.
یکی دیگر از کارهایی که میتواند به صفحات شما نظم بدهد استفاده از فهرستهای درون صفحهای است.
این فهرستها باعث میشوند که هر بخش یا هر هدینگ از صفحه شما یک آدرس مجزا بگیرد و این مورد میتواند به درک بهتر و بخش بندی بهتر قسمتهای مختلف صفحه توسط روبات گوگل کمک کند.
از جداکننده های مناسب استفاده کنید
همچنین پیشنهاد شده است که از یک جدا کننده بین کلمات URL استفاده شود به طور مثال کلمات با خط تیره جدا شوند.
گوگل پیشنهاد میدهد از خط تیره عادی (hyphen) یا همان – بجای خط تیره باشیفت (underscores) یا همان ـ استفاده شود.
طبیتعا آدرس example.com/green-dress خوانایی بیشتری نسبت به آدرس example.com/greendress دارد.
چندین آدرس برای یک صفحه ایجاد نکنید
همچنین پیشنهاد میکنم همانطور که از پارامترهای عددی برای ایجاد URL صفحات استفاده نمیکنید آدرسهای مشابه را توسط ریدایرکت 301 و استفاده از تگ کنونیکال از فهرست کراول گوگل حذف کنید.
باز کردن چنیدن URL تکراری که به محتوای یکسانی ختم میشوند باعث میشود گوگل پهنای باند بیشتری برای کراول سایت شما استفاده کند.
این مورد باعث مصرف بیش از حد کراول بادجت شما و کندتر شدن سرعت ایندکس شدن صفحات شما خواهد شد.
مواردی که باعث ایجاد آدرسهای جدید برای یک محتوا میشوند:
- نسخه های مختلف یک محتوا مانند PDF، پرینت، موبایل، amp و …
- فیلترهای مختلف از یک صفحه مثل: جزییات محصول و ویژگیهای مختلف مانند رنگ و اندازه و …
- ایجاد محتوا به صورت پویا مثلاً محتوای تبلیغاتی یا محتوایی که با برچسبهای زمان تغییر می کنند.
و موارد دیگر
برای حل مشکل اینگونه URLها میتوانید اقداماتی از قبیل محدود کردن مسیر اینگونه آدرسها در فایل robots.txt و یا اضافه کردن برچسب nofollow به لینک های این صفحات انجام دهید.
پرسشهای رایج
منظور از ساختار URL چیست؟
ساختار URL یعنی ساختمان ظاهری یک URLمشخص چگونه به نظر میرسد. این بحث شامل مواردی همچون اندازه URL، خوانایی و ظاهر، بامعنی بودن، بخشبندی کردن و مواردی نظیر آنهاست.
اجزای یک URL کدام هستند؟
۱. پروتکل: که معمولا به دو صورت http و https میباشد.
۲. سابدامین: این بخش اختیاری است. به طور مثال www
۳. هاست: این بخش نمایانگر برند وبسایت و میزبانی است که فایلهای URL درون آن سایت قرار گرفته اند.
۴. تیالدی: منظور از TLD همان پسوند دامنه است به طور مثال .com یا .ir
۵. دایرکتوری: اگر بعد از دامین، کلماتی در آدرس قرار بگیرد و انتهای آن کلمه با اسلش (/) بسته شده باشد ان کلمه، یک پوشه و یا دایرکتوری درنظر گرفته میشود.
۶. فایل: اگر بعد از دامین و یا دایرکتوری عبارتی قرار گیرد ولی با اسلش بسته نشود به عنوان یک فایل شناسایی خواهد شد که میتواند پسوندهایی مانند .html و … نیز داشته باشد.
۷. کوئری استرینگ: در انتهای هر URL میتوان مقادیر دیگری نیز وارد کرد که باعث باز شدن یک بخش خاص از صفحات و یا اجرای فیلتر خاصی در صفحات خواهد شد که این بخش معمولا با علامت سوال و یا هشتگ از URL اصلی جدا میشود.
مرسی، مثال عالی بود :))
خواهش میکنم 🙂
خیلی عالی. ممکنه درباره کراول بادجت توضیح بدید؟
اگه بخوام خیلی ساده بگم منظور از کراول باجت همون میزان صفحاتی هست که گوگل در یک بازه زمانی مشخص مثلا سه ماه از سایت مورد نظر ما کراول میکنه.
البته من اینجا برای سادگی گفتم صفحات ولی هر قسمتی از وب سایت که یک URL مشخص داشته باشه و امکان این رو داشته باشه که توسط گوگل کراول بشه مثل تصاویر، فایل های، کامنت ها در صفحات و … میتونه جزو کرال باجت حساب بشه.
به طور خلاصه اهمیت کراول باجت اینجایی مشخص میشه که اگه گوگل صفحات و بخشهای مختلف رو نتونه کراول کنه و روبات گوگل نتونه با خزش صفحات مختلف سایت رو شناسایی کنه، طبیعتا اون صفحات ایندکس نمی شن و در نتایج گوگل نمایش داده نمی شن.
از اونجایی که امکانات گوگل محدوده و نمی تونه هر لحظه درحال چرخیدن توی سایت مورد نظر ما باشه یه میزان خاصی از کراول کردن رو برای سایت مورد نظر ما در نظر میگیره که اون میزان برحسب یه سری فاکتورها مثل پیج رنک وب سایت، تعداد بازدید وب سایت، حجم مطالب وبسایت و … توسط خود گوگل محاسبه میشه.
حالا اگه ما این بودجه ای که برای کراول صفحاتمون در نظر گرفته شده رو بجای تمرکز روی محتوای جدید ببریم سراغ URLهایی با محتوای تکراری و یا صفحات خطا و موارد مشابه، اتفاقی که میفته اینه که یه سری از صفحات ما ایندکس نمیشن یا خیلی زیاد طول میکشه تا ایندکس بشن.
اینه اون هوای فردا👍❤
😁
ممنون بابت توضیح یکی از مهمترین مسایل سئو
ممنون از نظرتون 🙏
عالی
ممنونم از نظر لطفتون
🙏❤🌹