عمومی

duplicate content چیست؟ چرا گوگل آن را جریمه نمیکند؟ آکادمی

راهنمای مطالعه

میخواهید یک مقاله در مورد محتوای کپی یا Duplicate Content بنویسید. اما به جای اینکه خودتان دست به کار شوید و یک مقاله مفید و ارزشمند خلق کنید، با هیجان بالایی یک مقاله را از نتایج گوگل انتخاب میکنید و محتوای آن را در سایت خود کپی پیست میکنید!

تبریک میگوییم، ماموریت با موفقیت انجام شد. حالا یک مقاله داریم که موضوع محتوای تکراری را خوب پوشش داده ولی یک مشکل در این زمینه وجود دارد:

این محتوا در بیش از یک سایت وجود دارد.

وقتی چنین اتفاقی بیافتد، یعنی یک محتوا در بیش از یک سایت با URL های متفاوت ظاهر شود، به آن محتوای Duplicate گفته میشود.

حقیقت هایی دردناک درباره ماهیت واقعی محتوای تکراری

  • محتوای تکراری هیچ ارزشی به سایت شما اضافه نمیکند
  • بر خلاف باور عموم، محتوای کپی تنها با ایجاد متن مشابه به وجود نمی‌آید
  • گوگل با دیدن چند محتوای مشابه، یکی را در صفحه نتایج نشان میدهد. این یعنی در صورت وجود محتوای تکراری در سایت شما، گوگل آن را ایندکس میکند ولی در نتایج یکی را نشان میدهد
  • گوگل هیچ جریمه ای برای محتوای کپی در نظر نگرفته است
  • مشکلات تکنیکال و فنی موجود در سایت رایج ترین دلیل ایجاد Duplicate Content است.
  • 25 تا 30 درصد محتوای اینترنت تکراری است!

نظر متخصصین سئو درباره Duplicate Content و رفتار گوگل نسبت به آن

وقتی صحبت از محتوای تکراری و نحوه رفتار گوگل با آن میشود، متخصصان سئو نظرات متنوعی به ما میدهند. برای اینکه با طیف گسترده ای از دیدگاه های مختلف درباره Duplicate Content آشنا شویم، در اینجا به بررسی نقطه نظرات کارشناس های سئو میپردازیم:

  1. «محتوای کپی یکی از بحث برانگیزترین موضوعات در سئو است. شکل های مختلفی از محتوای کپی وجود دارد که شما باید حواستان به آن ها باشد چون حتی یک باگ کوچک تکنیکال در سایت شما میتواند باعث به وجود آمدن هزاران صفحه Duplicate در سایت شما شود.»
  2. وقتی 3 یا 4 نسخه مشابه از یک صفحه دارید، مثل این است که دارید با 3 یا 4 سایت دیگر برای کسب جایگاه مبارزه میکنید. این کار میتواند باعث میشود محتوای اصلی شما هم شانس زیادی برای کسب جایگاه نداشته باشد.
  3. اگر یک یا دو صفحه در سایت خود دارید که بخشی از محتوای آن از سایت های دیگر گرفته شده است، اصلاً جای نگرانی نیست. مشکل زمانی حاد میشود که مشکلات فنی و تکنیکال سایت شما هزاران صفحه کپی تولید میکند و شما روح تان هم خبر ندارد.
  4. اصلاً میدانستید که حدود 25 تا 30 درصد محتوای وب، کپی است؟ فقط اگر میزان Duplicate Content سایت شما زیاد است یا شما باید فکری برای آن بکنید یا گوگل خودش دست به کار میشود و این مشکل را برای شما حل میکند.

استفاده از نظرات متخصصان به دلیل اینکه بر اساس تجربه و آزمون خطا به وجود آمده، میتواند مانند قطب نما راه درست را به ما نشان دهد. در صفحه سئو چیست میتوانید با تعداد بیشتری از متخصصان سئو ایرانی و خارجی آشنا شوید و از نظرات متنوع آن ها برای پیشبرد پروژه های خود استفاده کنید.

Duplicate Content چیست و چطور به وجود می‌آید؟

محتوای تکراری معمولاً به دو دلیل به وجود می‌آید:

عامل انسانی: منظور از عامل انسانی همان روشی است که در آن محتوای سایت ها به صورت عمدی از یک سایت در سایتی دیگر کپی میشوند مثل:

  • سایت های دیگری که محتوای شما را کپی میکنند
  • کپی کردن محتوا از سایت های دیگر
  • لندینگ پیج های صفحاتی که در گوگل ادز هستند

عامل غیرانسانی: منظور ما از عامل انسانی، مشکلات و اختلالات فنی موجود در سایت است. این مشکلات فنی به طور کل شامل موارد زیر است:

  • نسخه www سایت با نسخه بدون www / نسخه HTTP با نسخه HTTPS
  • حرف کوچک و بزرگ در URL ها
  • صفحات INDEX .html و (Index.php)
  • فیلتر محصولات سایت های فروشگاهی
  • محتوایی که در چند دسته بندی وجود دارد
  • صفحات مخصوص برای تصاویر
  • صفحات مخصوص کامنت ها
  • سایت های چند زبانه
  • نتایج جستجو در داخل سایت

3 روش ساده برای حل کردن مشکلات مربوط به محتوای کپی

حل کردن مشکلات مربوط به محتوای کپی در یک نکته خلاصه میشود:

اگر چند نسخه تکراری از یک نوع محتوا داشته باشید، میتوانید با معرفی کردن یکی از آن ها به عنوان محتوای اصلی، مشکل محتوای تکراری سایت خود را برطرف کنید.

اجازه دهید 3 روشی که بیشترین تاثیر و استفاده را در حل کردن مشکلات مربوط به Duplicate Content دارد را به شما معرفی کنیم:

1- ریدایرکت 301

استفاده از ریدایرکت 301 از نسخه کپی شده به نسخه اصلی محتوا یکی از رایج ترین روش های مدیریت محتوای تکراری است. وقتی چند صفحه با پتانسیل کسب رتبه بالا با یکدیگر ترکیب میشوند، این صفحات نه تنها دیگر با یکدیگر در رقابت نیستند، بلکه شانس بیشتری هم برای کسب رتبه های برتر در صفحه نتایج دارند. این یعنی نسخه اصلی محتوا از نظر جایگاه تقویت میشود.

2- تگ “Rel=”Canonical

استفاده از تگ کنونیکال این سیگنال را به گوگل میدهد که یک نسخه از محتوا، نسخه اصلی است و نسخه های مشابه آن اهمیتی ندارند. این یعنی هر امتیازی که موتور های جستجو برای رتبه دهی در نظر میگیرند (مثل اعتبار لینک ها یا کیفیت محتوا) نباید بین نسخه های کپی شده پخش شود و تنها به محتوای اصلی (یعنی آن که کنونیکال است) برسد.

3- نوایندکس کردن متا ربات ها

استفاده از تگ نوایندکس در متا ربات ها به گوگل میگوید که محتوای صفحه مورد نظر را ایندکس نکنند. در نتیجه با ایندکس نشدن صفحه، منابع ارزشمند سایت شما مثل بودجه خزش از بین نمیرود. تگ “noindex,follow” هم باید در بخش head صفحه HTML قرار بگیرد.

البته یادتان باشد که این دستور باعث نمیشود که گوگل وارد صفحه نشود. این کار تنها به گوگل میگوید که این صفحه را در لیست نتایج جستجوی خود قرار ندهد.

ارتباط محتوای تکراری به cannibalization و نحوه رفع آن

یکی از مشکلاتی که بسیاری از سایت ها با آن دست و پنجه نرم میکنند، وجود صفحات با ماهیت یکسان است. مثلاً فرض کنید که در یک دسته بندی، 3 مقاله با عنوان «تست روانشناسی» داریم که با اینکه به موضوعات متفاوتی از تست روانشناسی پرداخته، ولی ماهیت همه آن ها یکی است. در این حالت میگوییم که cannibalization اتفاق افتاده، اگر این عبارت برای شما تازه است پیشنهاد می‌کنیم مقاله Cannibalization چیست را مطالعه کنید.

این 3 مقاله از نگاه گوگل محتوای کپی در نظر گرفته میشوند و به دلیل اینکه دائم در حال رقابت با هم هستند، شانس پایینی برای کسب جایگاه دارند.

مهم ترین سوالات کاربران درباره محتوای تکراری یا Duplicate Content

در اینجا به مهم ترین و چالش برانگیز ترین سوالات کاربران درباره Duplicate Content میپردازیم تا دیگر هیچ نقطه ابهامی در این زمینه برای شما به وجود نیاید.

آیا محتوای کپی همیشه اجتناب پذیر است؟

گوگل به طور مستقیم اشاره کرده که تقریباً همه سایت ها دارای محتوای کپی هستند. مثلاً وقتی یک پاراگراف متن از کسی نقل قول میکنید، به طور ناخودآگاه دارید محتوای Duplicate تولید میکنید. پس میتوانیم اینطور نتیجه بگیریم که وجود محتوای تکراری در سایت به هر حال اجتناب ناپذیر است ولی موردی که باید نگرانتان کند این است که تعداد این محتوا از کنترل خارج شود و شما از آن بی خبر باشید!

چرا سایت هایی که از ما محتوا برداشتند بهتر از سایت ما جایگاه میگیرند؟

پاسخ کوتاه: احتمالاً گوگل محتوای شما را ایندکس نکرده.

پاسخ بلند: بعضی از سایت ها به دلیل نرخ بودجه پایین تر، دیرتر ایندکس میشوند. همین دیر ایندکس شدن باعث میشود تا گوگل به محض انتشار یک مقاله، آن را ایندکس نکند و در همین زمانی که صفحه جدید شما از دید گوگل پنهان مانده، سایت های دیگری محتوای شما را در سایت خود قرار میدهند. اگر سایتی که محتوای شما را کپی کرده، نرخ بودجه بهتری داشته باشد و سریع ایندکس شود، جایگاه سایت شما پایین تر از این سایت خواهد بود.

چرا بعضی از سایت هایی که محتوای کپی دارند افت نمی کنند؟

به عنوان مثال سایت های خبری از جمله سایت هایی هستند که محتوای خبری مشابه زیادی در آن ها مشاهده میشود. اما دلایل زیادی وجود دارد تا سایت هایی که محتوای کپی یا تکراری دارند در جایگاه بالا باقی بمانند. مهم ترین دلیل آن هم اعتبار دامنه بالا سایت های خبری است.

وقتی یک سایت نزد گوگل اعتبار خوبی داشته باشد و در کلمات زیادی جایگاه اول باشد، با قرار دادن Duplicate Content، گوگل به آن سایت شک نمیکند. اما لازم است اشاره کنیم که حتی این سایت های شناخته شده، در صورت تکرار این کار، توجه گوگل را به خود جلب میکنند.

چگونه به گوگل اثبات کنیم صاحب اصلی محتوا ما هستیم؟

بعد از انتشار هر مقاله، در پنل سرچ کنسول خود Request Indexing کنید. با این کار اگر تا حالا محتوای شما از چشم ربات های گوگل پنهان مانده، میتواند با ارسال درخواست ایندکس، ربات های گوگل را از محتوای جدید خود با خبر کنید. مقا

ادامه مقاله در سایت منبع

دیدگاهتان را بنویسید