Passage Indexing؛ الگوریتم ایندکس کردن متن جدید گوگل

  • نویسنده : امید ابوالحسنی
  • زمان مطالعه : 16 دقیقه
  • تاریخ انتشار : 1400/06/02
Passage Indexing؛ الگوریتم ایندکس کردن متن جدید گوگل

جستجو در گوگل از سال 2021 چشم‌اندازهای جدیدی را نشان می‌دهد زیرا این ابر موتور جستجو یک شاخص جدید به نام ایندکس کردن متن را ارائه کرده است. فناوری رتبه‌بندی جدید به طور رسمی‌ در 11 فوریه 2021 اجرا شد و حساب توییتر گوگل از آن خبر داد.

الگوریتم ایندکس کردن متن چیست؟

ایندکس کردن متن یک فناوری جدید است که توسط گوگل استفاده می‌شود و می‌تواند هر متن در نتایج جستجو را بر اساس جستجوی کاربران رتبه‌بندی کند. بیانیه ای که گوگل در سپتامبر 2019 در مورد BERT اعلام کرد را به خاطر دارید؟ آنها گفتند که BERT بر 10 درصد از جستجوهای به زبان انگلیسی تأثیر می‌گذارد. حالا‌، باور کنید یا نه‌، این ابزار جدید بیش از 99 درصد از جست و جو‌ها را تحت تأثیر قرار می‌دهد.

ایندکس کردن متن تأثیر مشابهی در صفحه نتایج جستجو خواهد داشت زیرا با این ابزار خزنده‌های گوگل شروع به درک ارتباط متون خاص در محتوای شما می‌کنند. اگرچه این ابزار ایندکس کردن متن یا همان Passage Indexing نامیده می‌شود‌، اما هیچ تغییر عمده‌ای در روند ایندکس کردن فعلی گوگل رخ نمی‌دهد. با این حال‌، این فناوریِ جدید بیشتر به رتبه‌بندی مربوط می‌شود.

بنابراین‌، اگر شما درباره یک موضوع خاص، متون مختلفی نوشته‌اید، گوگل از این به بعد بر اساس این قسمت از متن که توجه مخاطب را بیشتر جلب کرده و تطابق بیشتری با جستجوی کاربر داشته است، رتبه یا امتیاز خواهد داد. از زمان تأسیس‌، گوگل سعی کرده است بهترین و مرتبط‌ترین نتایج با سرچ کاربر را به او نشان دهد.  اکنون می‌توانید مشاهده کنید که دو فاکتور اصلی رتبه‌بندی یعنی محتوا و لینک‌ها تنها زمانی با اهمیت هستند که به درد کاربر بخورند و مرتبط با نیاز و خواسته او باشند.

ایندکس کردن متن  7 درصد از نتایج جستجو در سراسر جهان را تحت تأثیر قرار می‌دهد. با وجود BERT‌، مطمئناً این درصد در مدت یک سال به طور نمایی افزایش پیدا خواهد کرد.

ایندکس کردن متن بر رتبه‌بندی تاثیر دارد نه بر نمایش

اجازه دهید درک مفهوم ایندکس کردن متن را برای شما آسان کنم. اول از همه باید بدانید، ایندکس کردن متن مربوط به جایی نیست که گوگل می‌خواهد نتایج را نمایش دهد. این یک عامل رتبه‌بندی اضافی است که Google را قادر می‌سازد تا هر متن داخل صفحه را به صورت جداگانه را درک کند.

ایندکس کردن متن در مورد نمایش نتایج نیست. این ابزار باعث نمی‌شود که اسنیپت‌ها به نحوی طولانی تر شوند بلکه مربوط به درک بهتر یک صفحه با درک محتوای متنی است‌، جایی که می‌توان آنها را شناسایی کرد و البته این در کنار سایر عوامل رتبه‌بندی کار خواهد کرد.

کارکرد ایندکس کردن متن دقیقاً مانند الگوریتم BERT یا Link Analysis خواهد بود. این الگوریتم در کنار سایر عوامل رتبه‌بندی کار می‌کند تا نتایج بهتری را برای کاربران به ارمغان آورد بدون اینکه تغییری در ظاهر کلی صفحه نتایج ایجاد کند.

در اینجا یک مثال جالب برای درک نحوه عملکرد الگوریتم ایندکس کردن متن آمده است:

صفحه ای را که می‌خواهید رتبه‌دهی کنید به عنوان یک کتاب با چندین فصل در نظر بگیرید. تا به حال گوگل بر اساس موضوع اصلی  کتاب رتبه‌بندی را انجام می‌داد. اما با ایندکس کردن متن‌، گوگل فصل‌های جداگانه کتاب شما را درک می‌کند. بنابراین این بدان معناست که هر فصل (یا هر بخش از سایت) هنگامی‌که یک جست و جو بسیار مرتبط توسط کاربر انجام شود، در نتایج نشان داده می‌شود. یعنی گوگل مرتبط‌ترین محتوا را به کاربر نشان خواهد داد نه فقط برترین سایت از نظر رتبه.

این بدان معناست که برای بهینه کردن صفحات خود از منظر ایندکس کردن متون، نیازی به انجام هیچ کاری ندارید زیرا بیشتر یک تغییر رتبه داخلی است.

با این حال‌، ساختاردهی محتوای شما ممکن است باعث درک بهتر مفهوم متن برای الگوریتم ایندکس کردن گوگل شود و کار را آسان‌تر کند. بنابراین‌، اگر شما فردی هستید که محتوای طولانی را با چند عنوان فرعی می‌نویسید و اگر جذب ارگانیک مخاطب به سمت محتوای شما کم است، محتوای شما به جهت ایندکس کردن متن مشکل دارد.

پیشتر‌، صفحات با موضوعات بسیط و فراگیررتبه‌بندی خوبی کسب نمی‌کردند. اما با ایندکس کردن متن‌، چنین صفحاتی اکنون می‌توانند به عنوان مرتبط‌ترین نتیجه به سرچ کاربر به اون نشان داده شده و رتبه‌بندی شوند.

بنابراین‌، اگر از یک وب سایت تجارت الکترونیک استفاده می‌کنید‌، صفحات محصول شما ممکن است از مزیت ایندکس کردن متن برخوردار نباشند زیرا در این مورد، محتوا شاخصه اصلی است.

الگوریتم ایندکس کردن متن چگونه کار می‌کند؟

ایندکس کردن متن با کار خزنده‌ها یا ایندکس کردن معمولی تداخل نمی‌کند  اما به Google کمک می‌کند تا معنی متون داخل صفحه  را درک کند.

الگوریتم ایندکس کردن متن

این بدان معناست که Google هر زمان که کاربر جستجویی را انجام داد، مناسب‌ترین قسمت‌ها از متن را بر اساس مرتبط بودن با موضوع جستجو به کاربر نشان خواهد داد.

اگر جستجوی سریع انجام دهید مثلا یک سوال را در قسمت سرچ گوگل تایپ کنید، گوگل در نهایت نتایج را به صورت لیستی از وب‌سایت‌ها به شما ارائه میکرد. اما آنچه شما می‌خواهید یک پاسخ خاص به سوالتان  است و گوگل قبلاً قادر به ارائه آن نبود.

با این حال‌، با الگوریتم ایندکس کردن متن‌، موتور جستجوی Google مناسب‌ترین پاسخ را به شما تحویل خواهد داد. جالب است که صفحه‌ای که به شما پاسخ می‌دهد ممکن است دارای محتوای طولانی باشد‌، اما Google فقط با نشان دادن مناسب‌ترین پاسخ در وقت شما صرفه جویی می‌کند.

گوگل در این باره می‌گوید: بنابراین‌، برای مثال‌، فرض کنید شما سوالی مانند “چگونه می‌توانم تشخیص دهم که آیا پنجره‌های خانه من ضد ماوراء بنفش است” را جستجو کنید. این یک پرسش بسیار پیچیده است و ما صفحات زیادی را در مورد شیشه آنتی UV و پرسش شما دریافت می‌کنیم. نتایج زیاد هستند، اما هیچ یک از اینها واقعاً به شخص  کمکی نمی‌کند. الگوریتم جدید ما می‌تواند روی  یک انجمن پرس و پاسخ، زوم کند. ظاهراً می‌توانید از بازتاب شعله برای سنجیدن آنتی ماورا بنفش بودن شیشه استفاده کنید و بقیه پست‌های صفحه که چندان مفید نیستند را نادیده بگیرید.

آیا Google فقط  بخش‌هایی از صفحات را ایندکس می‌کند؟

مقامات گوگل تأیید کرده‌اند که Passage Index قرار نیست جایگزین ایندکس کردن معمولی صفحات شود. این بدان معناست که خزنده‌های گوگل به طور کامل به ایندکس کردن صفحات ادامه می‌دهند‌، اما با انجام این ابزار‌، سعی می‌شود محتوا و معنی هر قسمت از محتوا درک شود. (ایندکس کردن یا ایندکس کردن صفحات به معنای ثبت آنها در گوگل برای نشان داده شدن به عنوان رکورد جستجو است. به طور کلی به معنای ثبت شدن در حافظه گوگل است)

این موضوع ربطی به نحوه ایندکس کردن صفحات توسط گوگل ندارد و در واقع لایه دیگری را به روند موجود اضافه می‌کند‌، که البته رتبه صفحات را تغییر می‌دهد.

تفاوت بین فیچر اسنیپت(Featured Snippet) و ایندکس کردن متون (Passage Indexing)

به گفته گوگل‌، یک اسنیپت‌، قسمتی از یک صفحه سایت است که به طور کلی به موضوع سایت مربوط است (وقتی یک سرچ انجام می‌دهید در بالای نتایج یک تکه متن کوچک قرار دارد و در آن پاسخ‌هایی به سوال شما داده می‌شود. به این قطعه اسنیپت می‌گویند).

با این حال‌، Passage Indexing ارتباط کلی و موضوعی صفحه را در نظر نمی‌گیرد‌، بلکه فقط قسمتی از متن را که مربوط به عبارت جستجو است در نظر می‌گیرد.

دنی سالیوان از گوگل نیز در توییتی در مورد همین جمله گفت: “از اسنیپت‌ها برای جستجوی صوتی استفاده می‌شود. آنها قبلاً با استفاده از سیستم‌های مختلف  شناسایی شده‌اند.

آیا Google برای ایندکس سازی متن از پردازش زبان SMITH استفاده می‌کند؟

ما در مورد BERT شنیده ایم که می‌تواند پرسش‌های طولانی را هم در جستجو و هم در صفحات جداگانه درک کند. اما در حال حاضر‌، به نظر می‌رسد گوگل یک موجود عظیم طراحی کرده است که با اسم رمز SMITH شناخته می‌شود. SMITH مخفف Siamese Multi-Deep Transformer based Hierarchical (SMITH) Encoder است که یک اختراع جدید برای پردازش طبیعی زبان است.

هدف این مدل پردازش زبان این است که الگوریتم‌های گوگل قسمت‌های یک متن را درک کنند. بنابراین‌، اکنون ما نقشه راه گوگل را در مورد نحوه عملکرد ‌ایندکس‌گذاری متن را در آینده نزدیک می‌دانیم.

سند اشتراک گذاری شده توسط گوگل در مورد SMITH عنوان می‌کند، سیستم پردازش زبان در ارائه اخبار، مقالات مرتبط و مهمتر از همه خواندن اسناد به افراد کمک خواهد کرد. نکته سوم درباره خواندن اسناد یک جنبه مهم است و مستقیماً با ایندکس کردن متن ارتباط دارد. SMITH یک سیستم تطبیق سند طولانی مدت است‌، که مجدداً توسط گوگل و توییت‌های Danny Sullivan در مورد نحوه سود رساندن SMITH به محتوای طولانی در بلند مدت اشاره می‌کند.

نحوه عملکرد این ابزار تقریباً شبیه BERT است. در حالی که BERT از مدل سازی  کلمه  استفاده می‌کند‌، SMITH این کار را با مدل سازی بلوک‌های جمله انجام می‌دهد. به گفته گوگل‌، نتایج تجربی آنها در چندین مجموعه داده برای تطبیق اسناد، در طولانی مدت، نشان می‌دهد که مدل SMITH از مدل‌های قبلی پیشرفته تر است و عملکرد بهتری دارد.

هنگامی‌که SMITH را با BERT مقایسه می‌کنید‌، مورد اول توانایی پردازش کلمات بیشتری را دارد‌، که به گفته گوگل به افزایش قابلیت تطبیق اسناد کمک می‌کند.

  گوگل می‌گوید: در مقایسه با BERT‌، مدل SMITH  قادر است حداکثر طول متن ورودی را از 512 به 2048 افزایش دهد. لازم به ذکر است که حداکثر طول متن ورودی برای BERT 512 کلمه است.

نحوه عملکرد SMITH به این صورت است:

  • مرحله 1: یک متن به چندین بلوک جمله تقسیم می‌شود.
  • مرحله 2: پردازشگر زبان Transformers ایندکس‌های متغیر  هر بلوک جمله را یاد می‌گیرد.
  • مرحله 3: کل بلوک جمله در BERT به صورت متنی نمایش داده می‌شود.
  • مرحله 4: با توجه به دنباله ای از بلوک جمله، تبدیل کننده‌های متن، محتوای هر جمله و نمایش متن نهایی را یاد می‌گیرند.

حدس و گمان: آیا ما در فاز دوم بهینه سازی محتوا هستیم؟

‌ایندکس‌گذاری متن نحوه نمایش نتایج جستجوی گوگل را تغییر می‌دهد و به نظر می‌رسد سئو سایت‌ها تغییرات اساسی داشته باشد. گوگل عناوین متا و برچسب‌های عنوان را به عنوان سیگنال‌های ضروری برای درک محتوا در نظر می‌گرفت. اما این تا زمانی بود که ‌ایندکس‌گذاری متن را راه‌اندازی نشده بود.

با ‌ایندکس‌گذاری متن، گوگل ایندکس کردن صفحات را با درک معنی متون به طور مستقل آغاز کرده است. در نتیجه‌، متن‌ها به صورت انفرادی اکنون می‌توانند برای جستجوهای  مرتبط رتبه‌بندی شوند. نکته جالب‌تر این است که حتی اگر صفحه در مورد موضوعی کمتر مرتبط بحث کند‌، اگر پاسخ پرسش کاربر در بخشی از متن دفن شده باشد‌، آن سایت در صفحه نتایج نشان داده می‌شود.

صحبت با کارکنان گوگل در مورد ‌ایندکس‌گذاری متن‌، حاکی از آن است که ایندکس کردن متن پیامدهای بزرگتری هم خواهد داشت. به عنوان مثال‌، طی مباحثه ای با جان مولر مشخص شد نتایج ‌ایندکس‌گذاری متن ممکن است اکنون در بخش اسنیپت ظاهر شود‌، اما با گذشت زمان ‌ایندکس‌گذاری متن نتایج عادی جستجو را تعیین می‌کند.

وی گفت: بنابراین ممکن است ما ابتدا این نتایج را در بخش اسنیپت نشان دهیم زیرا نمی‌دانم که ما آن مثال را نشان دادیم یا شاید این واضح‌ترین راهی است که می‌توانیم این را بررسی کنیم. و سپس زمانی می‌رسد که شروع به نمایش بیشتر نتایج ‌ایندکس‌گذاری متن در نتایج جستجوی معمولی می‌کنیم.

این یک اظهارنظر بزرگ است زیرا می‌دانیم که گوگل مدتی است به توضیحات متا اهمیت کمتری داده است و احتمال زیادی وجود دارد که Passage Indexing آنچه را که در توضیحات متا ظاهر می‌شود کنترل کند.

علاوه بر این‌، ما شخصاً فکر نمی‌کنیم که محدودیت کاراکتر توضیحات متا (همان خلاصه و چکیده محتوای صفحه) برای گنجاندن کل متن افزایش یابد. در عوض‌، کاری که Google می‌تواند انجام دهد این است که همان کاری که در مورد توضیحات متا و اسنیپت انجام می‌داد را به کل متن بسط دهد.

به این ترتیب‌، کاربر می‌تواند به قسمت دقیق صفحه ای که به سوال او پاسخ می‌دهد‌، دست پیدا کند. اما اگر بر درآمد تبلیغات تکیه دارید، این ویژگی به درآمد شما ضربه می‌زند. ما فکر میکنیم به زودی شاهد تحقق این مورد خواهیم بود و دلیل آن است که گوگل سابقه بررسی ویژگی‌های SERP را در مقیاس کوچک قبل از ارائه آن در مقیاس بزرگتر دارد.

پاسخ به سوال درباره این الگوریتم توسط مدیران گوگل مبنی بر اینکه آیا Passing Indexing فقط به پاسخ‌های بهتری در اسنیپت‌ها منجر می‌شود‌، و اینکه آیا این مساله به خودی خود افشاگری در مورد اهمیت فهرست بندی متن برای گوگل است، اینگونه پاسخ داد: من یک قدم به عقب برمی‌دارم و فقط با این اطلاعات حدس می‌زنم. معمولاً آنچه در مورد این موارد اتفاق می‌افتد این است که ما آنها را در یک مکان خاص قرار می‌دهیم‌، کمی ‌آزمایش می‌کنیم تا دریابیم که چگونه این موارد را به بهترین نحو پیاده سازی کنیم‌، چگونه بهتر کار می‌کنند‌، و سپس راه‌هایی را برای گسترش بیشتر آن پیدا می‌کنیم.

اما باز هم مانند همه این تغییرات، معمولاً آنها را در مقیاس کوچک امتحان می‌کنیم و سپس با گذشت زمان مقیاس را افزایش می‌دهیم حتی اگر گوگل  Passage Indexing را به قسمت اسنیپت محدود کند، ممکن است تعداد درخواست‌های صفر کلیک افزایش یابد (یعنی کاربر در صفحه نتایج جستجو عینا جواب سوال خود را در اسنیپت مشاهده کند).

این امر به این دلیل اتفاق می‌افتد که کاربران بهترین اطلاعات مربوط به مفهوم متن را در SERP دریافت می‌کنند و نیازی نیست که آنها از وب سایتی که محتوا را تنظیم کرده است دیدن کنند.

نکته بسیار مهم: بنابراین‌، هنگامی‌که ‌ایندکس‌گذاری متن اجرا شد‌، به دقت کلیک‌ها را زیر نظر داشته باشید. همچنین‌، احتمال زیادی وجود دارد که کنسول جستجوی گوگل ویژگی Enhancement for Passage Indexing را اضافه کرده و کلیک ایجاد شده از این ویژگی جدید را به نمایش بگذارد. این بدان معناست که فعالان عرصه ‌SEO اکنون می‌توانند به جای تمرکز روی کلمات کلیدی، روی مرتبط بودن و نتیجه بخش بودن محتوایشان متمرکز شوند.

درک نگرانی‌های کاربر و پرداختن به آنها با ایجاد محتوا‌، نقش بسیار مهمی‌در موفقیت وب سایت‌ها پس از راه‌اندازی کامل ‌ایندکس‌گذاری متن خواهد داشت. یعنی یک محتوای طولانی که رویکردی جامع در مورد یک موضوع خاص دارد و الگوریتم ‌ایندکس‌گذاریِ متن، آن را بر خواهد گزید. به لطف الگوریتم پردازش زبان طبیعی گوگل  BERT‌، درک معنا و ارتباط هر قسمت دیگر برای موتورهای جستجو کار مشکلی نیست.

گاهی اوقات اگر به الگوریتم‌ها و ویژگی‌هایی که گوگل ارائه می‌دهد نگاه کنید‌، می‌توانید نحوه و پشتیبانی آنها در دستیابی به هدف گوگل که ارائه بهترین نتایج ممکن برای کاربران است را مشاهده کنید.

پرسش و پاسخ تکمیلی

سفارش فوری تولید محتوا

تعداد کلمه و مقاله را وارد کنید تا سفارش شما محاسبه شود

درصد تخفیف : 0%
قیمت هر مقاله0 تومان
قیمت کل0 تومان
قیمت با تخفیف0 تومان
پرداخت

با ما گفتگو کنید