
جستجو در گوگل از سال 2021 چشماندازهای جدیدی را نشان میدهد زیرا این ابر موتور جستجو یک شاخص جدید به نام ایندکس کردن متن را ارائه کرده است. فناوری رتبهبندی جدید به طور رسمی در 11 فوریه 2021 اجرا شد و حساب توییتر گوگل از آن خبر داد.
الگوریتم ایندکس کردن متن چیست؟
ایندکس کردن متن یک فناوری جدید است که توسط گوگل استفاده میشود و میتواند هر متن در نتایج جستجو را بر اساس جستجوی کاربران رتبهبندی کند. بیانیه ای که گوگل در سپتامبر 2019 در مورد BERT اعلام کرد را به خاطر دارید؟ آنها گفتند که BERT بر 10 درصد از جستجوهای به زبان انگلیسی تأثیر میگذارد. حالا، باور کنید یا نه، این ابزار جدید بیش از 99 درصد از جست و جوها را تحت تأثیر قرار میدهد.
ایندکس کردن متن تأثیر مشابهی در صفحه نتایج جستجو خواهد داشت زیرا با این ابزار خزندههای گوگل شروع به درک ارتباط متون خاص در محتوای شما میکنند. اگرچه این ابزار ایندکس کردن متن یا همان Passage Indexing نامیده میشود، اما هیچ تغییر عمدهای در روند ایندکس کردن فعلی گوگل رخ نمیدهد. با این حال، این فناوریِ جدید بیشتر به رتبهبندی مربوط میشود.
بنابراین، اگر شما درباره یک موضوع خاص، متون مختلفی نوشتهاید، گوگل از این به بعد بر اساس این قسمت از متن که توجه مخاطب را بیشتر جلب کرده و تطابق بیشتری با جستجوی کاربر داشته است، رتبه یا امتیاز خواهد داد. از زمان تأسیس، گوگل سعی کرده است بهترین و مرتبطترین نتایج با سرچ کاربر را به او نشان دهد. اکنون میتوانید مشاهده کنید که دو فاکتور اصلی رتبهبندی یعنی محتوا و لینکها تنها زمانی با اهمیت هستند که به درد کاربر بخورند و مرتبط با نیاز و خواسته او باشند.
ایندکس کردن متن 7 درصد از نتایج جستجو در سراسر جهان را تحت تأثیر قرار میدهد. با وجود BERT، مطمئناً این درصد در مدت یک سال به طور نمایی افزایش پیدا خواهد کرد.
ایندکس کردن متن بر رتبهبندی تاثیر دارد نه بر نمایش
اجازه دهید درک مفهوم ایندکس کردن متن را برای شما آسان کنم. اول از همه باید بدانید، ایندکس کردن متن مربوط به جایی نیست که گوگل میخواهد نتایج را نمایش دهد. این یک عامل رتبهبندی اضافی است که Google را قادر میسازد تا هر متن داخل صفحه را به صورت جداگانه را درک کند.
ایندکس کردن متن در مورد نمایش نتایج نیست. این ابزار باعث نمیشود که اسنیپتها به نحوی طولانی تر شوند بلکه مربوط به درک بهتر یک صفحه با درک محتوای متنی است، جایی که میتوان آنها را شناسایی کرد و البته این در کنار سایر عوامل رتبهبندی کار خواهد کرد.
کارکرد ایندکس کردن متن دقیقاً مانند الگوریتم BERT یا Link Analysis خواهد بود. این الگوریتم در کنار سایر عوامل رتبهبندی کار میکند تا نتایج بهتری را برای کاربران به ارمغان آورد بدون اینکه تغییری در ظاهر کلی صفحه نتایج ایجاد کند.
در اینجا یک مثال جالب برای درک نحوه عملکرد الگوریتم ایندکس کردن متن آمده است:
صفحه ای را که میخواهید رتبهدهی کنید به عنوان یک کتاب با چندین فصل در نظر بگیرید. تا به حال گوگل بر اساس موضوع اصلی کتاب رتبهبندی را انجام میداد. اما با ایندکس کردن متن، گوگل فصلهای جداگانه کتاب شما را درک میکند. بنابراین این بدان معناست که هر فصل (یا هر بخش از سایت) هنگامیکه یک جست و جو بسیار مرتبط توسط کاربر انجام شود، در نتایج نشان داده میشود. یعنی گوگل مرتبطترین محتوا را به کاربر نشان خواهد داد نه فقط برترین سایت از نظر رتبه.
این بدان معناست که برای بهینه کردن صفحات خود از منظر ایندکس کردن متون، نیازی به انجام هیچ کاری ندارید زیرا بیشتر یک تغییر رتبه داخلی است.
با این حال، ساختاردهی محتوای شما ممکن است باعث درک بهتر مفهوم متن برای الگوریتم ایندکس کردن گوگل شود و کار را آسانتر کند. بنابراین، اگر شما فردی هستید که محتوای طولانی را با چند عنوان فرعی مینویسید و اگر جذب ارگانیک مخاطب به سمت محتوای شما کم است، محتوای شما به جهت ایندکس کردن متن مشکل دارد.
پیشتر، صفحات با موضوعات بسیط و فراگیررتبهبندی خوبی کسب نمیکردند. اما با ایندکس کردن متن، چنین صفحاتی اکنون میتوانند به عنوان مرتبطترین نتیجه به سرچ کاربر به اون نشان داده شده و رتبهبندی شوند.
بنابراین، اگر از یک وب سایت تجارت الکترونیک استفاده میکنید، صفحات محصول شما ممکن است از مزیت ایندکس کردن متن برخوردار نباشند زیرا در این مورد، محتوا شاخصه اصلی است.
الگوریتم ایندکس کردن متن چگونه کار میکند؟
ایندکس کردن متن با کار خزندهها یا ایندکس کردن معمولی تداخل نمیکند اما به Google کمک میکند تا معنی متون داخل صفحه را درک کند.

این بدان معناست که Google هر زمان که کاربر جستجویی را انجام داد، مناسبترین قسمتها از متن را بر اساس مرتبط بودن با موضوع جستجو به کاربر نشان خواهد داد.
اگر جستجوی سریع انجام دهید مثلا یک سوال را در قسمت سرچ گوگل تایپ کنید، گوگل در نهایت نتایج را به صورت لیستی از وبسایتها به شما ارائه میکرد. اما آنچه شما میخواهید یک پاسخ خاص به سوالتان است و گوگل قبلاً قادر به ارائه آن نبود.
با این حال، با الگوریتم ایندکس کردن متن، موتور جستجوی Google مناسبترین پاسخ را به شما تحویل خواهد داد. جالب است که صفحهای که به شما پاسخ میدهد ممکن است دارای محتوای طولانی باشد، اما Google فقط با نشان دادن مناسبترین پاسخ در وقت شما صرفه جویی میکند.
گوگل در این باره میگوید: بنابراین، برای مثال، فرض کنید شما سوالی مانند “چگونه میتوانم تشخیص دهم که آیا پنجرههای خانه من ضد ماوراء بنفش است” را جستجو کنید. این یک پرسش بسیار پیچیده است و ما صفحات زیادی را در مورد شیشه آنتی UV و پرسش شما دریافت میکنیم. نتایج زیاد هستند، اما هیچ یک از اینها واقعاً به شخص کمکی نمیکند. الگوریتم جدید ما میتواند روی یک انجمن پرس و پاسخ، زوم کند. ظاهراً میتوانید از بازتاب شعله برای سنجیدن آنتی ماورا بنفش بودن شیشه استفاده کنید و بقیه پستهای صفحه که چندان مفید نیستند را نادیده بگیرید.
آیا Google فقط بخشهایی از صفحات را ایندکس میکند؟
مقامات گوگل تأیید کردهاند که Passage Index قرار نیست جایگزین ایندکس کردن معمولی صفحات شود. این بدان معناست که خزندههای گوگل به طور کامل به ایندکس کردن صفحات ادامه میدهند، اما با انجام این ابزار، سعی میشود محتوا و معنی هر قسمت از محتوا درک شود. (ایندکس کردن یا ایندکس کردن صفحات به معنای ثبت آنها در گوگل برای نشان داده شدن به عنوان رکورد جستجو است. به طور کلی به معنای ثبت شدن در حافظه گوگل است)
این موضوع ربطی به نحوه ایندکس کردن صفحات توسط گوگل ندارد و در واقع لایه دیگری را به روند موجود اضافه میکند، که البته رتبه صفحات را تغییر میدهد.
تفاوت بین فیچر اسنیپت(Featured Snippet) و ایندکس کردن متون (Passage Indexing)
به گفته گوگل، یک اسنیپت، قسمتی از یک صفحه سایت است که به طور کلی به موضوع سایت مربوط است (وقتی یک سرچ انجام میدهید در بالای نتایج یک تکه متن کوچک قرار دارد و در آن پاسخهایی به سوال شما داده میشود. به این قطعه اسنیپت میگویند).
با این حال، Passage Indexing ارتباط کلی و موضوعی صفحه را در نظر نمیگیرد، بلکه فقط قسمتی از متن را که مربوط به عبارت جستجو است در نظر میگیرد.
دنی سالیوان از گوگل نیز در توییتی در مورد همین جمله گفت: “از اسنیپتها برای جستجوی صوتی استفاده میشود. آنها قبلاً با استفاده از سیستمهای مختلف شناسایی شدهاند. “
آیا Google برای ایندکس سازی متن از پردازش زبان SMITH استفاده میکند؟
ما در مورد BERT شنیده ایم که میتواند پرسشهای طولانی را هم در جستجو و هم در صفحات جداگانه درک کند. اما در حال حاضر، به نظر میرسد گوگل یک موجود عظیم طراحی کرده است که با اسم رمز SMITH شناخته میشود. SMITH مخفف Siamese Multi-Deep Transformer based Hierarchical (SMITH) Encoder است که یک اختراع جدید برای پردازش طبیعی زبان است.
هدف این مدل پردازش زبان این است که الگوریتمهای گوگل قسمتهای یک متن را درک کنند. بنابراین، اکنون ما نقشه راه گوگل را در مورد نحوه عملکرد ایندکسگذاری متن را در آینده نزدیک میدانیم.
سند اشتراک گذاری شده توسط گوگل در مورد SMITH عنوان میکند، سیستم پردازش زبان در ارائه اخبار، مقالات مرتبط و مهمتر از همه خواندن اسناد به افراد کمک خواهد کرد. نکته سوم درباره خواندن اسناد یک جنبه مهم است و مستقیماً با ایندکس کردن متن ارتباط دارد. SMITH یک سیستم تطبیق سند طولانی مدت است، که مجدداً توسط گوگل و توییتهای Danny Sullivan در مورد نحوه سود رساندن SMITH به محتوای طولانی در بلند مدت اشاره میکند.
نحوه عملکرد این ابزار تقریباً شبیه BERT است. در حالی که BERT از مدل سازی کلمه استفاده میکند، SMITH این کار را با مدل سازی بلوکهای جمله انجام میدهد. به گفته گوگل، نتایج تجربی آنها در چندین مجموعه داده برای تطبیق اسناد، در طولانی مدت، نشان میدهد که مدل SMITH از مدلهای قبلی پیشرفته تر است و عملکرد بهتری دارد.
هنگامیکه SMITH را با BERT مقایسه میکنید، مورد اول توانایی پردازش کلمات بیشتری را دارد، که به گفته گوگل به افزایش قابلیت تطبیق اسناد کمک میکند.
گوگل میگوید: در مقایسه با BERT، مدل SMITH قادر است حداکثر طول متن ورودی را از 512 به 2048 افزایش دهد. لازم به ذکر است که حداکثر طول متن ورودی برای BERT 512 کلمه است.
نحوه عملکرد SMITH به این صورت است:
- مرحله 1: یک متن به چندین بلوک جمله تقسیم میشود.
- مرحله 2: پردازشگر زبان Transformers ایندکسهای متغیر هر بلوک جمله را یاد میگیرد.
- مرحله 3: کل بلوک جمله در BERT به صورت متنی نمایش داده میشود.
- مرحله 4: با توجه به دنباله ای از بلوک جمله، تبدیل کنندههای متن، محتوای هر جمله و نمایش متن نهایی را یاد میگیرند.
حدس و گمان: آیا ما در فاز دوم بهینه سازی محتوا هستیم؟
ایندکسگذاری متن نحوه نمایش نتایج جستجوی گوگل را تغییر میدهد و به نظر میرسد سئو سایتها تغییرات اساسی داشته باشد. گوگل عناوین متا و برچسبهای عنوان را به عنوان سیگنالهای ضروری برای درک محتوا در نظر میگرفت. اما این تا زمانی بود که ایندکسگذاری متن را راهاندازی نشده بود.
با ایندکسگذاری متن، گوگل ایندکس کردن صفحات را با درک معنی متون به طور مستقل آغاز کرده است. در نتیجه، متنها به صورت انفرادی اکنون میتوانند برای جستجوهای مرتبط رتبهبندی شوند. نکته جالبتر این است که حتی اگر صفحه در مورد موضوعی کمتر مرتبط بحث کند، اگر پاسخ پرسش کاربر در بخشی از متن دفن شده باشد، آن سایت در صفحه نتایج نشان داده میشود.
صحبت با کارکنان گوگل در مورد ایندکسگذاری متن، حاکی از آن است که ایندکس کردن متن پیامدهای بزرگتری هم خواهد داشت. به عنوان مثال، طی مباحثه ای با جان مولر مشخص شد نتایج ایندکسگذاری متن ممکن است اکنون در بخش اسنیپت ظاهر شود، اما با گذشت زمان ایندکسگذاری متن نتایج عادی جستجو را تعیین میکند.
وی گفت: بنابراین ممکن است ما ابتدا این نتایج را در بخش اسنیپت نشان دهیم زیرا نمیدانم که ما آن مثال را نشان دادیم یا شاید این واضحترین راهی است که میتوانیم این را بررسی کنیم. و سپس زمانی میرسد که شروع به نمایش بیشتر نتایج ایندکسگذاری متن در نتایج جستجوی معمولی میکنیم.
این یک اظهارنظر بزرگ است زیرا میدانیم که گوگل مدتی است به توضیحات متا اهمیت کمتری داده است و احتمال زیادی وجود دارد که Passage Indexing آنچه را که در توضیحات متا ظاهر میشود کنترل کند.
علاوه بر این، ما شخصاً فکر نمیکنیم که محدودیت کاراکتر توضیحات متا (همان خلاصه و چکیده محتوای صفحه) برای گنجاندن کل متن افزایش یابد. در عوض، کاری که Google میتواند انجام دهد این است که همان کاری که در مورد توضیحات متا و اسنیپت انجام میداد را به کل متن بسط دهد.
به این ترتیب، کاربر میتواند به قسمت دقیق صفحه ای که به سوال او پاسخ میدهد، دست پیدا کند. اما اگر بر درآمد تبلیغات تکیه دارید، این ویژگی به درآمد شما ضربه میزند. ما فکر میکنیم به زودی شاهد تحقق این مورد خواهیم بود و دلیل آن است که گوگل سابقه بررسی ویژگیهای SERP را در مقیاس کوچک قبل از ارائه آن در مقیاس بزرگتر دارد.
پاسخ به سوال درباره این الگوریتم توسط مدیران گوگل مبنی بر اینکه آیا Passing Indexing فقط به پاسخهای بهتری در اسنیپتها منجر میشود، و اینکه آیا این مساله به خودی خود افشاگری در مورد اهمیت فهرست بندی متن برای گوگل است، اینگونه پاسخ داد: من یک قدم به عقب برمیدارم و فقط با این اطلاعات حدس میزنم. معمولاً آنچه در مورد این موارد اتفاق میافتد این است که ما آنها را در یک مکان خاص قرار میدهیم، کمی آزمایش میکنیم تا دریابیم که چگونه این موارد را به بهترین نحو پیاده سازی کنیم، چگونه بهتر کار میکنند، و سپس راههایی را برای گسترش بیشتر آن پیدا میکنیم.
اما باز هم مانند همه این تغییرات، معمولاً آنها را در مقیاس کوچک امتحان میکنیم و سپس با گذشت زمان مقیاس را افزایش میدهیم حتی اگر گوگل Passage Indexing را به قسمت اسنیپت محدود کند، ممکن است تعداد درخواستهای صفر کلیک افزایش یابد (یعنی کاربر در صفحه نتایج جستجو عینا جواب سوال خود را در اسنیپت مشاهده کند).
این امر به این دلیل اتفاق میافتد که کاربران بهترین اطلاعات مربوط به مفهوم متن را در SERP دریافت میکنند و نیازی نیست که آنها از وب سایتی که محتوا را تنظیم کرده است دیدن کنند.
نکته بسیار مهم: بنابراین، هنگامیکه ایندکسگذاری متن اجرا شد، به دقت کلیکها را زیر نظر داشته باشید. همچنین، احتمال زیادی وجود دارد که کنسول جستجوی گوگل ویژگی Enhancement for Passage Indexing را اضافه کرده و کلیک ایجاد شده از این ویژگی جدید را به نمایش بگذارد. این بدان معناست که فعالان عرصه SEO اکنون میتوانند به جای تمرکز روی کلمات کلیدی، روی مرتبط بودن و نتیجه بخش بودن محتوایشان متمرکز شوند.
درک نگرانیهای کاربر و پرداختن به آنها با ایجاد محتوا، نقش بسیار مهمیدر موفقیت وب سایتها پس از راهاندازی کامل ایندکسگذاری متن خواهد داشت. یعنی یک محتوای طولانی که رویکردی جامع در مورد یک موضوع خاص دارد و الگوریتم ایندکسگذاریِ متن، آن را بر خواهد گزید. به لطف الگوریتم پردازش زبان طبیعی گوگل BERT، درک معنا و ارتباط هر قسمت دیگر برای موتورهای جستجو کار مشکلی نیست.
گاهی اوقات اگر به الگوریتمها و ویژگیهایی که گوگل ارائه میدهد نگاه کنید، میتوانید نحوه و پشتیبانی آنها در دستیابی به هدف گوگل که ارائه بهترین نتایج ممکن برای کاربران است را مشاهده کنید.
پرسش و پاسخ تکمیلی