גורמי דירוג בגוגל: מערכות חדשות במקום פנדה ופינגווין

מאז הוקם מנוע החיפוש של גוגל אי שם בשנת 1998, הוא מתהדר בשינויי גרסה תמידיים כגון פנדה, פינגווין, עדכון מובייל, מהירות טעינה ועוד. כעת מסתבר שחלק מהם הפך ללא רלוונטי, ובמקומם יש מערכות חדשות.

באתר הפיתוח של גוגל, פורסמו מערכות דירוג הנמצאות בשימוש כיום – לעומת אלו שכבר לא רלוונטיות (אם מכיוון שהן שולבו במערכות חדשות יותר, ואם מכיוון שהפכו לחלק ממערכת הליבה של גוגל). מעבר לכך, גוגל פיתחה עד היום מאות אלגוריתמים שונים בעלי תפקידים מגוונים.

בהקשר זה ראוי לציין שבגוגל יש הבדל בין "עדכונים" ובין "מערכות דירוג" (Ranking Systems); זאת לעומת תעשיית ה-SEO שנוהגת לקרוא להכול "עדכונים" (עדכון פנדה, עדכון פינגווין וכן הלאה). דני סאליבן מגוגל אמר שבעתיד הם יקפידו יותר על המינוחים הנכונים ועל ההבדלים ביניהם.

מנוע החיפוש של גוגל משתמש במערכות דירוג אוטומטיות, שבוחנות מספר רב של פרמטרים וסיגנלים במאות מיליארדי דפי אינטרנט; זאת כדי לספק את התוצאות הרלוונטיות והמועילות ביותר. מערכות אלו עוברות בדיקות ושדרוגים כמעט תמידיים, ובגוגל טוענים שמתבצעים מעל 3,000 שינויים בתחום החיפוש מדי שנה.

מערכות דירוג לא פעילות בגוגל

המערכות הבאות התקיימו מתישהו בעבר וכיום כבר אינן רלוונטיות. חלק מהן שולב במערכות דירוג אחרות, וחלק שולב במערכות הליבה של החיפוש בגוגל.

עדכון פנדה (Panda System)

מערכת לזיהוי תוכן איכותי ומקורי שהושקה ב-2011, שפגעה בעיקר ב"חוות הספאם" שהיו נפוצות אז. מערכת זו התפתחה עם חלוף הזמן, ושולבה סופית במערכת הליבה של גוגל ב-2015.

עדכון פינגווין (Penguin System)

מערכת לזיהוי קישורי ספאם שהושקה ב-2012, ונתנה מכה רצינית להרבה מקדמים בזמנו (ביניהם גם אני) בשל שימוש יתר בטקסט עוגן מדויק. גם מערכת זו שולבה בליבת גוגל ב-2016 ומאז כבר לא קיימת ענישה, אלא הדחה של קישורים המתויגים כקישורי זבל.

עדכון יונק הדבש (Hummingbird)

כאן לא מדובר במערכת דירוג כמו כל השאר, ומכאן יש להבין שמדובר בעדכון של מערכת קיימת. הוא הושק באוגוסט 2013 ומטרתו הייתה לשפר את ההבנה של חיפושים בשפה טבעית (שפת שיחה).

אבטחת אתרים (Secure sites system)

מערכת שהושקה ב-2014 כדי לוודא שכל האתרים יהיו בעלי פרוטוקול אבטחה מינימלי (HTTPS). מערכת זו שולבה במערכת אחרת שנקראת "חוויית שימוש" (ראו בהמשך).

מהירות טעינה (Page speed system)

מערכת שהושקה ב-2018 תחת השם "עדכון מהירות", ומטרתה לדרג גבוה יותר תוכן שנטען מהר יותר במכשירים ניידים. גם מערכת זו שולבה במערכת "חוויית שימוש".

ידידותיות לניידים (Mobile-friendly ranking system)

מערכת שמטרתה לתת העדפה בתוצאות החיפוש לתוכן שנראה טוב יותר במכשירים ניידים. גם מערכת זו שולבה במערכת "חוויית שימוש".


מנקודת מבט של איש SEO ותיק, שעבר על בשרו את כל ה"מערכות" וה"עדכונים" האלה – די מדהים לגלות שכיום הן כבר לא רלוונטיות. מן הסתם המערכות הקיימות כיום מתוחכמות יותר, ולכן הן עדיין בשימוש… אבל בכל זאת – זה חידוש משמעותי. לא היינו יכולים לדעת דבר כזה, אלמלא גוגל הייתה מכריזה על כך.

מערכות דירוג פעילות בגוגל

בניגוד לנהוג לחשוב, גוגל איננו מערכת אחת אחידה שעושה את הכול. בדיוק כפי שיש סוגים שונים של בינות מלאכותיות (למידת מכונה, הבנת שפה, ראייה ממוחשבת) – גם בגוגל לכל "תחום" יש מערכת אוטומטית נפרדת.

להלן מערכות הדירוג העיקריות הפעילות כיום בגוגל:

RankBrain

ראנק בריין הוא בינה מלאכותית שהושקה באוקטובר 2015, המסייעת לגוגל להבין איך מילים קשורות לרעיונות. בצורה כזו ניתן להציג תוצאות גם עבור חיפושים חלקיים שלא מכילים את כל המילים הנחוצות, וזאת על ידי הבנה שהמילים הקיימות קשורות למילים אחרות ולרעיונות נוספים. הרחבה בנושא ניתן למצוא כאן >

BERT

ברט הוא בינה מלאכותית (קיצור של Bidirectional Encoder Representations from Transformers) המאפשרת לגוגל להבין איך צירופי מילים שונים מביעים משמעויות והקשרים שונים. מודל BERT (שנקרא גם Deep Rank) הושק כקוד פתוח ב-2019, ומאז ממשיך לשמש להבנת השפה הן בגוגל והן בחברות אחרות כגון מיקרוסופט. הרחבה בנושא ניתן למצוא כאן >

MUM

מאמ היא בינה מלאכותית חדשה יחסית שהושקה במאי 2021, המסוגלת גם להבין וגם ליצור שפות (ראשי תיבות של Multitask Unified Model). מאמ חזקה פי כמה אלפים יותר מברט, והיא פועלת עם יותר מ-75 שפות שונות. נכון להיום היא עדיין לא משמשת לדירוג אתרים בחיפוש גוגל, אלא ליישומים ספציפיים יותר (שיפור תוצאות החיפוש עבור מידע בנושא חיסוני קורונה, וכן שיפור תצוגת התשובות הישירות בגוגל).

רוצה להתקדם?

    קידום אורגניייעוץ SEOשיעור פרטי

    התאמה נוירונית (Neural matching)

    רשת נוירונית מתוחכמת שמטרתה אחזור מדויק יותר של מידע. המערכת הושקה ב-2018 כאשר הבינו בגוגל שאפשר להשתמש ברשת נוירונית, כדי להבין איך להתאים בין חיפושים לדפי אינטרנט. הרשת הנוירונית מסייעת לגוגל להבין ייצוגים מעורפלים ופחות ברורים של שאילתות חיפוש, בהשוואה לדפים המתאימים להן.

    חוויית שימוש (Page experience system)

    אנשים מעדיפים אתרים עם חוויית שימוש נהדרת, וזו הסיבה שבגוגל יש מערכת שמודדת את חוויית השימוש. המדידה נעשית לפי קריטריונים רבים כגון זמן טעינה, ידידותיות למכשירים ניידים, פרסומות חוסמות ומפריעות, פרוטוקול מאובטח ועוד (בעבר, כל אלו התקיימו כמערכות נפרדות – ראו רשימת מערכות לא פעילות). דפים בעלי חוויית שימוש טובה יותר, יקבלו העדפה בתוצאות החיפוש.

    צמצום כפילויות (Deduplication systems)

    כשמה כן היא, מערכת ספציפית שמיועדת לנפות ולסנן תכנים כפולים מתוך אלפי ומיליוני תוצאות שדומות אחת לשנייה. מערכת זו פועלת גם בגזרת התשובות הישירות – אם אתר מופיע כתשובה ישירה בגוגל, הוא לא יופיע שוב באותו עמוד עבור אותו חיפוש במקביל.

    מידע לשעת חירום (Crisis information systems)

    גוגל פיתחה מערכות אוטומטיות המספקות מידע חיוני בשעת חירום, כגון אסונות טבע, משברים אישיים ועוד. המידע כולל טלפונים וקווי חירום, ארגוני הצלה וסיוע, מידע מתעדכן ממקורות חדשותיים ועוד.

    דומיינים מדויקים (Exact match domain system)

    גוגל נעזר גם בדומיין כדי לקבוע האם התוכן רלוונטי לחיפוש. במקביל הוא גם מוודא שדומיינים בעלי מילות מפתח מדויקות, לא יקבלו יותר מדי קרדיט בחיפושים מסוימים.

    רענון (Freshness systems)

    חיפושים מסוימים דורשים תוכן רענן וחדש יותר. לדוגמה, אם מישהו מחפש שם של סרט שיצא זה עתה – הוא ודאי ירצה לראות גם ביקורות עדכניות ולא רק תוכן ישן. אם מישהו מחפש רעידת אדמה, במצב רגיל הוא עשוי לקבל מידע מגוון – אבל אם החיפוש מתבצע בזמן שבו רעידת אדמה מתרחשת או התרחשה לאחרונה, התוצאות יעודכנו במידע רענן יותר מאתרי חדשות ותוכן.

    תוכן מועיל (Helpful content system)

    מערכת ששולבה לאחרונה בגוגל, ומטרתה להציף ולהציג תכנים מועילים שנכתבו על ידי אנשים למען אנשים (בניגוד לתוכן אוטומטי או תוכן שנכתב עבור מנועי החיפוש).

    ניתוח קישורים ופייג' ראנק (Link analysis systems and PageRank)

    גוגל משתמש במספר מערכות כדי להבין כיצד דפים מקשרים אחד לשני, במטרה לקבוע איזה במה הדפים הללו עוסקים ומי מהם יהיה המועיל ביותר בתגובה לחיפוש כלשהו. יש לשער שמערכת זו מחליפה את פינגווין, שכבר אינו פעיל כיום (ראו רשימת מערכות לא פעילות).

    בין המערכות הללו ניתן למצוא גם את פייג' ראנק הוותיק, שמהווה את הבסיס למנוע גוגל מימיו הראשונים (עוד כשמייסדי גוגל רק חשבו עליו בזמן שלמדו בסטנפורד). פייג' ראנק התפתח והשתדרג מאז, וכיום הוא משולב במערכות הליבה של גוגל.

    חדשות מקומיות (Local news systems)

    מערכות המיועדות לזהות ולהציף מעלה מקורות חדשותיים מקומיים, כל אימת שזה רלוונטי (לדוגמה בפיצ'רים כגון "בראש החדשות" / Top Stories או "חדשות מקומיות").

    תוכן מקורי (Original content systems)

    מערכת שמטרתה להציף תכנים מקוריים בתוצאות החיפוש, כגון דיווח חדשותי מקורי לעומת מקורות שרק מצטטים אותו. ניתן לעזור לגוגל לעשות זאת באמצעות תגי קנוניקל, המעידים על המקור עצמו.

    הסרת תכנים (Removal-based demotion systems)

    גוגל מאפשר להסיר תכנים מסוימים מהאינדקס, כגון תוכן העובר על החוק (לדוגמה הפרת זכויות יוצרים) או מידע אישי / רגיש. אם גוגל מזהה שיש יותר מדי בקשות להסרת תכנים מאתר מסוים, הוא עשוי לקבל זאת כסיגנל המעיד על איכות ירודה – ולטפל בכך בהתאם.

    אינדוקס פסקאות (Passage ranking system)

    מערכת AI המשמשת לסריקה ואינדוקס של פסקאות ספציפיות מתוך עמוד קיים; זאת כדי להבין יותר טוב כיצד דף מסוים הוא רלוונטי לחיפוש ספציפי.

    חוות דעת למוצרים (Product reviews system)

    מערכת שמיועדת לאתר ולצ'פר חוות דעת אמיתיות ומקוריות עבור מוצרים, כמו גם תוכן שמספק ניתוחים בעלי תובנות ומחקר מקורי. בדרך כלל תכנים מסוג זה צריכים להיכתב על ידי מומחים או חובבים נלהבים המכירים היטב את התחום.

    אמינות המידע (Reliable information systems)

    מערכות המיועדות להצגה של המידע האמין ביותר עבור חיפוש מסוים, באמצעות הצפת מקורות סמכותיים כלפי מעלה (כגון חדשות) וצמצום חשיפה של תוכן דל ולא איכותי. במקרים בהם חסר מידע אמין או שהמידע הקיים לא אמין דיו, המערכת תציג הודעה שאין מספיק מידע בנושא, ותציע במקביל לבצע חיפוש חדש.

    גיוון דומיינים (Site diversity system)

    מערכת המיועדת לוודא שלא יוצגו יותר משני דפים של אותו אתר בתוצאות העליונות; זאת כדי למנוע השתלטות של אתר מסוים. למרות זאת, יהיו מצבים בהם כן יוצגו יותר משני עמודים מאותו אתר – וזאת כאשר המערכת קבעה שזה רלוונטי במיוחד לחיפוש שבוצע. מערכת גיוון הדומיינים מתייחסת בדרך כלל לסאב-דומיין כאל חלק מאותו אתר; עם זאת, יש מצבים בהם גם סאב דומיינים יקבלו יחס של אתרים נפרדים, במידה שזה רלוונטי ונדרש לגיוון התוצאות.

    גילוי ספאם (Spam detection systems)

    אף אחד לא אוהב ספאם – וזה תקף גם לתוצאות החיפוש. האינטרנט מלא בכמויות עצומות של תוכן זבל, שאם לא יטופל ימנע מאיתנו לקבל מידע אמיתי ומועיל. גוגל מיישם מגוון רחב של מערכות לגילוי ומניעת ספאם, שאחת מהן נקראת (איך לא) SpamBrain.

    מה נחשב לספאם בגוגל? הסתרת טקסט וקישורים, תוכן מושתל בעקבות פריצה, הצגת מידע שונה למנועים ולמשתמשים, דחיסת מילות מפתח, קישורי זבל ומניפולציות קישורים, אוטומציית תוכן וטראפיק, הטעיה, תוכן גנוב, הפניות מטעות וכן הלאה.

    דילוג לתוכן