מלחמת מנועי החיפוש – האם האלגוריתם מבוסס הבינה המלאכותית של ינדקס טוב מזה של גוגל?

השבוע, סוף אוגוסט 2017,ינדקס מנוע חיפוש הרוסי הפופולרי השיק את האלגוריתם מבוסס למידה עמוקה בשם KOROLEV , על שם המדען הסובייטי מומחה הטילים  Sergei Korolev.

למידה עמוקה- המונח הלוהט בתעשיית ההיי-טק היום – הינה  ענף בלמידה החישובית – מודל חישובי המכיל קבוצת אלגוריתמים, ונשען על תשתית של רשתות נוירונים שפועלים בהשראת רשתות הנוירונים במוח האנושי ומאפשרים למערכת ללמוד ולהשתפר כול הזמן ככול שמוזנים אליה יותר נתונים.

אלגוריתם זה של למידה עמוקה מאפשר למחשב ללמוד מדוגמאות במקום להיות מתוכנת על פי כללים מוכתבים מראש. הלמידה העמוקה מתאפשרת בזכות הנתונים הגדולים וכוח המחשוב -מעבדים גרפיים שמסוגלים לעבד כמויות גדולות של דאטה, במספר ערוצים ולהגיע לתוצאות בצורה מהירה.

מן הראוי לציין שאין זה האלגוריתם מבוסס הבינה המלאכותית הראשון של ינדקס. כבר בנובמבר 2016  ינדקס הודיעה שהם השיקו אלגוריתם חדש מבוסס בינה מלאכותית, שמטרתו לטפל בשאילתות עם ביטויי זנב ארוך  בשם ,palekh על שם העיר שסמלה הוא עוף החול בעל הזנב הארוך. אלגוריתם זה מזכיר את RankBrain של גוגל,  עליו נודע מפי בכיר בגוגל כבר באוקטובר 2015 כגורם השלישי בחשיבותו בדרוג התוצאות לאחר התוכן ומספר הקישורים. RankBrain    משמש את גוגל לפרש שאילתות באופן שמאפשר איתור דפים שלא בהכרח מכילים את מונחי השאילתה. יש להניח שמוזנים לו דוגמאות של זוגות שאילתות ומסמכים רלוונטיים לשאילתה , מידע בצורת ישויות מתמטיות, ממנו הוא לומד והוא משתמש בכך לתחזיות על חיפושים עתידיים בעיקר לשאילתות ארוכות או שאילתות חדשות שלא נשאלו בגוגל בעבר.

ההבדל העיקרי באלגוריתם החדש של ינדקס KOROLEV מ- palekh, האלגוריתם מבוסס הבינה מלאכותית הוותיק יותר שלו, הוא שהוא מתבסס על הטקסט כולו בעוד  ש- palekhהתבסס על כותרים  headlines בלבד.

עם פיתוח חדש זה של ינדקס נשאלת השאלה האם הוא טוב יותר מגוגל ? לצורך כך נערכה השוואה בין גוגל וינדקס במספר שאילתות :

“White supremacy nazi”  

“This guy who made the iPhone”

“No visas for Russians”

“Strong macho president” 

“Fat spread from roasted peanuts”

ב- 3 שאילתות מתוך ה-5 , הביצועים של גוגל היו הרבה יותר טובים. בשתי השאילתות האחרות התוצאות היו שונות ללא עדיפות מיוחדת מבחינת הביצועים.

מעבר לכך, ההשוואה מלמדת על העדר חפיפה/חפיפה מעטה  בין מנועי החיפוש ומכאן ההעדפה לא להסתפק במנוע חיפוש אחד.

מידע נוסף בכתבה בנושא

 

אודות information-world

ד"ר יפה אהרוני , מידענית
פוסט זה פורסם בקטגוריה כללי, מנועי חיפוש. אפשר להגיע ישירות לפוסט זה עם קישור ישיר.

להשאיר תגובה

הזינו את פרטיכם בטופס, או לחצו על אחד מהאייקונים כדי להשתמש בחשבון קיים:

הלוגו של WordPress.com

אתה מגיב באמצעות חשבון WordPress.com שלך. לצאת מהמערכת /  לשנות )

תמונת Facebook

אתה מגיב באמצעות חשבון Facebook שלך. לצאת מהמערכת /  לשנות )

מתחבר ל-%s