גוגל השיקה ב- 5 בספטמבר 2018 את Dataset search– מנוע חיפוש חדש ייעודי לנתונים פתוחים, שהצטרף למנועים הייעודיים האחרים הקיימים של גוגל, שמתמקדים בחיפוש סוג חומר מסוים כגון תמונות , חדשות , מאמרים וספרים.
ברחבי העולם קיימים אלפי מאגרי נתונים פתוחים, שכוללים מיליונים של סטים של נתונים. אבל על פי דברי Natasha Noy מדענית מחשב בגוגל, חוקרים, שמעוניינים לאתר נתונים קיימים נאלצים לעשות זאת לא אחת מפה לאוזן. הבעיה חמורה במיוחד בקרב חוקרים בראשית הקריירה, שעדין לא מעורבים ברשת קשרים מקצועיים, ובקרב אלה שעוסקים במחקר רב תחומי, כגון אפידמיולוג שצריך גישה לנתוני אקלים, שיכולים להיות רלוונטיים להתפשטות וירוס מסוים.
Dataset search נועד לפתור את הבעיה.
מבחינה טכנולוגית, שלא כדרך בה נוהג מנוע החיפוש הכללי של גוגל עם דפי ווב, שאותם הוא קורא מנתח ומאנדקס, Dataset search אינו קורא את התכנים של הסטים של הנתונים, אלא הוא מאתר את הקבצים והסטים של הנתונים בהסתמך על תיוג הסטים על ידי בעליהם, שבא לידי ביטוי במידע–על שהם מספקים. מידע העל מתואר בשפת התיוג של מידע מובנה בדפי ווב Schema.org (יוזמה משותפת של שלושת מנועי החיפוש גוגל, בינג ויאהו ) .מכאן ששיתוף פעולה עם בעלי הנתונים הוא חיוני לפעילות המנוע. בנוסף גוגל פיתחה אלגוריתם מיוחד לדירוג הסטים של הנתונים בתוצאות החיפוש.
בעתיד יש כוונה לשלב את Dataset search עם גוגל סקולר, כך שיהיה קישור ממאמר מדעי לסטים הרלוונטיים של הנתונים.
לאור הדברים, אין ספק שמנוע זה מהווה תרומה חשובה לתנועת הגישה הפתוחה בכלל והנתונים הפתוחים בפרט.
על האתגרים והטכנולוגיה בה משתמש המנוע ,כפי שפורסמו לראשונה
פינגבאק: Dataset Search – נתונים ותובנות | עולם המידע