Web Scraping ב-2020 – האם השימוש חוקי? וכיצד ניתן להתגונן מפניו?

/, טכנולוגיה ומשפט, עמוד הבית/Web Scraping ב-2020 – האם השימוש חוקי? וכיצד ניתן להתגונן מפניו?

Web Scraping ב-2020 – האם השימוש חוקי? וכיצד ניתן להתגונן מפניו?

האם מידע הוא הזהב החדש? אולי הנפט החדש? מה שבטוח – בימינו מידע הוא משאב בעל ערך רב. יזמים ועסקים יהיו מוכנים לעשות הרבה על מנת להשיג מידע או להגן על מידע שנאסף על ידם. אחת הדרכים הפופולריות להשגת מידע בשנים האחרונות היא טכניקת ה-Web scraping (או "קצירת מידע"), שמעלה שאלות וסוגיות משפטיות רבות שטרם לובנו. במאמר זה אסביר מהי טכניקת קצירת המידע וכיצד היא מבוצעת תוך עמידה על היתרונות והחסרונות הכרוכים בה. לאחר מכן אציג את ההיבטים המשפטיים ואת הפסיקה האחרונה בסוגייה זו ולבסוף אספק המלצות בנוגע לדרכים בהן ניתן למזער את הסיכונים המשפטיים הכרוכים בשימוש בטכניקה זו.

מה זה Web Scraping?

המונחים data scraping ו-web scraping מתייחסים לטכניקות שונות של קצירת מידע ('שאיבה' או לקיחה של מידע) מאתרי אינטרנט באופן אוטומטי. קצירת מידע הינה שיטה טכנולוגית אשר מעסיקה הן מיזמים שמבקשים להשתמש במידע הקיים ברחבי האינטרנט לצרכיהם העסקיים, והן בעלי אתרים המבקשים למנוע את ניצול האתר שלהם, המידע הנאגר בו, ועבודתם הקשה הכרוכה בכך. לרוב, קצירת המידע מבוצעת באופן הבא: מבקש המידע שולח "תולעת" או ״זחלן״ (web crawler) שמחפשים באתר אינטרנט אחר תכנים ולינקים מסוימים שמעניינים את המבקש. בעקבות התולעת נע "קוצר" (web scraper), שאוסף ביעילות את המידע שהתולעת זיהתה כרלוונטי עבור המבקש ומעתיק אותו למאגר מידע בתצורה שמתאימה למבקש.

תהליך קצירת המידע באופן אוטומטי ובעזרת תוכנת מחשב מאפשר לאסוף מידע רב באופן מהיר ונוח תוך שינוי התצורה שבה המידע מוצג, וזאת במקום לאסוף את המידע באופן ידני. לדוגמא, בעזרת טכניקה של קצירת מידע, אתר מכירות אינטרנטי יכול לנטר במהירות רבה את השינויים במחירי סחורה אצל מתחריו. דוגמא אחרת היא איסוף כלל כתובות הדואר האלקטרוני מאתר מסוים על מנת לשווק לאותן בעלי כתובות מוצרים או שירותים שעשויים לעניין אותם. על אף יתרונותיו, תהליך קצירת המידע מגלם בתוכו מספר חסרונות כגון האטת תעבורה אינטרנטית ושיבוש חווית משתמש, ועשוי לעלות לכדי הפרת זכויות משתמשים ולקוחות ולזכות את בעלי האתר בסעדים משפטיים.

האם זה חוקי?

ניתן להעלות כמה טענות משפטיות כנגד השימוש בטכניקת קצירת המידע. ראשית, המידע הנקצר מתוך אתרי האינטרנט עשוי להיות מוגן בזכויות יוצרים לפי חוק זכות יוצרים, ולכן העתקתו או שימוש בו על ידי המבקש מהווה הפרה של זכויות אלו. שנית, רוב אתרי האינטרנט אוסרים על שימוש בטכניקות של קצירת מידע במסגרת תנאי השימוש שלהם. לדוגמא, סעיף 13.2.8 בתנאי השימוש של האתר זאפ אוסר על "שימוש בכל רובוט, 'תולעת', מנוע אחזור וחיפוש מידע, או בכל כלי אוטומטי או ידני אחר אשר מתוכנן לאנדקס, לאחזר ולאתר מידע באתר או כלי כאמור אשר מתוכנן לחשוף את מבנה מאגר הנתונים והקוד באתר זה". בהתאם, הפרה של תנאי השימוש עשויים לזכות את האתר בתרופות חוזיות או למצער יאפשרו לאתר לחסום את הגישה של המשתמשים המפרים אליו. שלישית, קצירת מידע עלולה להפר הוראות חוק כגון סעיף 31 לפקודת הנזיקין, העוסק בהסגת גבול במיטלטלין; סעיף 7(1) לחוק המחשבים וה-Computer Fraud and Abuse Act (ה-CFAA) האמריקאי.

פסק דין ג'ובמאסטר נ' אול יו ניד

הפסיקה בישראל בכל הנוגע לטענות אפשריות אלו מצומצמת מאוד. עם זאת, ניתן לזהות מגמה שמקלה עם השימוש בטכניקת קצירת המידע. כך למשל, בפסק דין ג'ובמאסטר בע"מ נ' אול יו ניד בע"מ נטען כלפי אול יו ניד כי היא מפרה את זכויות היוצרים של גו'במאסטר במודעות הדרושים שהאחרונה מפרסמת באינטרנט על ידי כך שאול יו ניד מעתיקה אותן לאתר שלה. בנוסף, נטען כי בכך אול יו ניד גם מפרה את תנאי השימוש של אתר ג'ובמאסטר. בית המשפט דחה את התביעה וקבע כי המודעות אינן מוגנות בזכויות יוצרים כיוון שהן מקבץ של עובדות ונתונים, ואין בהן את מידת היצירתיות הנדרשת על מנת להיחשב יצירה מוגנת. כמו כן, נדחתה הטענה על הפרת תנאי השימוש, מהטעם ש-"הטלת מגבלה על השימוש הלגיטימי במידע השייך לכלל, באמצעות הסכם שהינו למעשה חוזה אחיד, אינה יכולה לעמוד".

פסק דין HiQ v. LinkedIn

התפתחות משמעותית בסוגיית קצירת המידע חלה עם מתן פסק דין HiQ v. LinkedIn בבית המשפט הפדרלי לערעורים של המחוז התשיעי בארה"ב בספטמבר 2019. HiQ דלתה מידע בעזרת תולעים מפרופילים פומביים של משתמשי לינקדאין על מנת לנבא אילו משתמשים עלולים לעזוב את המעסיק שלהם בהתבסס על הפעילות שלהם באתר. בתגובה, שלחה לינקדאין ל-HiQ מכתב בו נכתב כי השימוש שעושה HiQ באתר לינקדאין אינו חוקי וכי בכוונתה למנוע את הגישה שלה לאתר. תגובתה של HiQ הייתה לפנות לבית המשפט בבקשה לקבל צו מניעה זמני שימנע מלינקדאין לחסום את גישתה לאתר ולקבלת סעד הצהרתי לפיו פעולותיה אינן מהוות הפרה של ה-CFAA.

בהחלטה צידד בית המשפט בגישתה של HiQ והורה ללינקדאין להפסיק את הפעלת המערכות שמנעו מ-HiQ לבצע את קצירת המידע. אמנם מדובר בהחלטה במסגרת בקשה לצו ביניים, אך בית המשפט קבע כי קצירת המידע מתוך לינקדאין לא מהווה הפרה של האיסור ב-CFAA שלא "לגשת למחשב ללא אישור" (access a computer without authorization”", כלשון החוק). אך על אף שבית המשפט דחה את הטענה לפיה קצירת מידע מפרה את ה-CFAA, הוא לא שלל את האפשרות שקורבנות קצירה יוכלו להיבנות על עילות אחרות, כגון הסגת גבול במיטלטלין, הפרת זכויות יוצרים, עשיית עושר ולא במשפט והפרת הזכות לפרטיות. כמו כן, בתחילת מרץ 2020 פנתה לינקדאין בבקשת רשות ערעור לבית המשפט העליון בארה"ב, ולכן ניתן להניח כי אם יתקיים עיון מחדש בהחלטה, עוד צפויות התפתחויות.

מסקנות והמלצות

לאור הפסיקה שנסקרה לעיל, ישנם כמה קווים מנחים לסוג קצירת המידע שטומן בחובו פחות סיכונים משפטיים עבור הקוצר, לפי הקריטריונים הבאים:

1. פומביות המידע הנקצר – ככל שהגישה למידע באתר זמינה לכולם ואינה דורשת רישום/סיסמא, הרי שהפסיקה בעניין לינקדאין קובעת כי קצירת מידע מסוג זה אינה מהווה הפרה של ה-CFAA. יש לציין כי אין בכך משום קביעה כי קצירת מידע שזמין רק לאחר רישום אסורה, אך הפסיקה בעניין לינקדאין לא הייתה חד משמעית בנושא זה. כמו כן, יש לציין כי ההכרעה ניתנה בארה״ב ולא ניתן להתחייב כי מערכת המשפט בישראל תתייחס ותכריע באותה הצורה.

2. טיב המידע הנקצר – ככל שהמידע הנקצר הוא רק עובדות ונתונים פשוטים, אשר לא נעשה בהם כל עיבוד, סידור או ארגון יצירתי מחדש, או שהמידע מגיע לאתר הנקצר מצדדים שלישיים (כגון המידע בפרופיל הלינקדאין), אזי הנטייה של בתי המשפט היא לא לראות במידע מסוג זה מידע שמוגן בזכויות יוצרים או מידע שנמצא בבעלות האתר. בנוסף, ככל שהמידע הנקצר הוא אינטימי ופרטי יותר, הרי שאיסופו עלול להיחשב פסול, במיוחד אם הוא נאסף לצורך מטרה לא ראויה, כפי שמפורט בסעיף 5 להלן.

3. קצב הקצירה – יש להימנע מקצב קצירה אגרסיבי מדי שעלול לפגוע במהירות הגלישה באתר הנקצר ואף להשביתו. בנוגע לשאלה האם הוראות האוסרות קצירת מידע בתנאי השימוש באתר תקפות – לא ניתנה על-כך תשובה חד-משמעית בפסיקה.

4. תכלית הקצירה – הנקודה האחרונה, אך אולי החשובה ביותר, היא מהי התכלית של קצירה המידע. אם משתמש פלוני קוצר מידע לצרכים אישיים, כגון מחקר או ניתוח המידע, הרי שמדובר בתכלית שמוכרת כלגיטימית. אך אם המידע נקצר על מנת למכור אותו לצד שלישי עבור רווח, או אם המטרה היא לסדר מחדש את המידע הנקצר ולהציגו כמידע שהופק או נוצר על ידי הקוצר, עולה הסיכוי שבית משפט יראה בכך שימוש לא ראוי של טכניקת הקצירה, וזאת גם אם היא עמדה ביתר הקריטריונים שפורטו לעיל. תכלית הקצירה אוזכרה הן בהחלטה בעניין LinkedIn והן בפסק דין ג'ובמאסטר כאחת הסיבות לקבלת טענות הקוצרים. כך למשל, בעניין LinkedIn העיר בית המשפט כי אילו המניעים לקצירה היו מניעת שירות (DDOS attack), גניבת זהויות או מניעים זדוניים אחרים, אז לאתר הנקצר היה אינטרס מהותי לחסום את הגישה של הקוצר. בנוסף, תקנות הגנת מידע של האיחוד האירופי (ה-GDPR) מכירות באיסוף ועיבוד מידע כחוקי כאשר יש לאוסף "אינטרס לגיטימי". אמנם יש הבדל בין איסוף מידע ממשתמשים על ידי אתר ובין קצירת מידע מתוך אתר, אך ניתן לראות כי התכלית שעומדת בבסיס האיסוף או הקצירה עשויה לקבוע אם מדובר בפרקטיקה חוקית.

כמו כן, בעלי אתרים שירצו למנוע את יכולתם של צדדים שלישיים לבצע קצירת מידע, יוכלו לפעול באחת או יותר מן הדרכים הבאות:

1. איסור על קצירת מידע במסגרת תנאי השימוש – אמנם איסור פורמלי במסגרת תנאי השימוש לא בהכרח יעצור כל גורם שמעוניין לקצור מידע מהאתר, אך הוא יאותת לקוצרים תמימים כי הדבר אסור ויקל על קבלת סעד משפטי עקב הפרת תנאי השימוש.

2. הגבלת התעבורה וכמות הבקשות המותרת מכתובות IP שחשודות בקצירת מידע.

3. שימוש ב-CAPTCHA על מנת לחסום גישה של תולעים לאתר.

4. פנייה לחברות מסחריות שמציעות פתרונות כנגד קצירת מידע.

עבור עסקים רבים, השימוש בטכניקת קצירת המידע האוטומטית הכרחית להיתכנות העסק ואף הישרדותו. בהתאם, השאלה היא לא האם עליהם להשתמש בטכניקה זו אלא כיצד ניתן להשתמש בטכניקה זו תוך צמצום הבעיות המשפטיות שעלולות להיות כרוכות בכך. קצירת מידע באופן חכם וזהיר תוך היצמדות לקווים המנחים שהותוו במאמר זה עשויים לצמצם את הסיכון המשפטי האמור ולשמור עליכם מפני תביעות.

מאמר זה אינו מהווה ייעוץ משפטי או תחליף לייעוץ משפטי ואין להסתמך עליו ככזה. המידע המוצג הוא כללי בלבד ועשוי להשתנות או להתעדכן מעת לעת ללא התרעה מראש.

By | 2020-06-18T15:35:30+00:00 יוני 17th, 2020|Articles, טכנולוגיה ומשפט, עמוד הבית|0 הערות

אודות המחבר:

Ofir Lazard
אופיר לזר (Ofir Lazard) הוא סטודנט למשפטים (L.L.B) וממשל (B.A) במרכז הבינתחומי הרצליה. במהלך לימודיו עבד כעוזר משפטי בחברת Varonis Systems והוא כרגע עובד כטרום-מתמחה במשרד עורכי הדין נשיץ ברנדס אמיר ושות'. את זמנו הפנוי הוא מעביר בחדר הכושר, עם חברים ובצפייה בקבוצת הכדורגל ארסנל.
נגישות