שימוש בשפת -R לחקר ויקיפדיה
המחקר האקדמי בנושא ויקיפדיה הולך וגובר בשנים האחרונות. מחקר זה דורש התמודדות עם מספר אתגרים: למידת תרבות העריכה והתנהלות הקהילה, הבנת כללי האתיקה המחקרית של קרן ויקימדיה, פיתוח כלי תוכנה לאיסוף ועיבוד נתונים ושימוש בשיטות מחקר חדישות.
עמותת ויקימדיה ישראל מעוניינת לקדם את השימוש בשפת R לחקר ויקיפדיה (בעברית ובשפות אחרות). ברצוננו ליצור קהילת מפתחים וחוקרים אשר תפגש על בסיס קבוע ותפתח כלים שעל בסיסם יתבצע מחקר.
היתרון בסביבת R הן יכולות מתקדמות לניתוח נתונים סטטיסטי, חזותי ואינטגרציה נוחה עם כלים אחרים. שפה זו צוברת פופולריות בקרב סטטיסטיקאים ומהווה חלק מאקולוגית הקוד הפתוח.
השימוש ב-R לחקר ויקיפדיה נמצא בראשית דרכו. ניתן לראות בקישור זה דוגמאות למחקרים שנעשו עד כה. לפני מספר חודשים פורסמה ספריית API ראשונה. הספרייה עדיין חסרה מספר פונקציות ועל כן בכוונתנו לפתח ספרייה חדשה אשר תרחיב את האפשרויות (כולל גישה נוחה ואחידה למערכת Wikidata). אפשרות נוספת היא שיפור הספריה הקיימת.
אנו מזמינים אתכם למפגש הראשון בנושא:
להרשמה ומידע נוסף – בדף המפגש בוויקיפדיה.
מפגש 1: ניתוח רשתות חברתיות באמצעות R
המפגש יתקיים בקמפוס גוגל בתל אביב, 11/12/2014, 18:30-21:30.
המפגש בשיתוף קהילת משתמשי R בישראל ובחסות עמותת ויקימדיה ישראל ואיגוד הסטטיסטיקה הישראלי.
מרצים: אורן בוצ'מן ועפרית לסר
לו"ז
18:30-19:00 התכנסות
19:00-20:00 – עפרית לסר
20:30 – 20:00 הפסקה
21:30 – 20:30- אורן בוצ'מן
Social network analysis with R and igraph
-
Social network analysis (SNA) is the use of network theory to analyze social networks. SNA provides both a visual and a mathematical analysis of entities relationships. These entities can be people, organizations, countries etc.
SNA is a practical method for visualizing such networks, identify powerful individuals, and perform data-mining in order gain further insight on its nature.
This talk presents some basic concepts in SNA, and demonstrates it using R and igraph.
igraph is a collection of network analysis tools with the emphasis on efficiency, portability and ease of use. It is open source and free and can be programmed in GNU R (as well as Python and C/C++).
About me: Ofrit Lesser is a PHD student at the Information Systems Engineering department, Ben Gurion University.
פיתוח ספריית API לויקיפדיה: איך כתבתי סקריפר ידידותי ב-R.
אורן בוצ'מן, פעיל בעמותת ויקימדיה ישראל, מתכנת
- הקדמה:
– כאולר שווצרי
– Curl יתרונות וחסרונות
– פיתוח מונחה עצמים
– בדיקות
– תיעוד
- מה ה-API חושף:
– מאמרים
– משתמשים
– שינויים אחרונים
– רשימות
– מנוע החיפוש הפנימי
- אתגרים הנדסיים בספריית API
– כניסה למערכת ( דו-שלבית)
– עריכה (דו-שלבית)
– קצב בקשות מקסימלי
– עריכות תחת שם משמתמש
– אגרגציית בקשות
– דפדוף בתוצאות
- יישומים
- תסריט שימוש בפרוייקט מחקר – זיהוי ארועים תקשורתיים (Breaking News)
להרשמה ומידע נוסף – בדף המפגש בוויקיפדיה.