פרויקט Apache FLink

בדף הזה מופיעים הפרטים של פרויקט כתיבה טכנית שהתקבל בעונה של Docs ל-Google Docs.

סיכום הפרויקט

ארגון קוד פתוח:
Apache Flink
כותבים טכניים:
קרטיק קארה
שם הפרויקט:
הרחבת Table API ומסמכי התיעוד של SQL
אורך הפרויקט:
אורך סטנדרטי (3 חודשים)

תיאור הפרויקט

הפתעה של Flink SQL היא מדהימה. הרעיון שאפשר לעבוד על שידורים באמצעות SQL בלבד הוא ברור אבל מורכב. נראה לי שבסופו של דבר, Flink SQL יכול לבטל את הצורך במהנדסי נתונים לביצוע ניתוח טריוויאלי על נתונים בזמן אמת, כמו ספירת בקשות ל-Uber/Lyft בערים שונות בזמן אמת. השלב הראשון להשגת המטרה הזו הוא לפשט את המסמכים כך שגם אנשים עם רקע בניתוח נתונים יוכלו להתחיל להשתמש בהם.

הנה כמה מהשיפורים שאני מתכנן לבצע במסמכים. נוכל לדון בנושא גדול יותר כשמתחילים את חומרי העזר - * אין דוגמאות בדף הסקירה הכללית. הדף אמור לכלול דוגמאות קלות להקדמה ל-Table API. * צריך לפצל את המושגים ואת דף ה-API המשותף. * לכל קטגוריה צריך להיות דף נפרד של הפונקציות. צריך גם לרשום את הפונקציות בטבלה עם השם, נתוני הקלט, הפרמטרים (אם יש) והערך המוחזר כעמודות. * הדף Data Type (סוג נתונים) צריך להכיל מיפויים מתאימים של סוג נתונים ב-JAVA → סוג נתונים ב-SQL. הייצוג הנוכחי הוא בצורת פסקאות, אבל עדיף שהוא יהיה טבלה. * הקטע 'תחביר' של הביטוי בדף של Table API צריך להיות בפורמט טוב יותר. * דף חדש לגמרי על מתכננים ודרכים שבהן משתמשים יכולים להפיק מהם תועלת. * דף בנושא אופטימיזציה שמפוזרים כעת על פני מספר קטעים. צריך גם לעצב מחדש את הדף SQL Overview.

בנוסף, התוכן צריך עריכה מחדש כי הוא מרגיש קצת מכריע. אנחנו צריכים גם להוסיף קטע שבו מוסבר מתי אפשר להשתמש ב-Table API במקום ב-Streaming API, עם השוואות כמו הפחתה במספר שורות הקוד, אופטימיזציות משתמעות טובות יותר, קריאוּת טובה יותר וניפוי באגים קל יותר.