פרטי משרה
מספר משרה: 229623
• היקף משרה – מלאה, (היברידי – יום עבודה 1 מהבית).
תיאור המשרה
דרוש Data engineer להשתלבות בעבודת הצוות ופרויקטים בתחום ה AI . אחריות לקליטה של כמויות גדולות של נתונים חדשים ולאחר מכן להבנה מעמיקה ובחינה של נתונים בשיתוף פעולה הדוק עם Data scientist. עיצוב ופיתוח של תהליכי דאטה קריטיים, מגוונים וגדולים – גם בסביבות ענן וגם ב on prem
דרישות המשרה
• ניסיון של לפחות 3 שנים כ Data engineer – חובה
• ניסיון של 3 שנים עם Python – בדגש על עבודה עם קבצי json ועבודה מול בסיסי נתונים – חובה
• ניסיון מעשי של שנתיים לפחות ב AWS עם services של Athena/Glue/StepFunction/EMR/Redshift/RDS – חובה
• עבודה מול קבצי טקסט למטרות AI ו LLM– יתרון משמעותי
• ניסיון מעשי עם Spark עבור Large scale data -יתרון משמעותי
• עבודה מול שירותי REST API -יתרון משמעותי
• הבנות של טכניקות של אופטימיזציה ועבודה עם partitions של סוגים שונים של דאטה כמו parquet, Avro, hdfs, delta lake
• ניסיון בתפיסה ועבודה עם docker, Linux, CI/CD tools, Kubernetes
• הכרות עם פתרונות GenAI / prompt engineering – יתרון משמעותי.
דגשים נוספים מיחידה מקצועית:
1. ניסיון ב-AWS חובה.
שירותים מרכזיים – glue, step function, lambda, sqs sns.
יתרון משמעותי – הכירות עם redshift ו-kafka, עבודה עם APIs
אפשר לשקול אולי מועמדים איכותיים עם ניסיון בשירותים אחרים, אבל מי שלא עבד בסביבת AWS [או סביבת ענן] כלשהי – לא רלוונטי.
2. ניסיון רב בכתיבת קוד פונקציונלי ב-python ותהליכי ETL מורכבים, כולל הקמת תשתיות / תבניות גנריות לניהול תהליכי ETL. לפחות 5 שנים.
במילים אחרות – לא רק כתיבת תהליכי ETL / ELT, אלא גם כתיבת תהליכים תומכים כגון בקרות, ניהול גנרי של תהליכים, עבודה עם פרמטרים וכו'
3. ניסיון בפריסת ש
