مثال على تحويل ETL: التعامل مع القيم والبيانات المفقودة
استخدم نصوص Bash لتحويل بيانات اليانصيب الخام ومعالجتها قبل التحميل.
سنغطي ما يلي...
سنغطي ما يلي...
المهمة 3: حذف الصفوف ذات القيم فارغ
كما لاحظنا، احتوت بعض الصفوف على قيم فارغ . ووفقًا لعالم البيانات، يجب حذف جميع الصفوف التي تحتوي على قيم فارغ .
Press + to interact
# *** *** ## *** Issue #3 - Get rid of all rows with null values *** ## *** *** #echo -e "\nTask #3 - Searching for Null Values"extract_nulls(){# Create an empty file called null_values.txt> null_values.txt# extract all lines with "null" and append to the filecat raw_data.csv | grep null >> null_values.txt}extract_nullsdelete_nulls(){if [ -s null_values.txt ]thenecho -e "\nFound Null Values:"cat null_values.txt# Grab the dates of linesnull_dates=$(cut --delimiter "|" --fields 1 null_values.txt)echo -e "\nRemoving Null Values..."# Remove all rows with null dates from raw_data.csvgrep -v "$null_dates" raw_data.csv > temp.csv; mv temp.csv raw_data.csvecho -e "Done."elseecho "There Are No Null Values"fi}delete_nulls
لقد أنشأنا ملفًا باسم transform_data_3_null.sh
لإجراء هذه العمليات. لنستعرض الكود سطرًا بسطر.
يحتوي البرنامج النصي على دالتين،
extract_nulls()
وdelete_nulls()
.السطر 8 : نقوم بإنشاء ملف نصي فارغ يسمى
null_values.txt
. ...