...

/

مثال على تحويل ETL: التعامل مع القيم والبيانات المفقودة

مثال على تحويل ETL: التعامل مع القيم والبيانات المفقودة

استخدم نصوص Bash لتحويل بيانات اليانصيب الخام ومعالجتها قبل التحميل.

سنغطي ما يلي...

المهمة 3: حذف الصفوف ذات القيم فارغ

كما لاحظنا، احتوت بعض الصفوف على قيم فارغ . ووفقًا لعالم البيانات، يجب حذف جميع الصفوف التي تحتوي على قيم فارغ .

Press + to interact
# *** *** #
# *** Issue #3 - Get rid of all rows with null values *** #
# *** *** #
echo -e "\nTask #3 - Searching for Null Values"
extract_nulls(){
# Create an empty file called null_values.txt
> null_values.txt
# extract all lines with "null" and append to the file
cat raw_data.csv | grep null >> null_values.txt
}
extract_nulls
delete_nulls(){
if [ -s null_values.txt ]
then
echo -e "\nFound Null Values:"
cat null_values.txt
# Grab the dates of lines
null_dates=$(cut --delimiter "|" --fields 1 null_values.txt)
echo -e "\nRemoving Null Values..."
# Remove all rows with null dates from raw_data.csv
grep -v "$null_dates" raw_data.csv > temp.csv; mv temp.csv raw_data.csv
echo -e "Done."
else
echo "There Are No Null Values"
fi
}
delete_nulls

لقد أنشأنا ملفًا باسم transform_data_3_null.sh لإجراء هذه العمليات. لنستعرض الكود سطرًا بسطر.

  • يحتوي البرنامج النصي على دالتين، extract_nulls() و delete_nulls() .

  • السطر 8 : نقوم بإنشاء ملف نصي فارغ يسمى null_values.txt . ...