مثال على تحويل ETL: معالجة مشكلة جودة البيانات
تعرف على كيفية استخدام نصوص Bash لتحويل بيانات اليانصيب الخام ومعالجتها قبل التحميل.
سنغطي ما يلي...
سنغطي ما يلي...
تحويل
بعد استخراج البيانات الخام، لنحوّلها وفقًا لاحتياجات وسياق العمل. في هذه المرحلة، علينا التواصل مع المستخدم الذي يطلب البيانات. في هذا العرض التوضيحي، المستخدم هو عالم البيانات في الشركة.
يطلب عالم البيانات أن تكون البيانات في نموذج جدول بدون قيم مفقودة أو فارغ . كما يجب ألا يكون هناك أي هناك تواريخ مكررة في الملف، ويجب أن تحتوي البيانات على ثمانية أعمدة مفصولة بفواصل . الأعمدة هي:
"تاريخ"
"رقم اليانصيب الأول"
"رقم اليانصيب الثاني"
"رقم اليانصيب الثالث"
"رقم اليانصيب الرابع"
"رقم اليانصيب الخامس"
رقم اليانصيب السادس ...