مثال ETL—تحميل
تعرف على كيفية تحميل البيانات إلى قاعدة بيانات PostgreSQL من shell.
سنغطي ما يلي...
سنغطي ما يلي...
الخطوة الأخيرة في خط أنابيب ETL هي تحميل البيانات المنظفة والمعالجة المخزنة فيclean_data.csv
في قاعدة بيانات PostgreSQL .
الاتصال بقاعدة البيانات
أولاً، نقوم بإنشاء نص برمجي Bash يسمىload_data.sh
سيُحوّل هذا المستخدمين من "الجذر" إلى "postgres"، ويبدأ قاعدة بيانات Postgres، ويُشغّل نصًا برمجيًا SQL لتحميل البيانات. سيتم تخزين نص SQL في ملف يُسمىload_data.sql
.
#!/bin/bash# Setting the project location as an environment variableexport WORKDIR='/usercode/ETL_Lottery'# Setting Postgres bin and data directories as environment variablesexport POSTGRES_BIN='/usr/lib/postgresql/16/bin'export POSTGRES_DATA='/var/lib/postgresql/data'# Create and start a new PostgreSQL database cluster.# Connect to Postgres and run the file: load_data.sqlsu - postgres -c "${POSTGRES_BIN}/initdb -D ${POSTGRES_DATA}${POSTGRES_BIN}/pg_ctl -D ${POSTGRES_DATA} startpsql postgres -f ${WORKDIR}/load_data.sql"
Deploying a PostgreSQL database: load_data.sh
الأسطر 4-8 : قمنا بتعيين موقع المشروع ودليل bin الخاص بـ Postgres كمتغيرات بيئية.
الأسطر 12-15: نقوم نشر قاعدة بيانات PostgreSQL وتشغيل البرنامج النصي SQL المخزن في
load_data.sql
.