مثال ETL—تحميل
تعرف على كيفية تحميل البيانات إلى قاعدة بيانات PostgreSQL من shell.
سنغطي ما يلي...
سنغطي ما يلي...
الخطوة الأخيرة في خط أنابيب ETL هي تحميل البيانات المنظفة والمعالجة المخزنة في clean_data.csv
إلى قاعدة بيانات PostgreSQL .
الاتصال بقاعدة البيانات
أولاً، ننشئ نصًا برمجيًا بلغة Bash يُسمى load_data.sh
، والذي سيُحوّل المستخدمين من "الجذر" إلى "postgres"، ويُشغّل قاعدة بيانات Postgres، ويُشغّل نصًا برمجيًا بلغة SQL لتحميل البيانات. يُخزّن نص SQL في ملف يُسمى load_data.sql
.
#!/bin/bash# Setting the project location as an environment variableexport WORKDIR='/usercode/ETL_Lottery'# Setting Postgres bin and data directories as environment variablesexport POSTGRES_BIN='/usr/lib/postgresql/16/bin'export POSTGRES_DATA='/var/lib/postgresql/data'# Create and start a new PostgreSQL database cluster.# Connect to Postgres and run the file: load_data.sqlsu - postgres -c "${POSTGRES_BIN}/initdb -D ${POSTGRES_DATA}${POSTGRES_BIN}/pg_ctl -D ${POSTGRES_DATA} startpsql postgres -f ${WORKDIR}/load_data.sql"
Deploying a PostgreSQL database: load_data.sh
الأسطر 4-8 : قمنا بتعيين موقع المشروع ودليل bin الخاص بـ Postgres كمتغيرات بيئية.
الأسطر 12–15: نقوم نشر قاعدة بيانات PostgreSQL وتشغيل البرنامج النصي SQL المخزن في
load_data.sql
.