ETL فرايند استنتاج و استخراج داده ها از محيط هاي عملياتي (Extract)، تغيير در ساختار و ماهيت داده هاي استخراج شده(Transform) و بارگذاري داده ها (Load) در پياده سازيData warehouse مي باشد. در ادامه به صورت مختصر به توضيح اجزاي ETL پرداخته مي شود:

1- مرحله Extract شامل استنتاج و استخراج داده ها از محيط هاي عملياتي، ايجاد روابط و روند داده اي در محيط هاي عملياتي از جمله بانک اطلاعاتي رابطه اي(Relational Databases) ، برنامه هاي کاربردي (Application Program)، فايل ها، سيستم هاي مديريت اطلاعات (IMS) و مهيا و يكپارچه نمودن اطلاعات جهت قرارگيري در انبار داده اي (Data Warehouse) مي باشد.
2- پردازش اطلاعات استخراج شده از مرحله Extract که شامل پالايش، متراکم سازي، کيفي سازي داده ها و يکپارچگي داده ها از منابع متعدد و متمايز مي باشد در مرحله Transformation اجرا مي شود.
از جمله اقداماتي كه در فرايند Transformation بر روي داده ها اعمال مي شود به موارد زير مي توان اشاره نمود:
- انتخاب ستون هاي قطعي و صحيح جداول براي بارگذاري (Load)
- تبديل يک فرمت ذخيره سازي يكسان براي مقدارهاي يکسان (به طور مثال اگر در منابع مختلف براي فيلد جنسيت، چند حالت male or female، m or f، 1 يا 0 وجود داشت، به يک قالب فرمت همانند 0 يا 1 تبديل شود.)
- خلاصه سازي از منابع متفاوت
- فراهم آوري روشي يکسان براي مقدارهاي محاسباتي يکسان(Calculated Value) در سطح حتي يک رکورد و يا در چند جدول مختلف
- انتخاب واحد اندازه گيري و شمارش يکسان براي مقدارهاي يکسان و از يک جنس، به طور مثال اگر در رکوردي طول مسيري را با واحد کيلومتر و در جاي ديگر با واحد متر اندازه ذخيره شده است، در DW به يک واحد مثل کيلومتر تبديل شود.
3 - Load مرحله بارگذاري اطلاعات جمع آوري شده از منابع مختلف بر روي Data warehouse مي باشد كه متناسب با نيازهاي سازمان صورت مي پذيرد. به عنوان نمونه بعضي از سازمان ها صرفا اطلاعات جديد را جايگزين اطلاعات قديمي مي كند ولي برخي ديگر داده ها را به صورت تاريخي نگهداري مي نمايند.