| # مجموعات البيانات | |
| يحتوي هذا المجلد على مجموعات البيانات المستخدمة لتدريب نماذج التعلم الآلي في نظام تسعير المناقصات. | |
| ## المجموعات المتوفرة | |
| - `cost_data.csv`: بيانات تكاليف المشاريع السابقة | |
| - `risk_data.csv`: بيانات المخاطر وتأثيراتها | |
| - `local_content_data.csv`: بيانات المحتوى المحلي | |
| - `documents_data.csv`: بيانات المستندات المصنفة | |
| - `entities_data.csv`: بيانات الكيانات المستخرجة | |
| ## هيكل مجموعات البيانات | |
| ### cost_data.csv | |
| بيانات تكاليف المشاريع السابقة مع خصائص كل مشروع: | |
| | العمود | الوصف | النوع | | |
| |--------|-------|------| | |
| | project_id | رقم المشروع | نص | | |
| | project_type | نوع المشروع | نص | | |
| | location | الموقع | نص | | |
| | area | المساحة (م²) | رقم | | |
| | floors | عدد الطوابق | رقم | | |
| | duration_months | مدة التنفيذ (شهور) | رقم | | |
| | tender_type | نوع المناقصة | نص | | |
| | client_type | نوع العميل | نص | | |
| | total_cost | إجمالي التكلفة | رقم | | |
| | cost_per_sqm | تكلفة المتر المربع | رقم | | |
| | material_cost | تكلفة المواد | رقم | | |
| | labor_cost | تكلفة العمالة | رقم | | |
| | equipment_cost | تكلفة المعدات | رقم | | |
| | overhead_percentage | نسبة المصاريف العامة | رقم | | |
| ### risk_data.csv | |
| بيانات المخاطر وتأثيراتها: | |
| | العمود | الوصف | النوع | | |
| |--------|-------|------| | |
| | risk_id | رقم المخاطرة | نص | | |
| | project_id | رقم المشروع | نص | | |
| | risk_category | فئة المخاطرة | نص | | |
| | risk_description | وصف المخاطرة | نص | | |
| | impact | التأثير | نص | | |
| | probability | الاحتمالية | نص | | |
| | risk_score | درجة المخاطرة | رقم | | |
| | response_strategy | استراتيجية الاستجابة | نص | | |
| | actual_impact | التأثير الفعلي | نص | | |
| | actual_cost | التكلفة الفعلية | رقم | | |
| ## الإحصاءات | |
| - عدد المشاريع: 500+ | |
| - الفترة الزمنية: 2018-2024 | |
| - التوزيع الجغرافي: جميع مناطق المملكة العربية السعودية | |
| ## الترخيص والقيود | |
| هذه البيانات للاستخدام الداخلي فقط ولا يجوز مشاركتها خارج الشركة. |