Retour

Mission en freelance

Script Python : Extraction PDF arabe vers CSV structuré

  • Data mining
  • Python

Je cherche un développeur Python pour créer un script d’extraction de texte depuis un PDF complexe contenant des annonces légales (en arabe, structurées en colonnes) vers un fichier CSV organisé par ligne d’annonce.

Objectifs du script :
Entrée : PDF (structure répétitive, publié chaque semaine)
Sortie : fichier CSV avec les colonnes suivantes :
Nom d’entreprise
Texte de l’annonce (en arabe)
Numéro de page

Contraintes techniques :
Texte en arabe avec mise en page en colonnes
Précision maximale exigée : les annonces doivent être restituées à l’identique

À fournir :
Script Python fonctionnel, bien documenté
CSV conforme aux spécifications

Je fournirai :
3 éditions PDF pour le développement
Le script sera validé sur d’autres éditions avant paiement

Exigences :
Expérience en extraction de PDF complexes et en texte arabe

Exemple du pdf :
https://www.sgg.gov.ma/BO/AR/3111/2025/BOAL_5869.pdf
https://www.sgg.gov.ma/BO/AR/3111/2025/BOAL_5853.pdf
https://www.sgg.gov.ma/BO/AR/3111/2025/BOAL_5867.pdf


Tarif mission négociable

Budget
2 500 DH
A distance
  • amine l.
  • Statut:  
    Ouverte
  • Publiée le:
    05-05-2025
  • Expire le:
    07-06-2025, dans 2 semaines
  • Vues: 163   |   Devis: 0