Je cherche un développeur Python pour créer un script d’extraction de texte depuis un PDF complexe contenant des annonces légales (en arabe, structurées en colonnes) vers un fichier CSV organisé par ligne d’annonce.
Objectifs du script :
Entrée : PDF (structure répétitive, publié chaque semaine)
Sortie : fichier CSV avec les colonnes suivantes :
Nom d’entreprise
Texte de l’annonce (en arabe)
Numéro de page
Contraintes techniques :
Texte en arabe avec mise en page en colonnes
Précision maximale exigée : les annonces doivent être restituées à l’identique
À fournir :
Script Python fonctionnel, bien documenté
CSV conforme aux spécifications
Je fournirai :
3 éditions PDF pour le développement
Le script sera validé sur d’autres éditions avant paiement
Exigences :
Expérience en extraction de PDF complexes et en texte arabe
Exemple du pdf :
https://www.sgg.gov.ma/BO/AR/3111/2025/BOAL_5869.pdf
https://www.sgg.gov.ma/BO/AR/3111/2025/BOAL_5853.pdf
https://www.sgg.gov.ma/BO/AR/3111/2025/BOAL_5867.pdf
Tarif mission négociable