mercredi 16 novembre 2011

Pages Aspirées

La prochaine étape de notre projet est d'ajouter une autre colonne dans notre tableau de liens http avec les pages aspirées.

Objectif : Lire un fichier contenant une liste d'URL, produire un fichier HTML contenant un tableau (à 2 colonnes) regroupant (1) ces URLs et (2) les pages aspirées correspondantes. Etablir les liens vers les 2 ressources (URL, page locale).


Voici notre beau script qui nous a posé plusieurs problèmes sur nos machines (Mac et Linux) mais a finalement marché.

Pour l'exécution du script dans le Terminal nous avons eu plusieurs problèmes. D'abord le script écrit sur mon Mac n'exécutait pas sur une machine Linux. M. Daube nous a beaucoup aidé à le décoder et à corriger quelques erreurs de syntaxe, notamment, la commande let "j+=1"; que nous avons changé: j=$((j+1));. Pour exécuter ce sript nous nous sommes placées dans le répertoire PROJET-MOT-SUR-LE-WEB. Ensuite nous avons tapé: sh ./PROGRAMMES/scriptaspiration.sh < ./PROGRAMMES/input.txt
Petite note: Nous avons crée un fichier qui s'appelle input.txt qui contient 2 lignes: ./URLS
./TABLEAUX/tableaux-v7.html
En incluant ce fichier, nous évitons de taper à chaque fois quand nous exécutons notre script le nom du répertoire contentant les fichiers avec les liens http et le nom du fichier html où stocker ces liens.
Voici une image de l'exécution:



Et finalement, le résultat:

Il nous reste quelques modifications à faire pour rendre le tableau plus beau, mais ce serait pour un autre jour.