Discussion Ekopedia:Wiki2papier
Un article de Ekopedia.
Sommaire |
[modifier] intro
J'ai un peut étudier comment on pourrait si prendre pour faire une version papier d'Ekopedia. Voici ou en est ma reflexion en cours.
[modifier] quelque probleme relatifs à wiki2papier
Wikimedia, le squelette de site wiki utilisé par ekopedia.org n'a pas été conçut dés le départ pour que sont contenus soit un jour imprimer aussi cela pose un certain nombre de problèmes lorsque l'on veut en imprimer le contenu.
Il y me semble qu'il y ai deux manière de gérer les problème:
- régler les problèmes en amont en en invitant les contributeurs à se confomer à un certain nombre de règles qui permettront que les versions papier d'ekopedia soit agréable à lire.
cette solution permettra que l'outil utilisé pour transformer ekopedia en version papier ne soit pas trop complexe à developper mais imposera que tout les contributeur prennent connaissance des contraintes qu'impose les version papier de ekopedia. Cette solution est celle qui permettra d'avoir le moins de modification à faire sur le document avant sont impression.
- régler les problèmes lors de la fabrication des documents imprimable:
c'est à dire ne pas imposer de restriction sur la manière de rediger les articles et régler les problèmes à posteriori en fabriquant un programme plus complexe qui aura plus de trucs à gérer. Les modification manuelle à apporté au document à imprimer seront aussi sans doute plus nombreuses.
- La troisième solution est de faire un mélange des deux première solution
[modifier] images
Les images poses plusieurs problèmes pour wiki2papier
[modifier] Imprimer touts les images?
Dans la version actuelle de ekopedia il y a des images qui à mes yeux ne mérite pas d'être imprimé car porteuse de peut d'information et sont mal adapté de part leur format à une impression (je pense notament à mes photos de presse à cidre). Une solution pour résoudre à priori ce problème serait de d'inciter les contributeurs à ne fournir que des images qui merite d'être imprimée. Une solution à posteriori serait de demander pour chaque images si l'utilisateur veut qu'elle soit imprimé
[modifier] Imprimer les image couleur en noir et blanc
Il me semble que dans une volonté d'économie, de décroissance et de simplicité la plupart des gens voudront imprimer leur version de ekopedia en noir et blanc ou plutôt en niveau de gris Les images couleurs dans ce cas pose un problème car lors de leur impresssions en noir et blanc, si les couleurs sont mal choisit, elles peuvent être transformé dans un gris identique qui rendra difficile la lecture des images. Il me semble important donc lorsque l'on met une image couleur sur ekopedia de faire attention au fait que celle-ci sera sans doute un jour imprimé en noir et blanc. La solution à priori à ce problème est il me semble de favoriser l'usage d'image en noir et blanc (moins consommateur d'encre que le niveau de gris ) et en niveau de gris. En effet dans la plupart des cas pour tous ce qui est schemas technique notament, une image noir et blanc est largement suffisante. Mais aussi lors de l'usage d'image couleur à ce que celle-ci donne quelque chose de lisible une fois en noir et blanc. Une autre solution à priori serait que l'on décide collectivement de supprimer les images couleur si l'on estime que celle-ci n'apporte pas quelque chose de significatif à ekopedia papier. Je ne vois pas vraiment de solution à posteriori pour gérer ce problème. Notament en ce qui concerne les images couleur qui se transforme mal en noir et blanc ou niveau de gris il n'existe pas à ma connaissance de logicielle qui permettent de les transformer pour qu'elle le devienne...
La solution pour les deux problèmes précédents serait à mes yeux de d'inciter les gens à utiliser des images noir et blanc et niveu de gris imprimable directement et des images méritant d'être imprimé car la gestion à posteriori me semble difficile à mettre en place. Et puis ce n'est parce que internet nous permet d'échanger des images sans grand intéret qu'il faut le faire.
[modifier] Le code html/CSS inclut dans les articles
Le code html/CSS inclut dans les articles pose problème. Ces codes bien qu'utile pour la mise en forme ( voir aticles sur les noeuds Les noeuds augmente de manière conséquente le travaille que doit faire le programme et donc la difficulté à programmer le dit programme pour que celui ci produise un document imprimable correcte. Dans une certaine mesure étant donnée la diversité des balises html/CSS ce travail est même titanesque. Une première solution serait de supprimer tout le code html/CSS quitte à perdre la mise en forme de certain articles. Une autres solutions serait de l'imiter l'usage des balises à une liste de balise definit pour qu'il soit humainement possible de faire un programme qui les transforment en un document imprimable.
J'ai personnelement un petit faible pour la première solution car cela demandera moins de travail pour réalisé wiki2papier mais dans le cas des tableaux par exemple il me semble que ce ci sont trés utile. La deuxième solution sera donc sans doute celle à adopter mais sera plus longue à mettre en oeuvre.
[modifier] extraire les données
Extraire les données de la base de données ne devrait pas être trop compliqué puisque celle ci est dejà structuré. Pour ca il faut écrire un parser qui va scanner l'archive est extraire tout ce qui nous interresse.
[modifier] Les sections interessante de la base de donnée:
- brokenlinks
peut être utile pour que le texte des liens romput apparraise comme du texte normal
- catégorielinks
pour faire la liste des catégorie, faire une fonction pour mettre en ordre alphabétique
- image
- imagelinks
contient les légendes des images
- links
je vois pas exactement le rôle mais je pense que ca peut être utile
- cur
liste de la dernière version des articles. Contient plein d'article plus ou moins en rapport avec le fonctionnement du site qu'il faudrait virer.
[modifier] le deuxième chiffre de chaque ligne est là pour nous aider
Seul les articles de type 0,14,6 et peut-être 2 me semble utile.
- 0:article imprimable (quelque parasite quand même)
- 1:page de discussion de articles
- 2:page utilisateur
- 3:page discussion des utilisateur
- 4:log divers, historique,
- 5:page divers pas interressante
- 6:article d'image
- 8:page relatif au système et autre truc bizarre
- 10:modèles enconstruction,article de la semaine
- 14:catégorie
[modifier] Les sections inutile
- blockip
aucun interet
- archive
je crois que c'est le contenu de l'ancien site??????
- interwiki
je ne vois pas le rôle et me semble inutile. C'est une liste de liens vers des sites de wiki.
- linkscc
aucune idée de ce que c peut-être. Peut-être un truc interne au site
- math
vide pour l'instant
- old
ancienne version des articles
- objetcache
je sais pas
[modifier] faire plusieurs document xml
Il me semble qu'il est ensuite nécessaire de faire différent document xml que l'on compilera ensuite en y ajoutant des données de formatage notament pour par la suite faire des export vers OpenOffice dont les docs sont aussi en xml (pour information il faut les dezippé pour les lire en clair). Là ce pose la question du balisage à utiliser, peut-être directement celui de openoffice. Ce pose aussi la question de la gestion du code html inclus dans les articles qu'il faut transcrire en balisage(gros travail) ou supprimer (perte de mise en page) ou se débrouiller pour qu'il n'y est plus de code html dans les articles du site.
- liste des articles par ordre alphabétique
- liste des catégorie/thématique
- listes alaphabétique du contenu des thématique
- liste des article par ordre alphabétique
- liste des utilisateur avec leur page perso peut-être
- quelque page statique: remerciement copyright/licence introduction
[modifier] faire un fichier contenant des données de formatage et les appliquer
pour chaque balise xml donner quelque données de formatage: police taille souligné retrait de paragraphe lettrine etc etc... faire un prog qui rajoute les données de formatage dans les doc xml
[modifier] compiler les fichiers xml
ensuite il faut mettre bout à bout les fichier xml. la encore un petit fichier contenant l'ordre de compilation
[modifier] exporter vers un format imprimable
Là ca risque d'être la partie la plus difficile car il faut séparer le gros doc xml en page imprimable. Cette séparation se fait suivant les données de formatages car suivant celle-ci on pourra en mettre plus ou moins sur une page. Elle se fait aussi suivant la taille de la page qui peut-être incluse dans les données de formataghe. Là je ne sais pas trop comment s'y prendre mais peut-être que openoffice peut faire ca pour nous. J'avais aussi dans l'idée de mettre à côté de chaque liens interne à l'encyclopédie le numéro de page de l'article. Mais ce numéro de page ne peut-être définit qu'a ce moment là de la génération du document. De plus l'ajout de ce numéro risque lui même de modifier le numéro de pages des articles en allongeant le texte ou en le réduisant suivant que l'on ai des liens à 1,2,3 ou 4 chiffres. Quelque jolie fonction recursive en perspective :-). Une autre solution serait un simple (cf:articles machin) néanmoins pour l'index des articles par ordre alphabétique une référence au numéro de page serait vraiment le bienvenue. Ensuite on export en format sxw openoffice en rajoutant quelque bricole si on a deja un balisage proche du sxw de openoffice. A partir d'openoffice on peut exporter en pdf, en doc, en txt, en rtf, et en html Pour le format latex que je ne connait pas trop il me semble qu'il faudra si prendre un peut differement mais ca doit être possible
j'y retourne
La ferme
[modifier] Voir Wikitravel
Wikitravel à aussi l'objectif d'être imprimé... Voir par exemple http://wikitravel.org/en/Wikitravel_talk:Goals_and_non-goals
--Cédric 22 fév 2005 à 08:57 (CET)

