Skip to content

Livre solide/livre liquide

Un petit texte rédigé dans le cadre du séminaire Cultures numériques proposé par la revue Implications Philosophiques

La notion de livre liquide touche à la question de l’intégrité du texte. Elle ne tient pas à la fréquence de publication, mais à l’altération du texte dans une publication donnée, sans avertissement. Un article de journal va rapidement être remplacé par une nouvelle publication sur le même sujet mais chacun des articles est à priori archivé en l’état. Au contraire, un contenu de guide touristique va être mis à jour sans formalités ni indication de date. Une page Wikipédia est par essence toujours ouverte en écriture mais chacune des modifications est bien répertoriée.

Dans chacun de ces cas la maléabilité la plus grande est possible. C’est le cas, nativement, de tout document numérique, qu’il soit “contenu web” ou fichier “détachable” (ePUB, PDF, etc): ils peuvent être ou rester (ré)ouverts en écriture, être remplacés par une version modifiée ou intégrer des contenus dynamiques générés par des outils liés. La liquéfaction n’est donc pas une question d’outil, tout les outils numériques la permettent, mais une question éditoriale.

….

La suite ici : http://ecultures.hypotheses.org/160

Livre Web: une révolution industrielle

(article publié le 27 novembre 2008, http://www.lescomplexes.com/blog/?p=50)

Qu’il s’agisse de l’économie du livre, du livre comme œuvre ou du statut de l’auteur, l’on ne cesse de tenter de transposer dans le numérique les modèles qui ont prévalu durant l’ère du papier comme support unique. L’archétype de cette transposition est la triade “fichier statique (avec ou sans DRM)/liseuse/logiciels propriétaires”.
Considérée il y a peu comme une révolution majeure par rapport au livre-papier elle apparaît aujourd’hui comme une solution acceptable bien que demandant encore quelques étapes pour être tout à fait adéquate. Elle reproduit en effet le modèle auteur/éditeur-leveur de fonds/imprimeur-libraire” indispensable à l’écosystème “tout papier”, en ignorant le changement de paradigme économique, culturel et social en cours.

On invoque aisément au sujet du Web une révolution informationnelle qui toucherait la culture par “des échanges et une collaboration à grande échelle à coûts de transaction extrêmement réduits”. La révolution est en fait d’ordre industriel. Internet a  évolué de “canal de diffusion” à “moyen de production” — Web applicatif — et il impose de passer à une logique d’édition en ligne qui va remodeler profondément l’industrie du livre, le statut des auteurs, la notion de culture, celle d’expert, celle de livre.

Les outils applicatifs du Web et leur impact sur la chaîne du livre

Les outils d’édition en ligne se perfectionnent avec le souci de l’histoire (Typographie, référence, clôture…) comme du futur du livre (production collaborative, interropérabilité, multimédia,…) et des lecteurs (expérience de lecture, qu’elle soit passive ou active, niveaux de lecture, extensions métiers, annotations, flux destinés à des publics différents tels que les handicapés, lecture vocale, lecture multilingue, etc….). Nous travaillons sur ce type d’outils d’édition et ne sommes pas les seuls.

Le Web participatif, interactif, et ses applications de blog, forum, tag, RSS, etc. à permis l’émergence de réseaux sociaux qui sont autant de réseaux de prescripteurs avertis, au sens propre comme au sens figuré. Ils sont animés et soutenus aussi bien par des particuliers que par des associations, des institutions ou des entreprises. Y interviennent des amateurs aussi bien que des professionnels des sphères d’intérêt concernées.

Les applications de service qui permettent d’exploiter les contenus (extraction de données bibliométriques, constitution et mise à jour de catalogues, production de fichiers destinés à une impression à la demande, interconnexion de contenus,… ) intègrent les livres produits à une économie large et aux réseaux d’étude et de savoirs.

De plus le droit s’adapte pour garantir aux créateurs la propriété intellectuelle de leur travail dans un contexte de réseau, qu’ils s’inquiètent de propriété patrimoniale ou non.

À court ou moyen terme les jeunes auteurs, ne seraient-ce qu’eux, vont produire leurs premiers ouvrages dans le Web et les faire connaître au moyen des différents réseaux de prescripteurs inscrits dans le réseau. Ces jeunes auteurs pour se faire connaître ne verrouilleront sans doute pas leurs ouvrages, parce qu’ils cherchent d’abord à être lus, à profiter du marketing viral offert par une diffusion libre. S’ils les verrouillent ils devront faire avec le refus des lecteurs soucieux d’intérropérabilité, avec l’obsolescence des readers ou des logiciels de lecture, ou avec les techniques de détournement des DRM. Une fois reconnus, recherchés par les lecteurs, une plate forme intelligente d’impression/distribution répondra à la demande papier.

Le métier d’éditeur-gestionnaire
La gestion de la production et de la distribution du livre papier imposait jusqu’ici la disponibilité de fonds importants garantis par l’association “éditeur-leveur de fonds” reposant elle-même sur l’auteur à succès. Cette économie, axée sur un marketing très fort et coûteux, trouvait sa légitimité culturelle dans son rôle de dénicheur de talents et dans la valorisation et le soutien de la création non directement rentable, elle-même tributaire pour exister de cette économie du livre papier. Le cercle était fermé.

La disparition, ou la répartition, du coût et de la logistique de production/distribution numérique et/ou papier rendra ce modèle obsolète.

Nous n’en sommes pas encore tout à fait là car les auteurs ont des habitudes d’écriture et ont encore du mal à changer d’outils. Il va suffire d’un premier succès d’auteur produit et directement accessible en ligne, ne serait-ce que d’un succès d’estime, pour que le basculement s’amorce. Que cet auteur soit auto-produit, soutenu par un éditeur exclusivement Web, par un regroupement ou par une association d’éditeurs (voir de blogueurs littéraires).

Le financement de la culture:
Pour financer la culture il faut pouvoir l’identifier or le Web applicatif nous fait passer de “Culture” à “cultures”. C’est déjà, et cela à toujours été, le cas. Aujourd’hui c’est outillé. Les réseaux d’intérêt et de prescription se développent, se spécialisent, se relient. Plus encore, les créateurs se multiplient. Combien de manuscrits sont-ils envoyés aux maisons d’édition chaque année en France dans l’espoir d’une publication? Il faut s’attendre à ce qu’une grande partie des refoulés finissent sur la Toile, sous une forme plus qu’acceptable, sur des sites personnels, dans des catalogues d’associations d’amateurs de littérature ou d’éditeurs en ligne. Les éditions “à compte d’auteur”, “à compte d’association”, “à compte de réseau de blogueurs”, vont se multiplier. Avec ce qu’elles offrent de bon et de moins bon. Avec ce qui sera lu et trouvera son public, avec ce qui sera vendu en impression à la demande ou en format électronique.
À ce titre les propositions de Philippe Aigrain sont vaines et symptomatiques encore une fois de cette tentative de transposition statique d’un modèle dans un autre. Il tente dans son ouvrage “Internet & Création” d’harmoniser les échanges libres des internautes et le financement de la culture. Nous saluons la noblesse de l’intention et, peut-être, l’intelligence politique, destinée à éviter le bouclage, le traçage et la pénalisation des échange de “biens culturels” sur le Net. Mais malheureusement, pas plus que la solution du bouclage celle de la “contribution créative” ne tient compte du changement de statut de l’auteur. Philippe Aigrain invoque la révolution informationnelle sans oser pousser jusqu’au bout la logique des outils de production et la vague de “création” qui submerge le Net. Il constate que “les pratiques culturelles se développent à une échelle sans précédent” sans sembler réaliser que la culture perd ainsi son statut spécifique. Qu’est-ce qu’est un créateur à l’heure du Web applicatif? Qui est digne du statut d’auteur, qui ne l’est pas? Quel réseau possède l’expertise pour en juger, lesquels ne l’ont pas?

Pour autant la littérature et la culture ne sont pas en danger dans ce processus, nonobstant le discours qui ressurgit sur la mainmise des amateurs par opposition aux experts. D’une part l’histoire a démontré l’inanité de l’argument et d’autre part rien n’empêche les experts de prendre part au mouvement. Ce qui est en “danger” c’est la gestion actuelle de la culture et le statut de l’auteur.

Toute l’architecture du financement de la culture est remise en question. Comment financer des cultures et une multitude de créateurs? Il n’y a aucun modèle actuel qui puisse répondre à cette problématique inédite sinon, selon nous, un modèle inédit issu lui-même du Web applicatif, le modèle mis en place autour du logiciel Libre. Il est basé sur la triade (une autre!) “développeurs/associations/entreprises” que l’on pourrait transposer ainsi “créateurs/associations(éditeurs-consultants)/plateformes de commercialisation (de service)”.
Il semblerait que cette proposition soit perçue comme péjorative à l’égard des créateurs, considérés ainsi comme de “simples” programmeurs (cette distinction entre celui qui fait et celui qui pense étant une réminiscence de la séparation logique entre outil et pensée!). D’autre part ce modèle est assimilé à une culture de la gratuité. C’est une erreur. Il s’agit d’une culture d’accès gratuit à la création et aux idées, financé par des services…payants. Si tant est que quelqu’un a besoin de ce service ou en a simplement envie, parce que c’est bien écrit, parce que cette production électronique est élégante et pérenne, parce qu’il veut conserver le livre papier sur son étagère, parce qu’il veut l’offrir, parce qu’il veut assister à cette lecture, à cet atelier d’écriture, parce qu’il veut pouvoir lire avant tout le monde, parce qu’il veut avoir accès à l’historique des brouillons, à la pensée en train de naître…

Il y a des services à offrir et à inventer autour du livre et de la création, et une économie de la culture Libre à bâtir (Nous ne saurions trop recommander comme source d’inspiration la lecture d’ouvrages tels que celui de François Élie sur l’Économie du Libre.)

Comme pour le logiciel Libre la vente d’exemplaires ne sera plus la source de revenus principale des éditeurs mais bien le service. Et le métier d’éditeur comme conseiller littéraire, prescripteur, dénicheur de talents devra peut-être s’articuler en marge de ces services avec un financement proche de celui du consultant indépendant. Pour cela il lui faut changer d’outils, savoir indiquer à ses auteurs des outils intelligents, passer de la tête de gondole au blog influent, à la folksonomie et aux futurs outils de réseautage. Il lui faut faire valoir en ligne son expertise culturelle et technique. Il semble que beaucoup de chemin reste à parcourir sur ce plan. Pour l’anecdote, nous avons récemment assisté à un cours donné à des étudiants en Master 2 “Métiers du livre” qui n’avaient pas la moindre idée de la façon d’ouvrir un blog sur une plate forme gratuite!

Le lecteur et le livre

Le lecteur hérite du pouvoir et des responsabilités qui y sont liées. Pouvoir de choisir les réseaux qui l’intéressent, dans les niches les plus spécialisées. Avec en conséquence la responsabilité de s’informer.

Et quant à l’expérience de lecture il n’y a aucun souci à se faire. Contrairement à une idée répandue, le livre est sans doute l’objet le moins en danger. Il ne peut que profiter de ces évolutions. Le livre Internet n’est pas le livre que nous connaissions tous jusque-là. Il est multidimensionnel. Mais rien n’empêche de l’écrire comme de le lire sur une seule dimension, papier ou électronique, et… passivement. Rien n’empêche non plus de le clore pour en faire une référence intellectuelle et culturelle. Ça n’est plus le même livre mais il en est issu et l’inclut, parce que les “développeurs” ont aussi le souci de la littérature comme de l’histoire des techniques et du lien de celle-ci à la pensée.

Passer des readers au objets Web

Les évolutions dues au passage du livre dans le Web applicatif ne seront peut-être pas exactement celles que nous disons ici. Nous ne pouvons pas non plus dessiner le modèle économique ad hoc à destination des professions en évolution. Mais il nous apparaît certain que le passage du livre numérique au livre-Internet est inévitable et souhaitable. Pour trois raisons au moins: d’une part parce qu’on ne peut pas désinventer une technologie. D’autre part parce que le Web applicatif offre un accès à la production et une responsabilité dans la sélection que beaucoup semblaient attendre, exploitent déjà et ne font que développer. Enfin parce que le livre y est plus que respecté.

Alors la forme que prend le livre numérique est signifiante, comme l’est toujours la forme quant au fond. Les “formes” que sont readers, DRM, formats statiques et logiciels de lecture dédiés constituent la négation de la transformation en cours de la production culturelle et de la culture. Elles ne doivent par conséquent pas être traitées “simplement” mais comme des impasses logiques dans l’histoire culturelle, sociale et politique du livre et de l’édition, et doivent laisser la place à des appareils munis d’une connexion à Internet, d’un navigateur Libre et d’un écran epaper.
Ces apports techniques et nouvelles perspectives de production ne sont possibles QUE parce que ces applications s’inscrivent dans le réseau. C’est ce que nous avons défini comme des applications PAR le Web et non POUR le Web. Le Web n’est pas une finalité mais un outil au service de projets d’écriture et de lecture, de partage des connaissances et de diverstissement, actuels et futurs, papier ou électronique.

Sortir de la “chaîne de formats” dans l’édition numérique

(article publié le 27 septembre 2008, http://www.lescomplexes.com/blog/?p=43)

Il existe typiquement trois modèles différents, divisés en deux catégories, de fabrication de contenu texte dirigé vers l’édition:

  1. Le modèle appplicatif qui se présente sous deux formes possibles: l’application CLIENT et l’application WEB.
    Dans les deux cas, la numérisation des données en entrée est pensée pour être le plus transformable possible, pour pouvoir jouer avec les options de création de contenu et produire les formats attendus ou à venir pour répondre à un ou des besoins spécifiques. Dans la plupart des cas personne ne se soucie de la façon dont les contenus sont créés. L’accent est mis sur la finesse et l’évolutivité de la création et de ses outils. Seuls importent ensuite les formats de sortie, non plus pour création mais pour diffusion, exploitation, conservation. Savez-vous comment sont numérisés les contenus dans Indesign ou QuarkXPress? Non, et cela ne vous pose aucun problème.
  2. Vient ensuite le modèle “chaîne” de formats” avec par exemple la plate-forme CybersDocs, pour la publication des thèses en ligne, ou O’Reilly avec son schéma XML Docbook.Selon ce modèle, un format produit pour répondre à un besoin sert de base pour la production d’un autre format destiné à répondre à un autre besoin. La chaîne implique que les transformations vont se suivre les unes après les autres.

Devant la recrudescence des discours encensant les “chaînes XML” nous voulons nous arrêter sur la différence logique qui sépare ces deux approches et inciter à retourner vers le modèle applicatif.

Deux idées erronées, qui n’en sont qu’une, poussent à se tourner vers le modèle de la chaîne XML:

  1. La première idée est qu’un format est séparable du processus auquel il appartient: In, Out et média/ outils associés.
  2. La seconde consiste à penser que le passage d’un format à un autre (modèle chaîne) ne représente pas une perte dans le processus d’édition, de diffusion et d’exploitation des contenus édités. Le corollaire étant qu’il existe un BON format (global, universel, intemporel) en entrée pour toutes les sorties.

Exemple de la chaîne CyberDocs

Prenons comme exemple la chaîne CyberDocs, plate-forme de conversion principalement maintenue à travers le projet Cyberthèses:

Le module de conversion de la plate-forme Cyberdocs vise à automatiser un processus deconversion depuis un format traitement de texte vers un document structuré en format XML, selon la DTD TEI Lite. Une telle opération consiste donc à identifier le plus de structure possible dans le document original pour rendre le document XML le plus riche possible.

[…]

Le module de conversion de la plate-forme Cyberdocs ne se contente pas de produire ce

document XML de référence. En effet, une fois celui-ci obtenu, le module peut produire des versions du document prêt à une publication statique, en format HTML, XHTML ou PDF. De plus, le module va préparer un ensemble de documents qui alimenteront le module de publication pour rendre l’interface de consultation encore plus riche.(Documentation PDF, p.26)

Les objectifs:

  1. production d’un document sémantiquement structuré pour un archivage pérenne (TEI Lite),
  2. publication “statique” (HTML, XHTML, PDF)
  3. recherches documentaires précises à l’intérieur d’un document ou dans une collection de documents publiés.

Le IN: dans ce processus est déterminé par la production des auteurs dans leur logiciel bureautique de traitement de texte, par une habitude, ce qui est parfaitement légitime. C’est la contrainte de départ, du ODT.

Un OUT primaire:

  • TEI Lite comme format sémantiquement structuré, pour archivage pérenne (dont on sous-entend par ailleurs qu’il serait “dynamique”).

Les OUTs secondaires (issus de TEI Lite):

  • Fiche de métadonnées,
  • HTML statique destiné à l’affichage en flux et à produire un fichier Html de transport.
  • PDF destiné à l’impression.

Analyse de la chaîne CyberDocs

Nous avons plusieurs chaînes du type: ODT-> TEI Lite -> Format X (Html, PDF, XML métadonnées)

    1. 1ère étape: passage ODT-TEI Lite
      • la feuille de style qui prépare le document ODT à cette transformation exclut de l’importation un certain nombre d’éléments: maths, dessins, graphiques, xlink, formulaires…
      • la présence de cette feuille de style implique que l’on ne peut importer du ODT dans cette chaîne QUE s’il a été structuré à cette fin, il ne s’agit plus d’une importation de ODT comme format de “traitement de texte” mais uniquement comme format “ODT destiné à être validé en tant que TEI Lite”. Si votre thèse n’a pas été produite avec cette feuille de style son importation demandera un travail de préparation important.

Cette première étape, qui pallie à l’absence de structuration sémantique “littéraire” pour laquelle ODT n’est pas fait, impose donc une perte en universalité du processus.

  1. 2nde étape: Passage TEI Lite-Html et TEI Lite-PDF

Le document “XML de référence”, l’axe de la chaîne est TEI Lite, un schéma XML (vocabulaire et grammaire) développé pour l’échange des données textuelles, notamment pour les sciences humaines et les études sur les textes littéraires. Du fait de son orientation “structuration sémantique” et de son mode de production hors ligne il convient à la production de documents statiques de stockage et d’interrogation ainsi que de fiches de métadonnées riches.

C’est à partir de ce document que CyberDocs cherche à produire du HTML et du PDF, à répondre aux besoins “affichage et diffusion en flux dynamique en réseau” et “structuration typographique destinée à l’impression”. C’est oublier que TEI Lite répond déjà à une intention précise et est presque la fin d’un processus, que nous appellerons “structuration littéraire concertée pour échange de données textuelles”. Cela revient à vouloir utiliser le OUT d’un processus comme IN dans des processus qui ne lui correspondent pas et qu’en conséquence il appauvrit.

La structure TEI Lite permet de répondre en partie aux besoins de ces deux processus. CyberDocs produit bel et bien des thèses en Html (statique, enfermé dans des cadres (frameset), peu ou pas accessible aux handicapés ou aux moteurs de recherche) et en Pdf (et pourrait en produire des versions plus riches à partir de la TEI native) .

En partant de TEI Lite statique CyberDocs renonce cependant à la part collaborative du Html puisque les contenus de production ne sont ni en ligne ni associés à des outils pouvant les rendre dynamiques. Cet aspect du Web n’est sans doute pas un argument de taille pour les universités et les chercheurs dont le travail tient encore à rester “encapsulé” avant publication officielle. Mais CyberDocs renonce également à l’intégration des contenus au Web pour une exploitation raffinée des connaissances après publication (Web services). À l’exception du catalogage et de la publication de fiches de métadonnées (localisation) les contenus ne peuvent être extraits et/ou réutilisés de façon dynamique dans d’autres ouvrages, analyses, hyper indexations, etc.

Conclusion

La première étape de la chaîne nous fait perdre en universalité, la seconde en fonctionnalités.

Qu’est ce qui même au choix d’une telle chaîne de formats?

    1. L’idée d’un format ad hoc
      • TEI, TEI Lite, Docbook sont des formats de stockage et d’interrogation exprimant chacun des besoins spécifiques…,
      • ODT pour une lecture sur un bureau et sa qualité de traitement de texte Wysiwyg en relation avec l’imprimante,
      • HTML pour une présentation en flux…
      • PDF pour une impression papier…

Cette pauvreté relative (perte de l’universalité de production des contenus et staticité de la sortie Web en particulier) est ici inévitable parce que l’on fait du résultat de l’objectif 1 (TEI Lite statique hors ligne) le IN des objectifs 2 et 3.

Ce choix provient de l’idée selon laquelle un format, et notamment le XML, est une information qui peut toujours être transformée. Or, un format, quel qu’il soit, est une réponse à un besoin. Il est engagé dans un processus qui a transformé les données…. C’est le vieux principe de McLuhan, “le message est le médium”. Il n’y a pas de transmission linéaire de l’information. D’ailleurs il n’y pas d’information au sens de message portant à lui seul un sens univoque et par conséquent compris par tous de la même façon quel que soit le contexte. Il faut donc dans un premier temps oublier cette quête quasi mystique du BON format (global, universel, intemporel).

Dans une chaîne il y a orientation à chaque étape, orientation irréversible. Cette orientation peut être de grande qualité dans un objectif donné:

Pour autant, faire un passage horizontal d’un format vers un autre fait toujours prendre le risque d’une perte, quoi qu’il en soit de la qualité de la feuille de transformation. La perte tient dans la négligence des différences d’objectif que sous-tendent chacun des formats, le processus auquel ils appartiennent et les outils qui y sont associés. Un format est toujours une réponse à un objectif. Ou plus exactement format et objectif fusionnent.

  1. La séparation format/processus

L’autre idée qu’il faut ici démonter est celle selon laquelle un format est séparable du processus auquel il appartient: In, Out, et média, outils associés.

Le XML est partout présenté comme LE format qui offre structuration sémantique, capacité de transformation illimitée vers une multitude d’autres formats, garant de la plus grande pérennité, et qui transporte donc toute l’information nécessaire sur un contenu donné pour son utilisation actuelle et future dans tous les contextes. N’en déplaise aux “experts”, c’est une erreur.

D’une part, le xml n’est pas un format. C’est un niveau de “numérisation” règlementé, un langage de balisage générique destiné à ranger des données textuelles, et dont le vocabulaire et la grammaire ne sont pas définis a priori. Lorsque l’on détermine des règles pour le balisage, des grammaires, celles-ci s’expriment en des schémas (DTDpar exemple), qui permettent notamment de valider automatiquement un document sur sa conformité à ce modèle. Le xml est une technique et c’est quand il est associé à un schéma qu’il devient un format! Donc, dire que le XML garantit pérennité, capacité de transformation universelle, revient à dire que l’encodage en O et 1 garantit pérennité, capacité de transformation, etc. Autant ne rien dire.

D’autre part lorsqu’il est associé à une DTD, et devient un format, le XML est déjà engagé dans un processus spécifique, une réponse à un besoin, lié à des outils (scripts), à des modes de présentation (supports de lecture) et pour lequel cette DTD a été élaborée. Il ne peut plus (ni ne dois) dès lors être appelé à répondre à tous les besoins.

Comme pour les autres formats (non xml), pas plus TEI que Docbook, xhtml, mathml, svg, etc, ne peuvent répondre à tous les besoins. Aucun d’entre eux ne peut constituer un bon IN pour tous les autres processus d’édition: Web, papier, eBook, Mobile…

Comment sortir alors de cette recherche du format ad hoc, répondre au besoin de pérennité et à la peur de la multiplication des sorties?

Revenir à la logique applicative:

  • mieux regarder l’ensemble des composants, outils de fabrication, formats d’exploitation, d’utilisation, et ainsi penser en terme de processus et non pas d’objet,
  • s’assurer de la finesse et de l’évolutivité des outils de création: pour cela ne pas chercher un format de données “brutes” normé mais au contraire hybridable avec d’autres techniques (comme LaTeX et XML) qui créent une donnée “brute” la plus transformable possible. Déhiérarchiser les processus d’édition.
  • à partir de cette donnée transformable, non normée, penser publication en étoile, chaque branche correspondant à un processus (une intention) donné. Il ne faut pas d’axe majeur, de “format de référence”.
  • s’assurer de l’accessibilité, de l’ouverture des formats et langages utilisés afin qu’ils puissent évoluer en fonction des nouveaux besoins, machines, lecteurs…
  • ne pas oublier que tous les OUT/exploitation/supports de lecture à venir ne peuvent être prévus.

__________________

Schéma (image cliquable pour une meilleure lecture) : Édition numérique à partir d’une application Web comparée à une “chaîne de formats”.

formats

Livre numérique et sémantiques

(article publié le 24 juillet 2008, http://www.lescomplexes.com/blog/?p=28)

Le développement technique de La Poule ou l’Oeuf est la réponse à un triple projet pour le livre électronique: à la fois une expérience de lecture de qualité, un outil de mutualisation et d’exploitation des connaissances et un outil d’évolution de la pensée.

Ces projets reposent sur 2 types d’acteurs, humains et machines, qui génèrent 3 types d’interaction, humain-humain, humain-machine, machine-machine, et nécessitent 3 types de structuration (les termes structuration et sémantique sont équivalents):
– une sémantique organique dont le rendu peut être la typographie, l’audiographie…
– une sémantique robotique permettant le service Web: requête et extraction de données, connexions inter-livres.
– une sémantique participative assurant le Web participatif: du formulaire d’abonnement à une collection à l’écriture collaborative en passant par l’annotation, le commentaire, le tagging (folksonomie), les votes et activités sociales de sélection.

La difficulté dans l’élaboration d’un outil destiné au livre et devant répondre à ces trois projets est de prévoir leur évolution. Si l’interaction humain-humain, c’est à dire ici en particulier auteur-lecteur, possède une histoire longue et éprouvée qui nous permet d’utiliser une sémantique consensuelle ce n’est pas le cas en matière d’interactions robotiques et participatives. Sans compter que la typographie issue des contenus risque elle-même d’évoluer avec le livre multimédia, les contenus dynamiques, l’hyperlien, etc.

La Poule ou l’Oeuf est donc conçue de façon aussi modulaire que possible. Il ne s’agit pas de structurer moins, au contraire, mais d’offrir une structuration modulable et des formats ouverts.

  • Vous avez besoin d’une DTD orientée métier (ingénierie, histoire, etc.), implantez-là. Indiquez cette DTD à vos lecteurs, moissonneurs, chercheurs qui sauront interroger vos livres et collections dans cette structure.
  • Vous voulez développer une requête précise, vous connaissez le schéma XML du livre, avez accès au code dans son ensemble, et pouvez nous fournir la feuille de transformation (XSLT) qui vous renverra les informations dans le langage de votre choix.
  • Vous avez besoin d’un format de sortie adapté à un appareil de lecture nouveau nous fabriquons la feuille de transformation de nos contenus XML vers celui-ci.

Le XMLaTeX n’est pas un format de lecture mais est conçu pour être stocké, transformé et interrogé en fonction des besoins. On peut même envisager de surcharger notre éditeur XMLaTeX avec des schémas XML différents (TEI, DocBook, etc), pour des raisons de gestion, et ne passer par XMLaTeX que dans un second temps, un temps de services pour différentes sorties.

Ce qui nous reste à faire:
– module d’implantation de DTD (enrichissement de XMLaTeX ou surcharge): tranformation en XMLaTeX et intégration de l’élément dans l’éditeur
– service Web: système d’information sur la DTD utilisée par livre ou par collection, service RESTFUL

_________ Sémantique organique
_________ Sémantique robotique
1- Moteurs de recherche, RDFa
2- Services Web
3- Connexion inter-livres/applications
_________ Sémantique participative

Le livre et le projet (flux)

(article publié le 20 juin 2008, http://www.lescomplexes.com/blog/?p=7)

Une fois définies les balises qui distinguent le livre comme mode de pensée (structure, clôture, intégrité, planification, malléabilité, références) nous pensons qu’il est indispensable d’offrir aux auteurs, aux éditeurs, aux lecteurs, c’est à dire au livre, l’intégration dans le Web.

Et nous parlons bien d’intégration dans le Web, par opposition à la transition au travers du Web. Dans le premier cas nous parlons d’un Web comme flux de contenus structurés au gré des besoins et non seulement d’un lieu dans lequel transiteraient des contenus statiques.

Un flux ne menace en aucun cas l’intégrité des contenus, en lecture seule. C’est la réponse à une demande de service, à un besoin, à un projet.

A titre d’exemple un flux RSS, c’est à dire un fichier XML construit à partir d’éléments choisis, ne met pas en danger l’intégrité d’un Blog. C’est un service que rend l’application qui sous-tend le Blog.

Il ne s’agit pas d’une personnalisation mais d’une sélection et d’une mise à disposition de tout ou parties du livre selon une logique différente, pour répondre à un besoin donné. Une table des matières, un index, une liste des figures ou un niveau “débutant” ne menacent pas l’intégrité d’un livre. Ce sont des sélections qui informent le lecteur, le chercheur, le bibliothécaire et l’auteur! Informent au sens de “donnent des renseignements” mais aussi au sens de “permettent à la pensée de prendre forme, d’articuler les idées d’une façon différente”.

Le livre doit pouvoir être pensé de la même façon comme un ensemble de contenus XML liés entre eux. Le flux principal est le livre entier, les contenus liés entre eux par le plan. Ce flux est publié ensuite en différents formats statiques de publication (Html, Pdf, etc.). Il répond au premier désir de l’auteur.

Mais on peut également décider d’exploiter cette source première pour créer d’autres flux:

  • flux RSS;
  • flux de telle ou telle balise structurelle ou sémantique, pour fournir à un bibliothécaire ou à un chercheur les données dont il a besoin: table des matières, notice bibliographique, liste des métaphores, nom des personnages et chapitres d’apparition;
  • flux pour une lecture différentielle: imaginons un manuel d’informatique se présentant sous trois flux différents; “débutant”, “intermédiaire” et “avancé”. Ou un roman avec ses historiques de rédaction, un classique avec son édition commentée, un roman à plusieurs voix;
  • un flux public, un flux privé;
  • un ou des flux d’accessibilité aux handicapés;

Les besoins restent à imaginer. Quels sont, quels seront ceux des auteurs, lecteurs, éditeurs, libraires ? Et avec quels objectifs? Partage, recherche, analyse, classification, information, collaboration, création… Quels qu’ils soient ils ne pourront évoluer mieux que dans le Web, lieu de rencontre inédit entre sources (intègres), projets et outils.

Le livre Complexe

(article publié le 19 juin 2008, http://www.lescomplexes.com/blog/?p=6)

Nous pensons que le livre doit être intégré dans le Web pour différentes raisons. Internet n’est pas seulement un canal de distribution. C’est aussi un outil de création et un lieu d’exploitation fine et de partage des connaissances.

Nous n’envisageons donc non pas de transférer des fichiers-livres statiques à travers cette boite postale moderne mais de produire des livres intégrés au réseau, que leur destination finale soit électronique, papier, vocale ou autre.

Pour procéder sans douleur il faut d’abord définir ce qui distingue un livre des autres formes de discours et doit être respecté dans son évolution.

  1. Le livre n’est ni une technique, ni un format. C’est un mode d’expression : sa définition ne tient pas à son support papier ou électronique, au stylo ou à la souris. La complexité n’est  pas là, elle est dans l’objet logique.
  2. C’est un document fini: Le processus d’écriture d’un livre possède un début et une fin et c’est son ou ses auteurs qui en déterminent la fin, c’est à dire la clôture. L’auteur estime un livre arrivé à son terme et le publie. Ce qui ne l’empêchera pas de travailler à une seconde ou une troisième édition du livre en question. Ce caractère fini permet d’en faire une référence pérenne.
  3. Aux contenus divers, tant par la forme que par le fond : – Sélection d’articles ou de contributions diverses (poèmes, nouvelles, cours, présentations données au cours de colloques, rapports…); – Texte unitaire (thèse, essai, roman : introduction-développement-conclusion, suite de chapitres…); – Textes, exercices, graphiques, tableaux, sons, vidéos…
  4. Planifiable et malléable : Un livre suit un plan qui peut être remanié quel que soit le degré d’avancement du projet ; Il doit pouvoir garder la trace de son évolution, des versions, et pouvoir y revenir si nécessaire, jusqu’au bouclage. Cette malléabilité et l’acte de clôture sont les garants duprincipe d’auteur contre la contrainte de la technique sur le contenu.
  5. Offrant un réseau de références multiples, externes ou internes, dont les liens sont conservés quel que soit le format de publication : notes de bas de pages, citations, références bibliographiques, listes de tableaux, listes de figure, liens internes, annexes, Index.

Ces balises déterminent un ordre de discours que ne sont pas le site Internet (fortement lié à un support et non fini), le blog (non fini, non planifiable…) ou le forum (la liste serait longue!). Bien qu’imprimables et reliables, et aussi “personnalisables” soient-ils, ce ne sont pas des livres. Ce sont des albums, des catalogues, des magazines, des annuaires…

Une fois ce cadre logique mis en place et supporté par un outil, nous sommes prêts à penser le passage du livre dans et par le Web.

Divine pagination

(article publié le 18 juin 2008, http://www.lescomplexes.com/blog/?p=5)

Nous voulons ici revenir sur l’un des arguments soutenant l’idée selon laquelle le livre est un objet trop complexe pour être transposé sur la Toile. Il s’agit de l’argument de la pagination.

Il nous semble que les tenants de cette complexité du livre, plutôt que de se demander en quoi pouvait être utile la pagination et comment nous pouvons la simuler ou la remplacer, expriment un projet: faire d’Internet un simple lieu de passage, un canal de distribution pour des fichiers pensés en vue d’outils de lecture qui leur seraient dédiés. Selon cette logique, avec le numérique tout change mais surtout pas la culture du livre, le commerce du livre et sa fabrication, réservés à des professionnels, à des experts !

L’argument repose sur la seule problématique du positionnement lors de citations ou de références au texte. Comment faire quand on n’a plus de page ?

Comment faisait-on avant l’imprimerie, quand il n’y avait aucune pagination et que le nombre de feuillets changeait d’une copie manuscrite à l’autre? La pagination fonctionne en effet uniquement si tout le monde s’entend sur une édition de référence. Oubliez les éditions multiples et les fichiers en flux lisibles depuis Internet. Vous devez, pour ne pas perdre de temps, avoir la même édition.

Pour segmenter une œuvre il existe pourtant de nombreux éléments, chapitres, sections, sous-sections, et des plus fins, comme les versets que l’on retrouve dans la Bible. Ces petits découpages sont extrêmement précis et pratiques pour retrouver un passage quand on a des formats d’éditions différents les uns des autres ! N’est-ce pas notre cas ?

Ce principe biblique est repris, en toute humilité (!), dans la Poule ou l’Oeuf. Chaque paragraphe d’un livre y est numéroté, de façon fixe et définitive une fois le livre clos par son auteur. Cette numérotation peut être visible ou invisible, que se soit pour Internet ou pour la version pdf. Sur Internet, un simple clic sur un paragraphe la fait apparaître. (Vous pouvez tester ce procédé sur notre documentation en ligne: http://www.lescomplexes.com/tuto/)

La numérotation des paragraphes est une solution parmi d’autres. On peut envisager l’utilisation de compteurs de tous genres, qu’ils soient incrémentés de façon automatique ou selon une segmentation imaginée par l’auteur. Car ce qui compte c’est d’atteindre à coup sûr la référence que l’on cherche et qu’il soit facile de comprendre son mécanisme. L’hypertexte permet avec une utilisation cohérente des urls d’arriver a ce résultat de façon intuitive. En utilisant un modèle simple d’URL comme celle-ci :

http://www.leSiteBaseDeDonnée.com/collectionX/livreX/chapitreX#paragrapheX

Il est facile de construire et de pointer une citation (pardon pour l’auto-citation!) :

Le lien : http://www.lescomplexes.com/v1.1/collections/col_pouloeuf1_1/pouloeuf/chapitre-90-fr.poule#para4

et la citation : “L’application est un outil de transformation, c’est un mode relationnel.”