en savoir plus
Permet à tous ses détenteurs d'obtenir 5% de réduction sur tous les livres lors du retrait en magasin (réduction non cumulable avec les réductions de type étudiant).
Offre également un certain nombre d'avantages auprès de nos partenaires.
Avec les favoris, retrouvez dans un espace les sélections effectuées au fur et à mesure de vos navigations dans le site.
Constituez pour votre usage personnel vos listes de livres en prévisions d'achats futurs et votre sélection d'articles, dossiers, événements, vidéos ou podcasts préférés ou à découvrir plus tard...
Il suffit simplement de cliquer sur "Ajout Favori" sur chaque page qui vous intéresse pour les retrouver ensuite dans votre espace personnel.
Requiert un compte Mollat
Requiert un compte Mollat
Dans les années à venir la masse de documents papier existants (texte et images) deviendra inexploitable sans des traitements informatiques efficaces pour nettoyer, baliser, structurer, créer des liens entre documents. Cet ouvrage explique comment exploiter et normaliser. ©Electre 2025
Internet donne accès à un gisement considérable de connaissances sous forme électronique. Ce gisement est cependant rarement utilisable directement : il faut nettoyer les données textuelles disponibles et les ramener aux standards des documents électroniques (SGML, HTML, etc.).
Cet ouvrage présente les critères à prendre en compte pour constituer un corpus électronique représentatif. Il montre également comment le normaliser et comment l'exploiter. Mis au point et testé dans le cadre d'une formation professionnelle, cet ouvrage forme aux outils standard qui permettent de filtrer les données (grep), d'opérer des transformations simples (sed), de travailler sur des tableaux (awk), de segmenter (lex) et de structurer les textes (yacc) ou d'appliquer des traitements arbitrairement complexes (perl).
Un CD-Rom d'accompagnement permet de se familiariser avec ces notions en travaillant sur un corpus d'entraînement à l'aide des outils présentés. Ces manipulations et de nombreux exercices corrigés conduisent à une maîtrise effective de ces techniques. Cette formation pratique est complétée par la présentation des concepts (langages réguliers, automates...) et des standards (SGML, HTML, ISO-Latin1) dont la connaissance est indispensable dans le domaine en pleine expansion des corpus électroniques.
Paru le : 19/05/1998
Thématique : Informatique d'entreprise
Auteur(s) : Auteur : Benoît Habert Auteur : Cécile Fabre Auteur : Fabrice Issac
Éditeur(s) :
Elsevier Masson
Collection(s) : Informatiques
Série(s) : Non précisé.
ISBN : Non précisé.
EAN13 : 9782225829536
Reliure : Broché
Pages : 320
Hauteur: 24.0 cm / Largeur 16.0 cm
Épaisseur: 1.7 cm
Poids: 547 g