Re: analyse de documents

Top Page

Reply to this message
Author: Patrick Dupre
Date:  
To: Patrice Karatchentzeff
CC: guilde
Subject: Re: analyse de documents
Fantastique !!!
Merci.

Maintenant, j'ai juste besoin que le "upper" et "lower cases" ne soient pas
distigues !


===========================================================================
 Patrick DUPRÉ                                 | | email: pdupre@???
 Laboratoire de Physico-Chimie de l'Atmosphère | |
 Université du Littoral-Côte d'Opale           | |
 Tel.  (33)-(0)3 28 23 76 12                   | | Fax: 03 28 65 82 44
 189A, avenue Maurice Schumann                 | | 59140 Dunkerque, France
===========================================================================



> Sent: Sunday, November 29, 2015 at 9:18 PM
> From: "Patrice Karatchentzeff" <patrice.karatchentzeff@???>
> To: "Patrick Dupre" <pdupre@???>
> Cc: guilde <guilde@???>
> Subject: Re: analyse de documents
>
> J'anticipe ta prochaine question :)
>
> pdf2txt mondoc.pdf | perl -ane 'for (@F) { print $_, "\n"}' | sort | uniq -c
>
> Le 29 novembre 2015 21:01, Patrice Karatchentzeff
> <patrice.karatchentzeff@???> a écrit :
> > pdf2txt mondoc.pdf | sort ?
> >
> > Le 29 novembre 2015 20:36, Patrick Dupre <pdupre@???> a écrit :
> >> Non, quelque chose de simple.
> >> J'ai un documents d'une 50taine de pages.
> >> Il y a des mots qui apparaissent tres souvent. Je veux juste les
> >> identifier et voir combien de fois ils sont utilises.
> >>
> >> ===========================================================================
> >>  Patrick DUPRÉ                                 | | email: pdupre@???
> >>  Laboratoire de Physico-Chimie de l'Atmosphère | |
> >>  Université du Littoral-Côte d'Opale           | |
> >>  Tel.  (33)-(0)3 28 23 76 12                   | | Fax: 03 28 65 82 44
> >>  189A, avenue Maurice Schumann                 | | 59140 Dunkerque, France
> >> ===========================================================================

> >>
> >>
> >>> Sent: Sunday, November 29, 2015 at 8:20 PM
> >>> From: "Patrice Karatchentzeff" <patrice.karatchentzeff@???>
> >>> To: "Patrick Dupre" <pdupre@???>
> >>> Cc: guilde <guilde@???>
> >>> Subject: Re: analyse de documents
> >>>
> >>> Salut
> >>>
> >>> Que cherches-tu exactement ?
> >>>
> >>> Si c'est un truc de compétition, il y a solr mais c'est vraiment pour
> >>> un usage pointu (= big data).
> >>>
> >>> Le 29 novembre 2015 19:58, Patrick Dupre <pdupre@???> a écrit :
> >>> > Bonsoir,
> >>> >
> >>> > Estc-e qu'il y aurait un outil qui permettrait d'analyser un document pdf ?
> >>> > Genre, le nombre fois qu'apparait un mot ou une occurence ?
> >>> >
> >>> > Merci.
> >>> >
> >>> > ===========================================================================
> >>> >  Patrick DUPRÉ                                 | | email: pdupre@???
> >>> >  Laboratoire de Physico-Chimie de l'Atmosphère | |
> >>> >  Université du Littoral-Côte d'Opale           | |
> >>> >  Tel.  (33)-(0)3 28 23 76 12                   | | Fax: 03 28 65 82 44
> >>> >  189A, avenue Maurice Schumann                 | | 59140 Dunkerque, France
> >>> > ===========================================================================

> >>> >
> >>>
> >>>
> >>>
> >>> --
> >>>       |\      _,,,---,,_           Patrice KARATCHENTZEFF
> >>> ZZZzz /,`.-'`'    -.  ;-;;,_   mailto:patrice.karatchentzeff@gmail.com
> >>>      |,4-  ) )-,_. ,\ (  `'-'      http://p.karatchentzeff.free.fr
> >>>     '---''(_/--'  `-'\_)

> >>>
> >>>
> >
> >
> >
> > --
> >       |\      _,,,---,,_           Patrice KARATCHENTZEFF
> > ZZZzz /,`.-'`'    -.  ;-;;,_   mailto:patrice.karatchentzeff@gmail.com
> >      |,4-  ) )-,_. ,\ (  `'-'      http://p.karatchentzeff.free.fr
> >     '---''(_/--'  `-'\_)

>
>
>
> -- 
>       |\      _,,,---,,_           Patrice KARATCHENTZEFF
> ZZZzz /,`.-'`'    -.  ;-;;,_   mailto:patrice.karatchentzeff@gmail.com
>      |,4-  ) )-,_. ,\ (  `'-'      http://p.karatchentzeff.free.fr
>     '---''(_/--'  `-'\_)

>