Almanach du Combattant - La base - CRID

Avatar de l’utilisateur
armand
Messages : 2912
Inscription : dim. déc. 24, 2006 1:00 am

Re: Almanach du Combattant - La base - CRID

Message par armand »

Bonsoir,
Ensuite un passage OCR ; comme je l'ai dit j'ai utilisé Acrobat, qui m'a donné un bon résultat, c'est à dire comme pour tout pdf, une superposition du document et du texte (respect de la mise en page, des images, etc). très bon résulat même, mais le contraste était parfait, et la police ( 10 points ) bien lisible ( pas le cas de l'AdC)
Bonjour
As tu un resultat satisfaisant à partir des .jpg de l'AdC en provennance de JCP ou SA ?
Moi je n'y arrive pas meme avec Acrobat Reader 8 en télechargement gratuit.

Au secours !
Cdt
Armand
Sur les traces du 132ème RI " Un contre Huit " et du 294ème RI (le "29-4")
Avatar de l’utilisateur
Stephan @gosto
Messages : 5598
Inscription : dim. oct. 17, 2004 2:00 am
Localisation : Paris | Chartres | Rouen
Contact :

Re: Almanach du Combattant - La base - CRID

Message par Stephan @gosto »

Bonsoir,

Juste un mot pour dire que, de mon côté, je n'ai pas eu le temps, ce week-end, de faire les scans des pages qui m'ont été demandées par certains d'entre vous. J'essaie de m'en occuper au plus vite.

Je pense qu'il est préférable, lorsque l'on se sert d'un OCR lambda, de travailler à partir de scans. Il est vrai aussi que le papier de l'almanach était, surtout au début, de qualité très médiocre, ce qui n'aide pas...

A très vite.

Amicalement,

Stéphan
ICI > LE 74e R.I.
Actuellement : Le Gardien de la Flamme

Image
Avatar de l’utilisateur
armand
Messages : 2912
Inscription : dim. déc. 24, 2006 1:00 am

Re: Almanach du Combattant - La base - CRID

Message par armand »

Stephan

Peux tu me detailler le mode operatoire : scan, OCR, .... car je n'y arrive pas.
Genre un pas à pas pour les nuls;

Merci d'avance

Tu pourrait me dire .....RTFM......... comme disent les anglo-saxons

Amicalement
Armand
Sur les traces du 132ème RI " Un contre Huit " et du 294ème RI (le "29-4")
Arnaud Memorial
Messages : 590
Inscription : lun. mars 19, 2007 1:00 am

Re: Almanach du Combattant - La base - CRID

Message par Arnaud Memorial »

Bonsoir à tous.

Une question supplémentaire, pour nos saisies :

Lorsqu'on constate une coquille certaine, que faire ? Laisser le texte en l'état ? Corriger sans rien dire ? Ou (je pense que c'est le mieux) ajouter la correction entre crochets, avec éventuellement un commentaire ?
Trois exemples sur mes saisies en cours :

1
Dès le 9 juillet, le 10e R.A.C. avait reçu l'ordre de prendre position sur le front Tory-Comblizy, région de Dormans
[Note de lecture : Tory-Comblizy n'existe pas, c'est \"le front d'Igny-Comblizy\" qu'il faut lire]

2
Vous tous, Anciens de la 8e, qu'il eût voulu revoir, remercier, embrasser, avant de succomber à ses blessures, je vous associe à l'homme rendu à l'exemplaire commandant de batterie
[Note de lecture : il faut lire bien sûr \"... l'hommage rendu à ...\"]

3
Le 14 juillet, à la suite d’un coup de main, un prisonnier révélait que les allemands avaient touché leurs vivres de réserve et faisait connaître l’heure de l’attaque ennemie. Le lendemain vers 10h. 50 du soir, l’état-major français déchaîna une énergique contre-préparation d’artillerie,...
[Note de lecture : en réalité, ce n'est pas le lendemain, mais le 14 au soir qu'est déclenchée la contre-préparation]


Alors, selon vous ? ...

Cordialement,
Arnaud
Avatar de l’utilisateur
laurent provost
Messages : 1043
Inscription : lun. juin 11, 2007 2:00 am

Re: Almanach du Combattant - La base - CRID

Message par laurent provost »

Bonjour,
Personnellement je suis pour la note en bas de page ou entre crochet avec la mention Note du transcripteur.
Cordialement.
Avatar de l’utilisateur
Jean RIOTTE
Messages : 5774
Inscription : sam. nov. 05, 2005 1:00 am

Re: Almanach du Combattant - La base - CRID

Message par Jean RIOTTE »

Bonsoir Arnaud,
Comme Laurent.
Cordialement.
Jean RIOTTE.
geojeff
Messages : 481
Inscription : jeu. nov. 30, 2006 1:00 am

Re: Almanach du Combattant - La base - CRID

Message par geojeff »

Bonsoir,

personnellement, je préfère laisser le texte tel quel en respectant orthographe et ponctuation ainsi que les éventuelles erreurs historiques, topographiques... que je constate

Mes raisons :

1. respect de l'auteur.
2. respect du lecteur qui recherche un document le plus possible fidèle à l'original, intérêt à mon sens principal dans la constitution de cette base.
3. je n'ai pas la science infuse et ne veux surtout pas rajouter de bétises dans ma transcription.

A la charge du lecteur de faire la part des choses et de faire une lecture critique.
Maintenant, ces remarques n'engagent que moi et je suivrai le mouvement.

Un bémol cependant : toutes ces histoires de OCR, scans avec reconnaissance des caractères par logiciels ... m'ennuient profondément. Je ne nie pas qu'il s'agirait très certainement du moyen le plus efficace et rapide le travail mais c'est aussi le moyen le plus rapide d'en faire fuir beaucoup, en tout cas moi le premier. Je n'y connais rien et ne veut pas perdre mon temps à apprendre. Désolé... Je ferai donc mes transcriptions sous traitement de texte (word).

Voilà, c'était juste mon avis, me fusillez pas... :D . Bon je vous laisse, j'ai des transcriptions en cours :bounce:

Amicalement
Jean-François


"O mon âme, n'aspire pas à la vie éternelle mais épuise le champ du possible", Pindare
Avatar de l’utilisateur
Charraud Jerome
Messages : 7096
Inscription : dim. oct. 17, 2004 2:00 am
Localisation : Entre Berry et Sologne
Contact :

Re: Almanach du Combattant - La base - CRID

Message par Charraud Jerome »

Bonsoir
Sans vouloir m'étaler trop longtemps sur les OCR de peur de faire fuir Jean François (si tu veux, je t'offrirais la dernière cigarette) [:charraud jerome] .
Les scans de Jean Claude sont de super qualité (BMP) et me permettent de n'avoir a faire pratiquement que de la mise en forme. Perso, j'utilise Omnipage Pro 12.
Je viens de faire quelques articles, cela peut se faire rapidement.

Cordialement
Jérôme Charraud
Les 68, 90, 268 et 290e RI dans la GG
Les soldats de l'Indre tombés pendant la GG
"" Avançons, gais lurons, garnements, de notre vieux régiment."
Image
Avatar de l’utilisateur
laurent provost
Messages : 1043
Inscription : lun. juin 11, 2007 2:00 am

Re: Almanach du Combattant - La base - CRID

Message par laurent provost »

Bonsoir,

Je ne veux pas m'étendre trop longtemps, Les Logiciels de Reconnaissance Optique de Carectères ( OCR in english), sont pour la grande majorité d'entre eux des logiciels propriétaires qui fonctionnent tous sous Windows :pfff: , Après avoir eu un ENORME bug sous windows, je suis sous linux, dont pas d'OCR très satisfaisant pour le moment.
Pour avoir "joué" avec des scans ou photographie numérique de texte provenant des sympathique forumeur, il est nécessaire bien souvent de modifier les caractéristiques des fichiers pour les amener à + de 300*300 Dot per Inch (DPI) pour avoir une reconnaissance à + 95 %. Bien souvent les photos numériques de texte sont par défaut a 72 DPI au format JPG.
Je continue donc à la main :pfff: :pfff: Ceux qui peuvent et qui savent, ben ils iront plus vite, ce n'est pas un débat :jap:
Reste a débattre du deuxième groupe de question concernant les illustrations et schémas....
Cordialement
Avatar de l’utilisateur
Alain Dubois-Choulik
Messages : 8743
Inscription : lun. oct. 18, 2004 2:00 am
Localisation : Valenciennes
Contact :

Re: Almanach du Combattant - La base - CRID

Message par Alain Dubois-Choulik »

Bonjour,
Sur un forum consacré au prisonniers de guerre de le 2°GM vient d'être publié une partie de l'ADC 1960 relative à cette période, du coup j'ai re-jeté un oeil sur le fichier Excel, je ne crois pas me tromper en disant que les articles signalés sont ceux concernant 14-18, mais .... aviez-vous fait le relevé aussi pour 39-45 ?
Cordialement
Alain
Les civils en zone occupée
Ma famille dans la grande guerre
Les Canadiens à Valenciennes
     "Si on vous demande pourquoi nous sommes morts, répondez : parce que nos pères ont menti." R. Kipling
Répondre

Revenir à « Sujets généraux »