L’azienda americana Parascript che automatizza l’estrazione e la classificazione di dati significativi per i servizi finanziari, le aziende e le organizzazioni governative e il settore medico e scientifico, ha rilasciato l’ultima versione di Edac Systems, Inc. Solution: ReadSCRIPT® Maestro, che integra la tecnologia N.I.Te alla tecnologia Parascript per il riconoscimento.
N.I.Te ha infatti fornito il proprio contributo per la corretta segmentazione di parole scritte a mano, in campi non strutturati, ovvero la ricerca, l’individuazione automatica e la separazione delle parole all’interno del documento, e la conseguente estrazione.
ReadSCRIPT® determina quali documenti devono essere processati e procede poi con la pattern recognition per separare e classificare i vari tipi di documenti. In secondo luogo definisce quali informazioni devono essere estratte ed infine stabilisce dove questi metadati ed indici devono essere assegnati.
I documenti da processare presentano diverse tipologie di formati, come la carta, il fax, e-mail o altri documenti elettronici e vengono scansionati o importati nel sistema. Se la qualità dell’immagine da catturare fosse scarsa, interviene PurePage che lavora sul suo miglioramento, sulla risoluzione e la regola sui 300 dpi. Inoltre, ReadSCRIPT utilizza oltre 25 dizionari per convalidare i campi ed ulteriori dizionari possono essere aggiunti per migliorare la validità dei risultati.