UF2 - Digitalització de textes

NUCLI FORMATIU 1

Els alfabets del mundo - Tipologia

- La comunicació segón Berelson:

La transmisió de informació, idees, emocions, habilitats, etc, a través de simbols, paraules, imatges, figures, grfics, etc.


Comunicació: Dar a coniexar als altres; les meves emocions, sentiments, formes de pensar, situacións en les que em trobo, etc.
A través de símbols, signes i paraules que permeten donar-me a entendre amb les altres persones.






-Principis: comunicació gestual, gestes o simbols amb el mateix cos.
Després, sons (simples), sons (complexos), mes informacií, mes coneixement.

Plasmació de señals, simbols, signes usats en la comunicació oral en parets o pedres.




Resultat d'imatges de señales de comunicacion rupestre

¿Per qué? Simplement necesitat, dar a entendre als demes el que vol una persona. I es fa amb recursos gráfics a mà, com per exemple un pal, una pedra, ungles, osos del últim animal caçat.



Refinament (evolució) de les demandes i necesitats: el món esta explicat per la "MAGIA"


ART RUPESTRE










Primers signes de escritura: Forma de donar-lí un signe o símbol al llenguatge parlat.

Paraules: Emiteixen sons de la naturalesa, expresions de aquesta.

Llenguatges: A partir dels sonsque acompanyen als gestes fets per comunicar-se.

Codis establerts per comunicar-se:

Establiment de codis consensuats per poder completar el procès comunicatiu:

Emisor - CANAL - CODI - Missatge - Receptor
           mitjà (físic) - llenguatge

Alfabet: Agrupació de símbols amb un orde determinat utilitzat en el llenguatge escrit que serveix com sistema de comunicació.

Dreriva del nom les dues lletres greges 'alfa' i 'beta'

ALFABETS DEL MÓN

1. Escritura conceptual
2. Escritura linüistica


1. ESCRITURA CONCEPTUAL

A través d'icones o representacions gràfiques expressa idees o paraules.

- Pictograma: Representació icònica que pot ser realista o bé una idealització
Exempres: jerogrific egipci, hitita jeroglífic.

Jeroglífics egipcis



Jerogrifics hitita



- Escriptura cuneiforme:

Deforma progresivamente els pictogrames inicials amb un punxó

Exeple: sumeri.



- Ideograma:

Element gràfic que representa paraules.
Exemple: escriptura xinesa, ideogrames moderns (señals de tràfic)



2.ESCRITURA LINGÜISTICA

A través de signes expressa sons.

- Escriptura sil·làbica:

Cada signo representa un grupo fonético (sílaba)
Exemples: Lineal B (grec micènic), sil·labari hitita, sil·labari xipriota, i el japonés actual.

- Escriptura alfabètica:

Cada signe representa un fonema.
Exemples: fenici, grec, llatí, alfabèt fonetic internacional (AFI)
No són escriptures perfectes, per exemple el català:
· ss, sc, ç representen /s/
· h no representa cap so
· qu representa /k/ o /kw/.


ORIGEN DE L'ESCRIPTURA

En llocs independents del món neix independentment a diverses civilitzacions, a partir de pictogrames.
Té com a primer ús la comptabilitat
Els testimones més antincs són les taules mesopotàmiques (Uruk 3300ae).
Hi ha investigadors que defensen la influència mesopotàmica sobre l'escriptura egípcia i la xinesa.


 


MESOPOTÀMIA: Escriptura sumèria

A partir del 3300 ae, a Sumer s'escriuen taules s'argila amb un sistema semipictogràfic que cap al 2500 ae, esdevé de la escriptura cuneïforme.
La llengua sumèria, poc coneguda, és de tipus aglutinant (ni indoeuropea ni semítica).

Orientació de l'escriptura: per columnes (d'esquerra a dreta) i de dalt a baix.


ORIENT MITJÀ I ÀSIA MENOR

- Van adaptar la tècnica cuneiforme els pobles de l'Orient Mitjà i l'Àsia Menor:
acadis, elemites, assitis, babilònics, hurrites, hitites.
Cap al 500 ae els perses empren un nou sistema cuneiforme, de tipus sil·làbic.


Sil·labari persa amb escritura cuneiforme

EGIPTE: SISTEMA JEROGLÍFIC

Des del 3000 ae fins al 400, a egipte s'empra el sistema jeroglífic, 6.000 pictogrames a partir del qual es desenvolupen dues escriptures cursives:

      - Demòtica
      Cap al 650 ae, més simplificada i per usos administratius i econòmics.


      - Hieràtica
      Gairebé tan antiga com la jerogrlífica, reservada des de l'aparició de la demòtica a la religió.
       Orientació de l'escriptura: dreta/esquerra, esquerra/dreta (bustrofedó)




XINA: Esccriptura logogràfica

Els primers caràcters de l'escriptura xinesa (4.500 signes) ja apareixen a la dinastia Shang (1400ae). Des de la reforma de la dinatia Quin (s.III ae) fins al s.XX, quan hi ha una darrera simplificació i sintrodueix l'àlfabet llatí (anys 1950), els caràcteers xinesos augmenten fins a 50.000, 1.500 dels quals són apresos a l'escola bàsica.


L'origen pictogràfic d'alguns signes és evident, però l'escriptura xinesa ha esdevingut sobretot semànticofonètica (logogrames).
Des del s.V, existeixen casos d'esccriptura sil·làbica, el més reeixit dels quals va ser el fan-chi'eh (62 signes), començaments del segle XX.


JAPÓ

A partir dels hanzi o carácters xinesos, els japonesos comencen a adaptar (s.v de), poc sistemàticament i amb valor fonètic, els seus kanki (5.000 signes, dels quals s'aprenen uns 1.800 a l'escola).

Fins al segle IX no es desenvolupen els dos sil·labaris principals:

- llengua oficial: el katakana o kana (47 signes derivats del k'ai-shi o escriptura xinesa, que ajuden a pronunciar el kanji);

Resultat d'imatges de silabario japonés
Silabari Hirigana

L'escriptura corrent, el hiragana (més de 300 signes, derivats del ts'ao-shu o cursiva inesa). Actualment, al Japó s'empra una escriptura mixta i sovinnt complicada amb kanji i kana (mots estrangers), hiragana (literatura, premsa, carrer) i romaji (alfabet llatí).

Resultat d'imatges de silabario japonés
Silabari Katakana

AMÈRICA CENTRAL

Els sistemes d'escriptura més complets d'amèrica precolombina (els indis americans feien pictogrames i els inques, "quipus" o nusas) són:

- L'asteca (Mèxic central)

- El maia (Mèxic meridional, Guatemala, Hondures, El Salvador).
Tots dos sistemes combinen elements fonogràfics o logogràfics, fet ben evivent després del desxiframent gairebé total (85%) dels signes maies.


Els primers testimonatges d'escriptura contreameicans són del 600 ae.
CRETA ----> Escriptura jerogrlífica i sil·làbica (1900-1700)
A creta s'empra una ecriptura jeroglífica que evoluciona cap a dues cursives:

-Lineal A (fins 1450 ae): encara no desxifrada, correspondria a la llengua minoica (no indoeuropea).

-Linal B (fins 1200 ae): derivada de la lineal A, correspon ja a una llengua grega (indeouropea). Més o menys descifrada.

Totes dues són sil·làbiques, tot i que fan servir logogrames, s'escriuen sobre tauletes s'argila i el seu ús principal és la comptabilitat.


ESCRITURES ALFABÈTIQUES
Les primeres escriptures alfabètiques registren llengües semítiques, evolucionen a partir dels jeroglífics egipcis, com les:

- inscripcions protosinaítiques
- protopalestines

O bé evolucionen de l'escriptura cuneïforme, com l'alfabet d'ugarit (Síria)





ALFABET FENICI
L'alifat fenici també registra una llengua semítica.

- Inscripcions més antigues: daten del 1200 ae (sarcòfeg del rei Ahiram de Biblos), però les diferències són insignificants respeste a l'alfabet establert cap al 1000 ae a Biblos : 22 signes consonantics, orientats de dreta a esquerra.

Origen: el vincles culturals i comercials de Fenícia amb Egipte, així com l'escriptura semítica comuna de les server llengües, van permetre que l'alfabet fenici fos adaptat probablement de ("l'escriptura egípcia")

DERVACIONS DE L'ALFABET FENICI

Després del seu establiment, l'escriptura fenícia es va difondre pel Mediterrani, per l'orient Pròxim i mithà i va arribar fins a l'índia, de manera que presenta les seüents subdivisions:

- Branca Fenícia
- Branca Palestina
- Branca Aramea
- Àrab meridional

ALFABET GREC

L'origen semític de l'alfabet grec és indubtable.
Evoluciona amb el temps. Així:

Grec clàssic: amb 24 lletres i una orientació esquerra/ dreta
Grec arcaic: variable i l'orientació té la forma de bustrofedó.


Inovacions pròpies del grec:

-l'anotació de vocals.

- l'alfegiment d'algunes consonants inexistents en les llengües semítiques.

Destacar:

 Aportació de vocals FONAMENTAL:
fa posible transcripció fonètica satisfactòria de les llengües europees

1. Primeres vocals:
Alfa, Espsilón, Iota, Omicrón, Ypsilón.

2. Periode clàssic:
Les lletres
Digamma, San, Qoppa, Sampi desapareixen, i per això no tenim les seves minuscules.

Derivacions de l'alfabet grec

L'alfabet grec participarà en el procés de formació de diverses escriptures:

A L'ÈPOCA ANTIGA:

-Llengües no hel·leniques d'Àsia Menor  (cari, lici, lidi)
-Les escriptures itàliques (etrusc)
-El copte (egipci i nubi)
En l'epoca medieval: El gòtic, el eslavo (cirílico ---> rusia

A L'ÈPOCA MEDIEVAL:
- El gòtic 
- L'eslau (ciríl·lic).


Resultat d'imatges de alfabet ciríl·lic

ALFABET LLATÍ

L'alfabet llatí és una més de les nombroses escriptures locals que els etruscos i els itàlics prenen, més o menys directament, d'alfabets grecs occidentals.

En el cas de Roma, es tracta probablement d'una adaptació etrusca de l'escriptura d'Eubea
(> cumes > caere > Roma), feta a mitjans del s.VIII ae.
Els primers testimonis llatins daten del segle VI ae.

L'alfabet clàssic (s.I ae) el constitueixen definitivament 23 lletres, amb orientació inicial bustrofèdica i posteriorment (ss.VI-IV ae) d'esquerra a dreta.
Després d'una llarga evolució

Destacar:
a) en principi habien 21 lletres (g,j,no,i = afegides als nostres alfabets)
b) nous sons = noves combinacions ch,ph,rh,th

ALFABET ARAMEU

Els arameus són un poble semític establert a Síria, on van esdevenir mercenaris i comerciants.
L'escritura aramea, adoptada de la finícia (segle X ae), va ser oficial durant més d'un mil·leni a diveresos imperis (babilònic tardà, assiri, persa) i la seva llengua és també bíblica (escrita als evangelis manuscrits la Mar Mort, té 22 consonants i orientació dreta/esquerra.

ALFABET HEBREU 

Té dues formes diferents:

- La més antiga: deriva de l'alfabet fenici i ha quedat reduïda a l'ús religiós.

- La més moderna: derivada de l'alfabet arameu s'anomena hebreu quadrat i és emprada actualment a israel: té 22 consonants alguns signes complementaris per a les vocals, i la seva orientació es de dreta a esquerra.



ALFABET ÀRAB

Els àrabs es constitueixen com a poble entre el segles IX-VII ae, però no tenen un regne establert fins al segle I ae, Nabateus.

L'escritura àrab deriva de un albafet arameteu-nabateu que evolucionarà cap a dos tipus principals del període islàmic S.VIII.

Cúfic (monumental)
Naski (crusiva)

28 consonants, signes vocàlics i orientació dreta/esquerra.
Ha estat un alfabet adoptat a Àsia, âfrica i Europa per pobles no semítics, persa, afganès, malasi, bantús.


A destacar:

-No hi ha trancripció vocals curtes
-No hi ha majúscules
-No hi permet divisió a final de línia
-Consonants dobles (tashdiid)
-Cal·ligrafia àrab: art en si mateix (no permeten representar figures animades


ÍNDIA

Existeix una escritura protoíndica corresponden a la civilizació de Harappa i mohenjodaro (vall de l’Indo). Té uns 250 signes sensé desxifrar encara.

Les escriptures modernes deriven de l’alfabet arameu:

- la Kharosti, 250 ae S.V de.
- I la brahmi que té 32 signes consonàntics i 4 vocàlics, orientats d’esquerra a dreta, i una gran varientat d’escriptures locals a l’india i àsia central i Tíbet , entre les quals sobresurt Devangarl.

ALFABETS ESLAUS

El primer alfabeto eslau va ser una creación original de Ciril·li, com a reina per a l’evangeliació dels pobles eslaus:
Són els 40 signes glagolícs (de glagol: “mot”).
Mes récent és l’alfabet ciríl·lic incertament atribuït a Ciril.
43 signes que deriven de lletres gregues, glagolíiques i d’altres signes.

A partir del 1050 (separació de l’esglesia romana i ortodoxa), els pobles eslaus han de tirar entre l’alfabet ciríl·lic i el llatí.


Abans d’arribar als 30 signes actuals, l´’alfabet ris va simplificar dos cops (segle XVIII i segle XX) l'alfabet ciríl·lic.

ESCRITURA GERMÀNICA

El futhark o alfabet rúnic  (s.II - S. XVII) és una creació pròpia dels pobLes germànics, amb aportacions de l'alfabet llatí.
Tenia entre 16 i 24 signes amb forma lineal, orientats de manera variable (dreta, esquerra, capgirats).

L'etapa més rica és la de les runes escandinaves (segles VIII-XI)


CARÀCTERS RÚNICS
  
-Associats a qüestions màgiques i místiques.
-Les runes transmeten un missatge secret.
-Cada signe té la seva qualitat.
-Els 'mestres de les runes 'gaudeixen de prestigi (saben gravar-les).

(investigar si fue un hombre o una mujer)

ALFABET IBÈRIC

A partir dels segles VI-V ae es van fer servir a la península ibèrica diversos alfabets:
       ·El fenici
       ·El grec jònic
       ·L'escriptura tartesso-Ibèrica  que:
Emprava un sistema mixt, sil·làbic i alfabètic, de 27 signes
- Orientació dual (dreta/esquerra al sud, esquerra/dreta al nord-est)
- Petites variants fonètiques (diferenciació entre oclusives sordes i sonores al nord-est).
-Les inscripcions ibèriques actualment es poden llegir, malgrat que no coneixem totalment  el significat dels mots ni l'origen de la llengua ibèrica.





NOUS ALFABETS
Amb els pas dels segles no han deixat d'aparèixer nous alfabets, codis de signes i sistemes d'expressió escrits o visuals:

· La taquigrafia (Pepys, Segle XVII: 300 símbols; Pitman segle XIX: 65 lletres)
· El telègraf (Morse: aparell, 1832; codi; 1838)
· L'escriptura per a cecs (Braille, 1809-1852)
· L'IPA o Alfabet Fonètic Internacional (Passy, 1886)
(S.O.S = save our souls)

El llenguatge de concordança mundial, l'Esperanto (llengua auxiliar planificada)
El codi de signes per a sords
Els senyals de trànsit, etc...
Els elements amb els quals produïm o fixem l'escriptura també han evolucionat radicalment:
La impremta (Xina, segle VIII; Gütenberg, 1440)
La màquina d'escriure (1867)
O el processador electrònic de textos (anys 1940)

FASES DEL PROCÉS DE TRACTANET DE TEXTES
Idea, redactor, transcripció paper o digital, correcció, correcció de text, fotocomposició, pdf baixa resolució, correcció ortografia, correcció de maquetació, pdf alta resolució, filmació (fotolit / planxa), impressió.

1. Composició manual.
2. Metall fos.
3. Fotocomposició.
4. Tipografia digital / autoedició.




ORIGINALS DE TEXTE

Manuscrits, parlats/audio, mecanografiarts, impresos, digitals (OCR).

- MANUSCRITS

En desús. En aqeuest cas, l'original es presenta mecanografiat.
Presentació habitual d'originals de text fins fa pocs anys; en la actualitat s'ha vist relegat per la irrupció de la informàtica i les seves múltiples avantatges.
Amb tot, encara hi ha autors aferrats a aquesta forma de escriure per el seu só y tacte de les tecles.

- PARLATS/AUDIO

- Poden ser rebutchats per la seva recepció

- MECANOGRAFIATS

En desús, amb tot, encara hi ha autors aferrats a aquesta forma de escriure per el seu só y tacte de les tecles. Perdida de temps.

- IMPRESOS
Aquells originals que ja han estat impressos en una anterior ocasió però dels que no es disposa de còpia digital.

- DIGITALS

Aquells originals elaborats amb un equip informàtic
Ofereixen múltiples avantatges sobre la resta d'originals perquè s'estalvia mès.
Problemes dels archius de fonts utilitzades y dels formats.
Bones especificacions en la recepció de aquest tipus d'originals.

Grau diferent de acabat:

-Originals digitalitzats sense composar.
-Originals digitalitzats mig compostos.
-Originals digitalitzats compostos.


ORIGINALS DIGITALITZATS SENSE COMPOSAR

En aquest cas l'autor s'ha limitat a picar el text sense fer distincions entre els diferents rangs que regeixen la composició. Les  idees de l'autor flueixin.

ORIGINALS DIGITALITZATS MIG COMPOSATS


L'autor entrega el text digitalitzat establint una proposta de composició pero no al final.
ORIGINALS DIGITALITZATS COMPOSATS 

En aquest cas l'original ha estat ja tractat convenienment per l'autor i presenta totes les característiques que ha de presentar un cop imprès.


PREPARACIÓ D'ORIGINALS
ESPECIFICACIÓNS D'ENTREGA D'ORIGINALS NO DIGITALITZATS

- Especificacions per anar tots unificats amb normes, en una editorial.
L'ús ha propiciat una unificació d'aquestes normes comunes per a les empreses.
Important tenir una còpia del treball original, es lliura la còpia i l'autor de queda l'original.

Especificacion d'entrega d'originals manuscrits

ESPECIFICACIONS D'ENTREGA D'ORIGINALS NO DIGITALITZATS

- Presentar-los escrits per una sola cara.

- Presentar una escritura neta, sense ratlles mi esmenes, amb amplis marges i generosa interlínia, facilment entenedor pel treballador encarregat de la digitalització.

- Fer servir formats de paper normalitzats.

- Paper blancs o d'un color clar que afavoreixi el contrast 

- Presentar cada una de las pàgines numerades sobre tot si l'original presenta els fulls solts 

- Per una correcció en l'original ha de fer-ho en altre color de tinta

ESPECIFICACIÓNS D'ENTREGA D'ORIGINALS PARLATS

- Presentar-los en un sistema d'arxiu normalitat reproduible en els equips normals de reproducció.

- Dicció clara i audible, facilment entenedora per treballador.

- Exposició continuada de les idees sense dubtes, acotacións o salts.

ESPECIFICACIÓNS D'ENTREGA D'ORIGINALS MECANOGRAFIATS

- Han d'estar escrits per una sola cara, DIN A4 (21cm x 29cm)

- Fan servir un format de paper estàndar.

- El blanc dels marges ha de ser ampli (almenys dos centímetres), i han de ser més grans els marges de cap i peu.

- El blanc de la interlínia (doble espai) 

- Ha d'aparèixer el número de pàgina al cap i marginat a la dreta.

- Ha d'aplicar-se una sangria d'un tabulador a la primeralínea de cada paràgraf

- El text es presentarà sense justificar, marginat a l'esquerra.

- L'autor no ha d'incloure correccións a l'original. Dificultaria la digitalització mitjançant OCR.

- L'original ha de presentar-se sense ratlles ni esmenes i amb els grafismes ben contrastats per a facilitar la digitalització.

ESPECIFICACIÓNS D'ENTREGA D'ORIGINALS IMPRESOS

- Ha d'existir un bon contrast entre el color del text i el fons, sense traspàs de tinta ni transparències que entorpeixin la digitalització

- Determinades fonts poden donar problemes en la digitalització

- Ha de comprobar-se que l'original s'adapti a l'escànner, que el llibre s'obri completament i que el format sigui més petit que l'àrea d'escannejat.

ESPECIFICACIÓNS D'ENTREGA D'ORIGINALS DIGITALITZATS

Són un conjunt de normes bàsiques que serviran de referencia a un autor per a entregar el seu treball amb unes mínimes garanties i que permet a l'empresa partir d'una base sólida per al posterior tractament.

L'ús ha proporcionat una unificació d'aquestes normes, de tal manera que moltes d'elles són communes per a totes les empreses implicades.

(Si els textes van sangrats, en negreta, en cursiva...)


1. ESPECIFICACIONS RELATIVES A APLICACIONS I FORMATS


Entregar una còpia impresa per una sola cara amb:

- El numero de pàgina de la última versió entregada.
- El llistat d'arxius amb l'extensió corresponent.
- L'aplicació o aplicacions on s'han creat.
- La seva versió
- Entorn operatiu.

Les aplicacions han de ser les més comúnment acceptades:

Editors de textes per defecte dels sistemes operatius:
Simple Text, Texte edit.
Editors de textes professionals: Word, Word Perfect.
Per a la utilització d'aplicacións de maquetació l'autor ha de consultar prèviament amb el preimpressor.

És recomendable que cada part de la feina es guardi com arxiu independent.
S'ha de tenir en compte l'ordre de la feina / arxius. Enumerar-(zeros i desenes).

2. ESPECIFICACIÓNS RELATIVES AL TEXT

DIN A4, espai, marge, interlineal...
Blanc del marge 2cm, més grans els marges de cap a peu.
Doble espai (interlineal).
Número de pàguines al peu i a la dreta.

FORMATS DE PAPER CM:

DIN A1 = 84 x 59,4
DIN A2 = 59,4 x 42
DIN A3 = 42 x 29,7
DIN A4 = 29,7 x 21
DIN A5 = 21 x 14,8
DIN A6 = 14,8 x 10,5
DIN A7 = 10,5 x 7,4

Són preferibles originals sense composar, a no ser que l'autor vulgui compossar-lo, tingui els coneixements,
El text presentarà aliniat a l'esquerra, sense justificar i sense partició de paraules.
No s'ha de forçar el canvi de línia ni el canvi de pàgina.
Fer servir un sol tipus de lletra, el més estàndar posible, un sol cos i un sol estil.
Les notes s'han d'incloure en el lloc que aniran ubicades, separades del texte general per gions llargs.

Els quadres i taules s'han de compondre en document a part i adjuntar-los com arxius independents.

S'ha d'aplicar un sagnat d'un tabulador a la primera línia de cada paràgraf.
Els paràgraf no s'han de separar entre sí per línies en balnc.

EQUIPS I APLICACIONS INFORMÀTIQUES EMPLEATS EN EL PROCÉS

Pèrfils d'entrada:

-Escáner, Disposar d'OCR (reconeixement òptic de caràcters), que permeti la digitalització dels originals impresos però del que es disposa d'un arxiu digital.

Connexió externa i interna. Un fax complementa l'enviament dels originals a través de xarxes telemàtiques.
Equips d'àudio si el treball és parlat

ORDINADORS

Compatibles IBM (PC) i Macintosh (MAC)

FONTS

Els dos entorns són necesaris en l'actualitat en una empresa de preimpressió i també en el procés de recepció d'originals, atès que els arxius digitals poden provindre dels dos entorns.
En la actualitat són compatibles y per això és posible compartir arxius entre ells. Poden ser incopatibles si no tenen la extensió adecuada.

La informació sobre les descripcions es recullen en petits arxius que s'emmagatzemen en el sistema operatiu de l'ordinador (tots els ordinadors incorporen una selecció per defecte de les principals fonts). 


APLICACIONS

Les aplicacions d'edició bàsica pròpias de cada sistema operatiu són suficients per a preparar originals digitals i els formats en que permeten guardar els documents són els més usuals.

Entre aquests programes trobem Word Pad (pc indows) i Simple Text o Text edit (Mac ASX)
Ls aplicacions d'edició profesional es troben disponibles en els dos entorns (destaquem Microsoft Word i Word Perfect).


FORMATS DIGITALS DE ARXIUS DE TEXTOS

FORMATS OBERTS:

ASCII
(American Standard Code for Information Interchange)
No conté informació de tipografia o disseny.

RTF
(Rich Text Format)
Conté informació de tipografia o diseny molt bàsica.

FORMATS ESPECÍFICS

Processadors de textes (el de InDesign, per exeple)contenen tota la informació de tipografia o disseny
permeten exportar en EPS poscript

TIPOGRAFÍA

·Poscript: 2 arxius. 1ª per la tipografia i el 2º per imprimir

·TrueType: 1 arxiu

·OpenType: Tipografía oberta

_____________________________________________________________________


NUCLI FORMATIU 2 

-Es rep l'original, es comprova que és adequat, còpia del treball, recollir treball.
Es procedeix a la digitalització de la còpia de l'original ajustant el format o format específic i en el temps previst.



MONOTIPIA

Sistema de impresión desarrollado por la empresa Monotype. Cuenta con una máquina con un teclado, como si fuera una máquina de escribir, con el que se compone texto con una serie de matrices individuales de cada carácter en la que se funde en metal esa misma composición. Una vez impreso, el plomo se vuelve a fundir y ya está listo para la nueva composición.





LINOTIPIA

También conocido como linotipo es una máquina inventada por Ottmar Mergenthaler en 1886 que mecaniza el proceso de composición de un texto para ser impreso. La linotipia fue comercializada por la empresa Linotype.


COMPUGRAFIC

A través de la impresión fotográfica, y mediante la acción del teclado, producía un negativo. Tras este paso y la insolación, se creaba el fotolito y, posteriormente, pasaba a una plancha de zinc, lo que permitía imprimir mediante la técnica de offset.

La fotocomposición desplazó a la composición manual o mediante la linotipia.

La fotocomposición, la técnica que utilizaba la máquina Compugraphic, fue una técnica revolucionaria en aquel momento ya que desbancó a las anteriores a ella. Uno de los detalles más llamativos es el teclado que contiene por su parecido casi idéntico a los que conocemos ahora.



FOTOCOMPONEDORA

La fotocomponedora és una màquina de preparació de línies de de text equivalent a una linotípia en tipografia. Hi han dos generacions:




2ª generació


3ª generació



ORIGINALS NO DIGITALS: MANUSCRITS

Són els originals escrits a mà.
No són molt usuals en la actualitat i moltes empreses els rebutjen ateses les dificultats i els costos que implica el canvi de format.
Tot i això alguns autors, fonamentalment del camp de la literatura, tenen el 'mal' costum d'entregar els seus originals en aquest format.

PARLATS

Una altra opció més estranya que la anterior.
En aquest cas, el texte es presenta en format audio, analògic o digital i a l'empresa de preimpresisó s'ha de fer la conversió de format a mesura que s'escolta.
Per les mateixes raons que en les de tipus manuscrit, aquests originals poden ser motiu de rebuig a la seva recepció.


MECANOGRAFIATS

En desús. En aquest cas, l'original es presenta mecanografiat.
Presentació habitual d'originals de text fins fa pocs anys; en la actualitat s'ha vist relegat per la irrupció de la informàtica i les seves múltiples avantatges.
Amb tot, encara hi ha autors aferrats a aquesta forma de treball, però cada cop són menys.
El canvi de format no presenta grans problemes, però sí pèrdues de temps i, per això, encariment del procés.

IMPRESOS

Aquells originals que ja han estat impressos en una anterior ocasió però dels que no es disposa de còpia digital.

DIGITALITZATS

Aquells originals elaborats amb un equip informàtic.
Ofereixen múltiples avantatges sobre la resta d'originals.
Els problemes amb aquests originals venen dels arxius de fonts utilitzades i dels formats.
Es fan necessàries unes bones especificasions en la recepció d'aquest tipus d'originals.
Els originals digitalitzats en poden presentar amb un grau diferent d'acabat:

-Originals digitalitzats sense composar
-Originals digitalitzats mig composats
-Originals digitalitzats composats

COMPRESSIÓ DE DADES

Algorismes de compressió: comprimir 

Algoritmes de descompressió 

Compressió:

- Sensé prèrdues (no es perd califat)                       
- Amb pèrdues (es toleren pèrdues de qualitat)

ARXIUS QUE UTILITZAREM AL LLARG DEL SEGLE:

·GIF (imarges)= 256 barreges de color [paleta de color=256 colores] ompressió 3 bytes, llavors del arxiu original al comprimir es comberteix en 1 byte.
   - jobs, dibuixos animals, “pàgines web”
·JPEG (imágenes)=l’ull humà detecta avans la lluentor (brillo) que el color. Llavors el JPEG emmagatzama la lluentor total però del color només emmagatzema la mitjana de dues crominàncies. La mitjana o fa escogint 5 punts de trama i d’aquests 5 punts agafa 2 i fa la mitja. De 5 valors de lluentor agafa els dos punts de trama i son 7 valors. La compressió real del JPEG es:
   
                                                             15  -   7
                                                             X   -   100%   =   2’14 a 1 

·MPEG (imatges) = es bas en el sistema de JPEG però per imatges en moviment. Solament agafa l’informació dels objectes que es mouen els demés el manté de l’imatge anterior.

·MP3 (sons) = 1 minut gravar en qualitat CD havría d’ocupar 10 megas. Descompon amb filtres = 32 canals en freqüència. Cada canal es codifica amb un nombre de bits depenént de l’amplada de l’onda. Té en compte que l’oïda humana és més selectiva en unes bandes de freqüència que d’altres y compimeix aquelles bandes de freqüència que l’oïda no pot detectar. Un arxiu de 10 mb multiplicat per 10 y dividit entre 100 dona 0,833 Mb 


ORIGINIALS EN FORMAT DIGITAL

En la recepció de l'original ja s'ha determinat prèviament en el procés de recepció d'originals si el format en que es presenta l'original és compatible amb els equips disponibles a l'empresa i si es requereix converció de format.


ORIGINALS DIGITALS SENSE COMPOSAR

Es canvia el format si procedeix.

ORIGINALS DIGITALITZATS MIG COMPOSATS
S'aprofita el format si es procedeix. Es treballa sobre una còpia

ESTABLIMENT DELS PARÀMETRES TIPOGRÀFICS

La forma en que han de disposar-se els textes i altres elements complementaris (quadres, taules) de l'obra.

Aquest procés es realitza un cop s'ha digitalitzat l'original i s'han obtingut còpies impresses del treball sense compaginar.
Prèviament o al mateix temps que se estableixes els paràmetres tipogràfics, es realitza la correcció de galerades, on s'introdueixen les modificacions que s'estimen oportunes en relació amb continguts, l'estil i els inevitables errors gramaticals i ortogràfics que es troben en aquestes fases inicials.

Aquesta tasca l'hauria de fer l'autor al costat dels correctors corresponents.
Generalment aquestes especificacions has d'apareixer en un lloc visible i lògic.
Així, les especificacions generals es presenten a la primera pàgina de la còpia del treball.

1. TEXT GENERAL

És aquell que predomina en el text, exposa les idees principals i, per tant, és el cos de l'obra.
La seva característica principal es la llegibilitat.

Ha de facilitar la lectura perquè al lector aquesta li sigui inteligible, en la mesura que sigui posible, atès el tema tractat.

Aquest condicionament ha de prevaldre sobre altres, atès que el fi últim és la consecusió de plaer intelectual del lector i res ha d'estorpir aquesta meta.


Especificacions de marcat del text general

És marcarà en la primera pàgina o en la fitxa d'especificacions.

2. TEXTES INDICATIUS

Té una funció informativa. Són aquells que apareixen en la pàgina i associats o no al text general.

Pertanyen a aquesta categoria el títols, subtítols i folis.

Atesa la seva funció, s'han de destacar de la resta de text pero no en exés; es tracta de proporcionar informació sense estridències, evitant les distraccions del lector que ha d'estar centrat en el text general.

3. TEXTES SECUNDARIS

És aquell que complementa el texte genaral.

Són textes secundaris: les notes, cites, índexs, peus d'il·lustracions, quadres i taules.

Els pròlegs, introduccions, epílogs i textes similars poden ser tractats com a textes secundaris o com a part del text general i, per tant, s'haurà d'indicar convenientment.

Es marcarà en la fitxa d'especificacions tipogràfiques i en la seva ubicació concreta.

CALIBRAT DE L'ORIGINAL

Consisteix en calcular el nombre de caràcters d'un original

Tal dada, a més de les especificacions del disseny de l'obra (caixa de composició, disposició dels blancs, pàgines en blanc,..) permetrà calcular el nombre de pàgines que tindrà l'obra d'un modus molt aproximat.

En l'actualitat qualsevol programa editor de textes mínimament professional proporciona totes les dades relevants referides al text incloses les relacionades amb el nombre de caràcters, espais, línies, paràgrafs, etc.

1. PROCEDIMENTS DE CALIBRAT CONVENCIONAL


Original mecanografiat

Un cop l'original s'ha presentat en la forma adient i s'han realitzat les còpies pertinents es procedeix al càlcul.

Segons quin métode s'utilitzi es necesitarà on no un tipòmetre o liniòmetre o, en la seva mancança, una regla corrent i un llapis.

Primer mètode

a) Es determinen les diferents parts en que es divideix l'obra i a les que s'han d'aplicar el càlculs: pròlegs, introduccions, prefacis, capítols..

b) Els càlculs es realitzen sobre cadascuna d'aquestes parts diferenciades i tenim present que si apareixen taules, quadres o il·lustracions s'ha de descomptar l'espai que ocupen.

c) Un cop establertes les parts, s'analitzen una a una comprtant les parts.

Original imprès

L'original impés normalment s'ha composat amb caràcters d'espaiat proporcional i els blancs entre caràcters, estre lletres i paraules varien per a aconseguir el justificat amb el que normalment es presenten.

A més presenten taules, quadres i il·lustracions, tot intregat en la caixa de composició i que es necessari descomptar, així com blancs entre columnes textes

Procediment:

Es delimiten les diferents parts en que es divideix l'obra i a las que s'han d'aplicar els càlculs: pròlegs, introduccions, prefacis, llibres, capítols, epílegs, biliografies, indexs...


Descomptes:

D'ilustracions, quadres, taules.

Per a descomptar les dimensions d'un gravat o quadre s'han de calcular les línies que aquest ocupa i els blancs preceptius.

S'ha de tenir en compte que les pàgines d'arrancada son pàgines curtes presentant un blanc de cortesia que ocupa vàries línies.

El mateix succeeix amb lespàgines finals de les parts: en aquests cas el blanc te la dificultat de què ajusti el text a tota la pàgina sense forzar-lo

Es realitza una pàgina plena de mostres amb les especificacions donades per a l'obra.


OCR (reconeixement òptic de caràcter)

Aplicació de l'escàner, com fer per ensenyar a llegir l'ordinador.
És un programa que llegeix aquestes imatges digitals i busca conjunts de punts que s'assemblin a lletres i caràcters.
Depèn de la complexitat de segons quin tipus de lletres, escriptura manual, text original o aplicar regles gramaticals (refer una frase mal construïda).
Perquè el programa distingeixi la diferents caràcters com ara la t i l'1, ha de complir unes característiques:
-Gran Resolució, a 600ppp o 300ppp, si la lletra és petita o de poca qualitat com periòdics.

El blanc i el negre és suficient (1 bit de color) o en escala de grisos (8 bits).
Escàner de corró.
En escanejar s'escaneja els punts que formen les imatges o text.

ESQUEMA BÀSIC DELS ALGORITMES

1. BINARITZACIÓ:

La majoria d'algoritmes de OCR parteixen d'una imatge binària. per tant és apropiat convertir la imatge d'escala de grisos, o una de color en una de blanc i negre.
Una manera de fer-ho és mitjançant l'histograma de la imatge, on mostra el nombre de píxels per a cada nivell de gris que apareix a la imatge. Per binarizarla hem d'escollir un llindar adequat, a partir del qual tots els píxels que no els superen es convertiran en negre i la resta en blanc. A partir d'aquí podem aïllar les parts de la imatge que contenen text (més transicions entre blanc i negre).

2. FRAGMENTACIÓ

La segmentació d'una imatge implica la detecció mitjançant processaments d'etiquetatge determinista o estocàstic (no hi ha ordre determinat) dels contorns o regions de la imatge basant-se en la informació d'intensitat o informació espacial.
No existeix un mètode genèric per dur a terme aquesta segmentació de la imatge que sigui eficaç.
Projeccions lineals ---> tècniques més utilitzades.

Clústers: tècnica més clàssica i simple per a imatges de grisos.
A partir de l'histograma, permet una classificació o espai dels píxels en regions homogènies.

3. SIMPLIFICACIÓ DELS COMPONENTS

Un cop aïllats els components connexos de la imatge, s'ha d'aplicar un procés de simplificació.
Esborra successivament els punts dels contorns de cada component de manera que es preservi la seva tipologia.
El escombrat es fa en paral·lel, assenyala els píxels esborrables per eliminar tots alhora.

4. COMPARACIONS DE PATRONS

Es comparen els caràcters obtinguts amb patrons emmagatzemats en una base de dades.
Mètodes: mètode de projecció vertical i horitzontal.
Altres mètodes: geomètrics o estadístics, estructurals, neuro-mimètics, markovians.


OCR - APLICACIONS

RECONEIXEMENT DE TEXTOS MANUSCRITS
És difícil el reconeixement d'un text manuscrit. La majoria d'algoritmes OCR no aconsegueix bons resultats. Implica una operació dels nivells morfològics, lèxic, i sintàctic que s'aconsegueix mitjançant el reconeixement de parla contínua.
Per això s'utilitzen algoritmes robustos que no utilitzen segmentació prèvia ja que s'obté automàticament amb la descodificació.


RECONEIXEMENT DE MATRÍCULA

Utilitzant els radars busquen textures similars a la de la matrícula i s'aïlla l'àrea rectangular que la forma. S'aplica un procés de classificació múltiple sobre el conjunt de píxels que pertanyen a la matrícula, si aperece un error es corregeix.


INDEXACIÓ A BASE DE DADES

Una de les formes més corrents de buscar imatges és a partir de les metadades introduïdes manualment per l'usuari. Cercadors d'imatges mitjançant el text com el dirs (Document Image Retrieval System) mitjançant un algoritme de OCR.