Tradu
Tradu
ç
ç
ão
ão
Autom
Autom
á
á
tica
tica
BelindaBelindaMaiaMaia Universidade do Porto
Universidade do Porto
&
&
PoloCLUP
PoloCLUPLinguatecaLinguateca
A
A
importância
importância
da
da
Tradu
Tradu
ç
ç
ão
ão
Autom
Autom
á
á
tica
tica
(TA)
(TA)
ImportânciaImportânciasocial –social –necessidadenecessidadede de
comunica
comunicaççãoãoentreentrepessoaspessoassemsem l
líínguangua comumcomum
ImportânciaImportânciapolípolíticatica--multilinguismomultilinguismo
ImportânciaImportânciacomercialcomerciale e econeconóómicamica
InteresseInteressecientícientíficoficoe e filosfilosóóficofico
Tradu
Traduç
ção
ão
e a M
e a
Má
áquina
quina
-
-
distinç
distin
ções
ões
MAHT > THAM –MAHT > THAM –TraduçTraduçãoãoHumana Humana
Assistida
AssistidapelapelaMMááquinaquina
CAT > TAC -CAT > TAC -TraduçTraduçãoãoAssistidaAssistidapelopelo
Computador Computador
HAMT > TAAH –HAMT > TAAH –TraduTraduççãoão
Autom
AutomááticaticaAssistidaAssistidapelopeloser ser Humano
Humano
THAM
THAM –
–
Traduç
Tradu
ção
ão
Humana
Humana
Assistida
Assistida
pela
pela
Má
M
áquina
quina
DescriDescriççãoãomaismaisvagavaga
ImplicaImplicautilizautilizaççãoãode de vvááriasrias
tecnologias
tecnologiasparaparafacilitarfacilitara tradua traduççãoão
ProcessamentoProcessamentode de textotexto
ArmazenamentoArmazenamentode de textostextose e
terminologia terminologia
RecursoRecursoààinformaçinformaçãoãonanaInternetInternet
TAC
TAC -
-
Traduç
Tradu
ção
ão
Assistida
Assistida
pelo
pelo
Computador
Computador
“CAT “CAT toolstools””--SDL/TRADOS, STAR SDL/TRADOS, STAR
TRANSIT, D
TRANSIT, DÉÉJJÀÀVU, WORDFAST etcVU, WORDFAST etc que incluem
que incluem
•
•MemMemóórias de Tradurias de Traduççãoão
•
•TerminologiaTerminologia •
•Extractores de textoExtractores de texto •
•……TATA
TAC
TAC -
-
Localizaç
Localiza
ção
ão
== TraduTraduççãoãode de manuaismanuais, , documentadocumentaççãoãoe a e a
parte
partelingulinguíísticasticade de programaprogramaççãoão
inform
informááticatica
ProgramasProgramasde de LocalizaLocalizaççãoão––PASSOLO, PASSOLO,
CATALYST etc
CATALYST etc
TeoricamenteTeoricamentefuncionalistafuncionalista--ououadaptaadaptaççãoão
do
do textotextoetc etc ààssnecessidadesnecessidadesLOCAISLOCAIS
Na Na prprááticatica> > uniformizauniformizaççãoãode de textotextoe e
tradu
Programas de TAC e Localiza
Programas de TAC e Localizaç
ção
ão
Inventados por engenheiros Inventados por engenheiros
impacientes com a lentidão de impacientes com a lentidão de tradu
traduçção humanaão humana
Aproveitam textos e traduçAproveitam textos e traduções jões jáá
existentes > reduzem custos existentes > reduzem custos
Garantem uniformidade de Garantem uniformidade de
terminologia e expressões comuns terminologia e expressões comuns
Oferecem material para melhorar TAOferecem material para melhorar TA
TA
TA
–
–
usos
usos
actuais
actuais
TraduTraduççãoão‘‘GistGist’’–ex. –ex. nanaComissãoComissão
Europeia Europeia
TextosTextosefeféémerosmeros+ utilizadores+ utilizadores
tolerantes
tolerantes > TA on> TA on--lineline
TA TA ememdomídomíniosniosespecespecííficosficos+ + llééxicosxicos
especializados
especializadose e sintaxesintaxesimplessimples
ProgramasProgramasespecíespecíficosficosentreentreL1 <> L1 <>
L2 L2
TA com
TA com
assistência
assistência
humana
humana
¾¾EstruturaEstruturalinear de linear de frasesfrases ¾
¾PréPré--ediediççãoãode de textotexto ¾
¾‘Linguagem‘Linguagemcontroladacontrolada’’ ¾
¾LéLéxicosxicosememdomídomíniosniosespecíespecíficosficos ¾
¾PóPóss--ediediççãoão ¾
¾TrabalhandoTrabalhandocom a ‘com a ‘caixacaixade vidrode vidro’’ ¾
¾AcessoAcessolimitadolimitadoàà‘‘caixacaixa negranegra’’––esp. esp.
l lééxicosxicos
A TA e o
A TA e o
Tradutor
Tradutor
Humano
Humano
Os Os tradutorestradutoreshumanoshumanostendemtendemaa •
•desprezardesprezara TAa TA
•
•tertermedomedodadaTATA
Os Os tradutorestradutoresnuncanuncasãosãoconvidadosconvidados
a
a avaliaravaliar a TA!a TA!
MASMAS
A A maiormaior ameaameaççaa ààtraduçtraduçãoão
profissional
profissionalnãonãoééa TAa TA
ÉÉo INGLÊS! o INGLÊS!
A TA
A TA
em
em
linha
linha
e o
e o
utilizador
utilizador
FacilitaFacilitacomunicacomunicaççãoãointernacionalinternacional––e a e a
v
vááriosriosnnííveisveis= = maismaisdemocrdemocrááticatica
CriaCriavontadevontadede de conhecerconhecertextostextosemem
l
líínguasnguasdesconhecidasdesconhecidas= = maismaistradutraduççãoão
humana
humana
TA TA ememdomdomííniosniosespecespecííficosficosououpreparadapreparada
para
parafins fins bembem--definidosdefinidos––aceleraacelerao o trabalho
trabalhode de tradutraduççãoão
TA TA ––entreentrecertascertasllíínguasnguas--utilizadautilizadacadacada
vez
vezmaismaisporportradutorestradutoreshumanoshumanos
Ferramentas desenvolvidas pela
Ferramentas desenvolvidas pela
Linguateca
Linguateca
METRAMETRA EVALEVAL TrAvaTrAva CORTACORTA BOOMERANGBOOMERANG METRA
METRA
http://http://www.linguateca.pt/metrawww.linguateca.pt/metra
Meta-Meta-ferramentaferramentade TAde TA
UtilizaUtilizavvááriosriosmotoresmotoresde TA de TA
dispon
disponííveisveisgrágrátistisememlinhalinha
EN > PTEN > PT PT > ENPT > EN
Resultados
Resultados
CentenasCentenasde de visitasvisitasporporsemanasemana!!
Muito Muito úútil para o ensino de lingutil para o ensino de linguíística stica
e tradu e traduççãoão
Grandes possibilidades para Grandes possibilidades para
avalia
avaliaçção de TA entre EN <> PTão de TA entre EN <> PT
Quantidade enorme de Quantidade enorme de ‘‘logslogs’’para para
an
anáálise de TA, comparalise de TA, comparaçção de ão de motores de TA
motores de TA etcetc..
EVAL >
EVAL >
TrAva
TrAva
UmaUmaexperiênciaexperiênciapedagópedagógicagica
INPUT –INPUT –frasesfrases‘‘naturaisnaturais’’tiradastiradasde de
corpora, com um
corpora, com um elementoelementode de problema
problema
OUTPUT dasOUTPUT das‘caixas‘caixasnegrasnegras’’––anáanáliselise
de
de problemasproblemas
AvaliaçAvaliaçãoãode diferentesde diferentesaspectosaspectosdos dos
sistemas sistemasde TAde TA
TrAva
TrAva
–
–
a
a
ferramenta
ferramenta
4 4 motoresmotoresde TA de TA ememlinhalinhaEN > PT:EN > PT: •
•Free TranslationFree Translation
• •SystranSystran • •E T ServerE T Server • •AmikaiAmikai
SistemaSistemade de classificaclassificaççãoãodos dos erroserros de de
TA TA
TrAva
TrAva
–
–
escolha
escolha
de
de
‘
‘
problemas
problemas
’
’
HomóHomógrafosgrafose e itensitenslexicaislexicais
poliss polisséémicosmicos
UnidadesUnidadeslexicaislexicaiscomplexascomplexas
FrasesFrasesidiomidiomááticasticas
ColocaçColocaçõesões
ComplexidadeComplexidadesintásintácticactica
AmbiguidadeAmbiguidadesintásintácticactica
ResoluçResoluçãoãode ande anááforafora
TrAva
TrAva
–
–
escolha do
escolha do
Input
Input
NãoNãoutilizautilizaççãoãode de ‘‘test suitestest suites’’
Nada de Nada de tentartentar‘‘baralharbaralhar’’a TAa TA
SelecSelecççãoãode de exemplosexemplosreaisreaisememcorpora:corpora: •
•British National Corpus British National Corpus ––BNC (100 milhõesBNC (100 milhõesde de palavras
palavras)) •
•COMPARA COMPARA •
•OutrosOutrostextostextos
Remover Remover textotextosupsupéérfluorfluo
Classifica
Classifica
ç
ç
ão
ão
do Input
do Input
LéLéxicoxicoEN EN
CóCódigosdigosmorfolmorfolóógicasgicas(POS/parts(POS/parts--ofof-
-speech)
speech) utilizadosutilizadospelopeloBNCBNC
EstructurasEstructurassintsintáácticascticas= =
combina
combinaççõesõesde POS do BNCde POS do BNC
ObservaçObservaçãoãodos resultadosdos resultadosdiferentesdiferentes
Classifica
Classifica
ç
ç
ão
ão
do Output
do Output
ProblemaProblema1: 1: ClassificaClassificaççãoãodo inputdo input •
•ClassificaClassificaççãoãoBNC POS BNC POS ––limitadalimitadaa POS a POS
e
e insuficienteinsuficienteparaparaananááliselisesintsintáácticactica •
•MasMasquequetipotipode de classificaclassificaççãoão????
ProblemaProblema2: 2: ExplicaExplicaççãoãodo outputdo output •
•ErrosErroslexicaislexicais––diciondicionááriosriosfracosfracos •
•ErrosErrosdevidosdevidosa a falhasfalhasdo do sistemasistemade de
an
anááliselisesintsintáácticocticoe/oue/ouhomhomóógrafosgrafos •
EXEMPLOS
EXEMPLOS
SintagmasSintagmasnominaisnominaiscomplexoscomplexos
‘Lexical bundles‘Lexical bundles’’ouou‘conjuntos‘conjuntos
lexicais lexicais’’
HomóHomógrafosgrafos
PolissemiaPolissemia
ColocaçColocaçõesões
Sintagmas
Sintagmas
nominais
nominais
complexos
complexos
DETerminerDETerminer+ + ADJectiveADJective+ + NounNoun
DETerminerDETerminer+ + ComplexComplexADJectiveADJective+ +
ADJective
ADJective+ + NounNoun
DETerminerDETerminer+ + ADVerbADVerb((––lyly) + ) +
ADJective
‘
‘
Lexical Bundles
Lexical Bundles
’
’
BiberBiberet alet al
((tambtambéémm‘‘Multi Words UnitsMulti Words Units’’..)..)
Ex. Ex. I want to, you are supposed to, I want to, you are supposed to, you were meant to, you want me to,
you were meant to, you want me to,
in the course of, at the time when,
in the course of, at the time when,
as far as
as far as……is concerned is concerned ……..
Homografia e
Homografia e
Polissemia
Polissemia
ExemplosExemplos RoundRound RunRunUm exemplo lexical ou sint
Um exemplo lexical ou sintá
áctico?
ctico?
‘‘SheShedrovedroveherherchildrenchildrento to schoolschool’’
‘‘SheShedrovedroveherherchildrenchildrenupupthethewall’wall’
‘‘SheShesangsangthethebabybabyto sleepto sleep’’
Acesso
Acesso
PesquisadorPesquisador •
•TrabalhaTrabalhano no seuseuespaespaççooindividualindividual •
•PodePodeacederacederaoaoseuseutrabalhotrabalho
Professor / administradorProfessor / administradorpodepode
aceder
aceder aoaotrabalhotrabalhodo alunodo alunoparapara ajudar
ajudar
Os resultadosOs resultadosaparecemaparecemtodostodosno no
‘
‘loglog’’do METRAdo METRA
Links
Links
METRA :METRA : http://http://www.linguateca.pt/metrawww.linguateca.pt/metra TrAvaTrAva:: http://http://www.linguateca.pt/travawww.linguateca.pt/trava//Pesquisa
Pesquisa
futura
futura
MelhorarMelhorarTrAvaTrAva •
•ReformularReformularbases bases teteóóricasricas
•
•AplicaAplicaççãoãode de ‘‘glass boxglass box’’??
METRA
METRA -
-Pedagogical applications
Pedagogical applications
Contrastive linguistics (undergraduate)Contrastive linguistics (undergraduate) •
•Choose item of grammar or lexiconChoose item of grammar or lexicon •
•Find examples in BNC or COMPARAFind examples in BNC or COMPARA •
•Submit to METRASubmit to METRA •
•Compare MT to human translationCompare MT to human translation •
•Reflect on resultsReflect on results ¾
¾ Better understanding of interconnection of Better understanding of interconnection of
lexicon + syntax + context
lexicon + syntax + context
Conclusions
Conclusions
-
-
teaching
teaching
A successful experimentA successful experiment
Future implications for researchFuture implications for research
Useful pedagogicallyUseful pedagogically •
•As linguistic analysisAs linguistic analysis •
•As appreciation of MTAs appreciation of MT
Development of training of working Development of training of working
with withMTMT
Conclusions
Conclusions
-
-
research
research
Further work needs to be done on:Further work needs to be done on: •
•Improving METRAImproving METRA
•
•Classifications in Classifications in TrAvaTrAva
•
•Searching METRA logsSearching METRA logs
A lone researcher can use it to A lone researcher can use it to
examine a restricted area examine a restricted area
BUT BUT ––a large team is needed to a large team is needed to
make practical use of the tools make practical use of the tools
Other research
Other research
Analysis of METRA logsAnalysis of METRA logs • •Who?Who? • •Why?Why? • •What?What? •
•Comparison of MT enginesComparison of MT engines •
•OnOn--line consultation of logsline consultation of logs
METRA logs
METRA logs
A large number of A large number of ‘‘hitshits’’per dayper day
GBsGBsof material of material ––and rising!and rising!
What can we do with it? What can we do with it?
We have ideas We have ideas ––but welcome but welcome
suggestions! suggestions!
Who
Who
uses METRA
uses METRA
and
and
Why
Why
?
?
IP IP addressesaddresses> > countrycountryofoforiginorigin––
even
eveninstitutioninstitution
¾
¾Portugal, Portugal, BrazilBrazil, , butbutotherothercountriescountries
too too
LanguageLanguagedirectiondirection--??????
TypesTypesofofrequestrequest ¾
¾EverythingEverythingfromfromsinglesinglewordswordsto to
doctoral
doctoralthesestheses!!
Differences
Differences
between
between
MT engines
MT
engines
SystranSystran+ Babelfish+ Babelfish + + GoogleGoogle
EE--TranslationTranslation ––EN>PT EN>PT onlyonly––butbut
good
goodwithwithtechnicaltechnicaltextstexts
AmikaiAmikai––trainedtrainedononee--mailsmails––goodgood
at
atcolloquialcolloquialtextstexts
BrazilianBrazilianemphasisemphasis––lexiconlexiconandand
grammar grammar
Research
Research
applications
applications
More advancedMore advancedcontrastivecontrastivelinguisticslinguistics
WorkWorkwithwithlogslogs •
•FindingFindingoutoutwhowhouses METRAuses METRA
•
•TestingTestingareasareasofoflanguagelanguage
•
•TestingTestingMT MT enginesengines
On
On
-
-
line
line
consultation
consultation
of
of
logs
logs
Future
Useful bibliography
Useful bibliography
ARNOLD, D, BALKAN, L., LEE HUMPHREYS, R. Lee, ARNOLD, D, BALKAN, L., LEE HUMPHREYS, R. Lee, MEIJER, S., & SADLER, S. (1994)
MEIJER, S., & SADLER, S. (1994) Machine Translation Machine Translation
--An Introductory guideAn Introductory guide. Manchester & Oxford : NCC . Manchester & Oxford : NCC
Blackwell. ISBN 1
Blackwell. ISBN 1--8555485554--217217--X X --or at: or at:
http://
http://www.essex.ac.uk/linguistics/clmt/MTbookwww.essex.ac.uk/linguistics/clmt/MTbook/./.
COLE, Ron (ed) 1996 COLE, Ron (ed) 1996 "Survey of the State of the Art "Survey of the State of the Art in Human Language Technology" Chapter 8
in Human Language Technology" Chapter 8 -
-Multilinguality
Multilinguality, at the Center for Spoken Language , at the Center for Spoken Language Understanding,
Understanding,
Oregon.
Oregon. http://cslu.cse.ogi.edu/HLTsurvey/ch8nodehttp://cslu.cse.ogi.edu/HLTsurvey/ch8node
2.html#Chapter8
2.html#Chapter8
MELBY, Alan K. 1995MELBY, Alan K. 1995, , The Possibility of Language: A The Possibility of Language: A
discussion of the Nature of Language, with
discussion of the Nature of Language, with
implications for Human and Machine Translation.
implications for Human and Machine Translation.
Amsterdam: John
Amsterdam: John BenjaminsBenjaminsPub. Co.Pub. Co.
Useful bibliography
Useful bibliography
MELBY, MELBY, AlanAlan19951995' ' WhyWhyCan'tCan'ta a ComputerComputer Translate
TranslateMore More LikeLikea a Person?'Person?' TheThe1995 1995 Barker
BarkerLectureLectureatatttt.orgttt.org--TranslationTranslation, , Theory
TheoryandandTechnologyTechnology. . atat: : http://
http://www.ttt.orgwww.ttt.org//theorytheory//barker.htmlbarker.html
MLIM MLIM --Multilingual Information Multilingual Information Management: Current levels and Future Management: Current levels and Future Abilities
Abilities --report (1999) Chapter 4 at: report (1999) Chapter 4 at: http://www
http://www-
-2.cs.cmu.edu/~ref/mlim/chapter4.html 2.cs.cmu.edu/~ref/mlim/chapter4.html