Asecção derecursosexternosdo descritorcontémosficheiros eclassesrequeridos peloanotador.
Oanotadordeexpressões globaisrequeroficheirodo conjuntode regras.O ficheirodo conjuntoderegrasédisponibilizadoparao anotadordeexpressões globais atravésdainterfacecom.ibm.uima.an_regex.FileResource,queé
implementada pelaclassecom.ibm.uima.an_regex.impl.FileResource_impl.Para passarasregraspersonalizadasparaoanotadordeexpressõesglobais,tem de forneceronome doficheirodoconjuntoderegraseadicionara localizaçãodo ficheiroaocaminhodaclasse.Achave queoanotadorde expressõesglobaisutiliza paraacederaoficheirodo conjuntoderegrasdenomina-seRuleSetDefinition.Não
altereestachave,casocontráriooanotadordeexpressõesglobais nãoencontraráo conjuntode regrase oanotadornãoconseguiráinicializar.
Os anotadorespersonalizadosimplementadosparaoEnterpriseSearchnãopodem utilizara definiçãoUIMAdatapathparaconsultarrecursosexternos.Paraconsultar recursos externos,especifiqueosnomesdecaminho pararecursosnocaminhoda classe doanotadorpersonalizado.Consulte aUIMAdocumentaçãosobreoSDK em http://www.alphaworks.ibm.com/tech/uima/paraobterinformações sobrea utilização doAssistentede GeraçãoPEAR(PEARGenerationWizard) para especificardefiniçõesde caminhosde classedoanotadorpersonalizado.
Amostra
Asecção derecursosexternosdo descritorédaseguinteforma:
<externalResourceDependencies>
<externalResourceDependency>
<key>RuleSetDefinition</key>
<description>Definição do conjunto de regras</description>
<interfaceName>com.ibm.uima.an_regex.FileResource</interfaceName>
<description>Ficheiro da definição do conjunto de regras para números das salas</description>
<fileResourceSpecifier>
<fileUrl>file:of_samples_regex_rules.xml</fileUrl>
</fileResourceSpecifier>
<implementationName>
com.ibm.uima.an_regex.impl.FileResource_impl</implementationName>
</externalResource>
Conceitosrelacionados
“Anotadorde expressõesglobais”napágina87
Oanotadordeexpressõesglobaispermite-lheexecutara análisede texto personalizadasemternecessidadede implementaroseuprópriomotor de análisedetexto.Combasenumconjuntoderegras(expressõesglobais)que podedefinirporsipróprio,oanotadordeexpressõesglobais detectaas estruturasdeinformaçõesem documentosdetextoecria anotaçõesdas informaçõesdetectadasna estruturadeanálisecomum.
“Ficheirodoconjuntoderegras”na página90
Noanotadorde expressõesglobais,oficheirodoconjuntoderegrasXML defineasregras,naformadeexpressõesglobais,quesãoutilizadaspara analisarodocumentode texto.
Referênciasrelacionadas
“Registar”napágina 100
Todasasmensagensderegistodo anotadorde expressõesglobaissãoescritas noficheiroderegistodacolecçãoactual.
Registar
Todasasmensagens deregistodoanotadordeexpressõesglobais sãoescritasno ficheirode registodacolecção actual.
Os ficheirosderegistodacolecçãoestãolocalizadosemES_NODE_ROOT/logs/e têm nomescomoformato<id_colecção>_<data_actual>.log. Épossívelvisualizaros ficheiros deregistoutilizandoosscripts esviewlogs.sh/.bat.
Existemseteníveisderegistopossíveis:
v Erro(Error) v Aviso(Warning) v Informações(Info) v Configuração(Config) v Optimizado(Fine) v Detalhado(Finer) v Pormenorizado(Finest)
Não podealteraromapeamento paramensagensdeErroeAviso.Porpredefinição, apenas mensagensInformações(Info),Aviso(Warning)eErro(Error)sãoescritas noficheirode registo.Estessãoosníveisderegistopadrãoutilizadospelo EnterpriseSearch.Osoutros níveisderegistopodemsermapeadosparaobter informações maisdetalhadas.
Pararecebermensagens deregistoapartirdoanotadordeexpressões globais,o nívelde registotemdeestardefinido,pelomenos, comoConfiguração(Config).
Nestenível,oanotadorregistadefiniçõesde configuração,talcomo,oficheirodo conjuntode regrasqueéutilizadoe onomedaclassedeimplementaçãoparaa interface com.ibm.uima.an_regex.String2Number.
Sedefinironívelde registoparaDetalhado(Finer),porexemplo,oanotador regista quaisasanotaçõesquenãofoipossível criar.Estenívelpodeajudara determinarporque nemtodasasanotaçõesqueestáa esperarforamcriadas.Por exemplo,poderiaexistirumerronumadasexpressõesglobais ouumgrupode captura opcionalpodenão terencontradocorrespondência paraqualquertextono documento.Domesmomodo, seespecificarqueumafuncionalidadedeveser definida comasequência detextoquecorrespondea umgrupode capturaenão existirsequênciade textocorrespondente,a funcionalidadeédefinida comonula.
Paraobter informaçõesmuitodetalhadas,definaonívelde registocomo Pormenorizado(Finest). Nestenível,oanotadorregistaopadrãodeexpressão globalactual,aparte dotextodedocumentoqueestáaser analisadaequaisquer anotações efuncionalidadesquetenhamsidocriadas.Aoutilizaroregistomuito detalhado, especialmenteosníveisderegistoDetalhado(Finer) ePormenorizado (Finest), temumimpactonegativonodesempenhoglobaldo anotador.
Serequerer omapeamentodonívelde registodetalhado,modifiqueoficheirode configuraçãodenominado tokenizer.propertiesemES_NODE_ROOT/
master_config/parserservice/alterandoa definiçãodaconfiguração trevi.tokenizer.jedii.InformationalLevelMapping=Info em
trevi.tokenizer.jedii.InformationalLevelMapping=Finest,porexemplo.
Paraactivar asalteraçõesdoníveldoregisto,temde parartodososprocessosdo analisador utilizandoaconsoladeadministração.Em seguida,temde parare reiniciardeseguidaa sessãode inicializaçãodoanalisadora partirdalinhade comandoschamando:
>esadmin session parserservice stop
>esdamin session parserservice start
Depoisdisso,a análisepode sernovamenteiniciadaedeveagorateronovonível de registo.Temde repetirestespassossemprequealteraroníveldoregisto.
Conceitosrelacionados
“Anotadorde expressõesglobais”napágina87
Oanotadordeexpressõesglobaispermite-lheexecutara análisede texto personalizadasemternecessidadede implementaroseuprópriomotor de análisedetexto.Combasenumconjuntoderegras(expressõesglobais)que podedefinirporsipróprio,oanotadordeexpressõesglobais detectaas estruturasdeinformaçõesem documentosdetextoecria anotaçõesdas informaçõesdetectadasna estruturadeanálisecomum.
“Ficheirodoconjuntoderegras”na página90
Noanotadorde expressõesglobais,oficheirodoconjuntoderegrasXML defineasregras,naformadeexpressõesglobais,quesãoutilizadaspara analisarodocumentode texto.
Referênciasrelacionadas
“Descritordo anotador”napágina 96
OdescritorXMLdoanotadordeexpressõesglobais contéminformações descritivassobreoanotadordeexpressõesglobaisqueénecessáriopara executaroanotador.