• Nenhum resultado encontrado

Recursos externos

No documento IBM OmniFind Enterprise Edition (páginas 106-111)

Asecção derecursosexternosdo descritorcontémosficheiros eclassesrequeridos peloanotador.

Oanotadordeexpressões globaisrequeroficheirodo conjuntode regras.O ficheirodo conjuntoderegrasédisponibilizadoparao anotadordeexpressões globais atravésdainterfacecom.ibm.uima.an_regex.FileResource,queé

implementada pelaclassecom.ibm.uima.an_regex.impl.FileResource_impl.Para passarasregraspersonalizadasparaoanotadordeexpressõesglobais,tem de forneceronome doficheirodoconjuntoderegraseadicionara localizaçãodo ficheiroaocaminhodaclasse.Achave queoanotadorde expressõesglobaisutiliza paraacederaoficheirodo conjuntoderegrasdenomina-seRuleSetDefinition.Não

altereestachave,casocontráriooanotadordeexpressõesglobais nãoencontraráo conjuntode regrase oanotadornãoconseguiráinicializar.

Os anotadorespersonalizadosimplementadosparaoEnterpriseSearchnãopodem utilizara definiçãoUIMAdatapathparaconsultarrecursosexternos.Paraconsultar recursos externos,especifiqueosnomesdecaminho pararecursosnocaminhoda classe doanotadorpersonalizado.Consulte aUIMAdocumentaçãosobreoSDK em http://www.alphaworks.ibm.com/tech/uima/paraobterinformações sobrea utilização doAssistentede GeraçãoPEAR(PEARGenerationWizard) para especificardefiniçõesde caminhosde classedoanotadorpersonalizado.

Amostra

Asecção derecursosexternosdo descritorédaseguinteforma:

<externalResourceDependencies>

<externalResourceDependency>

<key>RuleSetDefinition</key>

<description>Definição do conjunto de regras</description>

<interfaceName>com.ibm.uima.an_regex.FileResource</interfaceName>

<description>Ficheiro da definição do conjunto de regras para números das salas</description>

<fileResourceSpecifier>

<fileUrl>file:of_samples_regex_rules.xml</fileUrl>

</fileResourceSpecifier>

<implementationName>

com.ibm.uima.an_regex.impl.FileResource_impl</implementationName>

</externalResource>

Conceitosrelacionados

“Anotadorde expressõesglobais”napágina87

Oanotadordeexpressõesglobaispermite-lheexecutara análisede texto personalizadasemternecessidadede implementaroseuprópriomotor de análisedetexto.Combasenumconjuntoderegras(expressõesglobais)que podedefinirporsipróprio,oanotadordeexpressõesglobais detectaas estruturasdeinformaçõesem documentosdetextoecria anotaçõesdas informaçõesdetectadasna estruturadeanálisecomum.

“Ficheirodoconjuntoderegras”na página90

Noanotadorde expressõesglobais,oficheirodoconjuntoderegrasXML defineasregras,naformadeexpressõesglobais,quesãoutilizadaspara analisarodocumentode texto.

Referênciasrelacionadas

“Registar”napágina 100

Todasasmensagensderegistodo anotadorde expressõesglobaissãoescritas noficheiroderegistodacolecçãoactual.

Registar

Todasasmensagens deregistodoanotadordeexpressõesglobais sãoescritasno ficheirode registodacolecção actual.

Os ficheirosderegistodacolecçãoestãolocalizadosemES_NODE_ROOT/logs/e têm nomescomoformato<id_colecção>_<data_actual>.log. Épossívelvisualizaros ficheiros deregistoutilizandoosscripts esviewlogs.sh/.bat.

Existemseteníveisderegistopossíveis:

v Erro(Error) v Aviso(Warning) v Informações(Info) v Configuração(Config) v Optimizado(Fine) v Detalhado(Finer) v Pormenorizado(Finest)

Não podealteraromapeamento paramensagensdeErroeAviso.Porpredefinição, apenas mensagensInformações(Info),Aviso(Warning)eErro(Error)sãoescritas noficheirode registo.Estessãoosníveisderegistopadrãoutilizadospelo EnterpriseSearch.Osoutros níveisderegistopodemsermapeadosparaobter informações maisdetalhadas.

Pararecebermensagens deregistoapartirdoanotadordeexpressões globais,o nívelde registotemdeestardefinido,pelomenos, comoConfiguração(Config).

Nestenível,oanotadorregistadefiniçõesde configuração,talcomo,oficheirodo conjuntode regrasqueéutilizadoe onomedaclassedeimplementaçãoparaa interface com.ibm.uima.an_regex.String2Number.

Sedefinironívelde registoparaDetalhado(Finer),porexemplo,oanotador regista quaisasanotaçõesquenãofoipossível criar.Estenívelpodeajudara determinarporque nemtodasasanotaçõesqueestáa esperarforamcriadas.Por exemplo,poderiaexistirumerronumadasexpressõesglobais ouumgrupode captura opcionalpodenão terencontradocorrespondência paraqualquertextono documento.Domesmomodo, seespecificarqueumafuncionalidadedeveser definida comasequência detextoquecorrespondea umgrupode capturaenão existirsequênciade textocorrespondente,a funcionalidadeédefinida comonula.

Paraobter informaçõesmuitodetalhadas,definaonívelde registocomo Pormenorizado(Finest). Nestenível,oanotadorregistaopadrãodeexpressão globalactual,aparte dotextodedocumentoqueestáaser analisadaequaisquer anotações efuncionalidadesquetenhamsidocriadas.Aoutilizaroregistomuito detalhado, especialmenteosníveisderegistoDetalhado(Finer) ePormenorizado (Finest), temumimpactonegativonodesempenhoglobaldo anotador.

Serequerer omapeamentodonívelde registodetalhado,modifiqueoficheirode configuraçãodenominado tokenizer.propertiesemES_NODE_ROOT/

master_config/parserservice/alterandoa definiçãodaconfiguração trevi.tokenizer.jedii.InformationalLevelMapping=Info em

trevi.tokenizer.jedii.InformationalLevelMapping=Finest,porexemplo.

Paraactivar asalteraçõesdoníveldoregisto,temde parartodososprocessosdo analisador utilizandoaconsoladeadministração.Em seguida,temde parare reiniciardeseguidaa sessãode inicializaçãodoanalisadora partirdalinhade comandoschamando:

>esadmin session parserservice stop

>esdamin session parserservice start

Depoisdisso,a análisepode sernovamenteiniciadaedeveagorateronovonível de registo.Temde repetirestespassossemprequealteraroníveldoregisto.

Conceitosrelacionados

“Anotadorde expressõesglobais”napágina87

Oanotadordeexpressõesglobaispermite-lheexecutara análisede texto personalizadasemternecessidadede implementaroseuprópriomotor de análisedetexto.Combasenumconjuntoderegras(expressõesglobais)que podedefinirporsipróprio,oanotadordeexpressõesglobais detectaas estruturasdeinformaçõesem documentosdetextoecria anotaçõesdas informaçõesdetectadasna estruturadeanálisecomum.

“Ficheirodoconjuntoderegras”na página90

Noanotadorde expressõesglobais,oficheirodoconjuntoderegrasXML defineasregras,naformadeexpressõesglobais,quesãoutilizadaspara analisarodocumentode texto.

Referênciasrelacionadas

“Descritordo anotador”napágina 96

OdescritorXMLdoanotadordeexpressõesglobais contéminformações descritivassobreoanotadordeexpressõesglobaisqueénecessáriopara executaroanotador.

No documento IBM OmniFind Enterprise Edition (páginas 106-111)