COLETA DE DOCUMENTOS DE PATENTE - Proposta de melhoria do processo tradicional de inteligência

A coleta de documentos de patentes é uma atividade implícita ao ciclo de IT. Apesar de algumas peculiaridades geradas por diferenças na estruturação de cada base de dados, essa atividade segue um padrão de coleta divulgado pelos escritórios nacionais e pela World Intellectual Property Organization (WIPO). A Figura 9 representa os procedimentos de coleta de informações de patente para inteligência divulgados pela World Intellectual Property Organization (2012).

Figura 9 - Fases do subprocesso de coleta de documentos de patente

Fonte: produção da própria autora - baseado na World Intellectual Property Organization (2012)

Para a WIPO (2012), o subprocesso de coleta de documentos de patentes inicia-se com a definição dos critérios de busca (1). Em outras palavras, elabora-se a estratégia de busca de modo que os constructos que representam a necessidade de inteligência sejam transformados em palavras-chave, as quais são por vezes extraídas de documentos relevantes sobre o tema em questão. O guia da WIPO (2012) orienta tomar cuidado com a utilização de palavras, dada as mais variadas grafias e sentidos que estas empregam. Ao escolher as palavras-chave recomenda-se levar em consideração o idioma de indexação dos registros e os possíveis sinônimos.

Posteriormente, grupos de códigos da Classificação Internacional de Patentes (CIP) devem ser escolhidos a partir das palavras-chave. A CIP descreve uma invenção por meio de códigos com significados pré-estabelecidos, independente dos termos utilizados na escrita do documento. Essa informação está contida nos registros bibliográficos de praticamente todas as bases de dados de patentes (WORLD INTELLECTUAL PROPERTY ORGANIZATION, 2012). A CIP foi estabelecida em 1971, com o objetivo de descrever o conteúdo da patente, independente das terminologias utilizadas na escrita do documento. Na CIP as invenções podem ser classificadas em oito seções principais, sendo elas A (necessidades humanas); B (operações de processamento e transporte); C (química e metalurgia); D (têxteis e papel); E (construções fixas); F (engenharia mecânica, iluminação e aquecimento, armas e fornos); G (física) e H (eletricidade). A partir das seções, a classificação subdivide-se em outros quatro níveis hierárquicos, sendo eles: classe; subclasse; grupo principal; subgrupo.

A CIP é adotada por mais de 100 países e o uso de seus códigos em estratégias de busca apresenta-se como uma vantagem para recuperação de documentos de patente, visto que abrange todos os campos tecnológicos e é constantemente revisada considerando a

emergência de novas tecnologias (WORLD INTELLECTUAL PROPERTY ORGANIZATION, 2013). Dependendo da base de dados, outros sistemas de classificação também poderão ser escolhidos como substitutos ou complementares aos códigos CIP. Ao escolher os códigos, o coletor deve atentar-se às suas edições. Isso porque a CIP é revisada periodicamente para contemplar novos campos de desenvolvimento tecnológico, no entanto, somente os documentos de patente indexados nas bases posteriormente às atualizações é que conterão os códigos atualizados.

Posteriormente à escolha das palavras-chave e dos códigos CIP, deve-se estruturar a busca e executá-la (2). A primeira busca deve ser relativamente ampla, utilizando o operador booleano OR para unir as palavras-chave aos códigos CIP e wildcards (caracteres curinga) para incluir todas as variações das palavras. O objetivo primeiro seria recuperar a maior quantidade de documentos de patente possíveis referentes ao tema. Em um segundo momento, deve-se filtrar removendo os documentos irrelevantes (WORLD INTELLECTUAL PROPERTY ORGANIZATION, 2012)

Os campos de busca também devem ser escolhidos considerando as necessidades. Para estruturar a estratégia deve-se estudar o documento de ajuda da base de dados para conhecer o funcionamento do seu mecanismo de busca e melhor estruturá-la. A estratégia final geralmente é formada por palavras-chave e/ou de códigos CIP. O guia da World Intellectual Property Organization (2012) recomenda, como melhores práticas, avaliar a revocação e precisão da estratégia de busca e iniciar a busca de forma ampla e, posteriormente, limitá-la a um conjunto de documentos que seja possível observar em detalhes.

Por muito tempo as medidas revocação e precisão vêm sendo utilizadas para avaliar a qualidade de sistemas de informação. Segundo Capurro e Hjorland (2007), medidas de “precisão” e de “revocação” foram introduzidas em 1957 através dos experimentos realizados por Cyril Cleverdon no Cranfield Institute Technology, utilizados para avaliar a qualidade de sistemas informatizados de recuperação de informação, destacando-se até hoje como os mais famosos do campo. As formas de cálculos dos níveis de revocação e precisão encontram-se na seção 4.2. Com a estratégia de busca pronta e avaliada inicia-se a recuperação dos registros de documentos indexados na base escolhida. O coletor poderá escolher delimitações de período de tempo e escopo geográfico (países em que as patentes foram depositadas) de acordo com a necessidade.

Amaral (2010) levantou as técnicas utilizadas em processos de análise de inteligência (3), e entre elas estão: a) análise data mining/text mining, que permite obter novos padrões de conhecimento a partir de uma massa não estruturada dos dados por meio da linguagem

natural; b) análise de conteúdo: permite construir inferências a partir de textos, por meio da contagem dos termos e construções; c) análise de crescimento (curva-s): analisa o ciclo de vida de uma tecnologia para servir de base para o desenvolvimento de futuras estratégias tecnológicas e novas tecnologias; d) análise de patentes: permite o gerenciamento estratégico de uma determinada tecnologia e auxilia no processo de desenvolvimento de produtos e serviços; e) análise technological roadmap, que procura identificar relacionamentos estruturais entre ciência, tecnologia e aplicações, dando suporte à decisão; f) bibliometria, que elabora análise quantitativa, fundamentada na contagem de elementos textuais e informações extraídas de suportes físicos ou mesmo online.

O uso de softwares e da técnica de mineração de textos e dados para processar volumes significativos de registros são cada vez mais recorrentes. Um exemplo desses softwares é o VantagePoint (VP), que fornece facilidades e ferramentas que contribuem para o tratamento, contagem bibliométrica e análise de grandes volumes de dados brutos obtidos das bases de dados (VANTAGEPOINT, 2013). Embora existam softwares para bibliometria, algumas bases de dados disponibilizam ferramentas que possibilitam realizar análises bibliométricas dos resultados de uma busca, como, por exemplo, a Derwent Innovations Index (DII), porém com certos limites.

Outra técnica que pode ser empregada é a análise de documentos, também compreendida como análise de conteúdo, e apresenta um caráter qualitativo ou quantitativo. Na perspectiva de Bardin (1977), a análise de conteúdo iniciou-se com o conceito de hermenêutica. É utilizada para descrever e interpretar o conteúdo de toda classe de documentos e textos, além de uma leitura comum. Durante seu processo evolutivo tem oscilado entre a subjetividade das interpretações e o rigor e objetividade dos números. A abordagem quantitativa destaca-se, utilizando especialmente a indução e a intuição como estratégias para atingir níveis de compreensão mais aprofundados dos fenômenos que se propõe a investigar (MORAES, 1999).

A matéria-prima da análise de conteúdo constitui-se de qualquer material proveniente da comunicação verbal ou não-verbal, os dados advindos dessas diversificadas fontes se encontram em estado bruto (MORAES, 1999). Essa análise pode ser utilizada para complementar a informação obtida por outras técnicas, como, por exemplo, a bibliometria, ou ser um método de pesquisa exclusivo. Após e durante a análise se faz necessário atentar-se aos feeds de notícias relacionados aos recentes conteúdos publicados (4). Notícias confiáveis são ótimas para serem utilizadas como elementos complementares às análises de patentes (WORLD INTELLECTUAL PROPERTY ORGANIZATION, 2012).

No documento Proposta de melhoria do processo tradicional de inteligência e do subprocesso de coleta de documentos de patente: estudo de caso no Núcleo de Informação Tecnológica em Materiais (páginas 73-77)