2.2 DETERMINANTES DA READABILITY DOS RELATÓRIOS E SUAS IMPLICAÇÕES
2.2.3 O efeito do ambiente externo na readability dos relatórios
interferir na dinâmica de preparação dos relatórios, ao direcionar sua readability.
2.2.1 Readability como medida de complexidade textual
A readability pode ser considerada uma medida da complexidade do texto. Desenvolvida nas pesquisas em linguística e psicologia educacional, a readability reúne fatores relacionados ao texto que influenciam o modo pelo qual um grupo de leitores o entende (Dale & Chall, 1948; McLaughlin, 1969). Via de regra, as fórmulas de readability tentam medir a complexidade de um texto por meio do uso de palavras frequentes e estruturas sintáticas complexas. A premissa subjacente é que a facilidade de compreensão de um texto está relacionada ao grau de dificuldade de suas palavras e frases (Klare, 1963). Assim, argumenta- se que a readability capta o grau de complexidade textual em que textos com maior (menor) readability tem uma leitura menos (mais) complexa.
Textos com maior readability auxiliam o entendimento da mensagem expressa em relatórios. Para a informação contábil atingir seu propósito, ela deve ser o menos complexa possível (Courtis, 2004; Rutherford, 2003), pois, sem uma comunicação eficaz, a contabilidade perde propriedade informacional e resume-se a um repositório arquivístico de estatísticas sobre o desempenho da empresa (Stone & Parker, 2013). Fundamentalmente se uma mensagem não é entendida corretamente, ela não é adequada ao monitoramento ou tomada de decisão (Jones, 1988).
Por uma perspectiva empírica, as principais fórmulas de readability utilizadas nas pesquisas contábeis são o índice Flesch, desenvolvido por Rudolf Flesch, e o índice Fog, desenvolvido por Robert Gunning (Clatworthy & Jones, 2001; Courtis, 2004; Li, 2008; Loughran & McDonald, 2016; Rutherford, 2016a, 2016b). Flesch publicou sua primeira fórmula de readability em 1943, com o objetivo de prever a dificuldade de leitura para textos direcionados a adultos (Flesch, 1943). Posteriormente, em 1948, simplificou sua fórmula, calculada como 206, 835 − (1,015*número de palavras dividido pelo número de frases − 84,
6*número de sílabas dividido pelo número de palavras) (Flesch, 1948). Índices mais altos indicam maior facilidade de leitura e vice-versa. Para valores variando de 0 a 25, os textos são considerados muito difíceis de ler; 25 a 50 textos de difícil leitura; 50 a 75 textos de fácil leitura; e 75 a 100 textos de leitura muito fácil.
Gunning (1952) desenvolveu o índice Fog para captar a complexidade do texto, estimando o número de anos de educação formal necessário a seu entendimento. Sua fórmula é uma função de palavras por frases e de sílabas por palavras, calculada como 0,4*(número médio de palavras por frases + porcentagem de palavras de três ou mais sílabas). Para valores de Fog ≥ 18 o texto é ilegível; 14 – 18 (difícil); 12 – 14 (ideal); 10 – 12 (aceitável); e 8 – 10 (infantil). O índice Fog também é relacionado à quantidade de anos de educação formal em relação às séries educacionais que o leitor necessita cumprir para entender prontamente um texto de escrita inglesa. Segue a relação dos anos de educação formal, índice Fog, por série educacional: 17 (college graduate); 16 (college senior); 15 (college junior); 14 (college sophomore); 13 (college freshman); 12 (high school senior); 11 (high school junior); 10 (high school sophomore); 9 (high school freshman); 8 (eighth grade); 7 (seventh grade); e 6 (sixth grade).
Apesar de considerado um tópico importante, existem críticas sobre a utilização de fórmulas de readability nas pesquisas contábeis. Na Tabela 1, constam as críticas e sugestões de melhoria.
Tabela 1
Críticas em relação a aplicação de fórmulas de readability nas pesquisas contábeis e possíveis soluções
Críticas Porquê das críticas Possíveis soluções
(i) As fórmulas de readability reduzem um conceito complexo a duas variáveis: comprimento das frases e dificuldade das palavras.
• Fórmulas baseadas no comprimento das frases admitem que frases maiores são mais difíceis de serem entendidas. Ao não captar outras características do texto, essa suposição é questionada quando aplicada a comunicação contábil (Clatworthy & Jones, 2001; Courtis, 2004; Loughran & McDonald, 2016; Rutherford, 2018; Stone & Parker, 2013).
• A dificuldade das palavras baseada em sílabas é uma medida inadequada quando aplicada em documentos para adultos (Courtis, 2004; Giles, 1990), visto que, a maioria das palavras multissilábicas em documentos financeiros são fáceis de serem lidas (Loughran & McDonald, 2016).
• O comprimento da frase deve estar presente nas fórmulas de readability, mas não ser sua principal medida. O manual da SEC de 1998 orienta empregar, como item complementar, frases curtas sempre que possível. • Palavras complexas podem ser
identificadas por frequência de uso. Listas de palavras específicas adaptadas ao ramo de negócio auxiliam esse objetivo. Por exemplo, Loughran e McDonald (2011) desenvolvem uma lista de palavras próprias para as narrativas contábeis.
(ii) As fórmulas de
readability devem ser • A literatura enfatiza a importância de procedimentos para identificar as
• Loughran e McDonald (2016) e Rennekamp (2012) defendem a
adaptadas ao contexto
estudado. nuances do contexto estudado. Por exemplo, terminologias próprias dos setores (Loughran & McDonald, 2016) ou mudanças na prática da comunicação contábil oriundas de exigências regulatórias (Stone & Parker, 2013) podem reduzir a relevância das fórmulas de readability.
aplicação de medidas mais precisas de readability.
• Medidas alternativas devem incluir sempre que possíveis: lista de palavras próprias, terminologia financeira, palavras comuns, palavras concretas e voz ativa (Miller, 2010; Securities and Exchange Commission, 1998). (iii) As fórmulas foram
prioritariamente desenvolvidas para a escrita em inglês.
• O uso das fórmulas tradicionais é direcionado para escrita em inglês, o que limita sua aplicabilidade (Curto, 2014). • A forma como as empresas se
comunicam com os investidores está relacionada as diferenças linguísticas entre os países (F. Li, 2010), assim, as fórmulas devem incorporar, mesmo que indiretamente, essas diferenças.
• As fórmulas tradicionais devem ser adaptadas ao idioma pesquisado e modificadas para a área de estudo. • As diretrizes da SEC de 1998 foram
desenvolvidas para o inglês, porém a utilização das sugestões não deve ser restrita a tal idioma. Como as sugestões da SEC passaram por um escrutínio de profissionais de linguística e suas recomendações foram incorporadas em fórmulas testadas na pesquisa contábil, argumenta-se que é possível utilizar as recomendações para outros idiomas, para adaptar as fórmulas de readability. Outra alternativa seria utilizar ferramentas computacionais próprias da disciplina de linguística para adaptar e/ou elaborar fórmulas de readability. (iv) As fórmulas de readability não consideram elementos como gráficos, fotografias e tabelas.
• Ao desconsiderar elementos de cunho visual, as fórmulas de readability deixam de medir a complexidade da informação em sua totalidade (Meyer, 2003; Stone & Parker, 2013).
• As imagens contidas nas narrativas contábeis representam material visual passível de análise. A quantidade de tabelas, por exemplo, é uma medida complementar de readability (Miller, 2010; Richards & van Staden, 2015). Nota: a principal iniciativa para uma escrita menos complexa é o Plain English Handbook da Securities and Exchange Commission (1998). Com foco nos prospectos elaborados pelas empresas, as regras de inglês simples 421(b) e 421(d) apresentadas no manual defendem escolhas linguísticas e de formatação como medida de melhoria da qualidade textual. Especificamente, as sugestões linguísticas foram percebidas como os atributos que proporcionam melhor diálogo entre a empresa e os investidores (Securities and Exchange Commission, 2007).
Mesmo com as críticas apresentadas na Tabela 1, a utilização de fórmulas de readability não deve ser abandonada nem desencorajada (Bayerlein & Davidson, 2012; Stone & Parker, 2013), e sim redefinida (Loughran & McDonald, 2016; Rutherford, 2016b; Securities and Exchange Commission, 1998). Os índices de readability não são um “selo de aprovação” para escrita (Bogert, 1985), mas, sim, auxiliares na identificação de elementos que prejudicam a leitura. Ademais, as críticas são acentuadas em pesquisas que tentam determinar um nível absoluto de leitura por meio de uma nota para a compreensão de um texto (Richards & van Staden, 2015). Quando a readability é utilizada para fins comparativos entre relatórios, como é
o caso deste estudo, as críticas supracitadas não apresentam limitações materiais (Richards & van Staden, 2015).
As pesquisas contábeis tentam contornar as críticas desenvolvendo novas métricas de readability ou propondo melhorias nas fórmulas tradicionais (Tabela 2).
Tabela 2
Estudos anteriores que desenvolveram medidas ou adaptaram fórmulas tradicionais de readability para o contexto da pesquisa contábil
Autores Amostra Medidas de readability
Brochet, Naranjo e Yu (2016)
A amostra multipaíses contém as transcrições em inglês de teleconferências dos resultados, para empresas não americanas. Os dados foram coletados na base Thomson StreetEvents. Demais dados foram coletados nas bases I/B/E/S, Capital IQ e Global Datastream Index, para o período de 2002-2010.
Proposta
• Non-Plain English. É uma medida composta e padronizada para as falas transcritas das respostas da gerência, durante a seção “perguntas e respostas” das teleconferências. A medida é calculada com base (1) no comprimento médio da sentença; (2) no comprimento médio das palavras; (3) no uso da voz passiva; (4) nos pronomes pessoais; (5) nas frases negativas; (6) nas palavras supérfluas; e (7) na palavra "respectivamente"; • Linguistic Erros. É uma medida composta e padronizada
para as falas transcritas das respostas da gerência, durante a seção “perguntas e respostas” das teleconferências. A medida é calculada com base (1) no número de erros gramaticais sinalizados pelo Microsoft Word; (2) no uso da voz passiva; e (3) no uso anormal do artigo "o".
Complementar
• Índice Fog;
• Logaritmo do número de palavras da seção “perguntas e respostas” das teleconferências.
Kim et al. (2019)
A amostra é composta por relatórios 10-K depositados na base de dados EDGAR. Demais dados foram obtidos nas bases CRSP-COMPUSTAT, para o período de 1994-2014.
Proposta
• MODFOG. Esta variável modifica a fórmula original Fog. Para captar a readability no contexto financeiro versus o contexto geral, os autores identificam uma lista própria de 2.028 palavras que excedem três sílabas, mas que não são difíceis de entender no contexto financeiro, e as reclassificam como palavras simples para o cálculo da variável MODFOG;
• MODFLESCH. Esta variável modifica a fórmula original Flesch. A operacionalização segue a explicada para a variável MODFOG.
Complementar
• Logaritmo natural do número total de palavras do relatório 10-K;
• Logaritmo natural do tamanho do arquivo (em megabytes) do relatório 10-K;
• Índice Fog. Loughran e
McDonald (2014)
A amostra com dados entre 1994- 2009 contém todos os formulários de prospectos com 1.000 palavras ou mais. Também foram coletados os registros de Ofertas Públicas de Ações disponíveis no
sistema EDGAR.
Adicionalmente, as informações
Proposta
• Plain English. É calculada como a soma de seis componentes padronizados (média 0 e desvio-padrão 1). Para a fórmula, todos os componentes, exceto os pronomes pessoais, são negativamente assinados no somatório. Os seis componentes são:
• Média de palavras por frase (total de palavras / total de frases)
para os registros 10-K foram coletadas na base de dados EDGAR.
• Comprimento médio da palavra (total de caracteres / total de palavras)
• Porcentagem de verbos passivos (contagem de verbos em voz passiva em relação ao total de palavras)
• Porcentagem de palavras legais (contagem de palavras legais, com base na lista elaborada por Loughran e McDonald (2011), em relação ao total de palavras)
• Porcentagem de pronomes pessoais (contagem de pronomes pessoais de primeira pessoa do plural e da segunda pessoa do singular em relação ao total de palavras)
• Porcentagem de outros (contagem de categorias cuja frequência de ocorrência é relativamente baixa, o que inclui frases negativas, palavras supérfluas e o uso da palavra “respectivamente”, em relação ao total de palavras)
Complementar
• Logaritmo natural do número total de palavras do relatório 10-K.
Malaquias e
Silveira (2019) A amostra contém 46 empresas listadas no Índice Brasil 50 com dados disponíveis para o exercício do ano de 2017.
Proposta
• P_PORT index. É uma medida que considera uma ponderação pela quantidade de sentenças, para captar a quantidade de problemas linguísticos frente ao tamanho do relatório. A fórmula é calculada como: [(#anáforas + #catáforas + #vocabulário + #estrutura)*100] / #sentenças
Miller (2010) A amostra contém todos os arquivos 10-K e 10-K405 da base de dados EDGAR. Dados adicionais foram coletados nas bases I/B/E/S e CRSP- COMPUSTAT, para o período de 1994-2006.
Proposta
• READ_PE. É uma medida multidimensional de readability com base no manual da SEC de 1998. A fórmula é calculada como: 10*[(verbos passivos + verbos ocultos + uso excessivo de palavras qualificadoras + palavras jurídicas e jargão + tautologias) / número de frases];
• WORDS+TABLE. É o logaritmo natural do número de palavras adicionado ao número de células das tabelas contidas no relatório 10-K.
Complementar
• Índice Fog;
• Logaritmo natural do número de palavras incluídas no relatório 10-K.
Moreno e
Casasola (2015) A amostra é composta por duas empresas que foram analisadas de forma longitudinal. Ao todo foram analisadas 81 mensagens do presidente da Compañía Española de Petróleos S.A., para o período de 1930-2012 e 59 relatórios gerenciais da El Alcázar, para o período de 1928- 1992.
Proposta
• FREF. A fórmula original de Flesch foi adaptada para ser aplicada aos textos redigidos em espanhol. Para adaptar a fórmula foi empregada a metodologia proposta por Fernández Huerta (1959). Esse procedimento resultou na seguinte equação: 206,84 – (0,6*número de sílabas por 100 palavras) – (1,02*número médio de palavras por frase).
Nota: a relatório 10-K é um documento anual emitido pelas empresas por exigência da SEC. A fórmula Fog é calculada como: 0,4*(número médio de palavras por frases + porcentagem de palavras de três ou mais sílabas). A fórmula Flesch é calculada como: 206, 835 − (1,015*número de palavras dividido pelo número de frases − 84, 6*número de sílabas dividido pelo número de palavras).
Miller (2010) utiliza sugestões do Plain English Handbook para desenvolver uma métrica de readability do relatório 10-K. Suas evidências são consistentes com o entendimento de que relatórios complexos acarretam um aumento do custo do processamento da informação. Este estudo foi pioneiro, ao propor uma fórmula para medir a readability própria para o ambiente contábil.
Loughran e McDonald (2014) analisam o impacto das sugestões contidas no Plain English Handbook na melhoria da readability do relatório 10-K. Seus resultados mostram que, após as sugestões da SEC, (1) as empresas têm maior probabilidade de melhorar os componentes estilísticos dos prospectos dos relatórios e (2) as empresas com melhores práticas de governança corporativa são mais propensas a cumprir as sugestões da SEC. Coletivamente os achados indicam que as sugestões para uma escrita simplificada é benéfica para o ambiente informacional, porque tanto os preparadores quanto os usuários da informação consideram, pelo menos em algum grau, a readability.
As características da linguagem dos países foram consideradas na pesquisa sobre readability. Brochet et al. (2016) analisam a complexidade textual das transcrições para o inglês de teleconferências dos resultados de empresas não americanas. Seus achados mostram que uma barreira de idioma afeta a capacidade de os preparadores da informação se comunicarem com os investidores. A complexidade textual reduz o nível de relevância da informação por retardar a reação em que esta é incorporada no preço das ações. Este estudo é relevante por propor uma medida composta dos padrões de fala da teleconferência dos resultados, porém a análise é limitada ao inglês.
Em nível nacional, Malaquias e Silveira (2019) propõem uma medida baseada em aspectos linguísticos para avaliar a readability4 dos Relatórios da Administração. Seus
resultados indicam que empresas com relatórios maiores apresentam menor readability. Mesmo sendo relevante para o cenário nacional, por ser uma das primeiras pesquisas a elaborar uma medida de readability própria para o contexto estudado, algumas ressalvas devem ser feitas. Primeiro, há uma exclusão arbitrária de 3 relatórios. Segundo, suas conclusões são baseadas em estatísticas univariadas. Terceiro, a ausência de comparação com outras variáveis de readability impedem a validade de sua medida proposta. Por fim, a ausência de testes adicionais e a apresentação completa das medidas de associação prejudicam a confiabilidade de sua medida.
A adaptação de fórmulas tradicionais de readability ao contexto contábil é alternativa válida, a julgar que essas fórmulas advêm de disciplinas próprias de análise. Nesta seara, Moreno e Casasola (2015) estudam a evolução da readability da mensagem do presidente, escrita em espanhol, de duas empresas aplicando uma versão adaptada da fórmula de Flesch. Os resultados indicam que os relatórios apresentam baixa readability, mas mostram uma melhoria ao longo dos anos.
Ao associarem a readability do relatório 10-K e o crash do preço das ações, Kim et al. (2019) modificam o conceito de dificuldade das palavras, introduzindo lista própria do contexto pesquisado. Os autores, então, modificam a fórmula Fog e Flesch, cujos achados revelam que relatórios mais complexos estão associados a um maior risco de crash do preço das ações.
2.2.2 Relação entre readability dos relatórios e resultado das empresas
A relação entre readability e resultado pode ser apresentada por duas vertentes – a perspectiva do preparador e a perspectiva do usuário da informação: pela primeira, busca-se identificar se os relatórios têm suas características textuais modificadas de acordo com a direção do resultado das empresas; já a segunda procura verificar se a complexidade textual dos relatórios modifica a percepção do usuário da informação.
Pela perspectiva do preparador, argumenta-se que este pode utilizar mecanismos sutis, para influenciar o comportamento dos investidores. Em um contexto de relatórios, mudanças na readability podem ser utilizadas para sinalizar (ofuscar) resultados positivos (negativos) (Dempsey et al., 2012; Hassan et al., 2018; Li, 2008; Lo et al., 2017; Souza et al., 2019). O argumento é que as empresas tendem a apontar ativamente o “bom” resultado, ao passo que buscam ofuscar o resultado “ruim” (Bloomfield, 2002, 2008; Li, 2008; Rutherford, 2003; Smith & Taffler, 1992b). Em ambos os casos, pressupõe-se que os gestores, na função de preparadores, são parciais, apresentando relatórios modificados.
A informação com ênfase nos resultados positivos tenta superar assimetrias informacionais e reduzir o custo de capital, culminando em melhoria do resultado das ações da empresa (Baginski, Hassell, & Hillison, 2000). Hsieh, Hui e Zhang (2016) argumentam que o mercado reage positivamente à melhor readability, porque relatórios menos complexos diminuem a incerteza e, por extensão, aumentam os preços das ações. Bowen, Davis e Matsumoto (2005) identificam que os gestores tendem a retratar nos relatórios um resultado
mais favorável à empresa. Para Davis, Piger e Sedor (2012), os relatórios oferecem mecanismos para indicar as expectativas sobre resultados persistentes. Em alternativa, ao ofuscar a informação, pretende-se confundir ou distrair os usuários (Courtis, 2004), manipulando sua percepção sobre os relatórios (Clatworthy & Jones, 2001), a fim de retardar a reação de notícias ruins nos preços das ações (Bloomfiled, 2008).
Por uma perspectiva do usuário da informação, argumenta-se que a facilidade de processamento de informação afeta na tomada de decisão. Assim, os investidores preferem documentos mais informativos, visto que, por não conseguirem avaliar as informações de maneira imparcial e tempestiva, os usuários não consideraram todos os dados disponíveis na tomada de decisão (Hirshleifer & Teoh, 2003).
A readability dos relatórios é relevante no comportamento dos investidores. Mensagens claras e com maior readability são vitais para ajudar usuários sofisticados ou não sofisticados a entender a empresa (Financial Accounting Standards Board, 2004). Para Libby e Emett (2014), os usuários preferem informações com maior readability e, quando processam informações com pouca readability, discordam de seu conteúdo e evitam sua utilização. Esses argumentos são válidos porque, como a informação é no mínimo revelada no preço das ações, esse reage mais fortemente às estatísticas que são mais fáceis de ser extraídas (Bloomfield, 2002), já que informações difíceis de extrair se tornam custosas aos investidores (Li, 2008). A suposição subjacente por trás desse raciocínio é que, por ser dispendiosa, a análise da informação financeira só leva a análises detalhadas quando o benefício marginal é maior do que o custo marginal da análise posterior (Bloomfield, 2002; Grossman & Stiglitz, 1980).
Uma abordagem para entender as perspectivas supracitadas é identificar a relação bilateral entre readability e resultado. Na Tabela 3, sumarizam-se os estudos empíricos atuais que analisam essa relação.
Tabela 3
Estudos anteriores que investigaram a relação entre resultado e readability
Autores Amostra Principais medidas aplicadas
Dempsey et
al. (2012) Amostra de 183 Fundos de Investimento Imobiliário coletados na base de dados online norte-americana Mergent. Os dados financeiros foram coletados nas bases de dados CRSP-COMPUSTAT e SNL, para o período de 1994-2007.
• Medida de readability Flesch-Kincaid. • Medida de resultado Roa modificado
= Fundos de operação / ativo total. Hassan et
al. (2018) Amostra de 45 empresas listadas na Qatar Stock Exchange (QSE). Os dados financeiros foram coletados na base de dados COMPUSTAT Global Vantage, nos sites corporativos das empresas e nos relatórios anuais arquivados na QSE, para o período de 2014-2016. • Medidas de readability Flesch; Flesch-Kincaid. • Medida de resultado Roa
= Lucro antes dos itens extraordinários / ativo total.
Li (2008) Os dados financeiros foram obtidos na base de dados CRSP-COMPUSTAT. Os relatórios 10-K foram coletados na base de dados EDGAR da SEC, para o período de 1994-2004.
• Medidas de readability Fog;
Logaritmo natural do número total de palavras;
Variação ano a ano de índice Fog; Variação ano a ano do logaritmo natural do número total de palavras.
• Medidas de resultado Earnings
= Lajir / ativo total; Earnings ± dummy
= 1 se houver aumento de Earnings; Profit / loss
= 1 se Earnings > 0. Lo et al.
(2017) Os dados financeiros foram obtidos na CRSP-COMPUSTAT e as divulgações de Management Discussion and Analysis (MD&A) no sistema EDGAR da SEC, para o período de 2000-2012.