Visibilidade da Pesquisa ~ estudo, pesquisa e inovação

Como Aumentar a Visibilidade do seu Artigo

Por muitas vezes realizei a atividade de Revisão Sistemática (RS) e quem já fez sabe a quantidade de publicações que as buscas retornam e como é cansativo todo o processo de seleção. A busca por palavras-chaves é a primeira etapa na condução de uma RS, além de volátil, é sempre necessário realizar pesquisas avançadas (como uma linguagem de consulta SQL) para melhorar os resultados das buscas em algumas bases. A acurácia dos trabalhos encontrados em uma RS, em muitos casos, é medida apenas entre os resultados e não em relação as fases da condução, por isso preste atenção nos parágrafos seguintes, pois neles estão alguns segredos para aumentar a visibilidade da sua publicação científica.

O processamento de uma pesquisa é realizado de forma diferente entre as bases mais utilizadas pelos pesquisadores de todo mundo. Em algumas bases a pesquisa é inferida via metadados e em outras determinados campos de uma publicação (e.g. abstract, título, tópico e palavras-chaves). A única certeza que você terá realizando uma busca é:

Nunca poderá pesquisar os mesmos campos em todas as bases e irá variar os atributos de pesquisa para fazer a mesma comparação. Assim, você fará uma análise tendenciosa, de forma a assemelhar os atributos da pesquisa como se tivessem o mesmo significado. Não acredita ou não entendeu?, keep calm e continue lendo.

A ausência de um mecanismo robusto leva a oscilação dos resultados. Realizando uma RS, notei os seguintes resultados com o mesmo conjunto de palavras-chaves:

Alguns resultados foram aceitáveis, levando em conta uma taxa de erros definida para apontar o quanto as palavras-chaves poderiam ser bem ou mal definidas para as buscas (percentual de trabalhos de outras áreas que não são da área que estávamos pesquisando). Já a BibliotecaDigital da ACM, que retornou 140 publicações e a Web of Science, que retornou 93, demonstram que o mecanismo de busca dessas bases desfavorece a busca efetiva em uma determinada sub-área de conhecimento, pois não é criada uma correlação semântica entre os termos pesquisados nas palavras-chaves automaticamente como nas outras bases.

Afirmo isso, porque comparando o percentual de erros entre as bases, relembrando: publicações de outras áreas que não sejam o foco da pesquisa, temos uma diferença muito grande:

BibliotecaDigital da ACM (abstract + título) = 26
Compendex (abstract + título + key) = 12
Springer (abstract + título + key) = 11
GoogleScholar (abstract + título) = 6
IEEEXplore (abstract + título) = 2
Science Direct (abstract + título + key) = 2
Scopus (abstract + título + key) = 2

Isso significa que a maior parte do tempo ficamos lendo diversos trabalhos que não são o foco da nossa pesquisa. Analisando a taxa de erros podemos ver claramente uma variação muito grande entre as outras bases e a Biblioteca Digital da ACM e Web of Science (e não é por causa da quantidade de documentos indexados):

1) Scopus = 49.000.000

2) Web of Science = 46.000.000

3) Science direct = 11.560.155

4) Springer = 6.880.864

5) Compendex = 4.045.554

6) IEEE Xplore = 3.418.720

7) Google Scholar = 599.000 (2000-2013)

8) Biblioteca Digital da ACM = 372.129

A Biblioteca Digital da ACM possui a menor base de todas, porém se destacou com uma alta taxa de erros, porque a acurácia das pesquisas não é boa. O mesmo caso da Web of Science, embora essa permita inserir filtros para calibrar o alvo da pesquisa, ela retorna muitos artigos de outras áreas que não estão sendo pesquisadas.

Analisando os resultados em uma segunda condução da RS, retirei uma palavra-chave e inclui um filtro no tópico de pesquisa (nas bases que disponiblizaram essa alternativa). Como resultado, as bases com as piores taxas de erro não tiveram uma redução tão significativa com a nova pesquisa de palavras-chaves e filtro no resumo das publicações:

Biblioteca Digital da ACM de 120 para 96 (abstract) e 20 para 17 (título).

```
Compendex de 60 para 43.
```
```
Science Direct de 54 para 13.
```

Web of Science de 72 para 49 (tópico) e de 21 para 15 (título).

*As outras permanceram com os mesmos resultados!

Na primeira condução da Revisão Sistemática, os filtros reduziram o universo de leitura em média 70% com um desvio padrão de 11,5%, então na segunda condução esparamos ter algo em torno de 70-90 publicações para leitura integral contra 100-120 da anterior. Também com a redução dos estudos duplicados (em torno de 20% na condução anterior), o número total de artigos pode cair para em torno de 50 contra 85.

As conclusões iniciais desse experimento não é sobre a pesquisa em si, chamo atenção para a inexistência de estudos sobre a forma de condução de uma Revisão Sistemática em detalhes. A análise de cada base, incluindo as suas taxas de erros e acertos poderia ajudar na melhoria da arquitetura de busca dessas bases por incitar a competição com outras interfaces de busca melhores. Também, é importante frisar que grande parte dos dados das revisões podem ser tendenciosos, já que o objetivo é reduzir o universo da pesquisa, além de ignorar trabalhos científicos relevantes que não são muitos citados ou encontrados com facilidade. Por isso reitero a importância de ter um bom título em sua publicação, em todas as bases a pesquisa no título do trabalho obteve um grau de precisão muito alto, no caso da Biblioteca Digital da ACM a taxa de erros foi zero!. Isso significa que ao formular as palavras-chaves, definimos uma boa semântica de busca, diretamente no foco da área de pesquisa.

O segredo para definir um bom título para a sua publicação é saber relacionar conceitos e atributos que possam ser encontrados com facilidade pelos mecanismos de buscas menos sofisticados (e.g. “A Study on Exception Detection and Handling using Aspect-oriented Programming”). Provalmente quem irá procurar por estudos sobre tratamento de exceções irá encontrar esse artigo facilmente, por isso ele é um dos mais citados nessa área. No caso desse exemplo, embora o estudo tenha sido realizado com o foco em programação orientada a aspectos, os seus atributos possuem as palavras-chaves: detecção e tratamento, que são conceitos fortes relacionados com os métodos de tratamento de exceção em qualquer área da computação. Claro que a citação do artigo não é definida apenas pelos resultados da busca, ainda é necessário ler todo o trabalho na íntegra para encontrar contribuições relevantes no tema da sua pesquisa. Mas com o universo de busca tão grande, a prioridade de leitura será dos artigos mais citados e se você não facilitar a seleção da sua publicação, dificilmente ela será incluída numa Revisão Sistemática e assim poucos terão acesso a sua pesquisa.

Follow @jaguaracisilva

3 comentários:

Gilson Volpato9 de março de 2013 às 08:47
Interessante acréscimo ao processo de visibilidade dos artigos: fale a linguagem dos recursos de busca!

Lembre-se: para ser visto, a) publique conclusões audaciosas; b)publique em temas que os cientistas querem discutir; c) publique em revistas que os cientistas tenham acesso e considerem interessantes; d) publique em idioma que os cientistas de todo o mundo entendam; e) publique em linguagem que os cientistas de várias áreas entendam; f) publique textos que convençam objetivamente os cientistas.
ResponderExcluir
Respostas
Jaguaraci Silva9 de março de 2013 às 13:35
Este comentário foi removido pelo autor.
ResponderExcluir
Respostas
Jaguaraci Silva9 de março de 2013 às 13:38
É uma pena que não deixou seu contato, tudo que escreveu é muito relevante!. Obrigado por compartilhar conosco!.
ResponderExcluir
Respostas

Adicionar comentário

estudo, pesquisa e inovação

sexta-feira, 8 de março de 2013

Visibilidade da Pesquisa

3 comentários:

Inscreva-se

Arquivo do blog

Mais vistos

Teste a Velocidade da Internet

Siga-me

Curta