Como Aumentar
a Visibilidade do seu Artigo
Por muitas vezes realizei a atividade de Revisão Sistemática (RS)
e quem já fez sabe a quantidade de publicações que as buscas retornam e como é cansativo todo o processo de seleção. A busca
por palavras-chaves é a primeira etapa na condução de uma RS, além de volátil, é sempre necessário realizar pesquisas avançadas (como uma linguagem de consulta SQL) para melhorar os resultados das buscas em
algumas bases. A acurácia dos trabalhos encontrados em uma RS, em
muitos casos, é medida apenas entre os resultados e não em relação as fases da
condução, por isso preste atenção nos parágrafos seguintes, pois neles estão alguns segredos para aumentar a visibilidade da sua publicação científica.
O processamento de uma pesquisa é realizado de
forma diferente entre as bases mais utilizadas pelos pesquisadores de todo
mundo. Em algumas bases a pesquisa é inferida via metadados e em outras determinados
campos de uma publicação (e.g. abstract, título, tópico e palavras-chaves). A única certeza que você terá
realizando uma busca é:
Nunca poderá pesquisar os mesmos campos em
todas as bases e irá variar os atributos de pesquisa para fazer a mesma
comparação. Assim, você fará uma análise tendenciosa, de forma a assemelhar
os atributos da pesquisa como se tivessem o mesmo significado. Não
acredita ou não entendeu?, keep calm e continue lendo.
A ausência de um mecanismo robusto leva a
oscilação dos resultados. Realizando uma RS, notei os seguintes resultados com o mesmo conjunto de palavras-chaves:
- GoogleScholar 24 artigos;
- IEEEXplore 21;
- Scopus 30;
- Springer 52;
- ScienceDirect 54;
- Compendex 60;
- BibliotecaDigital da ACM 140;
- Web of Science 93;
Alguns resultados foram aceitáveis, levando
em conta uma taxa de erros definida para apontar o quanto as
palavras-chaves poderiam ser bem ou mal definidas para as buscas (percentual de
trabalhos de outras áreas que não são da área que estávamos pesquisando). Já a BibliotecaDigital da ACM, que retornou 140 publicações e a Web of Science, que retornou
93, demonstram que o mecanismo de busca dessas bases desfavorece a busca efetiva
em uma determinada sub-área de conhecimento, pois não é criada uma
correlação semântica entre os termos pesquisados nas palavras-chaves automaticamente como nas outras bases.
Afirmo isso, porque comparando o percentual de erros entre
as bases, relembrando: publicações de outras áreas que não sejam o foco da
pesquisa, temos uma diferença muito grande:
- BibliotecaDigital da ACM (abstract + título) = 26
- Compendex (abstract + título + key) = 12
- Springer (abstract + título + key) = 11
- GoogleScholar (abstract + título) = 6
- IEEEXplore (abstract + título) = 2
- Science Direct (abstract + título + key) = 2
- Scopus (abstract + título + key) = 2
Isso significa que a maior parte do tempo ficamos lendo diversos trabalhos que não são o foco da nossa pesquisa. Analisando
a taxa de erros podemos ver claramente uma variação muito grande entre as
outras bases e a Biblioteca Digital da ACM e Web of Science (e não é por causa da quantidade de documentos indexados):
1)
Scopus
= 49.000.000
2) Web of Science =
46.000.000
3) Science direct = 11.560.155
4) Springer = 6.880.864
5) Compendex = 4.045.554
6) IEEE Xplore = 3.418.720
7)
Google Scholar = 599.000
(2000-2013)
8)
Biblioteca
Digital da ACM = 372.129
A Biblioteca Digital da ACM possui a menor base de
todas, porém se destacou com uma alta taxa de erros, porque a acurácia das
pesquisas não é boa. O mesmo caso da Web of Science, embora essa permita
inserir filtros para calibrar o alvo da pesquisa, ela retorna muitos artigos
de outras áreas que não estão sendo pesquisadas.
Analisando os resultados em uma segunda condução da RS, retirei uma palavra-chave e inclui um filtro no tópico de pesquisa (nas bases que disponiblizaram essa alternativa). Como resultado, as bases com as piores taxas de erro não tiveram uma redução tão significativa com a nova pesquisa de palavras-chaves e filtro no resumo das publicações:
Biblioteca Digital da ACM de 120 para 96 (abstract) e 20 para 17 (título).
Compendex de 60 para 43.
Science Direct de 54 para 13.
Web of Science de 72 para 49 (tópico) e de 21 para 15 (título).
*As outras permanceram com os mesmos resultados!
Na primeira condução da Revisão Sistemática, os filtros reduziram o universo de leitura em média 70% com um desvio padrão de 11,5%, então na segunda condução esparamos ter algo em torno de 70-90 publicações para leitura integral contra 100-120 da anterior. Também com a redução dos estudos duplicados (em torno de 20% na condução anterior), o número total de artigos pode cair para em torno de 50 contra 85.
As conclusões iniciais desse experimento não é sobre a pesquisa em si, chamo atenção para a inexistência de estudos sobre a forma de condução de uma Revisão Sistemática em detalhes. A análise de cada base, incluindo as suas taxas de erros e acertos poderia ajudar na melhoria da arquitetura de busca dessas bases por incitar a competição com outras interfaces de busca melhores. Também, é importante frisar que grande parte dos dados das revisões podem ser tendenciosos, já que o objetivo é reduzir o universo da pesquisa, além de ignorar trabalhos científicos relevantes que não são muitos citados ou encontrados com facilidade. Por isso reitero a importância de ter um bom título em sua publicação, em todas as bases a pesquisa no título do trabalho obteve um grau de precisão muito alto, no caso da Biblioteca Digital da ACM a taxa de erros foi zero!. Isso significa que ao formular as palavras-chaves, definimos uma boa semântica de busca, diretamente no foco da área de pesquisa.
O segredo para definir um bom título para a sua publicação é saber relacionar conceitos e atributos que possam ser encontrados com facilidade pelos mecanismos de buscas menos sofisticados (e.g. “A Study on Exception Detection and Handling using Aspect-oriented Programming”). Provalmente quem irá procurar por estudos sobre tratamento de exceções irá encontrar esse artigo facilmente, por isso ele é um dos mais citados nessa área. No caso desse exemplo, embora o estudo tenha sido realizado com o foco em programação orientada a aspectos, os seus atributos possuem as palavras-chaves: detecção e tratamento, que são conceitos fortes relacionados com os métodos de tratamento de exceção em qualquer área da computação. Claro que a citação do artigo não é definida apenas pelos resultados da busca, ainda é necessário ler todo o trabalho na íntegra para encontrar contribuições relevantes no tema da sua pesquisa. Mas com o universo de busca tão grande, a prioridade de leitura será dos artigos mais citados e se você não facilitar a seleção da sua publicação, dificilmente ela será incluída numa Revisão Sistemática e assim poucos terão acesso a sua pesquisa.
Interessante acréscimo ao processo de visibilidade dos artigos: fale a linguagem dos recursos de busca!
ResponderExcluirLembre-se: para ser visto, a) publique conclusões audaciosas; b)publique em temas que os cientistas querem discutir; c) publique em revistas que os cientistas tenham acesso e considerem interessantes; d) publique em idioma que os cientistas de todo o mundo entendam; e) publique em linguagem que os cientistas de várias áreas entendam; f) publique textos que convençam objetivamente os cientistas.
Este comentário foi removido pelo autor.
ResponderExcluirÉ uma pena que não deixou seu contato, tudo que escreveu é muito relevante!. Obrigado por compartilhar conosco!.
ResponderExcluir