A Marinha dos Estados Unidos (US Navy) está desenvolvendo um banco de dados que visa alcançar ao menos 350 bilhões de posts em mídias sociais ao longo do mundo, para compreender como as pessoas se comunicam no mundo virtual.

A equipe do projeto não especificou qual plataforma virtual será utilizada para a coleção de dados, mas indicou que só irão catalogar os posts públicos (de perfis abertos, sem restrição de privacidade), postados entre 2014 e 2016. O projeto irá envolver ao menos 100 países diferentes, contando com uma base de 60 idiomas.

Algumas regras sobre a proposta foram reveladas por meio de um texto da Escola Naval de Pós-graduação (Naval Postgraduate School) e nele consta que: os posts analisados virão de 200 milhões de usuários e, dentre eles, serão analisados no máximo 30% de dados de um mesmo país. Metade dos dados (50%) devem estar em outros idiomas que não a língua inglesa e, no mínimo, 20% dos posts analisados devem conter a localização geográfica. A Marinha garantiu que mensagens privadas e informações de contato não farão parte da base de dados.

Segundo o principal pesquisador do projeto, T. Camber Warren, o objetivo da pesquisa é analisar como a comunicação, seja por expressões idiomáticas ou por gírias, evoluem com o passar dos anos nas diversas sociedades humanas. Warren também afirmou que a partir desse estudo será possível compreender como e por quê as comunidades são formadas a partir de certas narrativas específicas e como isso influencia os movimentos sociais e as populações dos países.