Tudo onde a ficção nos pode levar fica aquém da realidade que nos espera até ao final deste século; onde todo o desenvolvimento da Inteligência Artificial (IA) irá depender, em grande parte, das máquinas que os humanos vão construir.
A IA, que de início irá contribuir para a nossa sobrevivência, pode no futuro levar a espécie humana à total extinção.
O desenvolvimento da IA dependerá dos seus criadores humanos, mas sobretudo da aprendizagem das próprias máquinas, pois de certa forma serão elas que precisam de aprender; e se a melhor forma de o conseguirem é através dos nossos erros, então as máquinas estão no caminho certo para que no futuro tenham o domínio total sobre os seus criadores.
Um novo algoritmo permite que a IA aprenda com os seus próprios erros, como os seres humanos o fazem.
Este avanço acontece graças a um novo código aberto chamado ‘Hindsight Experience Replay’- HER, desenvolvido por investigadores da empresa ‘Open AI’ nos Estados Unidos da América, onde nos últimos meses os cientistas se têm concentrado no desenvolvimento de um novo processo de aprendizagem.
O algoritmo ajuda um agente de IA a “olhar em retrospetiva”, à medida que completa uma tarefa. E, de acordo com a ‘Open AI’, a máquina passa a interpretar as falhas como sucessos, para chegar ao resultado pretendido de uma função.
Sendo este o princípio da perfeição e o ponto chave da HER, que é algo que os humanos fazem intuitivamente; e mesmo que não tenhamos sucesso num objetivo específico, pelo menos conseguimos algo diferente.
Então, porque não fingir que queremos atingir esse objetivo, em vez de o pretendemos alcançar originalmente? Foi a conclusão a que chegaram os investigadores.
Ao fazer a substituição, o algoritmo de aprendizagem pode obter um sinal de que alcançou o objetivo, mesmo que não fosse essa a intenção. Isso significa, que todas as tentativas falhadas da IA, funcionam como algo não planeado.
Acontece também connosco, quando estamos num processo de aprendizagem. A exemplo, se tentarmos fazer algo pela primeira vez, nunca o conseguimos corretamente; é assim que os seres humanos aprendem e as máquinas também.
A HER da ‘Open AI’ quer a mesma forma de ensino e ao mesmo tempo o método tornar-se-á numa “alternativa ao sistema de recompensas”, envolvido em modelos de reforço de aprendizagem.
Ao tratar cada tentativa como um objetivo a atingir, a HER dá a um agente de IA uma recompensa, mesmo que este não consiga realizar a tarefa; isso ajuda a IA a aprender mais rápido e com maior qualidade.
Em qualquer caso, como as simulações da ‘Open AI’ demonstraram, esta pode ser bastante útil para encorajar os agentes a aprender com os seus próprios erros, levando muito rapidamente a máquina à perfeição.
Numa previsão do autor, apenas serão precisos mais 150 anos (seis gerações) para que a IA tenha o total controle sobre o homem.