CriticGPT é uma nova ferramenta de IA da OpenAI para encontrar bugs e erros no ChatGPT; novidade pode ajudar no treinamento do chatbot por humanos
OpenAI lança ferramenta para corrigir erros do ChatGPT chamado CriticGPT, treinado com base no GPT-4 e usado para corrigir possíveis bugs em respostas do ChatGPT sobre programação. Conforme a empresa, pessoas que usam a ferramenta notam melhorias em 60% dos casos.
A OpenAI criou a ferramenta para refinar os processos de revisão das respostas do ChatGPT, informando que o chatbot se torna mais preciso ao longo do tempo, com erros mais sutis, o que pode dificultar a vida dos profissionais que analisam imprecisões na plataforma. A solução, então, foi treinar o CriticGPT para escrever críticas que destaquem vulnerabilidades nas respostas, incluindo bugs que passam despercebidos pelos humanos.
A empresa quer integrar modelos similares à novidade nos sistemas de Aprendizado de Reforço por Feedback Humano (RLHF, na sigla em inglês), que usam o treinamento de profissionais para encontrar possíveis erros e comparar respostas do chatbot.
Os resultados colhidos pela empresa revelam que o CriticGPT não acerta em todas as sugestões, mas os treinadores têm desempenho melhor com a ferramenta em comparação com aqueles que não a usam. Os insights oferecidos pela IA ajudam a criar críticas mais compreensíveis e reduzem os riscos de bugs por alucinação da tecnologia (processo quando a IA cria fatos inexistentes ou imprecisos).
Limitações
A ferramenta pode servir para detectar bugs, mas a desenvolvedora ainda aponta algumas limitações:
- O CriticGPT é treinado apenas em respostas curtas do ChatGPT, então ainda precisa de aprimoramentos para compreender pedidos mais longos;
- Os modelos ainda podem causar alucinações e dificultar o trabalho dos treinadores da IA;
- A ferramenta pode corrigir um erro individual num código, mas pode deixar passar outros problemas dentro da própria resposta;
- O CriticGPT tem dificuldade para ajudar em tarefas muito complexas, até mesmo com a supervisão de especialistas.
- Inicialmente, a ferramenta está disponível apenas para quem trabalha com o treinamento das ferramentas de IA. E por falar em OpenAI, o CEO Sam Altman comentou recentemente que o sucessor do GPT-4, já em desenvolvimento, trará um “salto significativo” em comparação ao modelo atual.
Fonte: André Lourenti Magalhães Siga FebelTech no Google Noticias.