Código Google: Como usar o TensorFlow 2 para o processamento de linguagem natural de última geração

Como usar o TensorFlow 2 para o processamento de linguagem natural de última geração

11/11/2019

code { background-color: transparent }Hugging Face: processamento de linguagem natural de última geração em dez linhas do TensorFlow 2.0A Hugging Face é a startup líder em PLN com mais de mil empresas, incluindo Bing, Apple e Monzo, usando a biblioteca da organização em processos de produção. Todos os exemplos usados neste tutorial estão disponíveis no Colab. Encontre os links nas seções correspondentes.

IntroduçãoA Hugging Face é uma startup focada no PLN e tem uma grande comunidade que trabalha em código aberto, usando especialmente a biblioteca Transformers. A 🤗/Transformers é uma biblioteca baseada em python que expõe uma API para o uso de diversas arquiteturas de transformação conhecidas, como BERT, RoBERTa, GPT-2 ou DistilBERT. Esses recursos geram resultados de ponta em diferentes tarefas do PLN, como classificação de texto, extração de informações, resposta a perguntas e geração de texto. Essas arquiteturas são pré-treinadas com vários conjuntos de pesos. Para dar os primeiros passos com a Transformers, você só precisa instalar o pacote pip:pip install transformersA biblioteca teve um crescimento veloz no PyTorch e foi portada recentemente para o TensorFlow 2.0, oferecendo uma API que funciona com a API fit do Keras, o TensorFlow Extended e TPUs 👏. Esta postagem do blog é dedicada ao uso da biblioteca Transformers com o TensorFlow. Com a API do Keras e o TPUStrategy do TensorFlow, é possível ajustar um modelo de transformação de última geração.Biblioteca e filosofiaA Transformers é baseada no conceito de modelos de transformação pré-treinados. Esses modelos de transformação têm diferentes formas, tamanhos e arquiteturas e incluem maneiras próprias de aceitar dados de entrada: via tokenização.A biblioteca é baseada em três classes principais: configuração, tokenização e modelo.

Classe de configuração: a classe de configuração hospeda informações relevantes sobre o modelo que usaremos, como o número de camadas e de cabeçalhos de atenção. Veja abaixo um exemplo de um arquivo de configuração BERT para os pesos pré-treinados com base em bert. As classes de configuração hospedam esses atributos com vários métodos de E/S e propriedades de nome padronizadas.

<a href="https://medium.com/media/fbc4e947327509f8a10f2c46002020e0/href">https://medium.com/media/fbc4e947327509f8a10f2c46002020e0/href</a>

Classe de tokenização: a classe de tokenização gerencia a conversão da string python em matrizes ou tensores de números inteiros que são índices no vocabulário do modelo. A classe possui muitos recursos úteis que envolvem a tokenização de uma string em tokens. Essa tokenização varia de acordo com o modelo. Por isso, cada um deles possui o próprio tokenizador.

Classe de modelo: a classe de modelo mantém a própria lógica de modelagem da rede neural. O modelo do TensorFlow é herdado de tf.keras.layers.Layer, o que significa que ele pode ser usado com facilidade pela API fit do Keras ou treinado usando um loop de treinamento personalizado e o GradientTape.

Tecnologia simplificadaA vantagem da biblioteca Transformers está no uso de uma API simples e independente de modelo. O carregamento de um modelo pré-treinado, junto com o tokenizador, pode ser feito usando algumas linhas de código. Veja um exemplo de carregamento de modelos BERT e GPT-2 do TensorFlow, bem como os tokenizadores relacionados:<a href="https://medium.com/media/7ab04fc38cbf2651152aa50b17df00b7/href">https://medium.com/media/7ab04fc38cbf2651152aa50b17df00b7/href</a>Os pesos são transferidos por download do intervalo S3 da Hugging Face e armazenados em cache localmente na sua máquina. Os modelos estão prontos para inferências ou podem ser ajustados, se necessário. Vejamos como isso funciona na prática.Ajuste de um modelo da TransformerGraças a alguns métodos disponíveis na biblioteca Transformer, ficou mais fácil ajustar um modelo. As partes a seguir são criadas da seguinte forma:

Carregamento e pré-processamento de dados de texto

Definição de hiperparâmetros

Treinamento (com Keras em CPU/GPU e TPUStrategy)

Criação de um canal de entradaCriamos um notebook do Colab para ajudar você com o processo de codificação. Aproveitaremos o pacote tensorflow_datasets para o carregamento de dados. O Tensorflow-dataset oferece um tf.data.Dataset, que pode ser alimentado no nosso método glue_convert_examples_to_features.Esse método utilizará o tokenizador para tokenizar a entrada e adicionar tokens especiais no início e no final das sequências, caso eles sejam exigidos pelo modelo (como [SEP], [CLS], </s> ou <s>, por exemplo). Isso retornará um tf.data.Dataset contendo as entradas com recursos.Em seguida, podemos usar uma ordem aleatória desse conjunto de dados e agrupá-lo em lotes de 32 unidades usando os métodos padrão tf.data.Dataset.<a href="https://medium.com/media/fda0e93b3a54edfc85ee81b1b5d75857/href">https://medium.com/media/fda0e93b3a54edfc85ee81b1b5d75857/href</a>Treinamento com o método fit do KerasTreinar um modelo usando o método fit do Keras nunca foi tão simples. Agora que temos a configuração do canal de entrada, podemos definir os hiperparâmetros e chamar o método fit do Keras com nosso conjunto de dados.<a href="https://medium.com/media/c4c1e4f63aacf71e0863c56f4aabd79e/href">https://medium.com/media/c4c1e4f63aacf71e0863c56f4aabd79e/href</a>Treinamento com estratégiaUsar uma estratégia oferece a você um controle maior sobre o que acontece durante o treinamento. Ao alternar entre estratégias, o usuário pode selecionar a forma distribuída usada para treinar o modelo: de várias GPUs a TPUs.Até o momento, o TPUStrategy é a única maneira certeira de treinar um modelo em uma TPU usando o TensorFlow 2. Criar um loop personalizado usando uma estratégia é ainda mais útil, já que as estratégias podem ser facilmente alternadas, e o treinamento em várias GPUs não exige quase mudanças no código.A configuração desse loop é um pouco trabalhosa. Por isso, aconselhamos você a abrir o notebook do Colab a seguir para ter uma melhor compreensão do assunto em questão. Você não encontrará detalhes sobre a tokenização como na primeira edição, mas verá como criar um canal de entrada que será usado pelo TPUStrategy.O recurso usa o intervalo do Google Cloud Platform para hospedar dados, devido à complexidade do gerenciamento de TPUs em sistemas de arquivos locais. O notebook do Codelab está disponível aqui.A Transformers agora tem acesso às APIs do TensorFlow. Mas, por que isso é importante?A principal vantagem da biblioteca Transformers é seu modelo de API simples e independente. Ao atuar como um front-end para modelos que geram resultados avançados em PLN, ela facilita muito a alternância entre modelos de acordo com a tarefa em questão.Como exemplo, veja o script completo para ajustar BERT em uma tarefa de classificação idiomática (MRPC):<a href="https://medium.com/media/33ad175ce13adda7617db781867a3373/href">https://medium.com/media/33ad175ce13adda7617db781867a3373/href</a>No entanto, em um ambiente de produção, a memória é escassa. Você poderia usar um modelo menor e mudar para DistilBERT, por exemplo. Para isso, basta alterar as duas primeiras linhas para as novas opções:<a href="https://medium.com/media/772c31c23c14727b116b2354e8a8c3f9/href">https://medium.com/media/772c31c23c14727b116b2354e8a8c3f9/href</a>Como uma plataforma que hospeda mais de 10 arquiteturas de transformação, a 🤗/Transformers facilita o uso, o ajuste e a comparação dos modelos que transfiguraram o aprendizado detalhado para o campo do PLN. O recurso funciona como back-end para muitos aplicativos descendentes que utilizam modelos de transformação e é usado nos processos de produção em diversas empresas diferentes. Se você tiver perguntas ou questões, use nosso repositório do GitHub.

Um comentário :

Ehsaas Program 8171 BISP disse...: Thank you for making this easy to understand. Best Government Programs in Pakistan Great work!; 6 de março de 2025 às 10:06

Postar um comentário

Como usar o TensorFlow 2 para o processamento de linguagem natural de última geração

Um comentário :

Labels

Archive

Feed