Código Google: Apresentação do kit de ferramentas de otimização de modelo do TensorFlow

Apresentação do kit de ferramentas de otimização de modelo do TensorFlow

05/10/2018

aqui

Otimize modelos para reduzir tamanho, latência e consumo de energia com perda de precisão insignificante

Ativação da quantização pós-treinamento<a href="https://medium.com/media/9e358f0041b185aea2b9f26c1fd4b4de/href">https://medium.com/media/9e358f0041b185aea2b9f26c1fd4b4de/href</a>tutorial Benefícios da quantização pós-treinamento

Redução de 4x no tamanho dos modelos

A execução de modelos, compostos principalmente de camadas convolucionais, fica 10% a 50% mais rápida

Modelos baseados em RNN ganham até 3x mais velocidade

Com os requisitos reduzidos de memória e computação, também esperamos que a maioria os modelos consuma menos energia

Figura 1: Comparação de tamanho dos modelos: os otimizados são praticamente 4x menores

Figura 2: Comparação de latência: modelos otimizados são de 1,2 a 1,4x mais rápidos

modelos totalmente quantizados

Figura 3: Comparação de precisão: modelos otimizados apresentam queda insignificante de precisão, exceto os mobilenet

otimização de modelos Como a quantização pós-treinamento funciona?quantização pós-treinamentoquantização pós-treinamento Trabalho futuroGitHubStack OverflowAgradecimentosGostaríamos de agradecer a Raghu Krishnamoorthi, Raziel Alvrarez, Suharsh Sivakumar, Yunlu Li, Alan Chiao, Pete Warden, Shashi Shekhar, Sarah Sirajuddin e Tim Davis pelas contribuições essenciais. Mark Daoust ajudou a criar o tutorial de colaboração. Billy Lamberta e Lawrence Chan ajudaram na criação do site.

Nenhum comentário :

Postar um comentário

Apresentação do kit de ferramentas de otimização de modelo do TensorFlow

Nenhum comentário :

Labels

Archive

Feed