Arquivo da tag: Ubuntu 16.04

Desventuras na instalação do TensorFlow com suporte a GPU

A missão: instalar o TensorFlow incluindo suporte a GPU com Cuda

A máquina: Dell Inspiron 15 5557, com NVidia GeForce 930M

A plataforma: Linux Ubuntu Xenial Xerus 16.04

O mapa da mina: Homepage de Setup e Download do Tensor Flow

https://www.tensorflow.org/versions/r0.9/get_started/os_setup.html

O primeiro passo para prover o suporte à GPU seria  a instalação do NVidia Toolkit e do cuDNN.

O site do TensorFlow recomenda a instalação do toolkit versão 7.5 e cuDNN 4.

A instalação do toolkit NVidia foi tranquila, já que os pacotes já estão nos repositórios tradicionais do Xenial Xerus. Portanto, obviamente optei por não compilar o fonte do toolkit.

sudo apt-get install nvidia-cuda-toolkit

Já com o cuDNN é outra história. A versão 5, já disponível no site da NVidia, possui pacotes .DEB para download e instalação (tem que cadastrar uma conta e querem que você responda um questionário… chaaatoooo!)

Já para a versão 4 (requerida pelo TensorFlow segundo o site de configuração e download)  exige download e descompactação em pasta específica, ou seja, mais enjoada.

Feitas estas instalações iniciais, usei os pacotes PIP disponibilizados pelo próprio site de download do TensorFlow, com suporte à GPU.

A instalação PIP transcorre normalmente e, após usa instalação, é possível importar o TensorFlow no Python sem problemas (vida  longa ao PIP!)

Porém, quando executamos o código de teste convolutional.py (veja site acima do TensorFlow), surge o erro: CUDA_ERROR_MISALIGNED_ADDRESS

Após alguma pesquisa nos fóruns pertinentes, aparentemente a solução seria compilar tudo da fonte.

O problema adicional é que o fonte do TensorFlow parte do pressuposto que o toolkit NVidia foi instalado numa tal pasta /usr/local/cuda e, mesmo que você altere esse caminho, o arquivo configure chama vários outros com dependências de path difíceis de serem corrigidas caso você tenha instalado seu NVidia toolkit a partir do repositório.

Não estou muito a fim de compilar na unha o código do NVidia Toolkit, já que a solução via repositório é sempre mais “clean” e conta com a vantagem das atualizações automáticas.

Fiquei um pouco frustrada, mas acabei instalando os pacotes PIP do TensorFlow SEM O SUPORTE À GPU.

Tudo funcionou perfeitamente, incluindo o código de teste convolutional.py (veja link do TensorFlow acima). Sem a ajuda da GPU, esse código ocupa 100% da CPU (4 núcleos), jogando a temperatura do processador nas alturas durante mais de 15 minutos.

Por ora vai bastar para mim, mas espero que os pacotes PIP do TensorFlow em breve seja compatível com este tipo de configuração de máquina/plataforma. No mínimo, os caras podiam retrabalhar o script de configuração da compilação do fonte, prevendo a instalação de toolkit e cuDNN via repositório.

Mission not accomplished 😦

Tem dias que a gente perde…

 

 

 

 

 

Problema com WiFi no Ubuntu 16.04

Atualização 15/07/2016: meu WiFi parou de funcionar após o último update do 16.04. Eu já tinha executado o procedimento abaixo e achei que dessa vez o problema era outro. Após alguns dias pesquisando sem sucesso, entendi que o último update atualizou o pacote linux-firmware. Resumindo, tive que executar novamente o procedimento abaixo e tudo voltou a funcionar. Espera-se que em breve os repositórios do Ubuntu reflitam as modificações implementadas na versão não-oficial de drivers.


Após a instalação do Ubuntu 16.04 num Dell Inspiron 5557 o WiFi não funcionou automaticamente.

Se você está passando por problema semelhante, o primeiro passo é checar o modelo de sua placa wireless. Isso pode ser feito pelo comando:

lshw -C network

No meu caso a placa é:

description: Wireless interface
product: QCA6174 802.11ac Wireless Network Adapter
vendor: Qualcomm Atheros

Se essa não é sua placa, os comandos abaixo não servirão para você, ainda que a solução possa lhe servir de inspiração.

O problema com a placa QCA6174 já é conhecido na comunidade e uma busca no Google com o nome da placa e problemas de conexão retornará alguns posts envolvendo a instalação de um firmware não-oficial ainda não disponível nos repositórios.

Segue abaixo a sequência de comandos que deve ser executada. Note que, para que esta solução funcione, você deverá estar conectado à Internet (provavelmente, via cabo). É necessário reiniciar o computador após o procedimento.

Se você está enfrentando o mesmo problema, espero que a dica sirva para você também.


sudo mkdir -p /lib/firmware/ath10k/QCA6174/hw3.0/

sudo rm /lib/firmware/ath10k/QCA6174/hw3.0/* 2> /dev/null

sudo wget -O /lib/firmware/ath10k/QCA6174/hw3.0/board.bin https://github.com/FireWalkerX/ath10k-firmware/blob/7e56cbb94182a2fdab110cf5bfeded8fd1d44d30/QCA6174/hw3.0/board-2.bin?raw=true

sudo wget -O /lib/firmware/ath10k/QCA6174/hw3.0/firmware-4.bin https://github.com/FireWalkerX/ath10k-firmware/blob/7e56cbb94182a2fdab110cf5bfeded8fd1d44d30/QCA6174/hw3.0/firmware-4.bin_WLAN.RM.2.0-00180-QCARMSWPZ-1?raw=true

sudo chmod +x /lib/firmware/ath10k/QCA6174/hw3.0/*


A solução está descrita no post #22 do seguinte link:

https://bugs.launchpad.net/ubuntu/+source/linux-firmware/+bug/1520343?comments=all