Articles

Tutorial de Programação Python

h2>Tutorial Prático de Aprendizagem de Máquinas com Introdução ao Python

O que irá precisar para esta série tutorial:
  • Instalar numpy, matplotlib, pandas, sklearn e as suas dependências
  • >br>

pip install numpy

pip install scipy

pip install scikit-learn

pip install matplotlib

pip install pandas

br>

Need ajuda na instalação de pacotes com pip? ver o tutorial de instalação de pip

Olá meninas e meninos, bem-vindos a um curso de aprendizagem de máquinas aprofundado e prático.

O objectivo deste curso é dar-vos uma compreensão global da aprendizagem de máquinas, abrangendo teoria, aplicação, e funcionamento interno de algoritmos supervisionados, não supervisionados, e de aprendizagem profunda.

Nesta série, iremos cobrir a regressão linear, K Vizinhos mais próximos, Máquinas Vectoriais de Apoio (SVM), agrupamento plano, agrupamento hierárquico, e redes neurais.

Para cada algoritmo principal que cobrirmos, iremos discutir as intuições de alto nível dos algoritmos e como é que logicamente se destinam a funcionar. A seguir, aplicaremos os algoritmos em código utilizando conjuntos de dados do mundo real juntamente com um módulo, tal como com Scikit-Learn. Finalmente, mergulharemos no funcionamento interno de cada um dos algoritmos recriando-os em código, a partir do zero, nós próprios, incluindo todas as matemáticas envolvidas. Isto deverá dar-lhe uma compreensão completa de exactamente como os algoritmos funcionam, como podem ser afinados, que vantagens são, e quais são as suas desvantagens.

A fim de acompanhar a série, sugiro que tenha no mínimo uma compreensão básica de Python. Se não tiver, sugiro que siga pelo menos o tutorial básico de Python 3 até à instalação do módulo com o tutorial de pip. Se tiver uma compreensão básica de Python, e a vontade de aprender/obter perguntas, poderá seguir aqui sem problemas. A maioria dos algoritmos de aprendizagem da máquina são na realidade bastante simples, uma vez que precisam de ser para poderem ser escalados para grandes conjuntos de dados. A matemática envolvida é tipicamente álgebra linear, mas farei o meu melhor para continuar a explicar todas as matemáticas. Se estiver confuso/perdido/interessado sobre qualquer coisa, pergunte na secção de comentários no YouTube, na comunidade aqui, ou enviando-me um e-mail. Precisará também de Scikit-Learn e Pandas instalados, juntamente com outros que iremos agarrar pelo caminho.

Aprendizagem da máquina foi definida em 1959 por Arthur Samuel como o “campo de estudo que dá aos computadores a capacidade de aprender sem ser explicitamente programado”. Isto significa imbuir o conhecimento em máquinas sem o codificar. Pelo que descobri pessoalmente, as pessoas fora da comunidade de programação acreditam principalmente que a inteligência da máquina está codificada, desconhecendo completamente a realidade do campo. Um dos maiores desafios que tive com a aprendizagem de máquinas foi a abundância de material na parte da aprendizagem. É possível encontrar fórmulas, gráficos, equações e um monte de teoria sobre o tema da aprendizagem de máquinas, mas muito pouco sobre a parte “máquina” propriamente dita, onde se programa realmente a máquina e se executam os algoritmos sobre dados reais. Isto deve-se principalmente à história. Nos anos 50, as máquinas eram bastante fracas, e em muito pouca oferta, o que se manteve durante meio século. A aprendizagem da máquina foi relegada a ser principalmente teórica e raramente utilizada de facto. A Máquina Vectorial de Apoio (SVM), por exemplo, foi criada por Vladimir Vapnik na União Soviética em 1963, mas passou em grande parte despercebida até aos anos 90, quando Vapnik foi levado para os Estados Unidos pela Bell Labs. A rede neural foi concebida nos anos 40, mas os computadores na altura não eram de modo algum suficientemente potentes para funcionarem bem, e só o foram nos tempos relativamente recentes.

A “ideia” de aprendizagem de máquinas entrou e saiu em favor algumas vezes ao longo da história, deixando sempre as pessoas a pensar que se tratava apenas de uma moda. É realmente só muito recentemente que temos sido capazes de pôr à prova grande parte da aprendizagem de máquinas. Hoje em dia, é possível rodar e alugar um cluster de 100.000 GPU por alguns dólares por hora, o que os alunos de doutoramento sonham há apenas 10 anos. A aprendizagem de máquinas ganhou outro impulso em meados dos anos 2000 e tem vindo a aumentar desde então, beneficiando também, em geral, da Lei de Moore. Para além disto, há por aí amplos recursos para o ajudar na sua viagem com a aprendizagem de máquinas, como este tutorial. Pode simplesmente fazer uma pesquisa Google sobre o tema e encontrar informação mais do que suficiente para o manter ocupado durante algum tempo.

Isto vai ao ponto de termos agora módulos e APIs à nossa disposição, e pode envolver-se na aprendizagem de máquinas muito facilmente, sem quase nenhum conhecimento sobre o seu funcionamento. Com os padrões da Scikit-learn, pode obter uma precisão de 90-95% em muitas tarefas logo a partir do portal. A aprendizagem de máquinas é muito parecida com um carro, não é necessário saber muito sobre o seu funcionamento para obter uma quantidade incrível de utilidade. No entanto, se quiserem ultrapassar os limites de desempenho e eficiência, precisam de escavar debaixo do capô, que é mais como este curso é orientado. Se estiver apenas à procura de um tutorial rápido para empregar a aprendizagem de máquinas em dados, já tenho um exemplo simples de exemplo de classificação e um exemplo simples de clustering (aprendizagem de máquinas sem supervisão) que pode verificar.

Embora a idade e maturidade aparente da aprendizagem de máquinas, diria que não há melhor altura do que agora para a aprender, uma vez que se pode realmente utilizá-la. As máquinas são bastante potentes, aquela em que está a trabalhar pode provavelmente fazer a maior parte desta série rapidamente. Os dados também são muito abundantes ultimamente.

O primeiro tópico que iremos abordar é Regressão, que é onde iremos abordar no próximo tutorial. Certifica-te de que tens o Python 3 instalado, juntamente com Pandas e Scikit-Learn.

O próximo tutorial: Regressão – Introdução e Dados

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *