Guida Lista degli strumenti utili in python per AI/ML

GrincH--

Utente Emerald
2 Settembre 2010
524
86
275
536
Ultima modifica:
print("Hello Inforge!")

Spero stiate bene! A seguito della piccola guida introduttiva sulla regressione lineare, ho deciso di creare un piccolo elenco con breve descrizione degli strumenti più utili e "indispensabili" per attività di Data Science, Machine Learning e Intelligenza Artificiale (o come piace chiamarla a me da bravo dislessico Artificenza Intellettuale :asd: )

Distribution, IDE e Notebook:
Anaconda: A mio avviso, uno degli strumenti più utili per uno sviluppatore Python. Con Anaconda puoi non solo godere di una gestione agevolata dei progetti grazie alla Virtual Environment machine di Anaconda e di Conda, ma puoi facilmente addestrare modelli predittivi di Machine Learning, Reti Neurali, visualizzare dati e tantissime altre attività. Da non trascurare la facilità con cui puoi scaricare, installare e/o rimuovere pacchetti aggiungitivi e utilizzare i migliori IDE disponibili quali PyCharm, Spyder, VSCode[...] e anche Jupyter notebook ma volevo parlarvene qua sotto.

Jupyter: Parto subito da un suggerimento: non è l'unico del suo genere ma senza dubbio il più popolare, ma potete provare anche Google Colab in alternativa che offre una buona gestione del progetto con il drive. Jupyter si definisce un notebook di nuova generazione, effettivamente è uno strumento quasi indispensabile. Dico quasi perchè ormai la maggior parte dei progetti ML corre su ipython e Jupyter. Uno strumento utilissimo per runnare linea per linea, pulire e organizzare i dati, caricare un dataset e compiere le principali operazioni di Data scientist e ML.

Data Analysis & Data structure:
Pandas: potentissimo strumento di data analysis per la lettura e analisi dei dati in più formati: Tools for reading and writing data between in-memory data structures and different formats: CSV and text files, Microsoft Excel, SQL databases, and the fast HDF5 format;
Unione e fusione di più dataset.

Matplotlib: Altro utilissimo strumento per la generazione e proiezione di grafici. Usatissimo per esempio per fare la regressione lineare o altri tipi di analisi che richiedano un grafico

NumPy: Strumento importantissimo che fornisce strutture dati come matrici di grandi dimensioni e array multidimensionali e funzioni matematiche di alto livello per poter effettivamente operare sulle sopracitate strutture dati.

Machine Learning library:
Scikit-Learn:
Strumento indispensabile per chiunque voglia avventurarsi nel mondo ML senza troppi intoppi: Presenta vari algoritmi di Classificazione, regressione, Support Vector Machines, Random Forest, K-means [...]

PyTorch: E' la versione Python di Torch: Usatissimo per applicazioni che richiedano Computer Vision e in generale per il Deep Learning sfruttato anche da Tesla Autopilot.

TensorFlow: Made by Google. Può essere un'alternativa a Scikit-Learn, ma se il primo è improntato più su Classificazione, regressione etc... TF è improntato più su Training & Inference di Deep Neural Network. Può essere runnato su CPU/GPU multiple

Keras: Fornisce un interfaccia semplice da usare per Reti neurali Artificiali sia in fase di training che di evaluation del modello.


In questa lista sono presenti penso i maggiori strumenti che ritengo abbastanza indispensabili per chiunque voglia avvicinarsi in questo fantastico mondo, conoscere e saper utilizzare tali librerie (anche una sola) può davvero cambiare il tuo modo di vedere ML/AI e levarti tanti dubbi che magari stai nutrendo.
Una comparazione più esaustiva la si può trovare su wiki HERE .

Se avete qualche strumento che ritenete sia importante, vi prego di scriverlo qui così lo aggiungo alla lista.

Spero di essere stato utile!

[NOTE: La lista non è in ordine di importanza ne in ordine alfabetico, ho provato a mantenere un ordine concreto che non sminuisse o enfatizzasse gli altri strumenti]
 
  • Mi piace
Reazioni: ElectricDreamer