Discussione Dalla Cina arriva MathGPT

nfvblog

Moderatore
9 Dicembre 2021
665
67
332
450

Dalla Cina arriva MathGPT: l'implementazione di chatGPT per la matematica​


logoxtal.7e22d581.png




1    Introduzione

Visto che l'algoritmo alla base di ChatGPT è abbastanza versatile ecco una nuova implementazione sicuramente più funzionale della semplice scrittura, infatti, l'idea è venuta all'azienda cinese TAL Education Group che in occasione del suo ventesimo anniversario della fondazione, ha deciso di pubblicare questo strumento che ha prestazioni superiori in questo ambito specifico rispetto all'alternativa di OpenAI con questo specifico campo.

MathGPT non è solo uno degli strumenti più bramati e anche sogno bagnato di molti studenti pigri delle superiori, il suo vero scopo è quello di fornire un assistenza per un pubblico professionale, rivolgendosi al mondo della ricerca e a quello dell'insegnamento, per tutti quegli ambiti in cui sono presenti equazioni, problemi algoritmi, matrici e affini.

2    Come è strutturato il progetto

Sul sito sono i seguenti punti e i responsabili delle varie parti che fanno funzionare MathGPT:
  • Large Language Models, Appliend ML scientist
  • LLM Acceleration Engineer
  • UX Researcher
  • MathGPT Product Manager
  • Senior UI Designer (AI Direction)
  • ML Infrastructure Engineer (Golang)

2.1    Large Language Models, Applied ML scientist

  1. Condurre diverse iniziative per contribuire alle fasi vitali dei grandi modelli linguistici presso TAL, con l'obiettivo di migliorare i prodotti, le applicazioni e le esperienze utente TAL di prossima generazione con LLM avanzati.
  2. Collaborare su strategie di modellazione per assistere con l'intera gamma di ottimizzazione LLM, tra cui ingegneria rapida, ottimizzazione delle istruzioni, apprendimento per rinforzo dal feedback umano (RLHF), ottimizzazione efficiente dei parametri e messa a punto.
  3. Migliorare l'efficienza dei LLM, concentrandosi, tra gli altri, su architetture efficaci degli insegnanti e un rapido adattamento dei LLM.
  4. Migliorare la collaborazione con le parti interessate LLM e identificare nuove opportunità di ricerca e coinvolgimento dei prodotti.
  5. Collaborare a stretto contatto con i team di prodotto per accelerare il lancio dei loro progetti essenziali di machine learning, concentrandosi in particolare su modelli linguistici e multimodali di grandi dimensioni.
Locazione: Beijing, China/Cupertino, CA United States

2.2    LLM Acceleration Engineer

  1. Progettare e sviluppare efficienti modelli di training e sistemi di inferenza su larga scala per migliorare le prestazioni computazionali e accelerare la velocità di convergenza dei modelli.
  2. Ottimizza l'algoritmo e l'architettura del modello per utilizzare appieno le risorse hardware come GPU e TPU.
  3. Condurre l'analisi e la messa a punto delle prestazioni del modello per migliorare la velocità di addestramento e inferenza.
  4. Tieni traccia dei risultati più recenti, proponi idee per il miglioramento e l'innovazione e guida gli sviluppi tecnologici del team.
Locazione: Beijing, China/Cupertino, CA United States

2.3    UX Researcher

  1. Responsabile della raccolta di informazioni sul mercato e sugli utenti per il progetto strategico AI di TAL Education.
  2. Competente nell'utilizzo di metodi di ricerca qualitativa e quantitativa per estrarre informazioni sugli utenti e sul mercato, consentendo un processo decisionale informato in vari scenari aziendali.
  3. Possedere una forte prospettiva di business e una mentalità innovativa, guidando l'innovazione nell'implementazione del prodotto e nei modelli di business basati sulla profonda conoscenza dell'utente e sulla comprensione globale del business.
Locazione: Beijing, China

2.4    Senior UI Designer (AI Direction)

  1. Responsabile della progettazione del prodotto e del lavoro creativo all'interno del business dell'innovazione della direzione dell'intelligenza artificiale di TAL Education.
  2. Partecipare alla pianificazione preliminare e alla discussione di attività e prodotti per garantire la perfetta attuazione del progetto.
  3. Rimani aggiornato sulle recenti tendenze del design e sulle novità del settore, fai frequenti riepiloghi e fornisci opinioni e suggerimenti professionali per il nostro progetto.
Locazione: Beijing, China

2.5    ML Infrastructure Engineer (Golang)

  1. Responsabile della progettazione e dello sviluppo di moduli funzionali per il business AI di TAL Education, utilizzando il linguaggio Go per sviluppare un server robusto e scalabile.
  2. Soddisfa i requisiti di elaborazione del linguaggio naturale del progetto con l'aiuto delle funzionalità del modello LLM.
  3. Partecipare alla progettazione dell'architettura e condurre revisioni delle proposte tecniche, garantendo il controllo dell'architettura e della qualità del codice.
  4. Prestare molta attenzione allo sviluppo delle ultime tecnologie nel campo dell'intelligenza artificiale, nonché alla ricerca preliminare e alla produzione di nuove tecnologie.
Locazione: Beijing, China

3    Test e prestazioni

Per fare questi test sono stati utilizzati una serie di test con difficotà differenti, dalle scuole primarie alle secondarie di secondo grado, con 5 mila elementi al suo interno, i test sono disponibili sia in lingua inglese che cinese, scaricabili dal sito del progetto.
Come ripotato nel abstract della pagina
Questa versione include due set di dati open source di domande di competizioni matematiche cinesi e inglesi, ciascuno composto da 5.000 elementi (formazione da 3.000 e test da 2.000). Le domande sono a scelta multipla e riguardano argomenti di matematica a livello di scuola primaria, media e superiore. Vengono forniti passaggi dettagliati della soluzione per facilitare la formazione COT.
Visualizza allegato 71344

In questa tabella sono riportate le differenze di performance tra GPT4 e MathGPT che risulta molto interessante vedendo l'accuratezza del secondo rispetto al primo.

[chaption]Domende legittime[/chaption]
In questo periodo per avere un risalto mediatico ormai basta dare il proprio aggiungere la sigla GPT all'interno del titolo di progetto, onestamente le domande che vengono alla mente quando ho sentito parlare del progetto sono le seguenti:
  1. Ma visto che GPT-4 è più lento di GPT-3 quale paragone ci sarebbe tra MathGPT e GPT-3?
  2. Come è realmente strutturato l'algoritmo e quali reali modifiche sono state fatte rispetto allo standard di OpenAI?
  3. Avrà davvero un seguito?
Solo il tempo ci darà le risposte.
 
  • Mi piace
Reazioni: MRPants
Ma messa giù cosi sembrerebbe un tool didattico/di supporto apprendimento partendo appunto dal progetto di OpenAI , più che un vero prodotto a sè stante.
Mi sembra che gli studenti abbiano familiarizzato più di qualsiasi altro tipo di professione con la AI :asd:

Non me ne intendo di Geopolitica , ma valutando sulla base delle mie conoscenze hobbystiche , in campo tecnico-aviatorio i cinesi sono famosi per fare cose che sembrano mostruose ma poi sono dei riadattamenti/scopiazzamenti riusciti male di prodotti occidentali ( J20 docet :rofl: )