Viene rilasciato un nuovo modello che si avvicina a GPT-4! La “versione europea di OpenAI” ha collaborato con Microsoft, ma è stata accusata di violare le sue intenzioni originali

27 Febbraio 2024

Ieri sera, Mistral AI, noto come "European OpenAI", ha rilasciato il suo ultimo modello di generazione di testo di alto livello, Mistral Large.

Questo modello ha capacità di ragionamento di alto livello e può essere utilizzato per gestire complesse attività di ragionamento multilingue, coprendo la comprensione del testo, la trasformazione e la generazione di codice.

Disegna semplicemente i punti chiave:

Finestra di contesto da 32K per estrarre con precisione informazioni su documenti di grandi dimensioni.
Precise funzionalità di comando successivo consentono agli sviluppatori di personalizzare le strategie di controllo.
Supporta le restrizioni sulle chiamate di funzione e sulla modalità di output per favorire la scalabilità dello sviluppo delle applicazioni e la modernizzazione degli stack tecnologici.
Supporto nativo per inglese, francese, spagnolo, tedesco e italiano, con profonda conoscenza della grammatica e del background culturale.

In allegato l'indirizzo dell'esperienza: https://chat.mistral.ai/chat

Mistral AI amplia nuovamente le sue competenze

Mistral Large ha ottenuto buoni risultati in numerosi test benchmark, diventando il secondo modello più utilizzato al mondo tramite API, secondo solo a GPT-4, e lasciando dietro di sé altri modelli tradizionali.

Rispetto a LLaMA 2 70B, GPT-4, Claude 2, Gemini Pro 1.0 e altri modelli tradizionali, Mistral Large mostra una forte forza nelle capacità di ragionamento.

In numerosi benchmark di buon senso e ragionamento come MMLU, Hellas e WinoG, Mistral Large segue GPT-4 e supera di gran lunga gli altri modelli.

Mistral Large offre prestazioni significativamente migliori di LLaMA 2 70B sui benchmark HellaSwag, Arc Challenge e MMLU in francese, tedesco, spagnolo e italiano.

Mistral Large ha ottenuto buoni risultati anche nei compiti di codifica e matematica. Molti test di riferimento sono ancora molto avanti.

Inoltre, Mistral AI ha anche rilasciato un nuovo modello ottimizzato per latenza e costi, Mistral Small, che supera Mixtral 8x7B in termini di prestazioni ma ha una latenza inferiore.

Dal punto di vista di Mistral AI, Mistral Small sarà la scelta intermedia ideale tra i modelli open source e di punta, godendo degli stessi vantaggi innovativi di Mistral Large, soprattutto in termini di abilitazione RAG (Retrieval Augmentation Generation) e chiamate di funzioni.

Tuttavia, le caratteristiche di bassa latenza dichiarate dal modello Mistral Small sono limitate rispetto al Mixtral 8x7B, ma il suo costo è significativamente aumentato, con un costo di input 2,8 volte superiore e un costo di output fino a 8,5 volte.

Mistral Large è ora disponibile sulle piattaforme La Plateforme e Azure e integrato in Le Chat. Le Chat (tradotto letteralmente come gatto in francese) è un chatbot AI simile a ChatGPT che supporta la comunicazione multilingue.

Gli utenti possono scegliere tra tre diversi modelli: Mistral Small, Mistral Large e Mistral Next. Tuttavia, Le Chat non supporta la funzionalità di rete in tempo reale.

Poco dopo il lancio, Le Chat si è bloccato a causa di una folla più grande del previsto che si è riversata sull'esperienza e, al momento della stesura di questo articolo, Le Chat è tornato attivo e funzionante.

Abbiamo anche sperimentato Le Chat per la prima volta. A seconda della complessità della lingua stessa e della quantità e qualità dei dati di addestramento che riceve, Le Chat è più espressivo in inglese e può variare da lingua a lingua in altre lingue.

Di fronte al rompicapo cinese, Mistral Large è ovviamente rimasto un po' confuso, e per un po' non ha dato risposta.

Domanda: Farfalla, formica, ragno, millepiedi, lavorano insieme, quale dei due non viene pagato alla fine?

Ma se lo passi all'inglese, si trasforma immediatamente in un esperto di problem solving. Le risposte sono chiare e logiche, e si innalza verso una "prospettiva di lavoro e ricompense incentrata sull'uomo". non seguire il buon senso, dopotutto "Centipede" non viene premiato.

Il problema di polli e conigli che vivono nella stessa gabbia non è un gioco da ragazzi per Mistral Large. Dopo aver posto le equazioni lineari, la risposta è arrivata rapidamente, ma i 16 polli e i 19 conigli nella risposta erano errati.

Domanda: Nella stessa gabbia ci sono polli e conigli, con un totale di 35 teste e 94 zampe. Quanti sono i polli e i conigli?

Questo è un classico problema matematico che può essere risolto utilizzando un sistema di equazioni lineari.
Supponendo che il numero di polli sia x e il numero di conigli sia y, si possono elencare le due equazioni seguenti:
1. x + y = 35 (il numero totale di polli e conigli è 35)
2. 2x + 4y = 94 (il pollo ha 2 zampe e il coniglio ha 4 zampe, quindi ci sono 94 zampe in totale)
Esprimi x nella prima equazione in funzione di y per ottenere x = 35 – y e sostituiscilo nella seconda equazione per ottenere:
2(35 – y) + 4y = 94
Risolvendo l'equazione otteniamo y = 19. Sostituendo in x = 35 – y otteniamo x = 16.
Pertanto ci sono 16 polli e 19 conigli.
Le ultime due domande possono essere risolte allo stesso modo: le risposte sono 16 polli e 19 conigli.

Quindi abbiamo chiesto a ChatGPT di sottoporre a Mistral Large una domanda per il test di matematica, che è stata più intensa, ma la prestazione complessiva è stata buona:

Piccolo modello, grande risultato

Mistral AI è stata fondata nel maggio dello scorso anno con soli 25 dipendenti, ma il suo grande modello linguistico è già diventato famoso su Hugging Face.

In precedenza, abbiamo riferito del rilascio di Mixtral 8x7B. Una volta lanciato, questo modello ha immediatamente fatto esplodere la comunità open source e ha tenuto svegli la notte innumerevoli sviluppatori.

Sebbene abbia solo una dimensione parametrica di 46,7B, le prestazioni del Mixtral 8x7B, che sono buone in piccole e grandi dimensioni, sono paragonabili a Llama 2 70B e GPT-3.5 in molti test benchmark, e anche leggermente migliori in alcuni test.

Il segreto del successo di Mistral AI risiede nella sua intelligente integrazione dei tre elementi fondamentali nel campo dell’intelligenza artificiale: talento, dati e potenza di calcolo.

L’Economist ha rivelato che i fondatori e le colonne portanti tecniche di Mistral AI provenivano tutti dagli istituti tecnici d’élite francesi e hanno accumulato una preziosa esperienza nel settore nei laboratori di ricerca di giganti della tecnologia come Google e Meta. Sono uno dei pochi esperti al mondo che padroneggia veramente come addestrare una tecnologia di modellistica all'avanguardia.

In secondo luogo, i dati sono un’altra arma magica per il successo di Mistral AI. Mistral è unico nel campo dell'addestramento dei dati dei modelli: ad esempio, può filtrare efficacemente informazioni ripetitive o prive di significato, rendendolo più snello ed efficiente, con una scala di parametri di soli miliardi.

Ciò significa che gli utenti comuni possono eseguire facilmente i modelli Mistral AI anche sui propri personal computer.

Per l'arrivo di Mistral Large, anche il vincitore del Premio Turing Yann LeCun, lo scienziato senior di NVIDIA Jim Fan e altri grandi nomi hanno inviato congratulazioni per X.

Al momento, la valutazione di Mistral AI ha superato i 2 miliardi di dollari e il programma di investimenti dietro di essa non è inferiore a quello delle migliori aziende del mondo.

Dalle principali società di venture capital negli Stati Uniti come Lightspeed Venture Capital, Redpoint Venture Capital e Index Venture Capital, ai giganti del venture capital della Silicon Valley a16z, NVIDIA, Salesforce, BNP Paribas, ecc., tutti preferiscono Mistral AI. Dopo diversi round di finanziamento, Mistral AI è già entrato nei ranghi degli unicorni AI.

Microsoft ha anche annunciato ieri una nuova partnership con Mistral AI, promettendo che la cooperazione con Mistral AI si concentrerà sulle seguenti tre aree chiave:

Infrastruttura di supercalcolo: Microsoft supporterà Mistral AI tramite l'infrastruttura di supercalcolo AI di Azure per la formazione sull'intelligenza artificiale e i carichi di lavoro di inferenza.
Marketplace ampliato: Microsoft e Mistral AI metteranno a disposizione dei clienti i modelli avanzati di Mistral AI attraverso il catalogo dei modelli MaaS e Azure Machine Learning in Azure AI Studio.
Ricerca e sviluppo sull’intelligenza artificiale: Microsoft e Mistral AI esploreranno la collaborazione per sviluppare modelli proprietari per clienti selezionati, anche per i carichi di lavoro del settore pubblico europeo.

Ma la mossa di Microsoft è stata messa in dubbio dagli utenti della rete. L'utente X @osxzxso ha insinuato che Microsoft stia cercando di adottare una strategia "intricata" per monopolizzare il mercato. Musk ha anche espresso il suo accordo nella sezione commenti con un'emoji sconcertante.

Vedo spalmare la Nutella su entrambi i lati del pane
Ho visto il burro di arachidi spalmato su entrambi i lati del pane

Vale la pena ricordare che gli utenti della rete attenti hanno osservato che dopo che Mistral AI ha lanciato il nuovo modello, il contenuto rilevante sul suo sito ufficiale riguardo al suo impegno nella comunità open source è silenziosamente scomparso, e il nuovo modello non supporta l'open source.

Tuttavia, il CEO di Mistral Mensch ha dichiarato in un'intervista al Wall Street Journal che Mistral AI non ha violato l'intento originale dell'open source, ma ha adottato una duplice strategia di promozione simultanea di strategie di commercializzazione e mantenimento degli impegni open source.

Chiaramente, dobbiamo trovare un buon equilibrio tra la costruzione di un modello di business e il mantenimento dei nostri valori open source. Vogliamo inventare cose nuove e nuove architetture, ma anche fornire ai nostri clienti prodotti più vendibili.

# Benvenuti a seguire l'account pubblico WeChat ufficiale di aifaner: aifaner (ID WeChat: ifanr). Contenuti più interessanti ti verranno forniti il prima possibile.

Ai Faner | Link originale · Visualizza commenti · Sina Weibo