The machines are coming for your pricing models

Uscito oggi.

Dopo un anno di studi Hassabis ed il suo team hanno creato il nuovo algoritmo MuZero, che a loro avviso rappresenta una rivoluzione nel campo dell'intelligenza artificiale applicata ai giochi. Pare di capire che Muzero non fosse stato progettato per gli scacchi, ma per robe tipo Space Invaders, Supermario e collateralmente, ovvero come effetto collaterale della loro ricerca sui domini che riguardano la visione, ha eguagliato le prestazioni di Alphazero e negli scacchi.


abstract

Nell'ambito degli scopi dell'intelligenza artificiale, la costruzione di agenti con capacità di pianificazione è stata a lungo una delle principali sfide. I metodi di pianificazione basati sull'esplorazione di alberi hanno riscosso un enorme successo in settori difficili come gli scacchi e Go, dove un simulatore perfetto è disponibile. Tuttavia, nei problemi del mondo reale le dinamiche che governano l'ambiente sono spesso complesse e sconosciute. In questo lavoro presentiamo l'algoritmo MuZero che, combinando una ricerca basata su tre modelli appresi, consente di ottenere prestazioni umane superiori in intervalli che variano domini sfidanti (challenging) e visivamente complessi, senza alcuna conoscenza delle loro dinamiche sottostanti.

MuZero apprende un modello che quando è applicato in modo iterativo, prevede le variabili più rilevanti per la pianificazione: la ricompensa, la politica di selezione delle azioni e la funzione valore. L'ambiente canonico nei videogiochi per testare le tecniche di intelligenza artificiale è costituito dai giochi Atari, dominio in cui i modelli basati sugli approcci di pianificazione hanno storicamente competuto in passato.

Valutati su 57 diversi giochi Atari il nostro nuovo algoritmo ha raggiunto un nuovo stato dell'arte.

Quando invece è stato valutato sul Go, sugli scacchi e sullo shogi, senza alcuna conoscenza delle regole del gioco, MuZero ha eguagliato le prestazioni sovrumane dell'algoritmo AlphaZero, a cui era stato fornito le sole regole del gioco.


https://arxiv.org/pdf/1911.08265.pdf
 
Muzero non riesce a superare Alphazero, per il noto limite della patta nel gioco degli scacchi dove esiste sempre la possibilità di rifugiarsi nella cd. posizione di "stallo" per poter tenere le posizioni inferiori, ma nel Go, che e' un gioco nel quale o vince uno o vince l'altro, ha superato AlphaGo.

Direi quasi per serendipity.

Dove arriveranno tra poco Albert Silver e Demis Hassabis estendendo sempre piu' l'intelligenza delle macchine a domini sempre piu' estesi e variegati?
 

Allegati

  • Annotazione 2019-11-21 165850.jpg
    Annotazione 2019-11-21 165850.jpg
    104 KB · Visite: 607
E dire che non era passato nemmeno un mese dall'ultimo straordinario risultato di Deep Mind, cioe' l'azienda di Hassabis comperata da Google.

Non solo Go: l'Ai di Google batte anche gli archeologi - Repubblica.it

Anche se va riconosciuto che la Repubblica secondo me l'ha sparata grossa.
Nel paper che ho letto si afferma che l'intelligenza artificiale di Google ha battuto due dottorandi, non due prof. ordinari di epigrafia.
Ed inoltre la macchina non e' ancora in grado di far da sola, cioe' e' utile solo come ausilio alla decifrazione epigrafica nei casi difficili.
 
Google Deepmind.....non solo scacchi e Go ma anche Starcraft 2. Una rete neurale ha battuto i migliori giocatori del mondo.
Scacchi e Go sono giochi a informazione perfetta. Starcraft no.
Gli sviluppi di tali ricerche avranno implicazioni importanti in molti campi: medico, chimico, matematico, economico e ahime' anche militare suppongo.

DeepMind’s StarCraft 2 AI is now better than 99.8 percent of all human players - The Verge

Da notare che in questi 3 domini, la rete ha imparato da sola. Partendo da zero, solo le regole del gioco, e giocando contro se stessa milioni di partite.
 
Ultima modifica:
Da notare che in questi 3 domini, la rete ha imparato da sola. Partendo da zero, solo le regole del gioco, e giocando contro se stessa milioni di partite.

Arrivi in ritardo: mentre hai scritto queste righe, quelli di Deep Mind sono gia' andati oltre: nel nuovo modello di apprendimento sviluppato di recente partono da zero come nel modello precedente ma non hanno piu' bisogno di imparare le regole del gioco.

Le imparano dall'osservazione.

Sulla rete, su Arvix, è uscito uno pseucode dell'algoritmo Muzero
 
Arrivi in ritardo: mentre hai scritto queste righe, quelli di Deep Mind sono gia' andati oltre: nel nuovo modello di apprendimento sviluppato di recente partono da zero come nel modello precedente ma non hanno piu' bisogno di imparare le regole del gioco.

Le imparano dall'osservazione.

Sulla rete, su Arvix, è uscito uno pseucode dell'algoritmo Muzero

Affascinante...ma anche un pochino inquietante:yes:
 
Consola sapere che in un'epoca di machine Learning abbiano ancora la loro importanza la penna, il blocco note e la calcolatrice.

Finanza: in "Monkey Trading" il metodo statistico al trading
ROMA (MF-DJ)--Investire online attraverso un approccio prettamente statistico ribattezzato "Monkey Trading". E' il metodo illustrato nel libro di Roberto Bizzarri "Monkey Trading.

"Il rivoluzionario sistema di trading statistico per investire online nei mercati finanziari senza l'uso dell'analisi tecnica e fondamentale"

edito da Bruno Editore è uscito oggi.

"Fino ad oggi qualsiasi investitore era dell'idea che esistessero due soli modi per investire online: il primo attraverso l'analisi tecnica e il secondo attraverso l'analisi fondamentale". spiega in una nota Bizzarri. "quello che però molti non sanno è che attraverso la statistica è realmente possibile individuare. con una precisione a dir poco chirurgica. gli esatti giorni e le esatte fasce orarie in cui il prezzo tende un numero incredibilmente alto di volte al rialzo o al ribasso. In un certo senso. è come tirare in aria 100 volte la monetina e sapere che 70 volte su 100 siamo in grado di prevedere se sarà testa o croce. Sono queste le informazioni che a mio avviso permettono all'investitore di massimizzare le proprie opportunità di profitto".

"Ho deciso di scrivere questo libro per permettere a chiunque di apprendere. in maniera estremamente semplice e lineare. un nuovo modo di fare trading online. anche in assenza di specifiche competenze tecniche e/o macroeconomiche.

Monkey Trading è piuttosto un metodo che mette la statistica a servizio dell'investitore, consentendogli di fare trading attraverso quattro soli strumenti:

1 una penna

2 un blocco note

3 una calcolatrice e

4 una semplice strategia"


conclude Bizzarri.

"Quello del trading è senza dubbio un mondo estremamente affascinante e ricco di infinite opportunità di investimento". afferma Giacomo Bruno. editore del libro. "peccato però che molti investitori preferiscano non cimentarsi in questo settore. ritenendolo troppo difficile da apprendere. Bizzarri ha invece sviluppato un rivoluzionario sistema di trading online - alternativo alla classica analisi tecnica e fondamentale - dove alla base di tutto c'è appunto la statistica. che rappresenta un valido aiuto per la massimizzazione dei profitti nel lungo periodo".

gug

(END) Dow Jones Newswires

December 20. 2019 13:26 ET (18:26 GMT)
 
How To Build Your Own MuZero AI Using Python (Part 1/3)

It isn’t even shown the rules of the game (non ho capito come abbia fatto, ma non importa

Lo spiega bene successivamente nell'articolo che hai segnalato: anziché conoscere a priori le regole del gioco, ha tre reti neurali che si occupano di "ipotizzarle" e "prevederle".

Questo permette all'algoritmo di agire una specie di "immaginazione" quando arriva il momento di apprendere delle strategie vincenti.
 
Tesi apparentemente singolare quella di Bizzarri.

Se prendo una serie storica, poniamo con cadenza oraria e costruisco le cumulate delle barre della 1^, 2^,...n^ ora separatamente ottengo n paths equiparabili a n moti browniani. E' noto che queste cumulate, pur avendo media nulla stanno per la maggior parte del tempo lontane dallo 0 e quindi mostrano un trend, pur essendo impossibile a priori prevederne l'evoluzione futura.

Quindi se il tema è questo si tratta di fuffa...
 
Tesi apparentemente singolare quella di Bizzarri.

Se prendo una serie storica, poniamo con cadenza oraria e costruisco le cumulate delle barre della 1^, 2^,...n^ ora separatamente ottengo n paths equiparabili a n moti browniani. E' noto che queste cumulate, pur avendo media nulla stanno per la maggior parte del tempo lontane dallo 0 e quindi mostrano un trend, pur essendo impossibile a priori prevederne l'evoluzione futura.

Quindi se il tema è questo si tratta di fuffa...

No, non funziona così, è in realtà simile a quello che fanno ottimi trader, solo che loro lo fanno in ambiente R o Python e non certo con carta e penna.
 
Indietro