P.A.T.
Nuovo Utente
- Registrato
- 8/5/01
- Messaggi
- 31.034
- Punti reazioni
- 1.404
Uscito oggi.
Dopo un anno di studi Hassabis ed il suo team hanno creato il nuovo algoritmo MuZero, che a loro avviso rappresenta una rivoluzione nel campo dell'intelligenza artificiale applicata ai giochi. Pare di capire che Muzero non fosse stato progettato per gli scacchi, ma per robe tipo Space Invaders, Supermario e collateralmente, ovvero come effetto collaterale della loro ricerca sui domini che riguardano la visione, ha eguagliato le prestazioni di Alphazero e negli scacchi.
abstract
Nell'ambito degli scopi dell'intelligenza artificiale, la costruzione di agenti con capacità di pianificazione è stata a lungo una delle principali sfide. I metodi di pianificazione basati sull'esplorazione di alberi hanno riscosso un enorme successo in settori difficili come gli scacchi e Go, dove un simulatore perfetto è disponibile. Tuttavia, nei problemi del mondo reale le dinamiche che governano l'ambiente sono spesso complesse e sconosciute. In questo lavoro presentiamo l'algoritmo MuZero che, combinando una ricerca basata su tre modelli appresi, consente di ottenere prestazioni umane superiori in intervalli che variano domini sfidanti (challenging) e visivamente complessi, senza alcuna conoscenza delle loro dinamiche sottostanti.
MuZero apprende un modello che quando è applicato in modo iterativo, prevede le variabili più rilevanti per la pianificazione: la ricompensa, la politica di selezione delle azioni e la funzione valore. L'ambiente canonico nei videogiochi per testare le tecniche di intelligenza artificiale è costituito dai giochi Atari, dominio in cui i modelli basati sugli approcci di pianificazione hanno storicamente competuto in passato.
Valutati su 57 diversi giochi Atari il nostro nuovo algoritmo ha raggiunto un nuovo stato dell'arte.
Quando invece è stato valutato sul Go, sugli scacchi e sullo shogi, senza alcuna conoscenza delle regole del gioco, MuZero ha eguagliato le prestazioni sovrumane dell'algoritmo AlphaZero, a cui era stato fornito le sole regole del gioco.
https://arxiv.org/pdf/1911.08265.pdf
Dopo un anno di studi Hassabis ed il suo team hanno creato il nuovo algoritmo MuZero, che a loro avviso rappresenta una rivoluzione nel campo dell'intelligenza artificiale applicata ai giochi. Pare di capire che Muzero non fosse stato progettato per gli scacchi, ma per robe tipo Space Invaders, Supermario e collateralmente, ovvero come effetto collaterale della loro ricerca sui domini che riguardano la visione, ha eguagliato le prestazioni di Alphazero e negli scacchi.
abstract
Nell'ambito degli scopi dell'intelligenza artificiale, la costruzione di agenti con capacità di pianificazione è stata a lungo una delle principali sfide. I metodi di pianificazione basati sull'esplorazione di alberi hanno riscosso un enorme successo in settori difficili come gli scacchi e Go, dove un simulatore perfetto è disponibile. Tuttavia, nei problemi del mondo reale le dinamiche che governano l'ambiente sono spesso complesse e sconosciute. In questo lavoro presentiamo l'algoritmo MuZero che, combinando una ricerca basata su tre modelli appresi, consente di ottenere prestazioni umane superiori in intervalli che variano domini sfidanti (challenging) e visivamente complessi, senza alcuna conoscenza delle loro dinamiche sottostanti.
MuZero apprende un modello che quando è applicato in modo iterativo, prevede le variabili più rilevanti per la pianificazione: la ricompensa, la politica di selezione delle azioni e la funzione valore. L'ambiente canonico nei videogiochi per testare le tecniche di intelligenza artificiale è costituito dai giochi Atari, dominio in cui i modelli basati sugli approcci di pianificazione hanno storicamente competuto in passato.
Valutati su 57 diversi giochi Atari il nostro nuovo algoritmo ha raggiunto un nuovo stato dell'arte.
Quando invece è stato valutato sul Go, sugli scacchi e sullo shogi, senza alcuna conoscenza delle regole del gioco, MuZero ha eguagliato le prestazioni sovrumane dell'algoritmo AlphaZero, a cui era stato fornito le sole regole del gioco.
https://arxiv.org/pdf/1911.08265.pdf