Eccomi : windows 10 home 64 bit + office 2019 - 32 bit
qui lo screenshot ottenuto
...e questo è il caso classico di NON funzionamento.
Il "flusso logico" del programma è il seguente:
1) scarico la pagina in HTML (e questo funziona, sempre)
2) assegno il contenuto HTML ad un documento DOM con: doc.body.innerHTML = p
3) leggo il contenuto in formato "puro testo" grazie alla innerText, con: doc.body.innerText (e QUI sorge il problema)
4) estraggo dal testo tutti i dati che mi servono.
N.B.: la struttura DOM e le proprietà citate fanno parte delle librerie standard di sistema su Windows, non sono ovviamente "cose" su cui posso mettere le mani !
Da alcune ricerche fatte in rete, pare che, da fonti ufficiose non confermate, alcuni aggiornamenti di Office applichino una sorta di "aliasing" alla proprietà/funzione di libreria "innerText", reindirizzandola automaticamente verso "textContent" in modo del tutto trasparente all'utente (e, ahimé, al programmatore).
Dal sito Microsoft:
The property textContent is similar to the innerText property, however there are some differences:
textContent returns the text content of all elements, while innerText returns the content of all elements, except for script and style elements.
innerText will not return the text of elements that are hidden with CSS (textContent will).
Pertanto è Microsoft stessa che dice che innerText NON DOVREBBE restituire il codice js ma, dopo determinati aggiornamenti di Office (quali ? ...non lo so ! Ma soprattutto PERCHE' ???)
la chiamata a innerText viene "trasformata" in textContent, che restituisce anche il codice JavaScript insieme al contenuto di testo.
Quindi nel momento in cui il programma cerca la semplice stringa "Prezzo Ultimo Contratto " seguita dalle CIFRE del prezzo, in questo caso troverà del codice js che, una volta interpretato come numero, ovviamente darà errore !
Ovviamente il tutto agisce a livello di sistema, quindi il singolo programma NON può "risolvere", né bypassare questa cosa.
Soluzione ? Temo NESSUNA
, al di là di NON fare gli aggiornamenti di Office, o usare versioni precedenti !
(Io con Office 2010 non ho problemi, né mi scarica aggiornamenti. Il sistema operativo del PC, invece, non sembra essere influente.)
Questo è quanto, allo stato attuale.