Questi file però sono un po’ problematici, perché:
- si chiamano “URL AGCOM.txt” proprio mixed case e con lo spazio;
- sono codificati in UTF-16 una scelta bizzarra per chi si occupa di elaborare dati simili;
- ma la codifica MIME indicata è US-ASCII e quindi sono illeggibili per i mail reader correttamente funzionanti;
- hanno i caratteri di fine riga di MS-DOS che circa qualsiasi ISP deve convertire;
- contengono un misto di domini con e senza www. davanti e con e senza http:// davanti;
- hanno spazi a inizio e fine riga, ma solo a volte;
- l’ultima riga non ha i caratteri di fine riga e ci ho messo un po’ per capire come mai non era leggibile…;
- mancano di qualsiasi metodo che permetta di verificarne l’integrità;