JPL crea un archivio PDF per aiutare la ricerca sul malware.

JPL creates a PDF archive to assist malware research.

Il progetto Corpora Digitale ospita l'archivio di dati enorme come parte del programma di sponsorizzazione Open Data di Amazon Web Services, e i file sono stati confezionati in file zip facilmente scaricabili. ¶ Credito: Science RF/Adobe

Gli scienziati dei dati presso il Jet Propulsion Laboratory della National Aeronautics and Space Administration degli Stati Uniti (JPL) hanno compilato 8 milioni di file PDF in un archivio open source per migliorare la sicurezza online.

Il corpus fa parte del programma Safe Documents dell’agenzia per i progetti di ricerca avanzata del Dipartimento della Difesa degli Stati Uniti (DARPA).

Gli esperti possono cercare in questo archivio informazioni su malware che potrebbero essere nascosti nel codice di un file per aiutare a prevedere le minacce online emergenti e per aumentare la tecnologia PDF.

I ricercatori hanno identificato i PDF da includere utilizzando Common Crawl, un repository pubblico di dati di Web-crawl, mentre il software specializzato ha recuperato i file troncati.

L’insieme di dati di circa 8 terabyte è il corpus più grande del suo tipo disponibile pubblicamente. Dal Jet Propulsion Laboratory Vedi l’articolo completo

Abstracts Copyright © 2023 SmithBucklin, Washington, D.C., USA