JPL crea un archivio PDF per aiutare la ricerca sul malware.
JPL creates a PDF archive to assist malware research.
Gli scienziati dei dati presso il Jet Propulsion Laboratory della National Aeronautics and Space Administration degli Stati Uniti (JPL) hanno compilato 8 milioni di file PDF in un archivio open source per migliorare la sicurezza online.
Il corpus fa parte del programma Safe Documents dell’agenzia per i progetti di ricerca avanzata del Dipartimento della Difesa degli Stati Uniti (DARPA).
Gli esperti possono cercare in questo archivio informazioni su malware che potrebbero essere nascosti nel codice di un file per aiutare a prevedere le minacce online emergenti e per aumentare la tecnologia PDF.
I ricercatori hanno identificato i PDF da includere utilizzando Common Crawl, un repository pubblico di dati di Web-crawl, mentre il software specializzato ha recuperato i file troncati.
- Scegliere la strada giusta modelli di churn vs modelli di uplift
- Creare un Vantaggio Informativo con l’Accesso Conversazionale ai Dati
- Attenzione ai dati non affidabili nella valutazione del modello uno studio di caso sulla selezione della prompt LLM con Flan-T5.
L’insieme di dati di circa 8 terabyte è il corpus più grande del suo tipo disponibile pubblicamente. Dal Jet Propulsion Laboratory Vedi l’articolo completo
Abstracts Copyright © 2023 SmithBucklin, Washington, D.C., USA