Data Quality for Security Challenges: Case Studies of Phishing, Malware and Intrusion Detection Datasets

Verma, Rakesh M.; Zeng, Victor; Faridi, Houtan

doi:10.1145/3319535.3363267

Citation Details

Data Quality for Security Challenges: Case Studies of Phishing, Malware and Intrusion Detection Datasets

Techniques from data science are increasingly being applied by researchers to security challenges. However, challenges unique to the security domain necessitate painstaking care for the models to be valid and robust. In this paper, we explain key dimensions of data quality relevant for security, illustrate them with several popular datasets for phishing, intrusion detection and malware, indicate operational methods for assuring data quality and seek to inspire the audience to generate high quality datasets for security challenges. more »

Award ID(s):: 1659755

PAR ID:: 10137610

Author(s) / Creator(s):: Verma, Rakesh M.; Zeng, Victor; Faridi, Houtan

Date Published:: 2019-11-06

Journal Name:: Conference on Computer and Communications Security

Page Range / eLocation ID:: 2605 to 2607

Format(s):: Medium: X

Sponsoring Org:: National Science Foundation

Free Publicly Accessible Full Text
Accepted Manuscript1.0
Conference Paper:
https://doi.org/10.1145/3319535.3363267

More Like this