一种基于FastText的恶意代码家族分类方法

张宇迪, 冯永新, 赵运弢

PDF(915 KB)
PDF(915 KB)
沈阳理工大学学报 ›› 2024, Vol. 43 ›› Issue (01) : 61-68+90.

一种基于FastText的恶意代码家族分类方法

  • 张宇迪, 冯永新, 赵运弢
作者信息 +
History +

摘要

传统的恶意代码家族分类方法主要通过代码家族浅层关联特征的统计分析达到分类和识别的目的。随着恶意代码加壳、混淆、多态技术的发展,传统方法的局限性逐渐显现,但恶意代码需调用API函数达成恶意目的始终是其不变的行为特征。基于embedding、word2vec模型的传统方法缺乏对低频API函数的特征提取能力,在表征API序列局部顺序特征时易产生映射失真,存在词典外API行为扩展、推理能力弱等导致分类准确率下降的不足。由此,引入负采样优化的FastText框架以加强对API序列映射的准确度,提出一种基于FastText框架下的恶意代码家族分类方法。利用FastText框架实现代码样本API序列的多维向量转换和精准表达,结合一维卷积及长短时记忆(LSTM)网络进一步提取API行为局部特征。实验结果表明,该模型的性能相较于传统的embedding方法和word2vec框架性能更优,准确率可达99%以上。

关键词

FastText / 恶意代码家族分类 / 长短时记忆网络

中图分类号

TP311.52 / TP309

引用本文

导出引用
张宇迪, 冯永新, 赵运弢. 一种基于FastText的恶意代码家族分类方法. 沈阳理工大学学报. 2024, 43(01): 61-68+90

基金

国家自然科学基金项目(61971291)

评论

PDF(915 KB)

Accesses

Citation

Detail

段落导航
相关文章

/