Bootstrap

AD-LLM: Benchmarking Large Language Models for Anomaly Detection

本文是LLM系列文章,针对《AD-LLM: Benchmarking Large Language Models for Anomaly Detection》的翻译。

摘要

异常检测(AD)是一项重要的机器学习任务,具有许多实际用途,包括欺诈检测、医疗诊断和工业监控。在自然语言处理(NLP)中,AD有助于检测垃圾邮件、错误信息和异常用户活动等问题。尽管大型语言模型(LLMs)对文本生成和摘要等任务产生了强烈的影响,但它们在AD中的潜力还没有得到足够的研究。本文介绍了AD-LLM,这是第一个评估LLM如何帮助NLP异常检测的基准。我们研究了三个关键任务:(i)零样本检测,使用LLM的预训练知识在没有特定任务训练的情况下执行AD;(ii)数据增强,生成合成数据和类别描述,以改进AD模型;以及(iii)模型选择,使用LLM来建议无监督的AD模型。通过对不同数据集的实验,我们发现LLM可以在零样本AD中很好地工作,精心设计的增强方法是有用的,并且解释特定数据集的模型选择仍然具有挑战性。基于这些结果,我们概述了阿尔茨海默病LLMs的六个未来研究方向。

1 引言

2

;