-
16-10-2019 - |
题
我正在研究欺诈检测系统。在该领域,新的欺诈行为定期出现,因此必须持续添加新功能。
我想知道(从开发过程的角度来看)处理它的最佳方法是什么?仅在功能向量中添加新功能并重新训练分类器似乎是一种天真的方法,因为将花费太多时间来重新学习旧功能。
我正在考虑为每个功能(或几个相关功能)培训分类器,然后将这些分类器的结果与整体分类器相结合。这种方法有任何缺点吗?如何为整体分类器选择算法?
解决方案
在理想的世界中,您保留所有历史数据,并确实通过从历史数据中追溯提取的新功能运行了一个新模型。我认为在此上花费的计算资源实际上非常有用。真的有问题吗?
是的,这是一种广泛接受的技术,可以建立分类器的合奏并结合其结果。您可以按照新功能和平均预测并行建立一个新模型。这应该增加值,但是,您永远不会以这种方式捕获新的和旧功能之间的互动,因为它们永远不会在分类器中出现。