用于比较两个向量以进行分类的损失函数

我正在执行一项 NLP 任务,在其中分析文档并将其分类为六个类别之一。但是,我在三个不同的时间段执行此操作。所以最终的输出是一个由三个整数组成的数组(稀疏),其中每个整数都是 0-5 的类别。因此,一个标签看起来像这样:[1, 4, 5]

我正在使用 BERT 并试图决定我应该连接什么类型的头部,以及我应该使用什么类型的损失函数。使用 BERT 的 size 输出1024并将其运行通过Dense具有 18 个神经元的层,然后重塑为 size 的东西是否有意义(3,6)

最后,我假设我会使用稀疏分类交叉熵作为我的损失函数?

以上是用于比较两个向量以进行分类的损失函数的全部内容。
THE END
分享
二维码
< <上一篇
下一篇>>