VIP內容

人類生成的類別標簽通常是嘈雜的,因為從多個專家收集的數據在不同標簽之間表現出不一致。為了改善這一效果,一種方法是要求標記者對樣本進行比較或排序:當類別標簽被排序時,麵對兩個或更多樣本的標記者可以根據類別的從屬關係對它們按w.r.t.的相對順序進行排序。比較比類別標簽更能提供信息,因為它們捕捉了類別之間和類別內部的關係;後者並不僅僅通過類別標簽來揭示。此外,在實踐中,比較標簽的可變性減少了:這在許多領域的實驗中都觀察到了,這是因為人們經常發現做出相對判斷比做出絕對判斷更容易。

然而,從比較中學習帶來了計算上的挑戰回歸排名特征是一個計算密集型任務。從樣本之間的成對比較中學習對應於對(^2)比較標簽的推理。更一般地,從大小為K的樣本子集的排名中學習對應於對(^K)標簽的推理。這需要顯著改善性能,例如,最大似然估計(MLE)算法在這樣的數據集。最後,收集排名也是勞動密集型的。這正是因為要標記的勢集的大小為K的空間的大小為(^K)。

本教程將回顧經典的和最近的方法來解決從比較中學習的問題,更廣泛地說,從排名數據中學習。將特別關注排名回歸設置,即排名是從樣本特征回歸。

https://neu-spiral.github.io/LearningFromComparisons/

Parametric models: Bradley-Terry, Plackett-Luce, Thurstone. Non-parametric Models: noisy-permutation model, Mallows model, matrix factorization methods. Maximum Likelihood Estimation and spectral algorithms. Ranking regression and variational inference methods applied to comparisons. Sample complexity guarantees for ranking regression. Deep neural network models and accelerated learning methods. Active learning from comparisons.

成為VIP會員查看完整內容
0
34
0
Top