Pytorch學(xué)習(xí)之19種損失函數(shù)
來源:CSDN-mingo_敏
地址:
https://blog.csdn.net/shanglianlm/article/details/85019768
基本用法
criterion = LossCriterion() #構(gòu)造函數(shù)有自己的參數(shù)loss = criterion(x, y) #調(diào)用標(biāo)準(zhǔn)時(shí)也有參數(shù)
19種損失函數(shù)1 L1范數(shù)損失 L1Loss
計(jì)算 output 和 target 之差的絕對值。
torch.nn.L1Loss(reduction='mean')
參數(shù):
reduction-三個(gè)值,none: 不使用約簡;mean:返回loss和的平均值;sum:返回loss的和。默認(rèn):mean。
2 均方誤差損失 MSELoss
計(jì)算 output 和 target 之差的均方差。
torch.nn.MSELoss(reduction='mean')
參數(shù):
reduction-三個(gè)值,none: 不使用約簡;mean:返回loss和的平均值;sum:返回loss的和。默認(rèn):mean。
3 交叉熵?fù)p失 CrossEntropyLoss
當(dāng)訓(xùn)練有 C 個(gè)類別的分類問題時(shí)很有效. 可選參數(shù) weight 必須是一個(gè)1維 Tensor, 權(quán)重將被分配給各個(gè)類別. 對于不平衡的訓(xùn)練集非常有效。
在多分類任務(wù)中,經(jīng)常采用 softmax 激活函數(shù)+交叉熵?fù)p失函數(shù),因?yàn)榻徊骒孛枋隽藘蓚€(gè)概率分布的差異,然而神經(jīng)網(wǎng)絡(luò)輸出的是向量,并不是概率分布的形式。所以需要 softmax激活函數(shù)將一個(gè)向量進(jìn)行“歸一化”成概率分布的形式,再采用交叉熵?fù)p失函數(shù)計(jì)算 loss。
torch.nn.CrossEntropyLoss(weight=None,ignore_index=-100, reduction='mean')
參數(shù):
weight (Tensor, optional) – 自定義的每個(gè)類別的權(quán)重. 必須是一個(gè)長度為 C 的 Tensor
ignore_index (int, optional) – 設(shè)置一個(gè)目標(biāo)值, 該目標(biāo)值會被忽略, 從而不會影響到 輸入的梯度。
reduction-三個(gè)值,none: 不使用約簡;mean:返回loss和的平均值;sum:返回loss的和。默認(rèn):mean。
4 KL 散度損失 KLDivLoss
計(jì)算 input 和 target 之間的 KL 散度。KL 散度可用于衡量不同的連續(xù)分布之間的距離, 在連續(xù)的輸出分布的空間上(離散采樣)上進(jìn)行直接回歸時(shí) 很有效.
torch.nn.KLDivLoss(reduction='mean')
參數(shù):
reduction-三個(gè)值,none: 不使用約簡;mean:返回loss和的平均值;sum:返回loss的和。默認(rèn):mean。
5 二進(jìn)制交叉熵?fù)p失 BCELoss
二分類任務(wù)時(shí)的交叉熵計(jì)算函數(shù)。用于測量重構(gòu)的誤差, 例如自動編碼機(jī). 注意目標(biāo)的值 t[i] 的范圍為0到1之間.
torch.nn.BCELoss(weight=None, reduction='mean')
參數(shù):
weight (Tensor, optional) – 自定義的每個(gè) batch 元素的 loss 的權(quán)重. 必須是一個(gè)長度為 “nbatch” 的 的 Tensor
6 BCEWithLogitsLoss
BCEWithLogitsLoss損失函數(shù)把 Sigmoid 層集成到了 BCELoss 類中. 該版比用一個(gè)簡單的 Sigmoid 層和 BCELoss 在數(shù)值上更穩(wěn)定, 因?yàn)榘堰@兩個(gè)操作合并為一個(gè)層之后, 可以利用 log-sum-exp 的 技巧來實(shí)現(xiàn)數(shù)值穩(wěn)定。
torch.nn.BCEWithLogitsLoss(weight=None, reduction='mean', pos_weight=None)
參數(shù):
7 MarginRankingLossweight (Tensor, optional) – 自定義的每個(gè) batch 元素的 loss 的權(quán)重. 必須是一個(gè)長度 為 “nbatch” 的 Tensor
torch.nn.MarginRankingLoss(margin=0.0, reduction='mean')
對于 mini-batch(小批量) 中每個(gè)實(shí)例的損失函數(shù)如下:
參數(shù):
margin:默認(rèn)值0
8 HingeEmbeddingLoss
torch.nn.HingeEmbeddingLoss(margin=1.0, reduction='mean')
對于 mini-batch(小批量) 中每個(gè)實(shí)例的損失函數(shù)如下:
參數(shù):
9 多標(biāo)簽分類損失 MultiLabelMarginLossmargin:默認(rèn)值1
torch.nn.MultiLabelMarginLoss(reduction='mean')
對于mini-batch(小批量) 中的每個(gè)樣本按如下公式計(jì)算損失:
也被稱為 Huber 損失函數(shù)。
torch.nn.SmoothL1Loss(reduction='mean')
torch.nn.SoftMarginLoss(reduction='mean')
torch.nn.MultiLabelSoftMarginLoss(weight=None, reduction='mean')
torch.nn.CosineEmbeddingLoss(margin=0.0, reduction='mean')
參數(shù):
14 多類別分類的hinge損失 MultiMarginLossmargin:默認(rèn)值0
torch.nn.MultiMarginLoss(p=1, margin=1.0, weight=None, reduction='mean')
參數(shù):
p=1或者2 默認(rèn)值:1margin:默認(rèn)值1
15 三元組損失 TripletMarginLoss
和孿生網(wǎng)絡(luò)相似,具體例子:給一個(gè)A,然后再給B、C,看看B、C誰和A更像。
torch.nn.TripletMarginLoss(margin=1.0, p=2.0, eps=1e-06, swap=False, reduction='mean')
其中:
16 連接時(shí)序分類損失 CTCLoss
CTC連接時(shí)序分類損失,可以對沒有對齊的數(shù)據(jù)進(jìn)行自動對齊,主要用在沒有事先對齊的序列化數(shù)據(jù)訓(xùn)練上。比如語音識別、ocr識別等等。
torch.nn.CTCLoss(blank=0, reduction='mean')
參數(shù):
reduction-三個(gè)值,none: 不使用約簡;mean:返回loss和的平均值;sum:返回loss的和。默認(rèn):mean。
17 負(fù)對數(shù)似然損失 NLLLoss
負(fù)對數(shù)似然損失. 用于訓(xùn)練 C 個(gè)類別的分類問題.
torch.nn.NLLLoss(weight=None, ignore_index=-100, reduction='mean')
參數(shù):
weight (Tensor, optional) – 自定義的每個(gè)類別的權(quán)重. 必須是一個(gè)長度為 C 的 Tensor
ignore_index (int, optional) – 設(shè)置一個(gè)目標(biāo)值, 該目標(biāo)值會被忽略, 從而不會影響到 輸入的梯度.
18 NLLLoss2d
對于圖片輸入的負(fù)對數(shù)似然損失. 它計(jì)算每個(gè)像素的負(fù)對數(shù)似然損失。
torch.nn.NLLLoss2d(weight=None, ignore_index=-100, reduction='mean')
參數(shù):
weight (Tensor, optional) – 自定義的每個(gè)類別的權(quán)重. 必須是一個(gè)長度為 C 的 Tensor
reduction-三個(gè)值,none: 不使用約簡;mean:返回loss和的平均值;sum:返回loss的和。默認(rèn):mean。
19 PoissonNLLLoss
目標(biāo)值為泊松分布的負(fù)對數(shù)似然損失:
torch.nn.PoissonNLLLoss(log_input=True, full=False, eps=1e-08, reduction='mean')
參數(shù):
log_input (bool, optional) – 如果設(shè)置為 True , loss 將會按照公 式 exp(input) - target * input 來計(jì)算, 如果設(shè)置為 False , loss 將會按照 input - target * log(input+eps) 計(jì)算.
full (bool, optional) – 是否計(jì)算全部的 loss, i. e. 加上 Stirling 近似項(xiàng) target * log(target) - target + 0.5 * log(2 * pi * target).
eps (float, optional) – 默認(rèn)值: 1e-8
參考資料:pytorch loss function 總結(jié)http://www.voidcn.com/article/p-rtzqgqkz-bpg.html
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。