車產翻譯模板 機器學習中的正負樣本
日期:2023-03-11 12:39:36 / 人氣: 868 / 發(fā)布者:成都翻譯公司
對于機器學習中的正負樣本問題,之前思考過一次,但是后來又有些迷惑,又看了些網上的總結,記錄在這里。下面摘錄一段博客中的解釋,是針對與SSD訓練中的正負樣本的生成問題:具體的代碼還沒有仔細研究,FasterRcnn也是類似的策略,它們的代碼都值得好好研究一下,但是目前還不知道yolo再選取負樣本的時候有沒有用到什么策略,有時間應該拜讀一下論文。關于機器學習中的正負樣本問題,我之前想過一次,但后來有點糊涂了。我閱讀了一些在線摘要并記錄在此處。
我們經常涉及的任務是檢測和分類。
對于分類問題,正樣本就是我們要正確分類的類別對應的樣本。例如,我們需要對一張圖片進行分類,以確定它是否屬于汽車。那么在訓練過程中,汽車的圖片是一個正樣本。原則上,一個負樣本可以選擇任何其他不是汽車的圖片車產翻譯模板,這樣就可以訓練一個汽車的分類網絡。在這個網絡上測試會發(fā)現車產翻譯模板,它會將一些非汽車圖片誤報為汽車。假陽性圖片是“困難樣本”。在后續(xù)的訓練中,這些硬樣本被加入到負樣本集中進行訓練。*終的網絡模型效果會更好。這個過程被稱為“困難的例子”。Dig”。另外,在選擇負樣本時,原則上,您可以選擇任何非汽車圖片作為負樣本,但更合理的情況應該考慮實際應用場景,例如實際應用是行車記錄儀上拍攝的圖片。那么對于分類,負樣本應該是其他非汽車圖片,如道路、樹木、路燈等。
針對檢測問題,需要判斷哪里有什么東西,也就是位置回歸,還要分類。這時候正樣本就是我們預先標出的bbox box的一部分,但是一般的檢測框架都是按照一定的規(guī)則生成一些預測的bbox,所以在選擇正樣本的時候需要判斷重疊在這些生成的 bbox 和 GT bbox 之間。如果重疊大于某個閾值,則將預測的 bbox 視為正樣本。如果沒有超過這個閾值,就被認為是一個負樣本。以下摘自博客中的解釋,針對SSD訓練中正負樣本的生成:
給定輸入圖像和每個物體的Ground Truth,首先找到每個Ground True Box對應的Default Box中*大的IOU作為正樣本。然后,在剩余的 Default Boxes 中,找到那些與任何 Ground Truth Box 的 IOU 大于 0.5 的 Default Box 作為正樣本。其他被視為負樣本(每個 Default Box 要么是一個正樣本 Box,要么是一個負樣本 Box)。如上圖,兩個默認框匹配貓,一個匹配狗。在訓練過程中,采用了Hard Negative Mining的策略(所有box都按照Confidence Loss進行排序,使得正負例的比例保持在1:3),以平衡正負的比例例子。
引自
具體代碼沒有仔細研究。FasterRcnn 也是一個類似的策略。他們的代碼值得研究。但是目前不知道yolo選擇負樣本的時候有沒有什么策略。如果你有時間,你應該閱讀這篇論文。
相關閱讀Relate
熱門文章 Recent
- 地稅完稅證明翻譯模板 地稅完稅證明委托書2023-03-11
- 機動車翻譯證書模板-登記證書式樣模板2023-03-11
- 兼職翻譯求職簡歷模板范文 英語翻譯下載求職簡歷模板(女性)2023-03-11
- 房產證所有頁翻譯件模板 房產證翻譯2023-03-11
- 英國留學簽證翻譯件模板 英國留學簽證申請表要如何正確填寫2023-03-11
- 申根簽證戶口本翻譯模板 法國學術會議申根簽證辦理(因私)2023-03-11
- 英國簽證戶口本翻譯模板百度云 第五篇:出國留學英國美國等國家學校的申請經驗分享2023-03-11
- 翻譯指令模板 Visual Studio設置代碼注釋模板2023-03-11
- 集體戶口證件翻譯模板 集體戶口的戶口證明怎么開2023-03-11
- 四六級成績翻譯模板 11月大學英語四六級口語考試必備,自我介紹*全模板!2023-03-11