訂閱
糾錯
加入自媒體

機器學習基礎 | 監(jiān)督學習與無監(jiān)督學習的快速入門指南

介紹監(jiān)督學習和無監(jiān)督學習有什么區(qū)別?

對于機器學習的初學者和新手來說,這是一個常見的問題。答案是理解機器學習算法本質的核心。如果沒有明白監(jiān)督學習與無監(jiān)督學習之間的區(qū)別,你的機器學習之旅就無法繼續(xù)進行。實際上,這是你踏上機器學習之旅之初應該學習的東西。如果我們不了解線性回歸,邏輯回歸,聚類,神經網絡等算法的適用范圍,就不能簡單地跳到模型構建階段。

如果我們不知道機器學習算法的目標是什么,我們將無法建立一個準確的模型。這就是監(jiān)督學習與無監(jiān)督學習的由來。在這篇文章中,我將用例子討論這兩個概念,并回答一個大問題——如何決定何時使用監(jiān)督學習或非監(jiān)督學習?什么是監(jiān)督學習?在監(jiān)督學習中,計算機是通過數據來訓練的。它從過去的數據中學習,并將學習到的東西應用到現在的數據中,以預測未來的事件。在這種情況下,輸入數據和期望的輸出數據都為預測未來事件提供幫助。為了準確預測,輸入數據被標記了正確的類別。

監(jiān)督機器學習分類重要的是要先記住,所有有監(jiān)督學習算法本質上都是復雜的算法,分為分類或回歸模型。1) 分類模型:分類模型用于輸出變量可以分類的問題,例如“是”或“否”、“通過”或“失敗”。分類模型用于預測數據的類別,F實生活中的例子包括垃圾郵件檢測、情緒分析、考試記分卡預測等。2) 回歸模型:回歸模型用于輸出變量為實際值的問題,例如唯一的數字、美元、工資、體重或壓力。它通常用于根據先前的數據觀測預測數值。一些比較常見的回歸算法包括線性回歸、logistic回歸、多項式回歸和嶺回歸。

監(jiān)督學習算法在現實生活中有一些非常實際的應用,包括:文本分類人臉檢測簽名識別客戶發(fā)現垃圾郵件檢測天氣預報根據當前市場價格預測房價股票價格預測等什么是無監(jiān)督學習?另一方面,無監(jiān)督學習是訓練機器使用既沒有分類也沒有標記的數據的方法,這意味著不能提供任何訓練數據,機器只能自己學習。機器必須能夠對數據進行分類,而無需事先提供任何有關數據的信息。其思想是將機器暴露在大量變化的數據中,并允許它從這些數據中學習,以提供以前未知的見解,并識別隱藏的模式。因此,沒有必要定義無監(jiān)督學習算法的結果,相反,它確定了與給定數據集不同或有趣的內容。這臺機器需要編程才能自動學習。計算機需要理解結構化和非結構化數據。以下是無監(jiān)督學習的精確說明:

1)聚類是最常見的無監(jiān)督學習方法之一。聚類的方法包括將未標記的數據組織到稱為聚類的集群中。因此,集群是類似數據項的集合。這里的主要目標是發(fā)現數據點之間的相似性,并將相似的數據點分組到一個集群中。2)異常檢測是指識別與大部分數據有顯著差異的稀有項、事件或觀測值的方法。我們通常在數據中尋找異常或異常值,因為它們是可疑的。異常檢測常用于銀行詐騙和醫(yī)療差錯檢測。無監(jiān)督學習算法的應用無監(jiān)督學習算法的一些實際應用包括:欺詐檢測惡意軟件檢測數據輸入過程中人為錯誤的識別進行精確的購物籃分析等你應該怎么選擇監(jiān)督學習和無監(jiān)督學習?在制造業(yè)中,哪種機器學習方法最適合給定的任務受著有許多因素的影響。而且,由于每個機器學習問題都是不同的,決定使用哪種技術是一個復雜的過程。一般來說,磨練正確機器學習方法的一個好策略是:評估數據。它有標簽嗎?是否有專家知識支持附加標簽?這將有助于確定是否應使用有監(jiān)督、無監(jiān)督、半監(jiān)督或強化的學習方法明確目標。這個問題是反復出現的嗎?或者,該算法是否有望預測新的問題?回顧在維數(特征、屬性或特征的數量)方面可能適合該問題的現有算法。候選算法應該適合整個數據量及其結構研究算法類型在相似問題中的成功應用最后的話監(jiān)督學習和非監(jiān)督學習是機器學習領域的關鍵概念。在學習不同的機器學習算法之前,對基礎知識的正確理解是非常重要的。

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號