VIP內容

近年來,機器學習取得了顯著進展,提供了一些新功能,比如創建複雜的、可計算的文本和圖像表示。這些功能催生了新產品,如基於圖像內容的圖像搜索、多種語言之間的自動翻譯,甚至是真實圖像和聲音的合成。同時,機器學習已經在企業中被廣泛采用,用於經典的用例(例如,預測客戶流失、貸款違約和製造設備故障)。

在機器學習取得成功的地方,它是非常成功的。

在許多情況下,這種成功可以歸因於對大量訓練數據的監督學習(結合大量計算)。總的來說,有監督的學習係統擅長於一項任務:預測。當目標是預測一個結果,並且我們有很多這個結果的例子,以及與它相關的特征時,我們可能會轉向監督學習。

隨著機器學習的普及,它在業務流程中的影響範圍已經從狹窄的預測擴展到決策製定。機器學習係統的結果經常被用來設定信用限額,預測製造設備故障,以及管理我們的各種新聞推送。當個人和企業試圖從這些複雜和非線性係統提供的信息中學習時,更多(和更好)的可解釋性方法已經被開發出來,這是非常重要的。

然而,僅僅基於預測的推理有一些基本的限製。例如,如果銀行提高客戶的信用額度會發生什麼?這些問題不能用建立在先前觀察到的數據上的相關模型來回答,因為它們涉及到客戶選擇的可能變化,作為對信用限額變化的反應。在很多情況下,我們的決策過程的結果是一種幹預——一種改變世界的行動。正如我們將在本報告中展示的,純粹相關的預測係統不具備在這種幹預下進行推理的能力,因此容易產生偏差。對於幹預下的數據決策,我們需要因果關係。

即使對於純粹的預測係統(這是監督學習的強項),應用一些因果思維也會帶來好處。根據因果關係的定義,它們是不變的,這意味著它們在不同的情況和環境中都是正確的。對於機器學習係統來說,這是一個非常理想的特性,在機器學習係統中,我們經常根據我們在訓練中沒有看到的數據進行預測;我們需要這些係統具有適應性和健壯性。

因果推理和機器學習的交集是一個迅速擴展的研究領域。它已經產生了可供主流采用的功能——這些功能可以幫助我們構建更健壯、可靠和公平的機器學習係統。

本書介紹了因果推理,因為它涉及很多數據科學和機器學習工作。我們引入因果圖,著重於消除理解的概念障礙。然後我們利用這個理解來探索關於不變預測的最新想法,它給高維問題帶來了因果圖的一些好處。通過附帶的原型,我們展示了即使是經典的機器學習問題,如圖像分類,也可以從因果推理工具中受益。

成為VIP會員查看完整內容
0
93
Top