
文章內容都是錯的SPC知識
工作狂人的網站寫過一篇文章討論Cpk及Ppk的計算演練「管制圖Cpk、Cp與Ppk、Pp的計算實例演練」,文章底下扣除我的留言總共有7篇留言,全都圍繞著作者文章提及的結論:「Ppk值幾乎永遠都大於Cpk值」。
Jeff 看到文章中的陳述以及各位讀者的討論,了解到在這部分的謬誤,因此開了一篇文章想澄清這部分的觀念以及完整陳述SPC應如何執行的細節,各位讀這篇文章時可以參照工作狂人原先的文章以及 Jeff 的這篇文章及參考文章。
讀者的留言
《留言1》
「Ppk值幾乎永遠都大於Cpk值」
我找到幾個資料和這說法相反,請看以下連結,
http://sixsigmastudyguide.com/process-capability-cp-cpk/
In theory Cpk will always be greater than or equal to Ppk. There are anomalies seen when the sample size is small and the data represents a short amount of time where estimating using R will overstate standard deviation and make Cpk smaller than Ppk.
而且你可以看以下連結中的minitab計算的實例,Cpk也是大於Ppk http://blog.minitab.com/blog/michelle-paret/process-capability-statistics-cpk-vs-ppk 這是因為樣本大小不同造成的嗎?? 再麻煩你開釋了,謝謝
《回應1 by Jeff》
從Ppk跟Cpk的公式就能直接推導Cpk ≥ Ppk的結論,因此「Ppk值幾乎永遠都大於Cpk值」這句話本身就是錯的。由於作者本身的結論是錯誤的,所以讀者留言1感到困惑。事實上留言1的讀者找到的網址是正確的,但網址提到的狀況是例外中的例外,其實不值得詳談。簡單來說,如果你的SPC每組數據都有4~5筆,而且又有20~25組數據,那就不可能發生Cpk < Ppk的事情,那也就沒什麼好討論的了。
《留言2》
對於 Chen 的留言我的想法是因為定義來說 ppk 是看 overall 變異,所以理論上的確 overall ≥ within 所以 Cpk ≥ Ppk,但是當製程趨於穩定時 overall ≒ within Cpk ≒ Ppk,又因為有抽樣誤差,因此有可能 Cpk < Ppk 不知道這樣對不對@@
《回應2 by Jeff》
這樣的推論是不正確的。製程趨於穩定的時候,總變異 = 組間變異 + 組內變異;此時由於製程穩定,所以組間變異只能說很小,不能說等於0。在這個條件下總變異仍然會大於組內變異,因此 Cpk 仍會 ≥ Ppk。
《留言3》
你好!首先謝謝你的文章,個人受益良多!謝謝。小弟對這篇文章有一行計算「標準差平均值(s-bar)=0.034436」感到疑惑,這5組標準差(0.0334、0.0414、0.0361、0.0268、0.0344)不應該是「0.03442」嗎? 文章中 0.034436 是如何計算出呢?
《回應3 by Jeff》
由於作者將20組、每組各5筆數據誤認成5組、每組各20筆數據,因此導致有這5組標準差。所以這5組標準差是錯誤的資訊,不需要糾結到底是怎麼計算的,因為怎麼算都是錯的。
《留言4》
我想,不管是 cpk、ppk,式子裏頭的未知參數都用相對之估計式取代,然估計式可以試點估計或區間估計法,是故 CPK, PPK 應以其區間估計值(信賴區間)來看待(考量抽樣誤差)而非僅單一數值。理論上還是 CPK ≥ PPK。
《回應4 by Jeff》
這位讀者想得太複雜了,居然還用上了區間估計…。事實上沒那麼複雜,在 SPC 裡面我們就是運用點估計的方式取得母體標準差的估計值,所以結論還是一樣,Cpk 會大於等於 Ppk。
《留言5》
你的計算是對的。但最後的結論是不符合一般狀況的,其實一般都是 Cpk ≥ Ppk。因為總體標準差 = 組內標準差 + 組間標準差,Cpk 只有考慮組內標準差,所以 Cpk 會比較好看。你會有這個結論是因為文中的範例太特殊,這個範例中,組內標準差太大,而組間差異幾乎等於0,才會導致 Ppk > Cpk 的特殊結果。我猜你是用亂數產生器去跑100個數字,然後分成5組,所以數據才會長這個樣子。
《回應5 by Jeff》
這位讀者說的總體標準差=組內標準差+組間標準差 是錯誤的說法,正確的說法是總變異=組內變異+組間變異 差別在於有無平方項。平方項的概念是取距離的總和 因為想評估資料之間彼此的距離遠近又擔心正負相抵,因此提出了平方項相加的概念 作為評估資料之間的距離關係,另外並非這個範例太特殊 純粹就是作者本身用錯計算方式了
上述這段我說錯了,這位讀者前半段說的是對的,總體標準差=組內標準差+組間標準差。但後面的猜測是錯的,作者不是用亂數產生器跑100筆資料,而是算錯了數據的組數。
《留言6》
Subgroup sizes = 5,感覺是每組有5筆(5筆*20組),而不是有5組(20筆*5組)。
《回應6 by Jeff》
這位讀者說對了,但還不是很確定的感覺。其實不用擔心,就是因為作者算錯數據了,你的觀察是正確的。
正確的知識應該被更多人看見
截至 2025/08/07,工作狂人這篇錯誤的文章已累積 80,278 人次瀏覽。Jeff 在 2020 年發表這篇澄清文時,當時的瀏覽人次僅約 2,800 次,流量差距將近 29 倍。
雖然目前無法得知這篇澄清文的最新瀏覽數,但錯誤的內容至今仍未修正,持續影響更多讀者。希望這篇文章能被更多人看見,協助大家釐清觀念,也讓真正正確的統計知識被廣泛應用在工作中。
正確的知識有其必要性,正確應用知識能協助各位在工作中以簡化繁,真正理解問題所在;一知半解甚至似懂非懂的胡亂應用只會把問題越弄越糟,大家領薪水瞎忙一場,沒有任何人得到好處。
若你希望更深入理解 SPC 的核心邏輯與實務應用,歡迎參考 Jeff 的課程或更多文章,學會判斷不只是看數字,而是理解變異背後的意義。
參考文章
【品質工程】管制圖的為什麼(6):Control Chart沒事不要調整參數?
相關課程
2025.08.03 文章搬移至森品官網
2020.09.26 編修文章內容
2019.11.27 編輯文章格式

