परिकल्पना परीक्षण

पायथन का उपयोग करके परिकल्पना परीक्षण पर एक सरल और संक्षिप्त ट्यूटोरियल

से छवि: http://www.advanceinnovationgroup.com/blog/median-based-hypothesis-testing

इस ब्लॉग में, मैं पायथन में सांख्यिकीय विधियों का उपयोग करके परिकल्पना परीक्षण का संक्षिप्त ट्यूटोरियल दूंगा। परिकल्पना परीक्षण वैज्ञानिक पद्धति का एक हिस्सा है जिससे हम सभी परिचित हैं, कुछ जो हमने शायद अपने शुरुआती शैक्षिक वर्षों में सीखा था। हालांकि, आंकड़ों में, कई प्रयोग आबादी के नमूने पर किए जाते हैं।

"यह निर्धारित करते हुए कि टिप्पणियों का एक नमूना सेट हमें प्रस्तावित स्पष्टीकरण के बारे में बताता है, सामान्य तौर पर, हमें एक अनुमान लगाने की आवश्यकता होती है, या जैसा कि हम सांख्यिकीविद् इसे कहते हैं, रीज़न विथ अनसोल्डिटी। अनिश्चितता के साथ तर्क करना सांख्यिकीय अनुमान का मूल है और इसे आमतौर पर नल हाइपोथीसिस सिग्नेचर टेस्टिंग नामक एक विधि का उपयोग करके किया जाता है। " -Ovens।

इस ब्लॉग के लिए एक उदाहरण के रूप में, मैं काग्ले पर पाए गए एक यूरोपीय सॉकर डेटा सेट का उपयोग करूंगा, और परिकल्पना परीक्षण का संचालन करूंगा। डेटासेट यहां पाया जा सकता है।

चरण 1

अवलोकन करें

पहला कदम घटनाओं का निरीक्षण करना है। इस मामले में, यह होगा: क्या औसत अनुमत लक्ष्यों पर रक्षा आक्रामकता का प्रभाव है?

चरण 2

अनुसंधान की जाँच करें

काम करने के लिए एक अच्छी मानसिकता कठिन नहीं होशियार है। एक अच्छी बात यह है कि देखें कि क्या आपके अवलोकन से संबंधित अनुसंधान पहले से मौजूद है। यदि ऐसा है तो यह हमारे प्रश्न का उत्तर देने में सहायता कर सकता है। पहले से मौजूद शोध या प्रयोगों से अवगत होने से हमें अपने प्रयोग को बेहतर बनाने में मदद मिलेगी, या शायद हमारे प्रश्न का उत्तर भी दे सकते हैं और पहली बार में प्रयोग नहीं करना है।

चरण 3

एक अशक्त परिकल्पना और एक वैकल्पिक परिकल्पना का गठन करें

एक वैकल्पिक परिकल्पना हमारा शिक्षित अनुमान है और एक शून्य परिकल्पना बस विपरीत है। यदि वैकल्पिक परिकल्पना दो राज्यों के बीच एक महत्वपूर्ण संबंध है, तो शून्य परिकल्पना कहती है कि कोई महत्वपूर्ण संबंध नहीं है।

हमारी अशक्त परिकल्पना यह होगी: 65 से कम बनाम 65 टीमों के बराबर या उससे अधिक की रक्षा आक्रामकता रेटिंग वाली टीमों के साथ अनुमत लक्ष्यों में कोई सांख्यिकीय अंतर नहीं है।

वैकल्पिक परिकल्पना: 65 से नीचे 65 बनाम से अधिक या उससे अधिक की रक्षा आक्रामकता रेटिंग वाली टीमों के साथ अनुमत लक्ष्यों में एक सांख्यिकीय अंतर है।

चरण 4

यह निर्धारित करें कि क्या हमारी परिकल्पना एक-पूंछ वाला परीक्षण है या दो-पूंछ वाला परीक्षण है।

वन-टेल्ड टेस्ट

"यदि आप 0.05 के महत्व स्तर का उपयोग कर रहे हैं, तो एक-पूंछ वाला परीक्षण आपके सभी अल्फा को ब्याज की एक दिशा में सांख्यिकीय महत्व का परीक्षण करने की अनुमति देता है।" एक-पूंछ वाले परीक्षण का एक उदाहरण होगा "65 से कम की आक्रामकता रेटिंग वाली फ़ुटबॉल टीमें सांख्यिकीय रूप से 65 की तुलना में कम रेटिंग वाली टीमों की तुलना में अधिक गोल करने की अनुमति देती हैं।"

टू-टेल टेस्ट

“यदि आप 0.05 के महत्व स्तर का उपयोग कर रहे हैं, तो दो-पूंछ वाला परीक्षण आपके अल्फा के आधे हिस्से को एक दिशा में सांख्यिकीय महत्व और दूसरे दिशा में सांख्यिकीय महत्व का परीक्षण करने के लिए आपके अल्फा के आधे हिस्से का परीक्षण करने की अनुमति देता है। इसका मतलब यह है कि 0.025 आपके परीक्षण सांख्यिकीय के वितरण की प्रत्येक पूंछ में है। ”

दो-पूंछ वाले परीक्षण के साथ, आप दोनों दिशाओं में सांख्यिकीय महत्व का परीक्षण कर रहे हैं। हमारे मामले में, हम दोनों दिशाओं में सांख्यिकीय महत्व का परीक्षण कर रहे हैं।

चरण 5

एक सीमा महत्व स्तर (अल्फा) सेट करें

(अल्फा मान): सीमांत दहलीज जिस पर हम अशक्त परिकल्पना को अस्वीकार करने के साथ ठीक हैं। एक अल्फा वैल्यू कोई भी वैल्यू हो सकती है जिसे हम 0 और 1 के बीच सेट करते हैं। हालांकि, साइंस में सबसे आम अल्फा वैल्यू 0.05 है। 0.05 में एक अल्फा सेट का मतलब है कि हम 5% या उससे कम मौका होने पर भी अशक्त परिकल्पना को खारिज करने के साथ ठीक हैं, परिणाम यादृच्छिकता के कारण हैं।

पी-मूल्य: इस डेटा को बेतरतीब ढंग से पहुंचने की गणना की संभावना।

यदि हम एक पी-वैल्यू की गणना करते हैं और यह 0.03 पर निकलता है, तो हम यह कहकर व्याख्या कर सकते हैं कि "एक 3% संभावना है कि जो परिणाम मैं देख रहा हूं वह वास्तव में यादृच्छिकता या शुद्ध भाग्य के कारण हैं"।

Learn.co से छवि

हमारा लक्ष्य पी-मूल्य की गणना करना और हमारे अल्फा से तुलना करना है। अल्फा जितना कम होगा परीक्षण उतना ही कठोर होगा।

चरण 6

सैंपलिंग करें

यहां हमारे पास हमारे डाटासेट फुटबॉल कहा जाता है। हमारे परीक्षण के लिए, हमें अपने डेटा सेट में केवल दो कॉलम की आवश्यकता है: team_def_aggr_rating और गोल_allowed। हम इसे इन दो स्तंभों के लिए फ़िल्टर करेंगे, फिर रक्षात्मक आक्रामकता रेटिंग वाली टीमों के लिए दो सबसेट बनाएं जो 65 से अधिक या उसके बराबर हों और 65 से नीचे की रक्षात्मक आक्रामकता रेटिंग वाली टीमें।

बस हमारी परिकल्पना परीक्षण के लिए फिर से तैयार करने के लिए:

औसत अनुमत लक्ष्यों पर रक्षा आक्रामकता का प्रभाव। अशक्त परिकल्पना: 65 से नीचे या 65 से अधिक टीमों के रक्षा आक्रामकता रेटिंग के साथ टीमों के साथ अनुमत लक्ष्यों में कोई सांख्यिकीय अंतर नहीं है। वैकल्पिक परिकल्पना: लक्ष्यों में एक सांख्यिकीय अंतर होता है, जिसमें रक्षा आक्रामकता की अधिक से अधिक रेटिंग वाली टीमों के साथ अनुमति दी जाती है। 65 से कम बनाम 65 टीमों के बराबर। दो-पूंछ वाला टेस्ट अल्फा: 0.05

अब हमारे पास नमूनों की दो सूचियाँ हैं जिन पर हम सांख्यिकीय परीक्षण चला सकते हैं। उस कदम से पहले, मैं एक दृश्य प्राप्त करने के लिए दो वितरणों की साजिश रचूंगा।

चरण 7

दो-नमूना टी-परीक्षण करें

दो-नमूना टी-परीक्षण का उपयोग यह निर्धारित करने के लिए किया जाता है कि क्या दो जनसंख्या साधन समान हैं। इसके लिए, हम पाइथन मॉड्यूल का उपयोग करेंगे, जिसे स्टैटमोडल कहा जाता है। मैं आँकड़ों के बारे में बहुत विस्तार में नहीं जाऊँगा, लेकिन आप यहाँ प्रलेखन देख सकते हैं।

चरण 8

मूल्यांकन और निष्कर्ष

याद रखें कि हमने जो अल्फा सेट किया था वह एक = 0.05 था। जैसा कि हम अपने परीक्षण के परिणामों से देख सकते हैं कि पी-मूल्य हमारे अल्फा से कम है। हम अपनी अशक्त परिकल्पना को अस्वीकार कर सकते हैं और 95% विश्वास के साथ हमारी वैकल्पिक परिकल्पना को स्वीकार करते हैं।

पढ़ने के लिए धन्यवाद! परिकल्पना परीक्षण पर अधिक गहराई के लिए, आप इस समूह परियोजना की जाँच कर सकते हैं GitHub I पर यहाँ परिकल्पना परीक्षण पर शामिल किया गया था।

संसाधन:

ओवन, मैथ्यू। "सांख्यिकी और" वैज्ञानिक विधि "YourStatsGuru से लिया गया। https://www.yourstatsguru.com/secrets/scimethod-stats/?v=4442e4af0916

एसएएस का परिचय। यूसीएलए: सांख्यिकीय परामर्श समूह। से 16, 2019)।

इंजीनियरिंग सांख्यिकी पुस्तिका। https://www.itl.nist.gov/div898/handbook/eda/section3/eda353.htm