數(shù)理統(tǒng)計課程應(yīng)用統(tǒng)計學(xué)探討

時間:2022-10-18 10:35:09

導(dǎo)語:數(shù)理統(tǒng)計課程應(yīng)用統(tǒng)計學(xué)探討一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

數(shù)理統(tǒng)計課程應(yīng)用統(tǒng)計學(xué)探討

摘要:本文旨在對應(yīng)用統(tǒng)計學(xué)專業(yè)中數(shù)理統(tǒng)計課程的現(xiàn)狀進(jìn)行分析,針對目前該課程教學(xué)過程中存在的問題,通過引入Python軟件對各主要知識點內(nèi)容進(jìn)行實現(xiàn),并從教師隊伍、實踐教學(xué)和過程化考核等方面給出課程改革的幾點探索,以提高學(xué)生學(xué)習(xí)興趣、加深學(xué)生對知識內(nèi)涵的理解、培養(yǎng)學(xué)生實踐和解決實際問題的能力,更高質(zhì)量地落實應(yīng)用型人才的培養(yǎng)。

關(guān)鍵詞:數(shù)理統(tǒng)計;應(yīng)用統(tǒng)計學(xué);Python程序設(shè)計語言;人才培養(yǎng)

隨著科技的快速發(fā)展,數(shù)理統(tǒng)計在自然科學(xué)、工程技術(shù)、管理科學(xué)及人文社會科學(xué)中得到越來越廣泛應(yīng)用。對于該課程傳統(tǒng)的重理論輕應(yīng)用的教學(xué)模式已不能適應(yīng)時代的發(fā)展和社會對人才的需求。應(yīng)用型人才的培養(yǎng)已成為新時代人才培養(yǎng)的風(fēng)向標(biāo),結(jié)合大數(shù)據(jù)時代現(xiàn)狀的發(fā)展需要,培養(yǎng)數(shù)理統(tǒng)計分析處理方面的人才更是大勢所趨。數(shù)理統(tǒng)計作為數(shù)學(xué)的一個分支,其以概率論為基礎(chǔ),研究大量隨機(jī)現(xiàn)象的統(tǒng)計規(guī)律性,由于計算機(jī)的廣泛應(yīng)用使得數(shù)理統(tǒng)計在理論研究和應(yīng)用已滲透到許多科學(xué)領(lǐng)域,并已成為科學(xué)研究不可缺少的工具[1]。但是,當(dāng)前數(shù)理統(tǒng)計課程教學(xué)過程中與計算機(jī)技術(shù)的結(jié)合卻存在嚴(yán)重的問題。為了提高教學(xué)效果、培養(yǎng)學(xué)生動手操作能力,將當(dāng)前主流計算機(jī)語言用于在應(yīng)用層面揭示各數(shù)理統(tǒng)計知識點的內(nèi)涵,并使得學(xué)生能夠熟練使用計算工具處理具體的數(shù)理統(tǒng)計問題,進(jìn)而對該課程的教學(xué)改革進(jìn)行探索,以實現(xiàn)應(yīng)用型人才的全面培養(yǎng)是當(dāng)前該課程面對的首要問題。

一、數(shù)理統(tǒng)計課程現(xiàn)狀分析

本文以應(yīng)用統(tǒng)計學(xué)專業(yè)為例,結(jié)合多年教學(xué)經(jīng)驗對數(shù)理統(tǒng)計課程、教學(xué)現(xiàn)狀、課程工具以及存在的問題進(jìn)行簡單介紹分析。

(一)數(shù)理統(tǒng)計課程簡介

數(shù)理統(tǒng)計課程作為應(yīng)用統(tǒng)計學(xué)專業(yè)的學(xué)科基礎(chǔ)與專業(yè)核心課程是多元統(tǒng)計分析、貝葉斯統(tǒng)計、非參數(shù)統(tǒng)計和數(shù)據(jù)挖掘技術(shù)與應(yīng)用等課程的基礎(chǔ)。應(yīng)用統(tǒng)計學(xué)專業(yè)旨在培養(yǎng)人格健全、統(tǒng)計學(xué)基礎(chǔ)知識與基本方法理論扎實、數(shù)據(jù)處理實踐能力強、勇于創(chuàng)新,能在工程、經(jīng)濟(jì)、管理、商務(wù)等領(lǐng)域從事數(shù)據(jù)采集、清洗、整理等實際工作,解決數(shù)據(jù)挖掘與分析中涉及的復(fù)雜統(tǒng)計方法問題的高素質(zhì)應(yīng)用型人才。而該課程是在概率論的基礎(chǔ)上對于統(tǒng)計知識的深入詳細(xì)講解,主要涉及統(tǒng)計量與抽樣分布、點估計、區(qū)間估計、假設(shè)檢驗和分布的檢驗等內(nèi)容。該課程主要是為了使學(xué)生了解并掌握數(shù)理統(tǒng)計學(xué)的基本思想、理論和方法,初步學(xué)會在實際工作中實現(xiàn)對數(shù)據(jù)的處理與分析。

(二)數(shù)理統(tǒng)計課程現(xiàn)狀

該課程是數(shù)據(jù)統(tǒng)計分析的基礎(chǔ),大多數(shù)高校的相關(guān)專業(yè)針對學(xué)生數(shù)據(jù)統(tǒng)計分析知識的傳授和能力的培養(yǎng)主要通過概率論與數(shù)理統(tǒng)計這一門課來實現(xiàn)基礎(chǔ)內(nèi)容的講解,而將概率論(48學(xué)時)和數(shù)理統(tǒng)計(48學(xué)時)分別單獨課設(shè)主要在統(tǒng)計學(xué)相關(guān)專業(yè)居多。不論是從課程的單獨開設(shè),還是課時的安排都足以體現(xiàn)出該課程對于統(tǒng)計學(xué)專業(yè)學(xué)生的重要性。但是在高校的教學(xué)過程中發(fā)現(xiàn),學(xué)生對該課程重要性的認(rèn)識不足,僅把該課程看作是一般的公共類數(shù)學(xué)課,對自己的要求只是考試通過的層面,并沒有把該課程當(dāng)成統(tǒng)計專業(yè)的重要基礎(chǔ)課程,也并未意識到該課程的內(nèi)容會高頻率的出現(xiàn)在后續(xù)的專業(yè)課中,從而很大程度上影響了學(xué)生的學(xué)習(xí)熱情和積極性。另外,由于該課程內(nèi)容抽象,且包含了大量的復(fù)雜理論,使得教學(xué)難度較大,并且學(xué)生的數(shù)學(xué)基礎(chǔ)較差,理解能力也存在差異,從而加大了學(xué)生的學(xué)習(xí)難度。并且,大多數(shù)該課程的教學(xué)只是對理論知識進(jìn)行講解,雖然也有很多人意識到需要將計算機(jī)軟件實現(xiàn)和應(yīng)用環(huán)節(jié)的教學(xué)相關(guān)結(jié)合,但是在實際教學(xué)過程中并未真正落實。依然給學(xué)生留下了枯燥乏味的印象,使得學(xué)生無法直觀形象的理解知識點的本質(zhì)內(nèi)容和應(yīng)用場景,也不利于應(yīng)用型人才的培養(yǎng)。

(三)課程工具使用情況

雖然當(dāng)今國內(nèi)眾多高校在教學(xué)過程中逐漸意識到,理論性較強的專業(yè)基礎(chǔ)課的重要性,并且想要實現(xiàn)快速計算、良好的可視化和教學(xué)效果,必須將其與實際應(yīng)用背景以及較好的計算工具相結(jié)合,以提高學(xué)生學(xué)習(xí)興趣的同時,使得學(xué)生深刻理解知識點的應(yīng)用場景和具體操作。但是,對于數(shù)理統(tǒng)計相關(guān)知識的教學(xué)較多的仍然在使用SPSS、Mathematica、MATLAB和R等傳統(tǒng)統(tǒng)計工具和分析軟件[2-5],也有部分教師考慮到Python軟件的簡潔清晰,功能強大且容易上手,可視化功能強大等優(yōu)勢,將其用于教學(xué)活動作為計算工具[6],但是其重點卻在概率論部分。

二、Python在課程教學(xué)過程中的作用

在應(yīng)用統(tǒng)計學(xué)人才培養(yǎng)方案中,Python程序設(shè)計語言是在數(shù)理統(tǒng)計課程之前課設(shè)的計算機(jī)語言課程,并已成為應(yīng)用統(tǒng)計學(xué)專業(yè)所需的主流語言軟件,該軟件工具廣泛應(yīng)用于統(tǒng)計分析、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和大數(shù)據(jù)可視化等專業(yè)方向課程內(nèi)容的實現(xiàn),在應(yīng)用統(tǒng)計學(xué)專業(yè)人才培養(yǎng)過程中起著重要的作用。并且將數(shù)理統(tǒng)計課程與Python和應(yīng)用統(tǒng)計學(xué)專業(yè)方向課程有效接軌,培養(yǎng)學(xué)生的學(xué)習(xí)熱情、激發(fā)學(xué)生的學(xué)習(xí)興趣,使學(xué)生能更好地理解數(shù)理統(tǒng)計知識并能熟練使用Python實現(xiàn)相關(guān)統(tǒng)計問題,從而保證人才培養(yǎng)過程的延續(xù)性。

(一)Python語言的特點

Python程序設(shè)計語言作為數(shù)據(jù)統(tǒng)計分析的流行語言,其在數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)等數(shù)據(jù)統(tǒng)計分處理方面有著很好的優(yōu)勢,其主要特點有:(1)Python是一門跨平臺、開源、免費的解釋型高級動態(tài)編程語言,是一種通用編程語言;(2)Python語言語法簡潔清晰,功能強大且易學(xué),最重要的是擁有大量的幾乎支持所有領(lǐng)域應(yīng)用開發(fā)的成熟擴(kuò)展庫;(3)Python語言除了可以解釋執(zhí)行以外,還支持命令式編程和函數(shù)式編程兩種方式,完全支持面向?qū)ο蟪绦蛟O(shè)計;(4)Python功能強大,可以實現(xiàn)C、C++和Matlab等多種不同語言的程序融合到一起實現(xiàn)無縫拼接,更好地發(fā)揮不同語言和工具的優(yōu)勢,以滿足不同應(yīng)用場景的需求。鑒于Python程序設(shè)計語言的各種優(yōu)勢,已廣泛應(yīng)用于統(tǒng)計分析、科學(xué)計算可視化、人工智能、機(jī)器學(xué)習(xí)、數(shù)據(jù)爬取與大數(shù)據(jù)處理等多個專業(yè)和領(lǐng)域。

(二)Python在數(shù)理統(tǒng)計課程教學(xué)過程中的應(yīng)用

Python作為一種被廣泛使用的免費開源軟件,將其應(yīng)用于數(shù)理統(tǒng)計教學(xué)全過程,對各個知識點內(nèi)容進(jìn)行實現(xiàn),使得學(xué)生更好理解知識點的內(nèi)涵本質(zhì)。(1)統(tǒng)計量與抽樣分布:當(dāng)講授統(tǒng)計量時,可以通過Python語言導(dǎo)入第三方numpy模塊重命名為np,即命令:importnumpyasnp,并調(diào)用函數(shù)np.mean()、np.var()、np.std()、np.corr()求得總體或者樣本均值、方差、標(biāo)準(zhǔn)差、相關(guān)系數(shù)矩陣等,編程實現(xiàn)不僅可以提高計算效率還可以加深學(xué)生的理解。也可導(dǎo)入matplotlib.pyplot模塊對于常見抽樣分布作圖,使學(xué)生直觀感受分布的特點。(2)點估計:主要包括:矩估計、極大似然估計,可通過自定義函數(shù)實現(xiàn)極大似然估計的求解,例如設(shè)總體X~Nμ,σ2(),x1,x2,…,xn()是來自總體X的一組樣本值,可通過Python模擬服正態(tài)分布的數(shù)據(jù),然后使用sympy庫和numpy中prod函數(shù)得到似然函數(shù),并通過sympy.log()去自然對數(shù)、sympy.diff()求偏導(dǎo)數(shù),然后求解sympy.diff()得到總體中參數(shù)μ,σ的極大似然估計。(3)區(qū)間估計:對于參數(shù)的區(qū)間估計,其本質(zhì)是希望給出參數(shù)取值的一個范圍,并確定該范圍包含參數(shù)真值的可靠程度,該范圍通常以區(qū)間形式給出。因此,對于不同的正態(tài)分布、T分布和χ2分布均可調(diào)用scipy.stats.norm.interval(confidence,loc=sample_mean,scale=sample_std)實現(xiàn),其中輸入?yún)?shù)包括置信度(confidence)、樣本均值(loc)、樣本標(biāo)準(zhǔn)差(scale)和自由度(df)可根據(jù)具體分布確定是否省略。(4)假設(shè)檢驗:關(guān)于假設(shè)檢驗問題主要包括:步驟1:確定問題,其中包括確定原假設(shè)(H0)與備選假設(shè)(H1),然后根據(jù)問題背景和樣本數(shù)據(jù)特點判斷假設(shè)檢驗類型,進(jìn)一步根據(jù)抽樣分布類型和假設(shè)檢驗的方向;步驟2:在原假設(shè)成立的情形下,計算所選的檢驗統(tǒng)計量和p值;步驟3:根據(jù)顯著性水平α大小以及檢驗方向,做出是否接受原假設(shè)的判斷。例如方差σ2未知時,均值的單邊檢驗問題,即H0:μμ0,H1:μ<μ0,可考慮使用統(tǒng)計模塊(stats),并調(diào)用單獨樣本t檢驗函數(shù)stats.ttest_1samp(data,pop_mean),其中輸入?yún)?shù)data表示樣本數(shù)據(jù)集,pop_mean表示總體均值μ0,該函數(shù)將返回輸出參數(shù)t表示檢驗統(tǒng)計量的值和雙尾檢驗的p值,進(jìn)而確定單位檢驗的p值與顯著性水平α進(jìn)行比較,從而做出判斷。(5)方差分析:方差分析(AnalysisofVariance,ANOVA)又稱“變異數(shù)分析”或“F檢驗”,是由Fisher提出的用于兩個及兩個以上樣本均數(shù)差別的顯著性檢驗,其原理是認(rèn)為不同處理組的均數(shù)間的差別基本來源于組間差異和組內(nèi)差異。對單因素方差分析,在滿足獨立、正態(tài)、方差齊性的前提條件下,可用scipy庫,并通過輸入?yún)?shù)為樣本數(shù)據(jù)的函數(shù)stats.f_oneway(),可得到F值和p值,然后與查表得到的原假設(shè)下檢驗問題的臨界值作比較,若F值大于等于檢驗臨界值,則拒絕原假設(shè)H0,否則接受H0;對于雙因素方差分析,基本思想和方法與單因素的方差分析相似,在同樣的前提條件下,可從statsmodels.stats.a(chǎn)nova中導(dǎo)入用于多因素方差分析的函數(shù)anova_lm()可得到方差分析表,進(jìn)而用于對檢驗進(jìn)行判斷。

三、課程教學(xué)改革

在數(shù)理統(tǒng)計課程中引入Python軟件對重要知識點進(jìn)行實現(xiàn)是應(yīng)用統(tǒng)計學(xué)專業(yè)課程改革的一部分,關(guān)于該課程更全面高效的改革還可從以下幾個方面開展:

(一)教師隊伍改革

應(yīng)用統(tǒng)計學(xué)專業(yè)人才培養(yǎng)過程中不僅要加深學(xué)生對理論知識的理解,更要注重對學(xué)生利用所學(xué)方法解決實際問題的能力的培養(yǎng),重點在應(yīng)用能力和創(chuàng)新能力的培養(yǎng)。因此,在此基礎(chǔ)上加強統(tǒng)計學(xué)專業(yè)教師隊伍建設(shè)工作,特別是Python軟件操作能力,案例挖掘能力和數(shù)理統(tǒng)計知識點與Python軟件的融合能力等方面的改革工作,應(yīng)多鼓勵教師隊伍走出去多與企業(yè)多交流,了解企業(yè)對人才的需求進(jìn)一步調(diào)整改革教學(xué)及學(xué)生技能培訓(xùn)的側(cè)重點。另外,引入新的教學(xué)方法和先進(jìn)教學(xué)理念,以提高課堂教學(xué)的質(zhì)量真正將應(yīng)用型人才培養(yǎng)落到實處。

(二)加強實踐教學(xué)改革

根據(jù)人才培養(yǎng)方案的要求,學(xué)生不僅要掌握數(shù)理統(tǒng)計課程中的理論知識,更重要的是要能夠?qū)⑺鶎W(xué)知識用于解決實際問題。因此,為了更好地實現(xiàn)教學(xué)目標(biāo),適量增加上機(jī)實驗課對培養(yǎng)學(xué)生利用Python軟件解決實際問題的同時,還能培養(yǎng)學(xué)生的動手能力,為后續(xù)專業(yè)方向類課程打好堅實基礎(chǔ)。

(三)優(yōu)化考核方法

數(shù)理統(tǒng)計課程的期末考核方法目前大多數(shù)都是閉卷考試,其中主要題型包括:選擇題、填空題、簡答題和應(yīng)用題。學(xué)生的最終成績由平時成績(30%)和期末卷面成績(70%)。為了實現(xiàn)科學(xué)且過程化考核,考核可細(xì)分為平時成績(30%)、實驗成績(20%)和期末卷面成績(50%),其中實驗成績部分主要考查學(xué)生的實驗操作技能的掌握、操作的規(guī)范性、實驗報告格式的規(guī)范性、結(jié)果的正確性和描述的嚴(yán)謹(jǐn)性。通過全過程化考核方式既能考查學(xué)生的平時課堂表現(xiàn),也能通過實驗課程成績評價學(xué)生使用Python軟件解決實際的能力,還能客觀公正地評價學(xué)生對理論知識的理解和應(yīng)用能力。

四、結(jié)語

數(shù)理統(tǒng)計課程作為應(yīng)用統(tǒng)計學(xué)專業(yè)的基礎(chǔ)課在整個人才培養(yǎng)中有著重要的地位。因此,本文主要通過引入Python軟件實現(xiàn)對數(shù)理統(tǒng)計課程的教學(xué)改革,首先對該課程的特點、現(xiàn)狀以及教學(xué)過程中存在的問題進(jìn)行簡單分析;然后,對Python軟件的特點以及結(jié)合教學(xué)過程中的經(jīng)驗對Python軟件與知識點的融入進(jìn)行了詳細(xì)的介紹,給出課堂教學(xué)改革的切入點和問題求解的過程;最后,從教師隊伍建設(shè)、實踐教學(xué)改革和課程考核方式等方面給出該課程的改革意見。通過一系列的改革舉措的落實提高學(xué)生學(xué)習(xí)興趣的同時,加深學(xué)生對知識理解,培養(yǎng)學(xué)生的應(yīng)用能力和操作能力,從而真正落實應(yīng)用型人才的培養(yǎng)。

參考文獻(xiàn):

[1]陳希孺.本世紀(jì)以來數(shù)理統(tǒng)計發(fā)展的歷史和現(xiàn)狀的若干問題[J].華中師院學(xué)報(自然科學(xué)版),1980(01):83-89.

[2]李榮華,姜英,呂煒,等.變量間的相關(guān)系數(shù)及其SPSS中計算[J].教育現(xiàn)代化,2020,7(21):107-108.

[3]解博麗,雷英杰,楊麗,等.概率論與數(shù)理統(tǒng)計引入MATLAB實驗教學(xué)手段的必要性[J].教育教學(xué)論壇,2020(23):280-282.

[4]章美月.基于Mathematica的《概率論與數(shù)理統(tǒng)計》課程教學(xué)改革探索與實踐[J].大學(xué)數(shù)學(xué),2020,36(05):49-56.

[5]汪浩,李瑩.大數(shù)據(jù)/人工智能背景下IT專業(yè)基于R的概率論與數(shù)理統(tǒng)計教學(xué)改革[J].計算機(jī)教育,2021(03):180-184.

[6]王福順,董淑芬,孫小華,等.Python賦能概率論與數(shù)理統(tǒng)計教學(xué)與實踐[J].中國多媒體與網(wǎng)絡(luò)教學(xué)學(xué)報(上旬刊),2021(03):218-220.

作者:丁毅濤 任水利 單位:西京學(xué)院理學(xué)院