生物統(tǒng)計學(xué)課件上(南昌大學(xué))
單擊此處編輯母版標題樣式,Today:,*,第四軍醫(yī)大學(xué)衛(wèi)生統(tǒng)計學(xué)教研室,*,制作:,Dr.,宇傳華,單擊此處編輯母版標題樣式,授課人:鄒志文,Email:,zouzhiwen,南昌大學(xué)生命科學(xué)與食品工程學(xué)院,名人名言,生活中最重要的問題,其中占大多數(shù)實際上只是概率的問題。,拉普拉斯,在終極的分析中,一切知識都是歷史。在抽象的意義下,一切科學(xué)都是數(shù)學(xué)。在理性的世界里,所有的判斷都是統(tǒng)計學(xué)。,C.R,勞,若想了解上帝在想什么,我們就必須學(xué)統(tǒng)計,因為統(tǒng)計學(xué)就是在量測他的旨意。,南丁格爾,世界上有三種,謊言,:謊言、該死的謊言和,統(tǒng)計,There are three kinds of lies:lies,damned lies and statistics.,馬克,吐溫,自傳引述十九世紀英國首相狄斯雷利的名句,國家統(tǒng)計局相關(guān)官員表示,我國居民消費增長較慢,居民消費支出在,GDP,中的比重較低。據(jù)悉,,2008,年中國居民消費率,(,居民消費占,GDP,的比重,),為,35.3%,,美國為,70.1%,,印度為,54.7%,。(,09,年,12,月,3,日新華網(wǎng)),“前三季度中國國內(nèi)生產(chǎn)總值(,GDP,)同比增長,7.7,,其中第三季度增長,8.9,”、“中國城市化率已達,45.68%”,、“,97%,外出農(nóng)民工已就業(yè)”,央視網(wǎng)消息,,CTR,市場研究公司通過隨機抽樣,電話調(diào)查了,2290,個收看家庭,結(jié)果顯示,,96.1%,的用戶收看了今年春晚,其中,81.6%,認為今年春晚辦得好。,而,15,日的,廣州日報,報道,在某門戶網(wǎng)站對今年春晚的滿意度調(diào)查上,截至今日零時記者截稿前,認為“好”的只占,15.2%,,不到兩成,,46.5%,的人認為不好。,春晚的滿意度每年都有兩個版本,央視永遠志得意滿,神采飛揚,民間許多人并不買賬,罵聲不絕。,京華時報,15,日報道,央視市場研究公司公布歷年的調(diào)查結(jié)果,近,5,年來,央視春晚的叫好率逐年走低。其中,,2006,年叫好率為,85.5%,,,2007,年為,83.6%,,,2008,年為,81.1%,,,2009,年為,81.1%,。,緒 論,第一節(jié) 生物統(tǒng)計的地位意義,第二節(jié) 生物統(tǒng)計學(xué)發(fā)展簡史,第三節(jié) 生物統(tǒng)計的主要內(nèi)容,第四節(jié) 生物統(tǒng)計的常用術(shù)語,第五節(jié) 生物統(tǒng)計學(xué)教學(xué)要求,第一節(jié) 生物統(tǒng)計的地位意義,一、生物統(tǒng)計的概念,生物統(tǒng)計學(xué):,把概率論和數(shù)理統(tǒng)計的科學(xué)原理和方法應(yīng)用于生物科學(xué)研究中的數(shù)量資料的搜集、整理和分析的科學(xué),,是一門應(yīng)用數(shù)學(xué),是現(xiàn)代生物學(xué)研究中不可缺少的工具。,數(shù)理統(tǒng)計:,是以隨機現(xiàn)象的數(shù)量特征和分布規(guī)律為研究對象的一種數(shù)學(xué)方法。,重要任務(wù)就是,對客觀事物得出,本質(zhì)的和規(guī)律性的認識,,使人們對所研究的資料作出,正確的結(jié)論,。,第一節(jié) 生物統(tǒng)計的地位意義,二、生物統(tǒng)計的地位,生物數(shù)學(xué),(Biomathematics):,以數(shù)學(xué)方法研究和解決生物學(xué)問題,并對生物學(xué)有關(guān)的數(shù)學(xué)方法進行理論研究,介于生物學(xué)和數(shù)學(xué)之間的邊緣學(xué)科。從研究使用的數(shù)學(xué)方法劃分,生物數(shù)學(xué)可分為生物統(tǒng)計學(xué)、生物信息學(xué)、生物系統(tǒng)論、生物控制論和生物方程等分支。,第一節(jié) 生物統(tǒng)計的地位意義,三、生物統(tǒng)計的作用,1,、,為科學(xué)地整理分析數(shù)據(jù)提供方法,2,、,判斷試驗結(jié)果的可靠性,由于存在試驗誤差,從試驗所得的數(shù)據(jù)資料必須借助于統(tǒng)計分析方法才能獲得可靠的結(jié)論。,3,、確定事物之間的相互關(guān)系,科學(xué)試驗的目的,不僅是研究事物的特征、特性,同時還要研究事物間的相互關(guān)系的聯(lián)系形式。,4,、提供試驗設(shè)計的原則和方法,5,、,為學(xué)習(xí)其他課程提供基礎(chǔ),第一節(jié) 生物統(tǒng)計的地位意義,四、生物統(tǒng)計的意義,W.Gosset,于,1908,年以,“,Student,”,筆名將,“,t-,檢驗,”,發(fā)表于,Biometrika,上,文章說:,“,任何實驗可以作為是許多可能在相同條件下作出的實驗的總體中的一個個體,一系列的實驗則是從這個總體所抽得的一個樣品。,”,第一節(jié) 生物統(tǒng)計的地位意義,21,世紀是生命科學(xué)的世紀,無疑也為生物統(tǒng)計學(xué)的發(fā)展與應(yīng)用拓展了廣闊的空間。生物醫(yī)學(xué)期刊雜志社聘請統(tǒng)計學(xué)專家為期刊論文把握統(tǒng)計處理的質(zhì)量,,新英格蘭醫(yī)學(xué)雜志,、,柳葉刀,等著名的醫(yī)學(xué)期刊還增設(shè)了負責處理統(tǒng)計學(xué)問題常務(wù)編委。,第一節(jié) 生物統(tǒng)計的地位意義,生物統(tǒng)計分析軟件包的普及將生物統(tǒng)計學(xué)從統(tǒng)計學(xué)家的書本里解放出來,成為生物學(xué)研究者的常用工具。但它也帶來了一個嚴重的弊端,對生物統(tǒng)計方法的誤用與濫用,。如果把整個統(tǒng)計分析過程變成一個黑箱,那就有可能垃圾進,垃圾出,(garbage in,garbage out),。,第一節(jié) 生物統(tǒng)計的地位意義,五、生物統(tǒng)計學(xué)的特點,Characteristics,1,、根據(jù)有限數(shù)量的樣本觀察數(shù)據(jù)來推斷和估計事物的總體,是生物統(tǒng)計的基本特點。,2,、用樣本來推斷總體,要求樣本具有一定的含量和代表性。,3,、推斷有很大的可靠性,但有一定的錯誤率(,如假陽性,)。,4,、實驗設(shè)計應(yīng)該先于生物統(tǒng)計分析的思考,!,第一節(jié) 生物統(tǒng)計的地位意義,第二節(jié) 生物統(tǒng)計學(xué)發(fā)展簡史,最早建立生物統(tǒng)計思想的是,A.Quetelet,(1796-1874),把統(tǒng)計學(xué)應(yīng)用于解決生物學(xué)、醫(yī)學(xué)和社會學(xué)中的問題,第一個認識到大量變異數(shù)據(jù)中蘊涵規(guī)律性(近代統(tǒng)計學(xué)的重要思想),最早應(yīng)用生物統(tǒng)計學(xué)的是,C.Darwin,(,1809-1882,),,進化論的本質(zhì)是生物統(tǒng)計,遺傳學(xué)奠基人,G.Mendel,的豌豆雜交實驗結(jié)果也證實了生物統(tǒng)計的規(guī)律,第二節(jié) 生物統(tǒng)計學(xué)發(fā)展簡史,統(tǒng)計學(xué)用于生物學(xué)的研究,開始于,19,世紀末,,1870,年,英國遺傳學(xué)家,,Galton(1822-1911),提出了,相關(guān)與回歸,的概念,被公認為生物統(tǒng)計學(xué)的創(chuàng)始人。,Galton,和他的繼承人,K.Plarson(1857-1936),于,1895,年成立了倫敦大學(xué)生物統(tǒng)計實驗室,提出了,檢驗方法。,K.Plarson,的學(xué)生,Gosset(1876-1937),在,1908,年以,“,student,”,筆名發(fā)表了,“,t,分布和,t,檢驗法,”,創(chuàng)立了小樣本檢驗代替大樣本檢驗的理論和方法。,Fisher,于,1923,年發(fā)展了顯著性檢驗及估計理論,提出了,F,分布和,F,檢驗,,創(chuàng)立了正交試驗設(shè)計和方差分析。,1901,年英國著名統(tǒng)計學(xué)家,Pearson,創(chuàng)辦了,生物統(tǒng)計學(xué)雜志,(,Biometrika),,標志著生物數(shù)學(xué)發(fā)展的起點。,第二節(jié) 生物統(tǒng)計學(xué)發(fā)展簡史,Neyman(1894-1981),和,S.Pearson,進行了統(tǒng)計理論的研究工作,提出統(tǒng)計假設(shè)檢驗系統(tǒng),標志著統(tǒng)計學(xué)真正形成。,There are five components to an experiment,:,Hypothesis,(假設(shè)),Experimental design,(實驗設(shè)計),Experimental execution,(實驗實施),Statistical analysis,(數(shù)據(jù)分析),Interpretation,(描述),第二節(jié) 生物統(tǒng)計學(xué)發(fā)展簡史,第三節(jié) 生物統(tǒng)計的主要內(nèi)容,統(tǒng)計研究設(shè)計,統(tǒng)計描述 統(tǒng)計分析,第三節(jié) 生物統(tǒng)計的主要內(nèi)容,調(diào)查設(shè)計,指調(diào)查研究工作全過程的計劃。,試驗設(shè)計,是指試驗研究工作進行前應(yīng)用數(shù)理統(tǒng)計原理,制定試驗方案,選擇試驗材料,,對實驗因素作合理、有效的安排,最大限度地減少 試驗誤差,使之達到高效,快速、準確、可靠和經(jīng)濟的目的。,兩者的區(qū)別,前者,:,是被動地進行觀察,希望干擾因素的影響盡可能減少;,后者,:,研究者能較主動地安排試驗因素,控制實驗條件,盡可能排除或抵消非試驗因素的干擾和影響。,統(tǒng)計研究設(shè)計,統(tǒng)計描述,統(tǒng)計分析,第三節(jié) 生物統(tǒng)計的主要內(nèi)容,統(tǒng)計表和統(tǒng)計圖,定量資料集中趨勢的度量,算術(shù)均數(shù)、幾何均數(shù)、調(diào)和均數(shù)、中位數(shù)、分位數(shù)和眾數(shù),定量資料離散趨勢的度量,標準差、標準誤差、變異系數(shù)、極差和四分位數(shù)間距,隨機變量及其概率分布,離散型:二項分布、波松分布,連續(xù)型:正態(tài)分布、,t,分布、,2,分布、,F,分布,統(tǒng)計研究設(shè)計 統(tǒng)計描述,統(tǒng)計分析,第三節(jié) 生物統(tǒng)計的主要內(nèi)容,a.,假設(shè)檢驗,b.,統(tǒng)計推斷,estimative statistics,c.,研究變量之間的關(guān)系,無自變量與因變量之分:,直線相關(guān)分析、典型相關(guān)分析,研究多變量內(nèi)部的從屬關(guān)系:主成分分析、因子分析等。,多變量之間親疏關(guān)系:聚類分析,有自變量與因變量之分:,直線回歸分析、曲線回歸分析、多項式回歸分析、,Logistic,概率模型回歸分析等,d.,判別分析,根據(jù)一些明確分類的總體所提供的信息,對未知個體的歸屬進行分類的判別分析。,第四節(jié) 生物統(tǒng)計的常見術(shù)語,第四節(jié) 生物統(tǒng)計的常見術(shù)語,1,、總體與樣本,Population and sample,1),總體,根據(jù)研究目的確定的研究對象的全體稱為,總體,。構(gòu)成總體的每個成員稱為個體,(individual),。含有有限個個體的總體稱為,有限總體,(finite population),。包含有無限多個個體的總體叫,無限總體,(infinite population),。,2),樣本,總體的一部分稱為,樣本,。,樣本中所包含的個體數(shù)目叫,樣本容量或大小,(sample size),。樣本容量常記為,n,。通常,n30,的樣本叫,小樣本,,,n,30,的樣本叫,大樣本,。,3,)抽樣,sampling,從總體中獲得樣本的過程。可分為放回式抽樣,(sampling with replacement),和非放回式抽樣,(without replacement),。隨機抽樣,(random sampling),是確定樣本代表性的有效方法。,第四節(jié) 生物統(tǒng)計的常見術(shù)語,2,、特征數(shù),表示總體和樣本的數(shù)量特征的量稱為特征數(shù)。,1),參數(shù),Parameter,:由總體計算得來的特征數(shù),,常用,希臘字母,表示。用,表示總體平均數(shù),用,表示總體標準差。,2),統(tǒng)計量,statistics,:由樣本計算得來的特征數(shù),,常用,拉丁字母,表示統(tǒng)計量。用 表示樣本平均數(shù),用,S,表示樣本標準差。,3),總體參數(shù)由相應(yīng)的統(tǒng)計量來估計,,例如用 估計,,用,S,估計,等。,總 體,樣 本,抽 樣,描 述,計算統(tǒng)計量,推 斷,統(tǒng)計量,第四節(jié) 生物統(tǒng)計的常見術(shù)語,3,、平均數(shù),mean,算術(shù)平均數(shù),:,幾何平均數(shù),:,加權(quán)平均數(shù):,第四節(jié) 生物統(tǒng)計的常見術(shù)語,4,、方差、標準差和變異系數(shù),variance,standard deviation and variation coefficient,1),極差,又稱范圍,range:,它是樣本變量中最大值和最小值之差,一般用,R,表示。,2),方差,樣本方差:,總體方差:,第四節(jié) 生物統(tǒng)計的常見術(shù)語,4,、方差、標準差和變異系數(shù),variance,standard deviation and variation coefficient,3,)標準差,樣本標準差,:,總體標準差,:,4,)變異系數(shù),:,是樣本變量的相對變異量,是不帶單位的純數(shù)。用變異系數(shù)可以比較不同樣本相對變異程度的大小。,第四節(jié) 生物統(tǒng)計的常見術(shù)語,5,、數(shù)據(jù)類型與頻數(shù)(率)分布,1,)連續(xù)型數(shù)據(jù)和離散型數(shù)據(jù),與某種標準做比較所得到的數(shù)據(jù)稱為連續(xù)型數(shù)據(jù),(continuous data),,又稱度量數(shù)據(jù),(measurement data);,例如,長度、時間、重量等。對連續(xù)型數(shù)據(jù)進行分析的方法,通常稱為變量的方法,(method of variable),。,由記錄不同類別個體的數(shù)目所得到的數(shù)據(jù),稱為離散型數(shù)據(jù),(discrete data),,又稱為計數(shù)數(shù)據(jù),(count data),;例如種子數(shù)、株數(shù)、人頭等。對離散型數(shù)據(jù)進行分析的方法,通常稱為屬性的方法,(method of attribute),。,2,)頻數(shù)(率)表,frequency table,用頻數(shù)分布或頻率分布清楚地描述數(shù)據(jù)變化規(guī)律的表格。,3,)頻數(shù)(率)圖,frequency gr