python aic准则_使用AIC进行变量选择并评估多元回归中的标准

python aic准则_使用AIC进行变量选择并评估多元回归中的标准#MultipleRegressionVariableSelectiondefmr(selection=False):importosos.chdir(r’C:\Users\Path’)importpandasaspdh=pd.read_csv(‘Dataset.csv’,index_col=0)#print(h.head(0))#dataset’svariablenamesyva…

大家好,又见面了,我是你们的朋友全栈君。

# Multiple Regression Variable Selectiondefmr(selection=False):importos

os.chdir(r’C:\Users\Path’)importpandasaspd

h=pd.read_csv(‘Dataset.csv’,index_col=0)#print(h.head(0)) # dataset’s variable namesyvar=’resale_price’modeleq=yvar+’ ~’forxvarin(# Insert new ‘x variable’ into a row, ending with ‘,”storey_range_lower’,’storey_range_lower_rt’,’storey_range_lower_sq’,’storey_range_upper’,’storey_range_upper_rt’,’storey_range_upper_sq’,’floor_area_sqm’,’floor_area_sqm_rt’,’floor_area_sqm_sq’,’lease_commence_year’,’lease_commence_year_rt’,’lease_commence_year_sq’,’transaction_month’,’transaction_month_rt’,’transaction_month_sq’,’town’,’flat_model’,’flat_type’,’no_of_rooms’,’block_number’,’block_number_rt’,’block_number_sq’,’postal_code’,’postal_code_rt’,’postal_code_sq’,’postal_code_2digit’,’postal_code_2digit_rt’,’postal_code_2digit_sq’,):ifmodeleq[-1]==’~’:modeleq=modeleq+’ ‘+xvarelse:modeleq=modeleq+’ + ‘+xvar#import matplotlib.pyplot as pl#%matplotlib inline#import numpy as npimportstatsmodels.apiassmfromstatsmodels.formula.apiimportols

bmodeleq=modeleqifselection:print(‘Variable Selection using p-value & PR(>F):’)minfpv=1.0whileTrue:#Specify C() for Categorical, else could be interpreted as numeric:#hout=ols(‘resale_price ~ floor_area_sqm + C(flat_type)’, data=h).fit()hout=ols(modeleq,data=h).fit()ifmodeleq.find(‘ + ‘)==-1:# 1 xvar leftbreak#print(dir(hout)) gives all the attributes of .fit(), e.g. .fvalue & .f_pvaluefpv=hout.f_pvalueiffpv

bmodeleq=modeleqprint(‘\nF-statistic =’,hout.fvalue,’ PR(>F) =’,fpv)prf=sm.stats.anova_lm(hout,typ=3)[‘PR(>F)’]maxp=max(prf[1:])#print(‘\n’,dict(prf))xdrop=prf[maxp==prf].axes[0][0]# 1st element of row-label .axes[0]#if xdrop.find(‘Intercept’) != -1 :# break# xdrop removed from model equation:if(modeleq.find(‘~ ‘+xdrop+’ + ‘)!=-1):modeleq=modeleq.replace(‘~ ‘+xdrop+’ + ‘,’~ ‘)elif(modeleq.find(‘+ ‘+xdrop+’ + ‘)!=-1):modeleq=modeleq.replace(‘+ ‘+xdrop+’ + ‘,’+ ‘)else:modeleq=modeleq.replace(‘ + ‘+xdrop,”)#print(‘Model equation:’,modeleq,’\n’)print(‘Variable to drop:’,xdrop,’ p-value =’,prf[xdrop])#print(‘\nVariable left:\n’+str(prf[maxp!=prf][:-1]),’\n’)print(‘\nF-statistic =’,hout.fvalue,’ PR(>F) =’,hout.f_pvalue)print(‘Variable left:\n’+str(prf[maxp!=prf][:-1]),’\n’)#input(“found intercept”)print(‘Best model equation:’,bmodeleq)print(‘Minimum PR(>F) =’,minfpv,’\n’)hout=ols(bmodeleq,data=h).fit()print(sm.stats.anova_lm(hout,typ=1))#print(anova) # Anova table with ‘Treatment’ broken uphsum=hout.summary()print(‘\n’,hsum)last=3#number of bottom p-values to display with more precision#p-values are not in general the same as PR(>F) from ANOVAprint(“\nLast”,last,”x-coefficients’ p-values:”)nxvar=len(hout.pvalues)foriinrange(last,0,-1):print(‘ ‘,hout.pvalues.axes[0][nxvar-i],’ ‘,hout.pvalues[nxvar-i])# Output Coefficient table:#from IPython.core.display import HTML#HTML(hout.summary().tables[1].as_html()) #.tables[] from 0 to 3mr(True)# do Variable Selection#mr() # do multiple regression once

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/142569.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • eBPF 简史「建议收藏」

    eBPF 简史「建议收藏」最近总能看到bpf,但苦于找不到合适的资料理解,终于找到一个分析讲解较全面的文章,分享给大家,原网址如下:http://www.linux-ren.org/tech/2230.mhtmlhttps://www.ibm.com/developerworks/cn/linux/l-lo-eBPF-history/index.html数日之前,笔者参加某一技术会议之时,为人所安利了一款开源项…

  • java卸载 安装错误_Java卸载后无法重新安装 提示已安装过[通俗易懂]

    java卸载 安装错误_Java卸载后无法重新安装 提示已安装过[通俗易懂]龙歌这款游戏需要在玩之前安装一个java的插件,有时候由于错误的安装或卸载java会造成虽然已经删除了java插件,但是重新安装java时系统提示已经安装了一个版本,而无法重新安装。在Windows中,如果本地安装过Java,但存在问题无法使用,需要重新安装同版本的Java时,会出现下面的提示:原因是原有Java安装目录已经被删除或损坏了,不过在注册表还残留了安装信息,如果用360和优化大师清除注…

  • 虚拟局域网vlan的最大个数_虚拟局域网的标准是

    虚拟局域网vlan的最大个数_虚拟局域网的标准是VLAN实例1.VLAN划分实例[Huawei]interfaceEthernet0/0/1[Huawei-Ethernet0/0/1]portlink-typeaccess[Huawei-Ethernet0/0/1]portdefaultvlan10[Huawei]interfaceEthernet0/0/2[Huawei-Ethernet0/0/2]portlink-typeaccess[Huawei-Ethernet0/0/2]portdefau

  • c#程序调试(如何使用debug调试)

    c#的Debug.WriteLine()和Trace.WriteLine()有没有例子?1.区别://输出跟踪信息Trace.WriteLine()将有关跟踪的信息写入Listeners集合中的跟踪侦听器在调试和release模式都输出!默认是写到输出窗口的,也可以指定写到指定文件,或系统日志中!//输出调试信息Debug.WriteLine()将有关调试的信息写入Listener

  • 快速傅里叶变换(FFT)算法【详解】[通俗易懂]

    快速傅里叶变换(FFT)算法【详解】[通俗易懂]快速傅里叶变换(FastFourierTransform)是信号处理与数据分析领域里最重要的算法之一。我打开一本老旧的算法书,欣赏了JWCooley和JohnTukey在1965年的文章

  • 【转载】ORM的概念, ORM到底是什么

    【转载】ORM的概念, ORM到底是什么

    2021年11月21日

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号