B
    ¢Ž0dÜR  ã               @   s<  d Z ddlZddlZddlZddlZddlmZmZ ddlm	Z	 ddl
mZ ddlmZ ddlmZ ddlmZ dd	lmZ dd
lmZ ddlmZmZ ddlmZ ddlmZ ddlmZ ddlmZ ddlmZmZ ddlm Z  ddl!m"Z" ddl#m$Z$ ddl%m&Z& ddl'm(Z(m)Z)m*Z* ddl+m,Z, e -¡ Z.e.j/dd…dd…f e.j0 Z1Z2ej3dd\Z4Z5ej6 7ddg idfdeƒ fgdd œd!fdeƒ fgdd"gd#œd$fg¡d%d&„ ƒZ8d'd(„ Z9d)d*„ Z:d+d,„ Z;d-d.„ Z<d/d0„ Z=d1d2„ Z>d3d4„ Z?d5d6„ Z@d7d8„ ZAd9d:„ ZBd;d<„ ZCd=d>„ ZDd?d@„ ZEdAdB„ ZFdCdD„ ZGdEdF„ ZHdGdH„ ZIej6 7dIe1e2edeƒ fdJedKdLfgƒfe4e5edeƒ fdJedKdLfgƒfg¡dMdN„ ƒZJej6j7dOedeƒ fdPeddQfgdRededdQfdPeddQfgdRgdSdTgdUdVdW„ ƒZKej6 7dXedeƒ fdJedYdQfgddZededYdQfdJedYdQfgddZg¡d[d\„ ƒZLdS )]z4Testing for the VotingClassifier and VotingRegressoré    N)Úassert_almost_equalÚassert_array_equal)Úassert_array_almost_equal)ÚNotFittedError)ÚLinearRegression)ÚLogisticRegression)Ú
GaussianNB)ÚRandomForestClassifier)ÚRandomForestRegressor)ÚVotingClassifierÚVotingRegressor)ÚDecisionTreeClassifier)ÚDecisionTreeRegressor)ÚGridSearchCV)Údatasets)Úcross_val_scoreÚtrain_test_split)Úmake_multilabel_classification)ÚSVC)ÚOneVsRestClassifier)ÚKNeighborsClassifier)ÚBaseEstimatorÚClassifierMixinÚclone)ÚDummyRegressoré   é   T)Z
return_X_yzparams, err_msgÚ
estimatorsz@Invalid 'estimators' attribute, 'estimators' should be a list ofÚlrÚerror)r   Úvotingz7Voting must be 'soft' or 'hard'; got \(voting='error'\)é   )r   Úweightsz0Number of `estimators` and weights must be equalc          	   C   s4   t f | Ž}tjt|d | tt¡ W d Q R X d S )N)Úmatch)r   ÚpytestÚraisesÚ
ValueErrorÚfitÚXÚy)ÚparamsÚerr_msgZensemble© r,   úT/var/www/html/venv/lib/python3.7/site-packages/sklearn/ensemble/tests/test_voting.pyÚ%test_voting_classifier_estimator_init%   s    
r.   c           	   C   sl   t dtƒ fdtƒ fgdd} d}tjt|d | j W d Q R X t| dƒrNt‚|  t	t
¡ t| dƒrht‚d S )NÚlr1Úlr2Úhard)r   r    z1predict_proba is not available when voting='hard')r#   Úpredict_proba)r   r   r$   r%   ÚAttributeErrorr2   ÚhasattrÚAssertionErrorr'   r(   r)   )ÚeclfÚmsgr,   r,   r-   Útest_predictproba_hardvoting<   s    r8   c           	   C   sü   t dtƒ fdtƒ fgdd} tdtƒ fgƒ}d}tjt|d d |  t¡ W d Q R X tjt|d d |  	t¡ W d Q R X tjt|d d |  
t¡ W d Q R X tjt|d	 d | t¡ W d Q R X tjt|d	 d | 
t¡ W d Q R X d S )
Nr/   r0   Úsoft)r   r    ZdrzfThis %s instance is not fitted yet. Call 'fit' with appropriate arguments before using this estimator.r   )r#   r   )r   r   r   r   r$   r%   r   Úpredictr(   r2   Ú	transformÚX_r)r6   Úeregr7   r,   r,   r-   Útest_notfittedJ   s    r>   c              C   sb   t ddd} tddd}tƒ }td| fd|fd|fgd	d
}t|ttdd}t| ¡ ddd dS )z7Check classification by majority label on dataset iris.Ú	liblinearé{   )ÚsolverÚrandom_stateé
   )Ún_estimatorsrB   r   ÚrfÚgnbr1   )r   r    Úaccuracy)Úscoringgffffffî?r!   )ÚdecimalN)	r   r	   r   r   r   r(   r)   r   Úmean)Úclf1Úclf2Úclf3r6   Úscoresr,   r,   r-   Útest_majority_label_iris`   s    rO   c              C   sŒ   t ddd} tdd}td| fd|fgdd}|  tt¡ t¡d	 d
ksLt‚| tt¡ t¡d	 dksjt‚| tt¡ t¡d	 dksˆt‚dS )zECheck voting classifier selects smaller class label in tie situation.r@   r?   )rB   rA   )rB   r   rE   r1   )r   r    éI   r!   r   N)r   r	   r   r'   r(   r)   r:   r5   )rK   rL   r6   r,   r,   r-   Útest_tie_situationl   s    
rQ   c              C   sf   t dd} tdd}tƒ }td| fd|fd|fgdddd	gd
}t|ttdd}t| ¡ ddd dS )z>Check classification by average probabilities on dataset iris.r@   )rB   r   rE   rF   r9   r   r!   rC   )r   r    r"   rG   )rH   gÃõ(\Âí?)rI   N)	r   r	   r   r   r   r(   r)   r   rJ   )rK   rL   rM   r6   rN   r,   r,   r-   Útest_weights_irisv   s    

rR   c              C   sR  t dd} t dd}t ddd}td| fd|fd|fgddd	gd
}tttdd\}}}}|  ||¡ |¡}| ||¡ |¡}	| ||¡ |¡}
| ||¡ |¡}tjt 	||	|
g¡dddd	gd}t
||dd td| fd|fd|fgdd
}td| fd|fd|fgdddgd
}| ||¡ | ||¡ | |¡}| |¡}t
||dd dS )zACheck weighted average regression prediction on diabetes dataset.rJ   )ÚstrategyZmedianÚquantilegš™™™™™É?)rS   rT   r   r!   rC   )r"   g      Ð?)Z	test_sizer   )Zaxisr"   )rI   N)r   r   r   r<   Úy_rr'   r:   ÚnpZaverageZasarrayr   )Zreg1Zreg2Zreg3r=   Z	X_r_trainZX_r_testZ	y_r_trainZy_r_testZ	reg1_predZ	reg2_predZ	reg3_predZ	ereg_predÚavgZereg_weights_noneZereg_weights_equalZereg_none_predZereg_equal_predr,   r,   r-   Útest_weights_regressor„   s.    

""

rX   c           	   C   sb  t dd} tdd}tƒ }t ddgddgddgd	d
gddgddgg¡}t ddddddg¡}t|  ||¡ |¡ddddddgƒ t| ||¡ |¡ddddddgƒ t| ||¡ |¡ddddddgƒ td| fd|fd|fgddddgd}t| ||¡ |¡ddddddgƒ td| fd|fd|fgddddgd}t| ||¡ |¡ddddddgƒ dS )z6Manually check predicted class labels for toy dataset.r@   )rB   gš™™™™™ñ¿g      ø¿g333333ó¿gffffffö¿g333333Àgš™™™™™Àgš™™™™™ñ?g333333ó?gÍÌÌÌÌÌ @gffffffö?gÍÌÌÌÌÌ@gffffff@r   r!   r   rE   rF   r1   )r   r    r"   r9   N)	r   r	   r   rV   Úarrayr   r'   r:   r   )rK   rL   rM   r(   r)   r6   r,   r,   r-   Útest_predict_on_toy_problem¨   s&    

*$$$$rZ   c           	   C   sB  t dd} tdd}tƒ }t ddgddgddgd	d
gg¡}t ddddg¡}t ddgddgddgddgg¡}t ddgddgddgddgg¡}t ddgddgddgddgg¡}d|d d  |d d  |d d  d  }d|d d  |d d  |d d  d  }	d|d d  |d d  |d d  d  }
d|d! d  |d! d  |d! d  d  }td"| fd#|fd$|fgd%dddgd&}| ||¡ |¡}t||d d dd' t|	|d d dd' t|
|d d dd' t||d! d dd' t	j
td(d)6 td"| fd#|fd$|fgd*d+}| ||¡ |¡ W d,Q R X d,S )-z1Calculate predicted probabilities on toy dataset.r@   )rB   gš™™™™™ñ¿g      ø¿g333333ó¿gffffffö¿g333333Àgš™™™™™Àgš™™™™™ñ?g333333ó?r   r!   g…7sa"ã?gö=ñ»Ù?g½¤Rhpâ?gâ„¶Z/Û?glç^Ô¬;à?g(1BW¦ˆß?gµU(V6ÁÙ?g&ÕëÔdã?gš™™™™™é?gš™™™™™É?g333333Ó?gffffffæ?gá5ùwÇóï?g9=”qX?gè_óï?g$ö/ÐAY?g        g      ð?r   é   r   r   rE   rF   r9   )r   r    r"   )rI   z1predict_proba is not available when voting='hard')r#   r1   )r   r    N)r   r	   r   rV   rY   r   r'   r2   r   r$   r%   r3   )rK   rL   rM   r(   r)   Zclf1_resZclf2_resZclf3_resZt00Zt11Zt21Zt31r6   Zeclf_resr,   r,   r-   Ú!test_predict_proba_on_toy_problemÇ   s>    

"",,,,r\   c              C   s^   t ddddd\} }ttddƒ}td|fgd	d
}y| | |¡ W n tk
rX   dS X dS )z7Check if error is raised for multilabel classification.r!   r   Fr@   )Z	n_classesZn_labelsZallow_unlabeledrB   Zlinear)ZkernelZovrr1   )r   r    N)r   r   r   r   r'   ÚNotImplementedError)r(   r)   Úclfr6   r,   r,   r-   Útest_multilabelø   s    r_   c              C   s€   t dd} tddd}tƒ }td| fd|fd|fgdd	}d
dgddgdddgd
ddggdœ}t||dd}| tjtj¡ dS )zCheck GridSearch support.r   )rB   r   )rB   rD   r   rE   rF   r9   )r   r    g      ð?g      Y@r1   g      à?)Zlr__Cr    r"   r!   )Ú	estimatorZ
param_gridZcvN)	r   r	   r   r   r   r'   ÚirisÚdataÚtarget)rK   rL   rM   r6   r*   Úgridr,   r,   r-   Útest_gridsearch  s    
re   c              C   sÎ   t dd} tdd}tƒ }t ddgddgddgd	d
gg¡}t ddddg¡}td| fd|fd|fgddd ||¡}td| fd|fd|fgddd ||¡}t| |¡| |¡ƒ t	| 
|¡| 
|¡ƒ dS )z:Check parallel backend of VotingClassifier on toy dataset.r@   )rB   gš™™™™™ñ¿g      ø¿g333333ó¿gffffffö¿g333333Àgš™™™™™Àgš™™™™™ñ?g333333ó?r   r!   r   rE   rF   r9   )r   r    Zn_jobsN)r   r	   r   rV   rY   r   r'   r   r:   r   r2   )rK   rL   rM   r(   r)   Úeclf1Úeclf2r,   r,   r-   Útest_parallel_fit  s    

"rh   c           	   C   s²  t dd} tdd}tddd}td| fd|fd|fgdd	jttt t	tƒf¡d
}td| fd|fd|fgdd	 tt¡}t
| t¡| t¡ƒ t| t¡| t¡ƒ tj d¡jt	tƒfd}td| fgdd	}| tt|¡ |  tt|¡ t
| t¡|  t¡ƒ t| t¡|  t¡ƒ tƒ }td| fd|fd|fgdd	}d}tjt|d | tt|¡ W dQ R X G dd„ dttƒ}	|	ƒ }
tjtdd |
jtt|d
 W dQ R X dS )z1Tests sample_weight parameter of VotingClassifierr@   )rB   T)ZprobabilityrB   r   rE   Zsvcr9   )r   r    )Úsample_weight)ÚsizeZknnzJUnderlying estimator KNeighborsClassifier does not support sample weights.)r#   Nc               @   s   e Zd Zdd„ ZdS )z.test_sample_weight.<locals>.ClassifierErrorFitc             S   s   t dƒ‚d S )Nz!Error unrelated to sample_weight.)Ú	TypeError)Úselfr(   r)   ri   r,   r,   r-   r'   O  s    z2test_sample_weight.<locals>.ClassifierErrorFit.fitN)Ú__name__Ú
__module__Ú__qualname__r'   r,   r,   r,   r-   ÚClassifierErrorFitN  s   rp   z Error unrelated to sample_weight)r   r	   r   r   r'   r(   r)   rV   ÚonesÚlenr   r:   r   r2   ÚrandomZRandomStateÚuniformr   r$   r%   rk   r   r   )rK   rL   rM   rf   rg   ri   Úeclf3Zclf4r7   rp   r^   r,   r,   r-   Útest_sample_weight-  s6    

rv   c              C   sJ   G dd„ dt tƒ} | ƒ }td|fgdd}|jttt ttƒf¡d dS )z:Check that VotingClassifier passes sample_weight as kwargsc               @   s   e Zd ZdZdd„ ZdS )z1test_sample_weight_kwargs.<locals>.MockClassifierzAMock Classifier to check that sample_weight is received as kwargsc             _   s   d|kst ‚d S )Nri   )r5   )rl   r(   r)   Úargsri   r,   r,   r-   r'   ]  s    z5test_sample_weight_kwargs.<locals>.MockClassifier.fitN)rm   rn   ro   Ú__doc__r'   r,   r,   r,   r-   ÚMockClassifierZ  s   ry   Zmockr9   )r   r    )ri   N)	r   r   r   r'   r(   r)   rV   rq   rr   )ry   r^   r6   r,   r,   r-   Útest_sample_weight_kwargsW  s    rz   c              C   sâ   t ddd} tdd d}tƒ }td| fd|fgddd	gd
 tt¡}td| fd|fgddd	gd
}|j|d tt¡ t| 	t¡| 	t¡ƒ t
| t¡| t¡ƒ |jd d  ¡ |  ¡ ksÀt‚|jd d  ¡ | ¡ ksÞt‚d S )Nr@   g      ð?)rB   ÚC)rB   Ú	max_depthr   rE   r9   r   r!   )r    r"   Únb)r}   r   )r   r	   r   r   r'   r(   r)   Ú
set_paramsr   r:   r   r2   r   Ú
get_paramsr5   )rK   rL   rM   rf   rg   r,   r,   r-   Ú!test_voting_classifier_set_paramsg  s    r€   c        	   
   C   s  t dd} tddd}tƒ }td| fd|fd|fgdd	d
dgd tt¡}td| fd|fd|fgdd	d	dgd}t d ¡<}t	 
¡ ( t	 ddt¡ |jdd tt¡ W d Q R X W d Q R X |rÄt‚t| t¡| t¡ƒ t|jƒd dksðt‚t|jƒdkst‚tdd„ |jD ƒƒst‚| ¡ d dks4t‚|jdd tt¡ t d ¡<}t	 
¡ ( t	 ddt¡ |jdd tt¡ W d Q R X W d Q R X |ržt‚t| t¡| t¡ƒ t| t¡| t¡ƒ d}t d ¡8}tjt|d |jdddd tt¡ W d Q R X W d Q R X |r t‚t d	gdgg¡}t d	dg¡}td|fd|fgdd
dgdd ||¡}td|fd|fgdd	dgdd}t d ¡<}t	 
¡ ( t	 ddt¡ |jdd ||¡ W d Q R X W d Q R X |rÞt‚t| |¡t ddgddggddgddggg¡ƒ t| |¡t ddgddggg¡ƒ |jdd |jdd t| |¡t d
d
gd	d	gg¡ƒ t| |¡t d
gd	gg¡ƒ d S )Nr@   )rB   rC   )rD   rB   r   rE   r}   r1   r   r   g      à?)r   r    r"   ÚignoreÚtostringÚdrop)rE   r!   c             s   s   | ]}t |ttfƒV  qd S )N)Ú
isinstancer   r   )Ú.0Úestr,   r,   r-   ú	<genexpr>˜  s    z*test_set_estimator_drop.<locals>.<genexpr>r9   )r    z4All estimators are dropped. At least one is required)r#   )r   rE   r}   F)r   r    r"   Úflatten_transformgffffffæ?g333333Ó?g      ð?g        )r   r	   r   r   r'   r(   r)   r$   ÚwarnsÚwarningsÚcatch_warningsÚfilterwarningsÚDeprecationWarningr~   r5   r   r:   Údictr   rr   Zestimators_Úallr   r   r2   r%   r&   rV   rY   r;   )	rK   rL   rM   rf   rg   Úrecordr7   ZX1Úy1r,   r,   r-   Útest_set_estimator_drop{  s|    

(
(
,

(
($"r’   c              C   s„   t dd} tdd}td| fd|fgddgdd}td| fd|fgt d	¡dd}| tt¡ | tt¡ t| 	t¡| 	t¡ƒ d S )
Nr@   )rB   r   rE   r   r!   r9   )r   r"   r    )r   r!   )
r   r	   r   rV   rY   r'   r(   r)   r   r2   )rK   rL   rf   rg   r,   r,   r-   Útest_estimator_weights_formatÍ  s    

r“   c              C   s8  t dd} tdd}tƒ }t ddgddgddgd	d
gg¡}t ddddg¡}td| fd|fd|fgdd ||¡}td| fd|fd|fgddd ||¡}td| fd|fd|fgddd ||¡}t| |¡j	dƒ t| |¡j	dƒ t| |¡j	dƒ t
| |¡| |¡ƒ t
| |¡ dd¡ d¡| |¡ƒ dS )z:Check transform method of VotingClassifier on toy dataset.r@   )rB   gš™™™™™ñ¿g      ø¿g333333ó¿gffffffö¿g333333Àgš™™™™™Àgš™™™™™ñ?g333333ó?r   r!   r   rE   rF   r9   )r   r    T)r   r    rˆ   F)r[   é   )r   r[   r!   r   N)r   r	   r   rV   rY   r   r'   r   r;   Úshaper   ZswapaxesZreshape)rK   rL   rM   r(   r)   rf   rg   ru   r,   r,   r-   Útest_transformÜ  s0    

"r–   zX, y, voterrE   é   )rD   c          	   C   s€   t |ƒ}|j| |t |j¡d |jdd t d ¡}|j| |t |j¡d W d Q R X |rbt‚| 	| ¡}|j|jks|t‚d S )N)ri   rƒ   )r   )
r   r'   rV   rq   r•   r~   r$   r‰   r5   r:   )r(   r)   Zvoterr   Zy_predr,   r,   r-   Ú test_none_estimator_with_weightsû  s    "
r˜   r†   Útree)rB   )r   r   r   )Zidsc             C   sL   ddgddgddgg}dddg}t | dƒr.t‚|  ||¡ | jdksHt‚d S )	Nr   r!   r   r[   r—   r”   r   Ún_features_in_)r4   r5   r'   rš   )r†   r(   r)   r,   r,   r-   Útest_n_features_in"  s
    
r›   r`   r@   )r   Úverbosec             C   s`   t  ddgddgddgddgg¡}t  d	d	d
d
g¡}d}|  ||¡ t || ¡ d ¡s\t‚d S )Ngš™™™™™ñ¿g      ø¿g333333ó¿gffffffö¿g333333Àgš™™™™™Àgš™™™™™ñ?g333333ó?r   r!   za\[Voting\].*\(1 of 2\) Processing lr, total=.*\n\[Voting\].*\(2 of 2\) Processing rf, total=.*\n$r   )rV   rY   r'   Úrer#   Z
readouterrr5   )r`   Zcapsysr(   r)   Úpatternr,   r,   r-   Útest_voting_verbose>  s
    "rŸ   )Mrx   rŠ   r$   r   ÚnumpyrV   Zsklearn.utils._testingr   r   r   Zsklearn.exceptionsr   Zsklearn.linear_modelr   r   Zsklearn.naive_bayesr   Zsklearn.ensembler	   r
   r   r   Zsklearn.treer   r   Zsklearn.model_selectionr   Zsklearnr   r   r   Zsklearn.datasetsr   Zsklearn.svmr   Zsklearn.multiclassr   Zsklearn.neighborsr   Zsklearn.baser   r   r   Zsklearn.dummyr   Z	load_irisra   rb   rc   r(   r)   Zload_diabetesr<   rU   ÚmarkZparametrizer.   r8   r>   rO   rQ   rR   rX   rZ   r\   r_   re   rh   rv   rz   r€   r’   r“   r–   r˜   r›   rŸ   r,   r,   r,   r-   Ú<module>   s¦   

$1*R 